EduCoder 机器学习逻辑回归

Posted 2021-07-06 Alex Hub

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了EduCoder 机器学习逻辑回归相关的知识，希望对你有一定的参考价值。

逻辑回归是属于机器学习里面的监督学习，它是以回归的思想来解决分类问题的一种非常经典的二分类分类器。由于其训练后的参数有较强的可解释性，在诸多领域中，逻辑回归通常用作 baseline 模型，以方便后期更好的挖掘业务相关信息或提升模型性能。

本实训项目的主要内容是基于 Python 语言搭建出一个能够识别恶性肿瘤的逻辑回归模型，并使用 sklearn 中的 LogisticRegression 实现手写数字识别。

任务描述

本关任务：根据本节课所学知识完成本关所设置的编程题。

编程要求

根据提示，在右侧编辑器补充 Python 代码，实现sigmoid函数。底层代码会调用您实现的sigmoid函数来进行测试。(提示: numpy.exp()函数可以实现 e 的幂运算)

测试说明

测试用例：

输入：1

预期输出：0.73105857863

输入：-2

预期输出：0.119202922022

开始你的任务吧，祝你成功！

#encoding=utf8
import numpy as np

def sigmoid(t):
    '''
    完成sigmoid函数计算
    :param t: 负无穷到正无穷的实数
    :return: 转换后的概率值
    :可以考虑使用np.exp()函数
    '''
    #********** Begin **********#
    return 1/(1+np.exp(-1*t))
    #********** End **********#

第2关：逻辑回归的损失函数

任务描述
相关知识
- 为什么需要损失函数
- 逻辑回归的损失函数
编程要求
测试说明

任务描述

本关任务：根据本节课所学知识完成本关所设置的选择题。

编程要求

根据相关知识，按照要求完成右侧选择题任务，包含单选题和多选题。

测试说明

平台会对你选择的答案进行判断，全对则通过测试。

开始你的任务吧，祝你成功！

1、逻辑回归的损失函数可以写成如下形式（A）

$c o s t = {- l o g (p^) - l o g (1 - p^) y = 1 y = 0$

A、

对

B、

错
2、下列说法正确的是（ACD）

A、

损失值能够衡量模型在训练数据集上的拟合程度

B、

sigmoid函数不可导

C、

sigmoid函数的输入越大，输出就越大

D、

训练的过程，就是寻找合适的参数使得损失函数值最小的过程
3、sigmoid函数(对数几率函数)相对于单位阶跃函数有哪些好处？（AB）

A、

sigmoid函数可微分

B、

sigmoid函数处处连续

C、

sigmoid函数不是单调的

D、

sigmoid函数最多计算二阶导
4、逻辑回归的优点有哪些？（D）

A、

需要事先对数据的分布做假设

B、

可以得到“类别”的真正的概率预测

C、

可以用闭式解求解

D、

可以用现有的数值优化算法求解

第3关：梯度下降

任务描述
相关知识
- 什么是梯度
- 梯度下降算法原理
编程要求
测试说明

任务描述

本关任务：用 Python 构建梯度下降算法，并求取目标函数最小值。

编程要求

根据提示，使用 Python 实现梯度下降算法，并损失函数最小值时对应的参数theta，theta会返回给外部代码，由外部代码来判断theta是否正确。

测试说明

损失函数为： $l o s s = 2 * (θ - 3)$ 最优参数为：3.0 你的答案跟最优参数的误差低于0.0001才能通关。

开始你的任务吧，祝你成功！

# -*- coding: utf-8 -*-

import numpy as np
import warnings
warnings.filterwarnings("ignore")

def gradient_descent(initial_theta,eta=0.05,n_iters=1000,epslion=1e-8):
    '''
    梯度下降
    :param initial_theta: 参数初始值，类型为float
    :param eta: 学习率，类型为float
    :param n_iters: 训练轮数，类型为int
    :param epslion: 容忍误差范围，类型为float
    :return: 训练后得到的参数
    '''
    #   请在此添加实现代码   #
    #********** Begin *********#
    theta = initial_theta
    i_iter = 0
    while i_iter < n_iters:
        gradient = 2*(theta-3)
        last_theta = theta
        theta = theta - eta*gradient
        if(abs(theta-last_theta)<epslion):
            break
        i_iter +=1
    return theta
    
    #********** End **********#

第4关：动手实现逻辑回归 - 癌细胞精准识别

任务描述
相关知识
编程要求
测试说明

任务描述

本关任务：使用逻辑回归算法建立一个模型，并通过梯度下降算法进行训练，得到一个能够准确对癌细胞进行识别的模型。

EduCoder 机器学习逻辑回归

第1关：逻辑回归核心思想

任务描述

相关知识

什么是逻辑回归

sigmoid 函数

编程要求

测试说明

第2关：逻辑回归的损失函数

任务描述

相关知识

为什么需要损失函数

逻辑回归的损失函数

编程要求

测试说明

第3关：梯度下降

任务描述

相关知识

什么是梯度

梯度下降算法原理

编程要求

测试说明

第4关：动手实现逻辑回归 - 癌细胞精准识别

任务描述

相关知识

数据集介绍

构建逻辑回归模型

EduCoder 机器学习 逻辑回归

第1关：逻辑回归核心思想

任务描述

相关知识

什么是逻辑回归

sigmoid 函数

编程要求

测试说明

第2关：逻辑回归的损失函数

任务描述

相关知识

为什么需要损失函数

逻辑回归的损失函数

编程要求

测试说明

第3关：梯度下降

任务描述

相关知识

什么是梯度

梯度下降算法原理

编程要求

测试说明

第4关：动手实现逻辑回归 - 癌细胞精准识别

任务描述

相关知识

数据集介绍

构建逻辑回归模型

EduCoder 机器学习逻辑回归