《python机器学习—预测分析核心算法》:构建预测模型的一般流程

Posted 飞鸟先森

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《python机器学习—预测分析核心算法》:构建预测模型的一般流程相关的知识,希望对你有一定的参考价值。

参见原书1.5节

构建预测模型的一般流程

问题的日常语言表述->问题的数学语言重述
重述问题、提取特征、训练算法、评估算法

熟悉不同算法的输入数据结构:
1.提取或组合预测所需的特征
2.设定训练目标
3.训练模型
4.评估模型在训练数据上的性能表现

机器学习:
开发一个可以实际部署的模型的全部过程,包括对机器学习算法的理解和实际的操作

通常,有非常切实的原因,导致某些算法被经常使用,了解背后的原因

(1)构造一个机器学习问题
审视数据集中的数据,确定需要做何种形式的预测
如,这些数据代表什么?如何与预测任务关联起来?

1.“更好的结果”->可测量可优化的具体目标
2.收集数据,表示为特征的矩阵
3.目标:已知正确的数据结果用于训练

<------问题重构---------<-
               | |
问题的定性描述->问题的数学描述->模型训练与性能评估->模型部署

(2)特征提取和特征工程
特征提取: (将决定哪些特征可以用来预测目标)
把一个自由形式的各种数据(如一个文档中的字词)转换为行、列形式的数字的过程

特征工程:
对特征进行整理组合,以达到更富有信息量的过程

算法,提供每个特征对最终预测结果贡献的度量
对特征打分,标识重要性

注意:数据准备和特征工程 估计会占开发一个机器学习模型80%~90%的时间

通常训练100~5000个不同的模型,然后选择与问题、数据集最匹配的模型

(3)确定训练后模型的性能
测试集:留出一部分数据,用于测试模型的性能

 


















以上是关于《python机器学习—预测分析核心算法》:构建预测模型的一般流程的主要内容,如果未能解决你的问题,请参考以下文章

《python机器学习—预测分析核心算法》:理解数据

分享《Python机器学习—预测分析核心算法》+PDF+源码+Michael Bowles+沙嬴

python好书推荐:A028[异步图书].Python机器学习:预测分析核心算法

《Python机器学习—预测分析核心算法》高清中文版PDF+高清英文版PDF+源代码

分享《Python机器学习—预测分析核心算法》高清中文版PDF+高清英文版PDF+源代码

分享《Python机器学习—预测分析核心算法》高清中文版PDF+高清英文版PDF+源代码