机器学习:机器学习工作流程

Posted Lansonli

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习:机器学习工作流程相关的知识,希望对你有一定的参考价值。

文章目录

机器学习工作流程

一、什么是机器学习

二、机器学习工作流程

1、获取到的数据集介绍

2、数据基本处理

3、特征工程

4、机器学习

5、模型评估


机器学习工作流程

一、什么是机器学习

机器学习是从数据自动分析获得模型,并利用模型对未知数据进行预测。

二、机器学习工作流程

机器学习工作流程总结:

  • 1.获取数据
  • 2.数据基本处理
  • 3.特征工程
  • 4.机器学习(模型训练)
  • 5.模型评估
    - 结果达到要求,上线服务
    - 没有达到要求,重新上面步骤

 

1、获取到的数据集介绍

数据简介

  • 在数据集中一般:

    • 一行数据我们称为一个样本
    • 一列数据我们成为一个特征
    • 有些数据有目标值(标签值),有些数据没有目标值(如上表中,电影类型就是这个数据集的目标值)
  • 数据类型构成:

    • 数据类型一:特征值+目标值(目标值是连续的和离散的)
    • 数据类型二:只有特征值,没有目标值
  • 数据分割:

    • 机器学习一般的数据集会划分为两个部分:
      - 训练数据:用于训练,构建模型
      - 测试数据:在模型检验时使用,用于评估模型是否有效
    • 划分比例:
      - 训练集:70% 80% 75%
      - 测试集:30% 20% 25%

 

2、数据基本处理

即对数据进行缺失值、去除异常值等处理。

3、特征工程

3.1、什么是特征工程

特征工程(Feature Engineering)是使用专业背景知识和技巧处理数据使得特征能在机器学习算法上发挥更好的作用的过程

  • 意义:会直接影响机器学习的效果

3.2、为什么需要特征工程

机器学习领域的大神Andrew Ng(吴恩达)老师说“Coming up with features is difficult, time-consuming, requires expert knowledge. “Applied machine learning” is basically feature engineering. ”

注:业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。

3.3 特征工程包含内容

  • 特征提取
  • 特征预处理
  • 特征降维

 

3.4 特征工程类别介绍

  • 特征提取
    • 将任意数据(如文本或图像)转换为可用于机器学习的数字特征

特征预处理

  • 通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程

特征降维

  • 指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程

 

4、机器学习

选择合适的算法对模型进行训练。

5、模型评估

对训练好的模型进行评估。


  • 📢博客主页:https://lansonli.blog.csdn.net
  • 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!
  • 📢本文由 Lansonli 原创,首发于 CSDN博客🙉
  • 📢停下休息的时候不要忘了别人还在奔跑,希望大家抓紧时间学习,全力奔赴更美好的生活✨

以上是关于机器学习:机器学习工作流程的主要内容,如果未能解决你的问题,请参考以下文章

机器学习中的特征工程

机器学习基础知识-持续更新

机器学习模型设计五要素

机器学习之----VC维理论基础及证明

一文介绍机器学习中的三种特征选择方法

年龄不是Kaggle的上限!我只是按照自己的兴趣专注于机器学习