2.3 数据变换李沐-斯坦福21秋季:实用机器学习中文版
Posted Jsper0420
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2.3 数据变换李沐-斯坦福21秋季:实用机器学习中文版相关的知识,希望对你有一定的参考价值。
【李沐-斯坦福21秋季:实用机器学习中文版】笔记系列
2.3 数据变换
1.数据流程:原始数据–标注及清理–数据变形–特征工程–模型训练
2. 数据归一化
1. Max-Min Normalization算法:
把一个列里面的数值的最小值与最大值都限定到一个固定区间内,然后把所有的元素只通过线性变化出来【将数据的单位放到合理的区间】;
2. Z-Score 算法:
通过算法使得均值变为0,方差变为1 。把一列的数据换成是-1到1之间的数据。
3. Decimal-Scaling 算法:
使Xi➗10的阶乘,使Xi的绝对值处于-1与1之间。
4. Log-Scaling 算法:
对数值都是大于0,且数值变换比较大可以试一下log一下【log上面的加减等于原始数据的乘除,可以将计算基于百分比的】。
3. 图象变换
将图片的尺寸变小,机器学习对低分辨率的图片不在意,图片采样的比较小,且jpeg选用中等质量压缩,可能会导致精度有1%的下降(ImageNet),凡是数据的大小与质量要做权衡,要么不要下采样,要么下采样的时候数据的质量(分辨率)就要高一点。通常数据质量更加的重要。
4. 视频变换
-
当你拿到VIDEO的时候,你需要将他缩减成对你最有用的片段,因为机器学习看不了那么长的视频
-
把视频压缩,但是读取比较困难
-
处理视频的时候,我们可以提取关键帧,而并不是输入整个视频
5. 文本变换
- 词根化(语法化):把一个词变成常见的形式
- 词元化(机器学习算法中最小的单元也就是token)
总结:
以上是关于2.3 数据变换李沐-斯坦福21秋季:实用机器学习中文版的主要内容,如果未能解决你的问题,请参考以下文章
极客日报:苹果承认从2019年开始扫描用户邮件寻找虐童资料;新浪回应“花钱买热搜”传闻;李沐斯坦福《机器学习》课程上线
AI大神李沐B站走红!连博导们都在追更,还亲自带你逐段读懂论文,网友:带B站研究生吧...
卧槽,B 站上线斯坦福最新「机器学习系统」全集,假期学起来!
机器学习的入门平台天花板,还可免费实操经典教程,确实也没谁了
原Andrew Ng斯坦福机器学习——Lecture 2_Linear regression with one variable