你实践中学到的最重要的机器学习经验是什么?
Posted 黄含驰的机器学习与优化打怪路
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了你实践中学到的最重要的机器学习经验是什么?相关的知识,希望对你有一定的参考价值。
原问题传送门:
你实践中学到的最重要的机器学习经验是什么?- 知乎 https://www.zhihu.com/question/46301335
本文仅供分享使用,侵删~
正文:
你实践中学到的最重要的机器学习经验是什么?- 宋一松的回答 - 知乎 https://www.zhihu.com/question/46301335/answer/196686877
Best Engineer Builds Tools
在机器学习领域,好的工具包括但不限于:
可以方便地添加新数据,新feature,且多人可以同步进行互不干扰
可以快速地训练出一个新模型
可以一键部署模型到生产环境,做A/B测试
可以实时看到A/B测试结果,什么指标涨了什么跌了
可以立刻做深入分析,发现什么情况下新模型表现得好,什么情况下不行
可以快速地循环反复上述步骤
这决定了你是否有能力快速迭代!(很多人根本快不起来。他们把大量时间浪费在了setup和等待上。setup数据,setup模型的训练,等待模型的训练,setup实验,等待实验的结果。)
你实践中学到的最重要的机器学习经验是什么?- 微调的回答 - 知乎 https://www.zhihu.com/question/46301335/answer/317361262
1. 永远保持怀疑
机器学习是由数据驱动,并有很强的黑箱性。因此很多时候容易得出似是而非的结论。
2. 寻找“最小预测单元”,避免追求通过一个模型预测多个目标
3. 简单有效的模型最好,不要完全弃用“人为规则”
4. 考虑的数据的依赖性(dependency)
5. 从回归到分类、从全部数据到部分数据、从连续到离散
5.1在特定情况下,因为条件限制,我们的回归模型效果不好或者要求的精度比较低,可以把回归问题转化为分类问题。
5.2如果数据的质量不连贯,我们可以大胆的抛弃掉一部分数据。
5.3. 如果需要,对于特征也可以做离散化。
6. 数据比模型更重要,但数据不是越多越好。要依据人为经验选取可能有关的数据,这建立在对问题的深入理解上。
7.学习数据挖掘的标准流程,制定科学成体系化的模型选择、评估与调试方案。
你实践中学到的最重要的机器学习经验是什么?- 萧瑟的回答 - 知乎 https://www.zhihu.com/question/46301335/answer/100770768
1. 首先要多花时间定义好要解决的问题,至于解决问题的方法可以先放一放。
2. 要做数据清洗,保证你的训练数据是干净和高质量的。
3.看待机器学习的问题,应该同时用统计和优化的视角。
4.关注结果和开箱的权衡。
5. 多了解一些领域知识有助于提高通用部分的理解。比如评价指标也是一门学问。
6. 做实验前,要做好规划。想清楚哪些适合在线跑,哪些适合离线跑。
你实践中学到的最重要的机器学习经验是什么?- 王喆的回答 - 知乎 https://www.zhihu.com/question/46301335/answer/528177439
时时刻刻从「用户的行为」出发构建和改进模型。
你实践中学到的最重要的机器学习经验是什么?- 罗一成的回答 - 知乎 https://www.zhihu.com/question/46301335/answer/206252862
重视代码的工程质量, 如果说你的整个系统耦合很紧的话尝试新的想法就会需要花很多时间.
你实践中学到的最重要的机器学习经验是什么?- 李韶华的回答 - 知乎 https://www.zhihu.com/question/46301335/answer/112354887
理解模型的基本假设,看自己的数据是否符合这种假设。任何模型都是有某种假设的,如果数据不符合这种假设,就不太可能学出有意义的模型并用于预测。
你实践中学到的最重要的机器学习经验是什么?- ShiningObsidian的回答 - 知乎 https://www.zhihu.com/question/46301335/answer/101544405
0:不要恐慌,保持耐心,控制变量,逐步解决。
1:确定所有的输入都是足够有意义的。
2:想清楚结果的评价标准。
你实践中学到的最重要的机器学习经验是什么?- mileistone的回答 - 知乎 https://www.zhihu.com/question/46301335/answer/405493746
持续改进训练数据带来的收益通常比改进模型来得快!
下面是改进训练数据的方法:
你实践中学到的最重要的机器学习经验是什么?- paley的回答 - 知乎 https://www.zhihu.com/question/46301335/answer/101196078
选特征,优先选覆盖度高,差异显著,并且表现稳定的特征。
注重离线指标,AUC,误差,模型规模等。这些离线指标的变化往往与线上效果波动强相关。
上线前做数据校验,上线后做好数据监控。
效果好与不好都是有原因的,尽量找出每次效果变化的原因。
以上是关于你实践中学到的最重要的机器学习经验是什么?的主要内容,如果未能解决你的问题,请参考以下文章
Python 机器学习 | 超参数优化 黑盒(Black-Box)非凸优化技术实践