在线机器学习的应用实践场景介绍
Posted 跳动的数据
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在线机器学习的应用实践场景介绍相关的知识,希望对你有一定的参考价值。
现在人工智能下的机器学习算法的应用在大部分场景下是很成熟了,传统的机器学习模型的训练方式很稳定成熟了,也就是Batch训练。
随着算法模型需要与用户实时响应相适应的需求,以及实时计算平台的快速发展,那么在线机器学习的应用也在一点点的纳入到了大家尝试范围。
业务响应与模型的一致性
在模型更新上,大多数还是集中在天、周、甚至月维度上的模型更新下。在现实业务的驱动下,很多的团队开始在工程上优化整个机器学习流程的链路,一部分是紧贴业务的平台化实践,比如使用实时特征平台加策略平台,也可以满足一定的需求,还有就是MLOps的实践。
训练学习的性能
目前离线训练的数据量都是全集,大多是TB级别的海量数据,在资源的使用和性能上比较大。
实时的训练学习算法比较简单,效果会比较好,在效果满足的情况下可以不需要存储数据,一条条的数据用完就可以丢弃。
有哪些在下优化算法
Google的FTRL
https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/41159.pdf
在线机器学习是一种在线优化权重的方法,比如[在线最优化求解-冯扬]有介绍
FTRL的实现可以参考腾讯Angel PS和阿里Alink中的实现。
上面这张图是微博在线机器学的在线优化算法选择
业界的实践案例
微博在社交平台的实践
腾讯在社交平台、广告、风控的实践
阿里在电商搜索推荐、金融业务的实践
Paypal在金融风控的实践
还有很多....
参考开源的框架
Angel
Alink
...
机器学习历史文章
欢迎加入跳动的数据微信交流群,一起讨论、学习、进步 !
以上是关于在线机器学习的应用实践场景介绍的主要内容,如果未能解决你的问题,请参考以下文章