在线机器学习的应用实践场景介绍

Posted 跳动的数据

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在线机器学习的应用实践场景介绍相关的知识,希望对你有一定的参考价值。

现在人工智能下的机器学习算法的应用在大部分场景下是很成熟了,传统的机器学习模型的训练方式很稳定成熟了,也就是Batch训练。


随着算法模型需要与用户实时响应相适应的需求,以及实时计算平台的快速发展,那么在线机器学习的应用也在一点点的纳入到了大家尝试范围。



业务响应与模型的一致性


在模型更新上,大多数还是集中在天、周、甚至月维度上的模型更新下。在现实业务的驱动下,很多的团队开始在工程上优化整个机器学习流程的链路,一部分是紧贴业务的平台化实践,比如使用实时特征平台加策略平台,也可以满足一定的需求,还有就是MLOps的实践。



训练学习的性能


目前离线训练的数据量都是全集,大多是TB级别的海量数据,在资源的使用和性能上比较大。


实时的训练学习算法比较简单,效果会比较好,在效果满足的情况下可以不需要存储数据,一条条的数据用完就可以丢弃。



有哪些在下优化算法


Google的FTRL

https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/41159.pdf


在线机器学习是一种在线优化权重的方法,比如[在线最优化求解-冯扬]有介绍


FTRL的实现可以参考腾讯Angel PS和阿里Alink中的实现。




上面这张图是微博在线机器学的在线优化算法选择



业界的实践案例


微博在社交平台的实践

腾讯在社交平台、广告、风控的实践

阿里在电商搜索推荐、金融业务的实践

Paypal在金融风控的实践

还有很多....


参考开源的框架


Angel

Alink

...




机器学习历史文章







欢迎加入跳动的数据微信交流群,一起讨论、学习、进步 !

以上是关于在线机器学习的应用实践场景介绍的主要内容,如果未能解决你的问题,请参考以下文章

机器学习模型python在线服务部署的两种实例

Angel:深度学习在腾讯广告推荐系统中的实践

vivo互联网机器学习平台的建设与实践

Python机器学习及实践——基础篇8(LinerR和SGD)

分享《机器学习实践应用》+PDF+源码+李博

送你一个在线机器学习网站,真香!