推荐算法进阶手册:2大篇章10大模块51份学习资料

Posted InfoQ

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了推荐算法进阶手册:2大篇章10大模块51份学习资料相关的知识,希望对你有一定的参考价值。

作者|刑无刀
编辑|Monica

但,今天如果你足够幸运,能看到这篇文章,那你就不必如此麻烦地到处找,到处打听,到处参加各类线下活动来获取最前沿最有价值的信息。因为在这里,链家网资深算法专家刑无刀花费 3 个月的时间为你整理了 51 份推荐算法的学习资料,覆盖有“原理篇”、“工程篇”两大篇章,“近邻推荐”、“常见架构”、“深度学习”、“内容推荐”等十大模块,包含 Facebook 开源的文本处理工具 fastText 背后原理、YouTube 视频推荐系统在深度神经网络上的尝试、腾讯内部实时推荐系统架构的剖析等等案例。

当然,如果你订阅了极客时间上线的《推荐系统 36 式》,这些资料可能你早已获得并已阅读,获取里面的知识精华。

但现在也不晚,推荐算法入门干货今天都分享给你。

推荐算法入门干货集锦

(刑无刀语)在专栏写作的过程中,我阅读了很多业界公开的资料,我觉得有必要整理出来,供想深入阅读的人继续去找虐。

整体来说,在选择参考文献时,我偏爱那些由公司发表的。因为推荐系统本质上还是一种非常依赖实践的算法应用方向,并且,这些商业公司论文中的技术内容也在他们实际的场景中经过了检验。

现分享给大家。我已经把这些资料整理一个压缩包中,并上传载百度云盘中,若想要以下全部资料,可在 InfoQ 后台回复:“推荐系统”。

推荐算法进阶手册:2大篇章10大模块51份学习资料

推荐算法进阶手册:2大篇章10大模块51份学习资料

原理篇(部分展示)
内容推荐
题目:Bag of Tricks for Efficient Text Classification

类型:论文

说明:

Facebook 开源的文本处理工具 fastText 背后原理。可以训练词嵌入向量,文本多分类,效率和线性模型一样,效果和深度学习一样,值得拥有。

题目:The Learning Behind Gmail Priority Inbox

类型:论文

说明:

介绍了一种基于文本和行为给用户建模的思路,是信息流推荐的早期探索,Gmail 智能邮箱背后的原理。

题目:Recommender Systems Handbook(第三章,第九章)

类型:书

说明:

这本书收录了推荐系统很多经典论文,话题涵盖非常广,第三章专门讲内容推荐的基本原理,第九章是一个具体的基于内容推荐系统的案例。

题目:文本上的算法

类型:网络文章 (网络免费版,已有成书《文本上的算法: 深入浅出自然语言处理》,内容更丰富)

说明:

介绍了文本挖掘中常用的算法,及基础概念。内容涉及概率论,信息论,文本分类,聚类,深度学习,推荐系统等。

题目:LDA 数学八卦

类型:网络文章

说明:

由浅入深地讲解 LDA 原理,对于实际 LDA 工具的使用有非常大的帮助。

近邻推荐
题目:Amazon.com recommendations: item-to-item collaborative filtering

类型:论文

说明:

介绍 Amazon 的推荐系统原理,主要是介绍 Item-Based 协同过滤算法。

题目:Item-Based Collaborative Filtering Recommendation Algorithms

类型:论文

说明:

GroupLens 的研究团队对比了不同的 Item-to-Item 的推荐算法。

……

深度学习
题目:Deep Neural Networks for YouTube Recommendations

类型:论文

说明:

介绍 YouTube 视频推荐系统在深度神经网络上的尝试。能从中看到 wide&deep 模型的影子。

题目:Efficient Estimation of Word Representations in Vector Space

类型:论文

说明:

Word2Vec 的作者在这篇文章中提出了一种词嵌入向量学习方法,也就是把开源工具包 Word2Vec 背后的模型详细介绍了一次。理论上很简单,更多是一些工程技巧的分享。Word2Vec 给推荐系统带来了一种新的隐因子向量学习方法,深陷评分预测泥潭的矩阵分解被开拓了思路。

推荐算法进阶手册:2大篇章10大模块51份学习资料

可后台回复“推荐系统”领取

工程篇(部分展示)
常见架构
题目:Activity Feeds Architecture

类型:演示文稿

说明:

本文非常详细地介绍了社交动态信息流的架构设计细节。

题目:Beyond the 5 stars(Netflix Recommendations)

类型:网络文章

说明:

Netflix 详细宏观上介绍了自家推荐系统的产品形态,不只是比赛中的评分预测那么简单的。

可后台回复“推荐系统”领取

关键模块
题目:Overlapping Experiment Infrastructure- More, Better, Faster Experimentation

类型:论文

说明:

ABTest 实验平台的扛鼎之作,Google 出品,值得拥有。

题目:TencentRec:Real-time Stream Recommendation in Practice

类型:论文

说明:

介绍了腾讯内部的实时推荐系统架构。

……

其他书目
  1. Pattern Recognization and Machine Learning(机器学习基础,有此一本足够了)。

  2. 推荐系统实践(国内唯一一本非翻译的推荐系统书籍,入门必选)。

  3. 信号与噪声(介绍贝叶斯统计的一本科普书)。

  4. 复杂(推荐系统面对的是复杂网络,了解复杂系统和复杂网络的特点,有助于开脑洞)。

  5. 信息简史(既然是信息经济,当然要读一本关于信息的历史)。

知道你们不会读的,所以就不推荐太多了。但愿我这个激将法有助于你学习进步。

以上资料,可后台回复“推荐系统”,即可领取。

欢迎大家订阅我的专栏 --《推荐系统 36 式》。山高水长,我们江湖再见。

也可点击“阅读原文”,订阅或浏览此专栏

以上是关于推荐算法进阶手册:2大篇章10大模块51份学习资料的主要内容,如果未能解决你的问题,请参考以下文章

卧槽!字节跳动《算法中文手册》火了,完整版 PDF 开放下载!

堪称神级的Spring Boot手册,从基础入门到实战进阶

读书分享全网学习资源大合集,推荐Python学习手册等三本书「01」

10个最热门的大数据技术

强烈推荐 |量化交易资料包领取B48:金融时间序列学习进阶资料大礼包

进阶大数据架构师学习路线