新书自荐:《从零开始构建企业级推荐系统》

Posted ResysChina

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了新书自荐:《从零开始构建企业级推荐系统》相关的知识,希望对你有一定的参考价值。

大家好,我是ResysChina驻场手张相於,经过长期拖延努力,我的新书《从零开始构建企业级推荐系统》于近期出版了,并已在各电商网站上架。其实这几年市场上出现了多本推荐系统相关的新书,其中也不乏一些优秀内容,那么这一本与其他书相比有什么特点?我又为什么要写这么一本书?今天就和大家唠一唠。

写这本书的动机

我第一次接触推荐系统是在2012年的电商行业,那个年代推荐系统领域有两大传说:一是推荐系统在Amazon的订单贡献达到了30%以上,二是Netflix悬赏百万美金寻找最强推荐算法。在这种气氛的烘托下,推荐系统开始受到越来越多的关注,但这种关注并没有在短时间内转化成为更丰硕的成果。在认知层面,除了电商和视频等少数行业,在大多数行业中推荐系统的重要性还没有被广泛认可,那时整个行业对于流量分发的认知也远没有今天这么深入透彻,对于推荐系统的认知也更多停留在“可以帮助电商网站卖货”这样的层面。在产品形态层面,彼时还是以各种豆腐块为主,现在占据主导的feed流、直播以及内容混排等也都还没有出现或者处在萌芽期。而在技术层面,机器学习技术还没有开始广泛应用,更遑论深度学习,那时推荐算法绝对的主角还是推荐算法的常青树——协同过滤算法。那一年,现在以推荐技术名扬四海的字节跳动刚刚成立。

推荐系统在后来几年内的发展可谓是一日千里,也在各个领域受到了越来越多的重视,在业务、产品和技术层面都取得了长足的发展,与搜索和广告一起,组成了互联网算法行业不可或缺的三大核心组件。尤其是近年来随着数据量的持续增长和算力的持续提升,推荐系统这一以数据和算法为核心驱动力的产品,在深度学习技术的助推下,将业务效果不断推向新的高度。

写这本书还有第二个驱动力,就是希望梳理出推荐系统一些通用的可泛化的做法和思路。推荐系统是一个涉及面非常广的领域,从算法到工程都有很多比较有技巧性的点,这些技术点编织成了一张复杂的网络,但这个世界的本质是简单的,这张复杂的网络中一定存在着一些关键的核心节点,这些节点代表了推荐系统中最为本质、代表了这些技术点共性的一些东西,掌握这些节点就好比抓住了一棵树的主干,更多的具体实践方法只是主干上长出的树杈和枝芽。正所谓“举一纲而万目张,解一卷而众篇明”,希望能通过这本书和读者一起探得推荐系统中的些许思想精华。

这本书的特点

经过这么多年的发展,推荐系统已经是一个内涵丰富而广泛的领域了,以作者浅薄的能力断然无法描述出这个领域的全貌,因此本书会在以下方面有所侧重:

1. 技术路线的条理:希望能将一个算法或模块的演进过程从简单到复杂循序渐进地展开阐述,读者可结合自己业务所处的情况来决定从哪个状态入手

2. 知识的系统性:希望能做到把散落的知识点连成面,例如在介绍相关性算法时,会将所有的相关性链条模式进行系统性总结,这样即使以后出现新的相关性算法,读者也可以很快知道应该如何应用

3. 通用性思考:希望能将找到不同问题之间的共同点,例如在介绍如何应用机器学习技术时,会对特征类型按照维度和泛化能力进行通用抽象分类,让读者真正理解不同特征的作用原理和作用范围

4. 踩坑实录:很多人告诉你如何成功,但或许只有我告诉你“如何失败”。书中收录了很多我和团队踩过的坑,这些坑在之前的单独分享中都得到了很多同行的共鸣,相信不同阶段的读者都会有所收获,所谓“有则改之无则加勉”,如果能在我的失败之上建立起你的成功,那我就太高兴了

正如本书题目所示,本书的目标是希望能帮助读者建立起一个能work的企业级推荐系统,并且提供了如何持续优化系统的一般性通用思路,在这个过程中建立起系统化的推荐系统知识体系。

这本书不是什么

推荐系统领域博大精深,每本书都有所侧重,这本书不是:

1. 代码库:前些年有本很经典的书《集体智慧编程》,这本书上的很多代码是可以拿来直接运行的,我当时也从中受益良多。本书在撰写前也考虑过是否要采用这样的风格,但经过慎重考虑后还是选择了文字、公式和图表居多的方式,因为书中想表达的大部分内容并不适合用代码来直接表达,而如果使用伪代码的话,其表意效果可能还不如文字。希望本书的文字能够传达比代码更丰富有效的信息,能让读者有“举一反三”和“书中无码,心中有码”的收获。

2. 机器学习入门指南:推荐系统离不开机器学习,但本书无意成为一本机器学习入门指南,如果读者在这方面需要补充基础,建议阅读一些经典的书籍,例如<ISLR>,<PRML>,西瓜书等

3. 前沿论文解析:推荐系统领域的论文出新速度近年来持续加快,如果一本书的定位是前沿技术进展,那么年初写完的书到年末可能就已经完全过时了。本书的侧重点在于帮读者搭建起85左右分的推荐系统,在这个过程中应用到的技术是有其通用性和规律的,并且也是具有一定不随时间而过期的本质性的,而从85分要再往上走,就需要读者结合自己的业务去应用前沿技术了,这部分最好的实践方法是阅读原始论文本身,并将其与自己的业务深入结合。此外每篇新论文出炉后,对其进行解析的文章还是比较多的,读者可以较容易地获取到这部分资源,并与此书结合使用

总结

如果你之前从我们的文章中有过些许收获,那么相信这本书对你也会有些许价值,技术人写书,赚不到什么钱,更多的是如罗老师所说:“交个朋友”,感谢大家支持。

如果买了不好看可以来找我,虽然不能退钱,但我可以教你怎么用来垫桌子腿。