原创 给运营编辑看的推荐系统说明书

Posted 总师

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了原创 给运营编辑看的推荐系统说明书相关的知识,希望对你有一定的参考价值。

(回顾)

随着内容信息流的的形式已经被普遍接受,对于一个内容型app甚至各种app,个性化推荐系统已经变成了标配。现在我们提到推荐系统,首先都能想到今日头条,的确虽然feed和推荐都不是今日头条发明的,但它却把这个人设发挥到了极致,导致后面跟随了无数“xx头条”的模仿者。但如果在十几年前,提到推荐系统,大家都会提到另外一家公司“Netflix”,现在他已经是一家超级媒体公司,很多电影前面都有NFLX,就是他家出品的。其实Netflix成立于1997年,最开始是一家在线影片租赁提供商,主要提供Netflix超大数量的DVD并免费递送,允许人们在线选购影片,并由公司负责送货上门,还带着DVD机,就像点个海底捞外卖一样。为了提升业绩,Netflix当然会根据顾客以往的浏览记录和租赁记录来提供相应的内容推荐。最让Netflix和推荐系统声名鹊起的是,2006年,Netflix宣布将100万美元奖励给第一位能够将其推荐系统的准确率提升10%的人,并且只要该比赛还在进行,公司就会将每年5万美元奖励给当年的第一名。消息一公布,世界各地的团队无不踊跃参与,纷至沓来。最终,历经三年时间,前后一百八十多个团队的较量,一支名叫“BPC”的团队率先突破障碍,以10.06%的改进效果获得了这份百万大奖。而通过这次百万大奖赛,对Netflix而言,既升级了自家网站的算法,并带来了大笔收入;又在程序员的圈子中塑造了公司形象,发掘了无数优秀算法人才,可谓一举多得。


(继续)

已经查不出最早的推荐系统来自哪,它发扬光大于电影网站,所以现在很多数据集仍然是电影数据集。其他典型的应用场景,音乐,购物,新闻资讯,交友,短视频。其中电影和音乐已经很少听说个性化推荐的作用了,其中一个原因是,商品的量本来就不是很大,用baidu查了movie.douban.com的索引量,四百多万,其中还包括影评页面。根据媒体公布的信息,2019年国内电影产量1037部,以此推断全世界一年的电影总产量不会超过5万部,赶不上新闻资讯和短视频一个小时的产量。推荐系统最重要的一个作用之一就是解决"信息过载问题",当然是内容越多,用户越难以找到想要的内容,也越能体现推荐系统的重要性。


后面会和大家从运营视角解读推荐系统,个人一直认为推荐系统实际上是一个运营型产品,运营在推荐中起到的作用要高于程序员,很多策略和特征更需要运营思维,如果一个研发团队推荐做得好,也说明了这个研发团队比其他人更懂运营。针对运营人员的知识背景的特点,后面会分几个章节别给大家介绍。


一、内容检索

如果给程序员看,当然一定要先说协同过滤。但为什么把协同过滤放在第二章呢?因为是给运营看的么,当然内容优先另外一个重要的原因,检索要比协同过滤的可性更强,也符合时间发展顺序。

二、协同过滤

也就是大家经常听到的CF,全称Collaborative Filtering,看完本章,以后再听到看到cf这个词就不会再被忽悠了,现有的推荐系统几乎全部都是围绕着"协同过滤"转的。这里留一个问题:“协同过滤”为什么叫协同滤”呢?请看第二章。

三、内容描述

电影、音乐、购物甚至交友的那个商品的属性都是客观存在的,例如导演,主演,类型,年代等等;也有很多资料库,例如imdb,豆瓣,猫眼等等。新闻资讯和短视频的属性描述就全靠作者或者编辑运营了。给内容评级和打标签一直是一个有争议的工作,可大家要知道没有标签,推荐系统是不能工作的。

四、数据指标

人总是要被正向激励的,那我们什么时候能看到我们工作的成果,和如何评价我们工作的好坏呢?

五、其他

补充一下运营同学可能被忽悠的地方和一些专业名词,其他容我再想想。

希望这个系列能给在运营一线的同学对推荐系统做一个解读,人工智能不断的发展,很多基础工作可能会被机器取缔,但我相信运营不会,我一直认为运营是一个富有挑战的岗位,做着具有创造性的工作。所以我们要更加了解机器是怎么运转的,能够利用机器的创造出更有价值的产品。


(待续)

什么是推荐系统

推荐系统通过分析用户的行为,找到用户的个性化需求,从而将一些长尾商品个性化推荐给相应的用户,帮助用户找到自己想要但难以被发现的商品。






以上是关于原创 给运营编辑看的推荐系统说明书的主要内容,如果未能解决你的问题,请参考以下文章

抖音企业代运营,杭州抖音代运营 抖音推荐系统背后的算法

QQ音乐推荐系统的精细化调控

推荐系统与精细化运营

原创 | 五千字长文干货,带你领略推荐系统

学习推荐系统必看的10篇RecSys论文,收藏!(官方推荐)

了解《推荐系统》必看的4篇论文附打包下载地址