基于喜欢、分享和视图的最受欢迎帖子的算法[重复]
Posted
技术标签:
【中文标题】基于喜欢、分享和视图的最受欢迎帖子的算法[重复]【英文标题】:Algorithm for most popular posts based on likes, shares and views [duplicate] 【发布时间】:2014-04-13 04:28:23 【问题描述】:我正在开发一个包含无数故事的网站。各种格式的故事:文本、视频、照片和其他多媒体元素。故事可以根据各种基础进行过滤,其中一些是“新”的,显然首先包含最新的故事,“精选”的故事将手动标记为特色,“流行”的故事我需要提出一个算法。
到目前为止,我正在做的是平均 facebook 喜欢、分享数量(包括 facebook、twitter 或任何其他分享)和观看次数。但这对我来说并不好。因为社交垃圾邮件等原因,对所有三个指标赋予相同的权重年龄听起来并不真实。
期待一些非常好的算法来对故事的受欢迎程度进行排名。
----加法-----
Popularity Algorithm 仅讨论基于“喜欢”的算法,该算法基于将结果分类为时间戳类别:流行于日、周和月。而This 的答案几乎可以回答我的查询,但不完全是因为那里假设了指标。我正在寻找一些具有真实解释的确切指标。例如“facebook *2”,解释为什么 *2 用于 facebook。我希望我现在没有重复!
【问题讨论】:
Popularity Algorithm 仅讨论基于“喜欢”的算法,并且该算法基于将结果分类为时间戳类别:流行于日、周和月。而This 的答案几乎可以回答我的查询,但不完全是因为那里假设了指标。我正在寻找一些具有真实解释的确切指标。例如“facebook *2”,解释为什么 *2 用于 facebook。我希望我现在没有重复! 【参考方案1】:我建议尝试使用 regression algorithm。使用最广泛的是 linear regression,但如果该模型不适合 - 请随意探索其他模型。
-
首先,确定每个故事的特征。你的特点是
喜欢,推文,分享,意见,....我还要添加一个布尔指标
(变量只能是 0 或 1 的值)用于每种类型
(视频/照片/...)。
接下来,为自己创建一个训练集 - 这是一组故事
您(或其他人类专家)评分的地方。
现在,使用这些特征和训练集 - 使用一些回归
算法来创建最适合您必须的功能的模型
您已经评分的示例。1
拥有模型后 - 您可以使用它为所有其他人打分
文件。
关于垃圾邮件发送者检测 - 您可以尝试异常检测算法
(1) 实际上,第 2 步和第 3 步可以一起完成 - 使用主动回归技术 - 在主动回归中,学习器(算法)会要求您提供可以使算法尽可能快地学习的示例。根据我的实验,PAlice 是一种性能非常好的主动回归算法。
【讨论】:
但是人工根据点赞数和点赞数手动给帖子打分不是很难吗?我的意思是人类甚至不能准确地说它是否是一个受欢迎的帖子..对吗?以上是关于基于喜欢、分享和视图的最受欢迎帖子的算法[重复]的主要内容,如果未能解决你的问题,请参考以下文章