基于喜欢、分享和视图的最受欢迎帖子的算法[重复]

Posted

技术标签:

【中文标题】基于喜欢、分享和视图的最受欢迎帖子的算法[重复]【英文标题】:Algorithm for most popular posts based on likes, shares and views [duplicate] 【发布时间】:2014-04-13 04:28:23 【问题描述】:

我正在开发一个包含无数故事的网站。各种格式的故事:文本、视频、照片和其他多媒体元素。故事可以根据各种基础进行过滤,其中一些是“新”的,显然首先包含最新的故事,“精选”的故事将手动标记为特色,“流行”的故事我需要提出一个算法。

到目前为止,我正在做的是平均 facebook 喜欢、分享数量(包括 facebook、twitter 或任何其他分享)和观看次数。但这对我来说并不好。因为社交垃圾邮件等原因,对所有三个指标赋予相同的权重年龄听起来并不真实。

期待一些非常好的算法来对故事的受欢迎程度进行排名。

----加法-----

Popularity Algorithm 仅讨论基于“喜欢”的算法,该算法基于将结果分类为时间戳类别:流行于日、周和月。而This 的答案几乎可以回答我的查询,但不完全是因为那里假设了指标。我正在寻找一些具有真实解释的确切指标。例如“facebook *2”,解释为什么 *2 用于 facebook。我希望我现在没有重复!


【问题讨论】:

Popularity Algorithm 仅讨论基于“喜欢”的算法,并且该算法基于将结果分类为时间戳类别:流行于日、周和月。而This 的答案几乎可以回答我的查询,但不完全是因为那里假设了指标。我正在寻找一些具有真实解释的确切指标。例如“facebook *2”,解释为什么 *2 用于 facebook。我希望我现在没有重复! 【参考方案1】:

我建议尝试使用 regression algorithm。使用最广泛的是 linear regression,但如果该模型不适合 - 请随意探索其他模型。

    首先,确定每个故事的特征。你的特点是 喜欢,推文,分享,意见,....我还要添加一个布尔指标 (变量只能是 0 或 1 的值)用于每种类型 (视频/照片/...)。 接下来,为自己创建一个训练集 - 这是一组故事 您(或其他人类专家)评分的地方。 现在,使用这些特征和训练集 - 使用一些回归 算法来创建最适合您必须的功能的模型 您已经评分的示例。1 拥有模型后 - 您可以使用它为所有其他人打分 文件。

关于垃圾邮件发送者检测 - 您可以尝试异常检测算法


(1) 实际上,第 2 步和第 3 步可以一起完成 - 使用主动回归技术 - 在主动回归中,学习器(算法)会要求您提供可以使算法尽可能快地学习的示例。根据我的实验,PAlice 是一种性能非常好的主动回归算法。

【讨论】:

但是人工根据点赞数和点赞数手动给帖子打分不是很难吗?我的意思是人类甚至不能准确地说它是否是一个受欢迎的帖子..对吗?

以上是关于基于喜欢、分享和视图的最受欢迎帖子的算法[重复]的主要内容,如果未能解决你的问题,请参考以下文章

2017年最受欢迎的UI框架

markdown 适用于后端和前端开发人员的最受欢迎的Google Chrome扩展程序。

如何确定给定 npm 包的最受欢迎版本?

每行红移数据库中列出的最受欢迎的类别

如何显示特定类别中最受欢迎的帖子

在我的朋友网络中找到最受欢迎的赞