您将如何计算 IMDB 电影评分?

Posted

技术标签:

【中文标题】您将如何计算 IMDB 电影评分?【英文标题】:How would YOU compute IMDB movie rating? 【发布时间】:2011-04-12 16:03:54 【问题描述】:

我这样做只是为了学习目的。我无意颠倒 IMDB 的方法。

我问自己我拥有 IMDB 或类似网站。如何计算电影评分?

我能想到的只有加权平均(这不过是算术平均值

对于下面提供的电影数据,计算将是

(38591*10 + 27994*9 + 32732*8 + 17864*7 + 7361*6 + 2965*5 + 1562*4 + 1073*3 + 891*2 + 3401*1) / 134434 = 8.17055953


我的评分 8.17055953 与 IMDB 评分不匹配(=加权平均)。所以我的结论是我在这里遗漏了一些东西,或者我的分数不是一个理想的分数。我可能会错过很多东西。

    我的分数有什么问题?为什么不理想? 如果你必须计算。你会怎么做?

【问题讨论】:

Everyone: claws 询问顶部/底部列表的排名机制。这个问题是关于 IMDb 如何将算术平均值转换为加权平均值。以“马诺斯:命运之手”为例——未加权平均为 2.1,加权平均为 1.5。 (或“教父”,选票填充的另一个例子。) 【参考方案1】:

不完全是主题,但对你有用:

How the ranking is calculated.

希望对你有帮助。

附:此页面已确认:

IMDB Chart

【讨论】:

我发现 Wikipedia 页面有点难以理解(不是精算师),但在 IMDB 页面底部有一些东西 - 在 Top 250 页面底部写着“真正的贝叶斯估计”和提供与***相同的公式......我发现这个页面更容易阅读:wiki.answers.com/Q/… 这篇文章不那么啰嗦,而且更容易理解,感谢您的链接:)【参考方案2】:

首先:您的计算(这是一个un加权平均值,或简单的平均值)有一个错字:您有19562'4'评级,但您应该有1562。更正此结果为 ~8.17,与 IMDB 的算术平均值相同。

接下来,如果您确实想要一个加权平均值,那么您需要一些可以衡量的东西!因此,例如,如果用户有“声誉”或类似的(甚至只是注册的时间长度),您可以将其用作他们评分权重的乘数。最后,除以权重总和而不是总票数,得到加权平均值。

可能需要某种重量的比例因子 - 例如,如果 SO 做了这样的事情,Jon Skeet 的观点可能有点不公平,要承受 20 万倍的重量新注册用户的意见:)

【讨论】:

以上是关于您将如何计算 IMDB 电影评分?的主要内容,如果未能解决你的问题,请参考以下文章

IMDb 评级:只保留不同的记录

IMDB 投票与评分的 matplotlib 图

电影评分那些事

IMDB Top 250 与豆瓣电影250的比较?

利用 Python 分析 MovieLens 1M 数据集

如何根据条件删除结果以计算平均和特定电影