分析影响水平
Posted
技术标签:
【中文标题】分析影响水平【英文标题】:Analyzing influence level 【发布时间】:2013-01-02 11:24:39 【问题描述】:我正在使用 Ipython 并通过库 Twython 我能够使用用户名获取推文。 是否可以分析影响度量(例如我正在检索其推文的人的影响力)或推文的影响是什么
谢谢
【问题讨论】:
【参考方案1】:您的问题的简短回答是,是的,您当然可以通过 Twitter 数据以某种方式衡量影响力。另一方面,您可能应该充分考虑如何将影响力理解为一个指标,这与您的数据有何关系,以及您将如何衡量数据中的影响力。
您可能会考虑以下几点:
1.) 除了为单个用户提取推文外,您可能还想提取他们的个人资料信息(例如,关注者数量、推文总数等)。通过将这些数据与推文中的元数据相结合,您将拥有更多的乐趣。
2.) 考虑逐个查看以下一些数据点:
转发推文的份额:假设您为个人拉入 1000 条推文;您可以确定转发这些推文的百分比(例如,这些推文中有多少百分比影响他人转发)。 每条转发推文的平均转发次数:当该人被转发时,是只有一两个人转发了他/她,还是有 hudnreds? 关注者数量:这个数据点本身就可以告诉您一些事情。一般来说,拥有更多关注者的人可能比拥有更少关注者的人更有影响力。3.) 您还应该考虑主题相关性。如果某人在 Twitter 上被大量转发并且拥有大量追随者,是因为与他们的职业相关的推文,还是因为他们写了关于猫的文章?根据您的用例和业务逻辑,这类问题可能很关键。
这些只是一些起点。我会花一些时间查看 Twitter REST API 1.1 文档和 Twython 文档,以便您更好地了解哪些数据点可用,然后考虑这些数据点如何有助于您衡量影响力。
祝你好运。
编辑 如果我理解正确,vishal1985,在您的评论中,您是在询问如何使用 Twython 来收集有关转推的信息。这可能意味着几件事之一,但我认为您要问的是如何获取我列出的一些数据点(例如,上面的“转发推文的分享”)。
在这里,我再次向您指出 Twython 和 Twitter API Documentation,如果您打算大量使用此类数据,您真的应该了解它们。但为了给您指明正确的方向,您可以通过以下方法确定作者的原始推文被其他人转发的百分比。
from twython import Twython
from __future__ import division #assuming you're using Python 2.X
t = Twython(app_key='...',
app_secret='...',
oauth_token = '...',
oauth_token_secret = '...') #supply your credentials for each of these
tweets = t.getUserTimeline(screen_name='justinbieber', include_retweets=False) #see note below
retweeted_tweets = 0
for tweet in tweets:
if tweet['retweet_count']> 0: #...if at least one person has retweeted the tweet
retweeted_tweets += 1
share_tweets_retweeted = retweeted_tweets/len(tweets)
#e.g., #number retweeted divided by total number of sampled tweets
这些步骤的作用是提取多达 200 条出现在用户时间线中的推文。 include_retweets=False 部分可能看起来令人困惑,但它是必要的。这样做是排除其他人写的你感兴趣的作者(在本例中为贾斯汀比伯)转推的推文,因为你想知道有多少人在他或她写原创内容时转推你的作者。我们遍历用户的时间线,并确定他们的推文被至少一个人转发的数量。然后,我们将其除以采样推文的总数,得到转发的份额。
请注意,这没有考虑分页(例如,在时间轴的多个页面中导航 - 您一次只能从时间轴请求 200 条推文,总共最多 5000 条),这是您需要做的事情d 可能要实施。希望这会有所帮助。
【讨论】:
感谢本杰明的回答,但使用twython如何收集转发。通过Twython很容易获得关注者数量 @vishal1985,请参阅我上面的编辑,它为您提供了一些关于如何使用 Twython 获取转发数据的指导。鉴于您最初的问题并不是关于如何使用 Twython,而是关于如何衡量对 Twitter 的影响,我建议针对有关 Twython 本身的任何问题打开一个新问题。我相信我的原始帖子回答了您最初的问题——如果您同意,您介意选择我的答案吗? :) 感谢本杰明的努力和简单的解释。如果一个人有更多的转发,我们可以将他/她视为一个有影响力的人,或者是其他一些指标。请你能澄清这一点 嘿本杰明,还有一件事我得到的推文只有 15-20。有没有其他方法可以增加到 100-220 以及如何获得转发的文字谢谢以上是关于分析影响水平的主要内容,如果未能解决你的问题,请参考以下文章