Twitter数据挖掘：如何使用Python分析大数据

Posted 2020-09-24

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Twitter数据挖掘：如何使用Python分析大数据相关的知识，希望对你有一定的参考价值。

技术分享

我们可以创建变量来存放待拉取的微博数量（即count），以及待拉取的用户（即name）。然后用这两个参数调用user_timeline()函数。下面是更新后的代码（注意，在代码的顶部应该保持认证和API对象的创建）。

# 传入认证信息，并创建API对象 api = tweepy.API(auth) # 待拉取微博的用户 name = "nytimes" # 待拉取的微博数量 tweetCount = 20 # 使用上面的参数，调用user_timeline函数 results = api.user_timeline(id=name, count=tweetCount) # 遍历所拉取的全部微博 for tweet in results: # 打印存在微博对象中的text字段 print tweet.text

输出的结果看起来像这样：http://www.wmyl15.com/

技术分享

这种类型数据的流行应用包括有：

对指定的用户进行分析，分析他们是如何与世界进行互动的

寻找Twitter的影响者并分析他们的粉丝的趋势和互动情况

监控某个用户的粉丝的变化情况

示例3：使用关键字查找微博

这是最后一个示例：获取包含某个关键字的最新的微博。如果想在Twitter世界中监控某个话题，或者甚至想看下你的商业被提到的情况，这都是相当有用的。假设现在想看下Twitter谈论Toptal的情况怎样。

翻阅完Tweept文档，search()函数似乎是完成我们目标的最佳工具。

技术分享

这里最重要的参数是q——查询参数，即要查找的关键字。

还可以设置lang参数，这样就只会取到想要的语言的微博。这里只返回英文（“en”）的微博。

现在可以修改代码，以体现要做的改变。首先创建存放参数（query和language）的变量，然后通过API对象调用相应的函数。最后在循环中也打印了发布微博的用户的终端名称。

# 传入认证信息，并创建API对象 api = tweepy.API(auth) # 你想查找的关键字 query = "Toptal" # 语言代码（遵循ISO 639-1标准） language = "en" # 使用上面的参数，调用user_timeline函数 results = api.search(q=query, lang=language) # 遍历所拉取的全部微博 for tweet in results: # 打印存在微博对象中的text字段 print tweet.user.screen_name,"Tweeted:",tweet.text

最后结果看起来像是这样：

技术分享