如何获取 Twitter 上发布的签到推文的地理位置和地点 ID
Posted
技术标签:
【中文标题】如何获取 Twitter 上发布的签到推文的地理位置和地点 ID【英文标题】:How to get geo location and venue id of a checkin tweet posted onTwitter 【发布时间】:2012-03-20 13:07:41 【问题描述】:Twitter 上发布了数千条 4sq 签到推文。这些推文都包含指向foursquare.com的链接。
链接,例如,https://foursquare.com/donnyndra/checkin/4f60500ae4b02a8707007b93?s=ogf_jvcuoha1T0QUfIRVWGupvuc&ref=tw,有一个签入 ID 和一个签名。
我在 4sq.com 上阅读了API doc,发现如果我想提出入住详情请求,需要一个代理用户。
这是否意味着我必须让进行签入验证的用户对我的应用进行访问? 但是我收集了数千条签到推文只是为了研究,不能让 4sq.com 用户进行身份验证。
有什么办法可以解决这个问题吗? 我只有:
签到ID和签名 client_id 和 client_secret既然我有签到的链接,我应该解析链接后面的页面以获得我想要的吗?有什么更好的方法吗?我的研究项目中使用了 Java 语言。
我真的很需要你的帮助!提前致谢!
【问题讨论】:
【参考方案1】:正如您所说,让用户通过 API 对您进行身份验证以访问他们的帐户不是一种选择,您可以做的唯一一件事就是尝试抓取链接后面的页面.
也就是说,如果这样做不违反 4sq 的服务条款,我会非常感到惊讶。此外,如果违反第三方公司的服务条款,您很可能会导致您的研究无效。
您最好联系 4sq,看看他们是否会让您使用(或者更有可能购买)他们数据的匿名子集。这样一来,您就可以非常了解公司,并且还可以获得使用他们数据的许可。
【讨论】:
哦...我需要另一种方法来收集不违反 TOS 的数据,或者干脆结束我的研究项目。无论如何,我真的很感谢你的回答。 您好 Tranq,请参阅 ***.com/questions/8206849/… 了解更多详情以上是关于如何获取 Twitter 上发布的签到推文的地理位置和地点 ID的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 twint 库为整个国家/地区抓取 twitter