以 JSON 格式获取 Twitter 订阅源,无需身份验证
Posted
技术标签:
【中文标题】以 JSON 格式获取 Twitter 订阅源,无需身份验证【英文标题】:Get Twitter Feed as JSON without authentication 【发布时间】:2012-11-07 09:41:12 【问题描述】:几年前我写了一个小的 javascript,它抓取了用户(我的)最近的一条推文,然后将其解析出来以显示,包括链接、日期等。
它使用这个 json 调用来检索推文,但它不再起作用了。
http://twitter.com/statuses/user_timeline/radfan.json
它现在返回错误:
"errors":["message":"Sorry, that page does not exist","code":34]
我已经研究过使用 api 版本(代码如下),但这需要身份验证,我宁愿避免这样做,因为它只是在我的网站上显示我的最新推文,无论如何在我的个人资料页面上都是公开的:
http://api.twitter.com/1/statuses/radfan.json
我没有跟上 Twitter 的 API 更改,因为我不再真正使用它,有没有办法解决这个问题,还是不再可能?
【问题讨论】:
不能再这样做了。以下是现在的操作方法:***.com/questions/17049821/… @SimonBarker 可以使用 json 调用来检索推文。我刚刚发布了一个关于它的答案 【参考方案1】:以前,Search API 是唯一不需要某种形式的 OAuth 的 Twitter API。现在它确实需要身份验证。
Twitter 的 Search API 是通过第三方收购获得的 - 他们很少支持它,而且似乎对它的存在不感兴趣。最重要的是,有效载荷有许多限制,包括但不限于 JSON 或 XMLkey:value 对的严重减少/strong> 文件返回。
当我听到这句话时,我感到很震惊。我花了很长时间弄清楚如何使用最少的代码来执行一个简单的 GET 请求(例如显示时间线)。
我决定采用 OAuth 路线来确保相关的有效负载。您需要一种服务器端语言来执行此操作。 JavaScript 对最终用户可见,因此在 .js 文件中包含必要的 keys 和 secrets 是个坏主意。
我不想使用大型库,所以我的答案是 PHP 和 @Rivers 的答案 here 的帮助。 @lackovic10 下面的答案描述了如何在您的身份验证中包含查询。
我希望这可以帮助其他人节省思考如何使用 Twitter 的 API 和新的 OAuth 要求的时间。
【讨论】:
根据this page,现在连搜索方法都需要认证。 是的,没错。现在所有 Twitter API 都需要 OAuth。我的印象是,在 Ruby 上完成 OAuth 比在 php 上要容易得多,如果有人试图决定如何最好地处理它。【参考方案2】:您无需登录即可通过高级搜索访问和抓取 Twitter:
https://twitter.com/search-advancedGET 请求
执行基本搜索请求时,您会得到:
https://twitter.com/search?q=Babylon%205&src=typd
q(我们的查询编码)
src(假设是查询的来源,即输入)
默认情况下,Twitter 返回前 25 个结果,但如果您点击
all
你可以获得实时推文:
https://twitter.com/search?f=realtime&q=Babylon%205&src=typd
JSON 内容
更多推文通过 AJAX 加载到页面上:
https://twitter.com/i/search/timeline?f=realtime&q=Babylon%205&src=typd&include_available_features=1&include_entities=1&last_note_ts=85&max_position=TWEET-553069642609344512-553159310448918528-BD1UO2FFu9QAAAAAAAAETAAAAAcAAAASAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
使用max_position
请求下一条推文
下面的 json 数组返回所有你需要抓取的内容:
https://twitter.com/i/search/timeline?f=realtime&q=Babylon%205&src=typd
has_more_items (bool)
items_html (html)
max_position(键)
refresh_cursor(键)
DOM 元素
这里有一个DOM elements
列表,您可以使用它来提取
作者推特句柄
div.original-tweet[data-tweet-id]
作者姓名
div.original-tweet[data-name]
作者的用户ID
div.original-tweet[data-user-id]
帖子的时间戳
span._timestamp[data-time]
帖子的时间戳,以毫秒为单位
span._timestamp[data-time-ms]
推文文本
p.tweet-text
转发次数
span.ProfileTweet-action–retweet > span.ProfileTweet-actionCount[data-tweet-stat-count]
收藏数量
span.ProfileTweet-action–favorite > span.ProfileTweet-actionCount[data-tweet-stat-count]
资源
https://code.recuweb.com/2015/scraping-tweets-directly-from-twitter-without-authentication/【讨论】:
当我尝试“twitter.com/i/search/…”时。它没有给出scroll_cursor。如何获取下一页内容。 @KishoreKumarSuthar 检查帖子底部链接的博客。它现在使用 max_position 而不是 scroll_cursor。我已经相应地更新了答案。 应该注意的是,由于 CORS 强制,这个解决方案对于任何基于 JS 的东西都没有用。 确实是一个服务器端的解决方案,例如与file_get_contents()
一起使用
如何按最近日期排序推文?【参考方案3】:
如果您仍在寻找 JSON 中未经身份验证的推文,这应该可以: https://github.com/cosmocatalano/tweet-2-json
【讨论】:
【参考方案4】:正如您在 the documentation 中看到的,使用 REST API 您需要 OAuth Tokens 才能执行此操作。幸运的是,我们可以使用 the Search(不使用 OAuth)并使用 from:[USERNAME]
运算符
示例:
http://search.twitter.com/search.json?q=from:marcofolio
将为您提供一个 JSON 对象,其中包含来自该用户的推文,其中
object.results[0]
会给你最后一条推文。
【讨论】:
所有 API 方法现在都需要身份验证。 @PaulSchreiber 我只是发布了一个已弃用的替代方案:http://search.twitter.com/search.json?q=
看起来像这样,因为 1.1 对 api 的请求必须被识别。 dev.twitter.com/rest/public/search: "请注意,现在 API v1.1 要求请求必须经过身份验证"
这对我来说效果很好,希望对某人有所帮助! github.com/jasonmayes/Twitter-Post-Fetcher
"errors":["code":215,"message":"Bad Authentication data."]【参考方案5】:
您可以使用 twitter api v1 获取推文,而无需使用 OAuth。例如:this 链接变成了 @jack 的最后 100 条推文。
时间线文档是here。
【讨论】:
"Twitter REST API v1 不再有效。请迁移到 API v1.1。dev.twitter.com/docs/api/1.1/overview。"【参考方案6】:这是一个快速的 hack(真的是一个 hack,应该谨慎使用,因为它不是未来的证明),它使用 http://anyorigin.com 来抓取 Twitter 网站以获取最新的推文。
http://codepen.io/JonOlick/pen/XJaXBd
它的工作原理是使用 anyorigin(您必须付费才能使用它)来获取 HTML。然后它使用 jquery 解析 HTML 以提取相关的推文。
移动网站上的推文使用 .tweet-text 类的 div,所以这很容易。
相关代码如下:
$.getJSON('http://anyorigin.com/get?url=mobile.twitter.com/JonOlick&callback=?', function(data)
// Remap ... utf8 encoding to ascii.
var bar = data.contents;
bar = bar.replace(/…/g, '...');
var el = $( '<div></div>' );
el.html(bar);
// Change all links to point back at twitter
$('.twitter-atreply', el).each(function(i)
$(this).attr('href', "https://twitter.com" + $(this).attr('href'))
);
// For all tweets
$('.tweet-text', el).each(function(i)
// We only care about the first 4 tweets
if(i < 4)
var foo = $(this).html();
$('#test').html($('#test').html() + "<div class=ProfileTweet><div class=ProfileTweet-contents>" + foo + "</div></div><br>");
);
);
【讨论】:
【参考方案7】:您可以使用 Twitter API 包装器,例如 TweetJS.com,它提供一组有限的 Twitter API 功能,但不需要身份验证。是这样称呼的;
TweetJs.ListTweetsOnUserTimeline("PetrucciMusic",
function (data)
console.log(data);
);
【讨论】:
【参考方案8】:方法“GET statuses/user_timeline”需要一个用户认证,你可以在官方文档上看到:
您可以使用不需要身份验证的搜索方法“GET 搜索”。
您有一个从这里开始的代码:http://jsfiddle.net/73L4c/6/
function searchTwitter(query)
$.ajax(
url: 'http://search.twitter.com/search.json?' + jQuery.param(query),
dataType: 'jsonp',
success: function(data)
var tweets = $('#tweets');
tweets.html('');
for (res in data['results'])
tweets.append('<div>' + data['results'][res]['from_user'] + ' wrote: <p>' + data['results'][res]['text'] + '</p></div><br />');
);
$(document).ready(function()
$('#submit').click(function()
var params =
q: $('#query').val(),
rpp: 5
;
// alert(jQuery.param(params));
searchTwitter(params);
);
)
【讨论】:
盗自***.com/questions/8890257/…以上是关于以 JSON 格式获取 Twitter 订阅源,无需身份验证的主要内容,如果未能解决你的问题,请参考以下文章
来自 mysql/JSON 的 twitter bootstrap typeahead 源
如何获取用户名以响应在iOS应用程序中获取组的订阅源的请求? [重复]