如何检索资源的 og/meta 属性?
Posted
技术标签:
【中文标题】如何检索资源的 og/meta 属性?【英文标题】:How can I retrieve og/meta attributes of a resource? 【发布时间】:2013-10-19 05:26:52 【问题描述】:我正在制作一个应用程序来检索用户 Twitter 上的推文。
这些供稿包含指向外部资源的链接,例如文章、网页或 YouTube 视频。
我通过 Twitter API 获得了这些提要的 JSON,但没有包含内容的 og:
属性。我想抓住它们并在我的网站上展示。
如this***的问题:
<meta name="og:type" content="website" />
<meta name="og:image" content="http://cdn.sstatic.net/***/img/apple-touch-icon@2.png?v=fde65a5a78c6"/>
<meta name="og:title" content="How can I check classes that ends with?" />
<meta name="og:description" content="I have some elements such as:
&lt;div class="button 17-facebook-dashboard-check"&gt;Elem1&lt;div&gt;
&lt;div class="button 18-google-dashboard-check"&gt;Elem2&lt;div&gt;
&lt;div class="button " />
<meta name="og:url" content="https://***.com/questions/19001883/how-can-i-check-classes-that-ends-with"/>
我想在每条推文上捕获每个共享资源的这些信息。
所以我想我会为每条推文(对我来说是一个盒子)做一个ajax请求客户端,下载html并解析它,检索og:title
、og:description
、og:type
和og:image
。
这是最好的方法吗?用 javascript/Jquery 解析这些数据怎么样?
【问题讨论】:
【参考方案1】:这些og:
属性是Open Graph Protocol 属性,有很多方法可以获得这些数据:你应该检查Open Graph Protocol parser 的代码,这可能对你很有用,还有这个php and jQuery Facebook link parser。
您还可以查看有关 PHP 解析的 *** Question 和 Opengraph PHP parser 并通过 ajax 调用动态使用它们。
最后,这个关于 JQuery 和纯 JavaScript 解析的*** question 非常有趣,可以真正帮助您。
希望你能找到你需要的东西! ;)
【讨论】:
【参考方案2】:免责声明:OpenGraph.io 是我从事并支持的商业产品。
正如您所提到的,通常没有 OG 标签可以使用。您可能会遇到各种情况(例如编码、滥用 HTML 标签等)。如果你想处理边缘情况,我推荐http://www.opengraph.io/
它的一个主要好处是,如果 OpenGraph 标记不存在,它将从页面内容中推断出标题或描述(如果您最终需要它)等信息。
要获取有关网站使用的信息(链接应该是 URL 编码的):
$.ajax('http://opengraph.io/api/1.0/site/http%3A%2F%2Fwww.washingtontimes.com%2F')
.done(function(data)
console.log(data);
);
这将返回如下内容:
"hybridGraph":
"title": "Washington Times - Politics, Breaking News, US and World News",
"description": "The Washington Times delivers breaking news and commentary on the issues that affect the future of our nation.",
"image": "http://twt-assets.washtimes.com/v4/images/logo-twt.4b20fb5d7b29.svg",
"url": "http://www.washingtontimes.com/",
"type": "site",
"site_name": "Washington Times "
,
"openGraph": ...,
"htmlInferred": ...,
"requestInfo": ...
【讨论】:
【参考方案3】:任何发现此问题并正在寻找使用浏览器控制台(Chrome 或其他)获取 OG(开放图)元数据值的方法的人都可以使用 ES6 JavaScript 来完成。
例子:
要获取“描述”标签(这也将返回 WordPress 网站的站点署名),请使用我写的这个单行代码 sn-p 来做到这一点:
document.querySelectorAll('meta[property="og:description"]')[0]
这并没有解决使用 Ajax 从服务器远程抓取东西的问题,这只是一个基于浏览器的解决方案。
这是另一个简单的例子。假设您想要获取所有元数据属性并将它们存储在可以传递的对象中。这在一个好的 WordPress 网站上最容易测试,但只要有开放的图形元标记,它就可以工作。
/*
10/01/18
Eric Hepperle
Grab all OG Meta Tags values on a webpage
Total time spent to create and test: 1 hr.
*/
console.clear();
// Store all our properties in one object
var ogWebsite = ;
//var metas = document.querySelectorAll('meta[property="og:description"]')[0]
var metaTags = document.querySelectorAll('meta');
var propTagCount = 0;
[...metaTags].forEach(function(tag, i)
// console.log(tag);
if (tag.hasAttribute('property'))
var propName = tag.getAttribute('property');
// console.log("%c\t%s", "background: orange; color: black", propName);
console.log(propName);
// Get the value of the OG property attribute
var ogMetaValue = document.querySelectorAll("meta[property='" + propName +"']")[0].content;
console.log("%cogMetaValue: %s","background: purple; color: white;", ogMetaValue);
// Add property to ogWebsite object. We can do this because
// ES6 (2015) allows varible keys with object literals.
// To work, you must use bracket "[]" notation instead of dots.
ogWebsite[propName] = ogMetaValue;
++propTagCount;
);
console.log("%cTotal meta tags: %s", "background: bisque; color: brown; font-weight: bold;", metaTags.length);
console.log("%cTotal meta tags with 'property' attribute: %s", "background: cadetblue; color: white; font-weight: bold;", propTagCount);
// Display the final object:
console.log(ogWebsite);
【讨论】:
以上是关于如何检索资源的 og/meta 属性?的主要内容,如果未能解决你的问题,请参考以下文章