Ontology/semantics/OWL/RDF 有啥杀手级应用吗? [关闭]

Posted

技术标签:

【中文标题】Ontology/semantics/OWL/RDF 有啥杀手级应用吗? [关闭]【英文标题】:Is there any killer application for Ontology/semantics/OWL/RDF yet? [closed]Ontology/semantics/OWL/RDF 有什么杀手级应用吗? [关闭] 【发布时间】:2011-02-02 08:44:54 【问题描述】:

在网上阅读了很多书籍、博客和文章后,我对语义技术产生了兴趣,他们说它将使数据机器可以理解,让智能代理进行出色的推理、自动化和动态的服务组合等。

我仍然在阅读 2 年以来的相同内容。文章/博客/语义会议的数量大幅增加。但我仍然看不到任何杀手级应用程序。为什么会这样?或者是否有一些应用程序/产品(商业/开源)已经存在,实际上正在做所有被吹嘘的事情?

更准确地说,是否有任何产品利用语义技术(尤其是 RDF/OWL/SPARQL)并提供功能/性能/可维护性,这是现有(非语义)技术无法实现的?一些完全依赖语义技术并真正为客户增加价值并产生收入的产品?

【问题讨论】:

@narnirajesh:我编辑了你的帖子,写了“不”而不是“数字”,这几乎使句子不可读。然后一个'?够了:不用写“??????”也不是“??????”。现在回答您的问题,“是否有任何产品利用语义技术(尤其是 RDF/OWL/SPARQL)” 我很想回答 Web 2.0 没有充分利用流行语 -合规技术,但别担心,我们正在为 Web 3.0 引进无知的顾问,他们将使用 MDA 在心跳中编写利用流行语的敏捷软件。 感谢您的编辑 :) 我没有完全理解您的语义技术方面的 cmets。能详细点吗? 【参考方案1】:

语义网依赖于内容提供者努力正确注释所有内容以使其机器可读。

对于大多数不是图书馆员的人来说,这工作量太大了。

真正的杀手级应用似乎是无需特殊标记即可从非结构化内容中获取语义的东西。例如,看看谷歌在其搜索引擎上所做的惊人工作。

为了使系统正常工作,它不能给用户带来沉重的负担。

中间立场是像 *** 上的标记系统。它们工作得很好,即使标签完全是临时的并且部分不一致。

【讨论】:

最好的办法是,如果您可以让原始信息的来源在创建时添加语义标签。语义标签相对于普通标签的优势在于它们不那么模棱两可。 如果您需要有人审查所有内容以放入语义标签,您的系统将无法扩展。因此,除非系统使用起来非常自然,以至于原始来源会标记所有内容,否则它不会工作。 有很多信息已经有语义结构,只是没有标准化的形式。 IMO 将自然语言内容“语义化”是一个白日梦,但如果所有公共数据库都提供 RDF 表示,它仍然非常有用。 您知道 Google 现在使用微格式和 RDFa 作为向搜索结果添加结构化信息的一种方式吗? 对不起,但这只是一个神话和对语义网络技术的误解:“语义网络依赖于内容提供者努力正确注释所有内容。这对大多数人来说工作量太大了不是图书馆员的人。”它没有,也不是。有很多方法可以在不让内容提供者(手动)标记内容的情况下获得正确的数据注释。现有数据库、(社交)标签、表单填写等。人们在 Facebook 和 Google+ 上填写表单,这是对数据的正确结构化,但似乎并没有阻止他们这样做。【参考方案2】:

对于需要强大查询的许多地方来说,深度语义支持很有趣。一个例子是在我最近工作的project 中,用于查找将工作负载分派到哪里的服务是基于语义的。 RDF/SPARQL 本身很有趣,因为它立即为您提供了非常丰富的查询,但是当您在其中添加 OWL 本体时,它会变得更好,因为这意味着您可以回答更丰富的查询(即,提出更接近用户的问题– 以及他们的雇主 – 真正想要的),同时允许服务提供商更清楚地表达他们所提供的内容。这并不是说这意味着每个人都告诉每个人一切,根本没有。相反,我们让各方描述提供了哪些服务,而不是他们使用什么配置来提供这些服务。这一切都得益于在整个信息系统中普遍使用的语义技术。

目前我正在研究Taverna,它现在使用 RDF 来提供增强的日志记录系统;特别是,用户(尤其是科学家)可以更轻松地搜索记录的大量信息,而不是只通过一个巨大的文本文件grep。毕竟,如果你不得不使用文本挖掘来找出你的文本挖掘工作流程中到底发生了什么,那就有点荒谬了……

【讨论】:

【参考方案3】:

我认为Drupal 7 有机会成为杀手级语义应用程序,它是具有相当大的安装基础的 CMS 的下一个版本,当发布完成并且每个人都开始升级突然,大量网站将自动暴露 RDF无需用户干预的嵌入式RDFa形式。

从商业角度来看,我认为 linked data 之类的东西 GoodRelations 是一个潜在的杀手级应用,例如,请参阅这些 Scott Brinker 和 Priyank Mohan 博客文章,其中讨论了 BestBuy 如何在启动后体验到 30% 的流量增长在他们的网页中嵌入基于linked data 的GoodRelations 作为RDFa。

一般来说,linked data 是一种使用机器可读数据扩充您的网站的绝佳方式,并且在您的网站的可见性方面显示出显着的效果,我最近看到了来自 BBC 的一些演示文稿,他们的wildlife finder 应用程序(一个使用 BBC 自然历史资源的链接数据应用程序)在 Google 搜索结果中已经超过了一些 Wikipedia 页面的动物

【讨论】:

GoodRelations 可能真的是杀手级应用 - 如果 SEO 真的受到语义网络兼容性的帮助,它将释放大量开发人员和 SEO 人员来实现它,当然 Google 已经开始使用 Product搜索 - support.google.com/webmasters/bin/…【参考方案4】:

在生物学领域,对 RDF 及相关技术的兴趣非常高。人们想要更少的解析和自定义代码来集成数据,以及更高级的查询。 RDF 已经提供了前者;例如,最大的生物医学资源之一UniProtKB 正在 RDF 中提供他们的数据。对于高级查询,我们还没有完成,因为良好的 RDF 数据和 OWL 本体的性能和可用性仍然有些欠缺。但它正在开始,请查看BioGateway 了解可以做什么的示例。

因此,这些技术的成果不是单个杀手级应用程序,而是研究人员可以探索数据而不是编写临时脚本和设置临时 SQL 数据库和所有这些管道的所有累积时间节省。

【讨论】:

真的!生命科学似乎是大部分语义工作发生的地方。在这种情况下,我想问你——生物数据是否比大多数数据库中的传统业务/交易数据更适合本体? 一般来说,是的。它只是更加复杂和相互关联。在数据结构的层面上,它比 SQL 的行更适合 RDF 的图。此外,世界各地的人们都在使用彼此的数据,因此使用 URI 全局寻址任何资源并将信息添加到现有图表的可能性是致命的。在传统的商业应用中,数据保留在内部。 见http://biodiversity.org.au/name/Dodonaea%20viscosa.rdf【参考方案5】:

AceWiki 给我留下了深刻的印象。它是尝试对人们输入的信息进行语义组织的几个 wiki 项目之一。

这项工作仍在进行中,并有一些限制。例如,它只允许人们输入符合英语词汇和语法子集的句子。

但是,我希望这些起飞。那里有如此大量的免费数据(例如 Wikipedia),我们无法创建程序来对其进行推理,因为内容太嘈杂。

【讨论】:

【参考方案6】:

刚刚发现DBpedia。将 Wikipedia 中的大量数据表示为 RDF 是一个很有前途的尝试。您可以将整个提取文件下载为 16GB 文件,但它也有一个 keyword search page。表示为 RDF 允许非常具体的“语义”查询。 This 显示了一些示例查询,例如如何找到员工人数超过 50000 的公司的官方网站列表。您甚至可以使用任何可以与其公共 API 接口的包装器(例如 this Python module)远程查询“云”。

【讨论】:

【参考方案7】:

Protege 适合开发本体。

【讨论】:

以上是关于Ontology/semantics/OWL/RDF 有啥杀手级应用吗? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章