什么是语义网? [关闭]

Posted

技术标签:

【中文标题】什么是语义网? [关闭]【英文标题】:What is the semantic web? [closed] 【发布时间】:2010-10-18 00:53:59 【问题描述】:

我听说过很多关于语义网的信息,但我仍然不确定它是什么。它将与我们现在所知道的网络有何不同?

【问题讨论】:

【参考方案1】:

最好的解释是举例。尝试googling 用于在网络上宣传的所有发动机小于 2.0 升、无铅运行、有 mp3 连接并且可以在从我家乘坐公共交通工具方便到达的陈列室中看到的汽车。

Google 只是无法帮助您处理该查询,实际上并非如此。您必须自己进行多次搜索并关联结果。在语义网络上,您可以表达对汽车销售产品的兴趣,并添加约束。每个结果都会很有用。一个或多个 UI 可能使您能够做到这一点,有些可能是专门的,有些则完全通用。

另一个示例,创建一个通常不存储在一个地方的事物的图表,例如健怡可乐的受欢迎程度,或者人群中的乡村散步与同一人群中的临床肥胖水平。对于这些,您可能根本不使用 Web 浏览器,但可能会使用 something more like Excel - 但语义 Web 为您提供了工具(SPARQL、RDF),用于查找和操作现有数据且可通过 HTTP 访问。

因此,Bravax 提出的观点并不完全正确,不会有太大的改变——您可能只是获得了一些更有用和更好的混搭网站。或者,您可能会发现自己做了很多在今天之前从未想过与网络相关的事情。

当前的网络有很多替代方法可以做同样的事情,比如动画 GIF、Flash、Silverlight、Dhtml 等。为了将数据放到语义网络上,会有一系列工具和格式。 RDFa 是一个很好的,一种更通用的微格式,但你可以provide a dump 整个数据库,暴露一个SPARQL endpoint,使用微格式或专有的 HTML 结构和add a transformation,会有很多工具适合不同的情况。

所以 Vartec 也部分正确,您可以使用 RDFa 和 eRDF,但也可以使用很多其他东西来发布数据。

请注意,语义网络与另一个更简单的概念 Linked Data 之间有很多重叠之处。它们之间的关系尚不清楚,但我的看法是,在语义 Web 工具和技术有任何作用之前,您需要链接数据网络。关联数据是关于数据的,语义网更多的是关于处理数据、对其进行推理以及处理诸如信任可靠性之类的问题。本质上是the technology stack的底层几层。

【讨论】:

祝最终用户将 SPARQL 查询输入搜索引擎。 我认为用户输入 SPARQL 的频率与他们现在输入 SQL 的频率差不多,尽管可能会稍微频繁一些,因为他们将有更多的数据来吸引他们。我想你有时会惊讶地看到 Excel 电子表格中嵌入了多少 SQL! 我的搜索引擎示例并没有提到 SPARQL.... “关联数据”只是语义网的委婉说法 很有可能,尽管关联数据的人倾向于将“本体”和其他事物看起来有些不同。 Sem Web 的人倾向于从数学/逻辑的角度看待事物。 Linked Data 人是笨拙的程序员的观点。将 Open Link Software 与 Clark 和 Parsia 进行对比。【参考方案2】:

它将与我们现在所知道的网络有何不同?

现在 HTML+CSS 更多地集中在结构和表现上。语义是关于信息的含义。在语义网中,您使用共享的ontologies 来建立对象的含义(语义)和对象之间关系的含义。 最著名的本体是:FOAF 和 Dublin Core。

语义通常用专门的语言表达,例如RDF 或OWL。 RDF 可以使用eRDF 或W3C 的RDFa 嵌入到XHTML 中。

结构较少的 eRDF/RDFa 替代方案是 microformats。

阅读更多: http://en.wikipedia.org/wiki/Semantic_web

【讨论】:

都柏林核心涉及信息资源包含的内容(关于数据/元数据的数据),而不是信息资源之间的关系。有关关系的信息可以使用 ISO 主题图 (en.wikipedia.org/wiki/Topic_Maps) 进行描述。 据我所知 - 语义网更多地涉及数据之间的关系(而不是分类)。 为了完整起见,并且由于示例通常有助于传达概念,您能否使用您提到的一种语言在您的答案中提供一个小代码示例? 语义通常会用专门的语言表达,例如 RDF 或 OWL。 这并不完全正确。由于RDF和OWL的语义共识,语义得以表达。 我认为 Dublin Core 的创建者从未将其视为本体。它只是一个简单的元数据模式。【参考方案3】:

语义网本质上是一个非常简单的想法。 (就像所有的好人一样。)

目前的 Web 由文档组成,文档之间存在链接。谷歌通过使用上下文和链接中的锚文本来确定链接的含义并基于此构建用于检索数据的引擎,从而做出了相当不错的业务。换句话说,谷歌猜测链接的语义是什么。

语义网的想法是“如果输入这些链接会怎样?” Web 上的每个事实都有一个地址 - 一个 URI - 并通过关系 (also URI) 链接到其他事实 (也是 URI)。关系组称为“本体”。

因此,与当前 Web 上的页面 A 链接到页面 B 的链接不同,语义 Web 上的链接更像:

URI A 使用 URI C 类型的链接链接到 URI B。

任何东西都可以有一个 URI。人们可以有 URI;通常我们使用一组称为 FOAF 的关系来描述它们。假设 Jeff Atwood 的 URI 是 http://codinghorror.com/foaf.xml;那么你可以说:

http://codinghorror.com> http://xmlns.com/foaf/0.1/homepage> http://codinghorror.com/foaf.xml>

即http://codinghorror.com是http://codinghorror.com/foaf.xml的内容所代表的人的主页。

现在机器可以读取和查询这些关系,因此您可以将 Web 变成计算机可以立即使用的数据库。 Semantic Web 查询语言是 SPARQL,值得一试。

【讨论】:

【参考方案4】:

语义网就是这样——位于万维网之上的语义(有意义的)层。它是半结构化的 (RDF),它是自描述的(使用 OWL 的本体),并允许资源发现 (SPARQL)。

语义网在“开放世界”假设的前提下工作;仅仅因为没有说明某事并不意味着它不存在,它只是“未知”。这与 mysql 等 RDBMS 中使用的逻辑完全不同。 - 如果缺少某些东西,它就不存在 - “封闭世界”假设。 Prolog 和 DATALOG 是 Close World 逻辑的好例子。

如果您想真正了解底层发生的事情,则需要查看其基础,即描述逻辑。可以在这里找到描述逻辑的一个很好的概述:http://www.inf.unibz.it/~franconi/dl/course/

如果您想了解有关 RDF 的更多信息,请阅读RDF Primer。 RDF Semantics 是另一篇引人入胜的读物。

研究人员基本上已经放弃了语义网的“语义”部分,并决定专注于关联数据 - 如何导航 RDF 三元组,以便我们可以浪费更多的互联网带宽;-)

【讨论】:

【参考方案5】:

目前在 HTML 页面中,我们有描述内容应该如何显示的标记标签,<b>、'<pre> 等。这些标签对它们的内容没有任何意义。

语义网的概念是文档将包含确实暗示其内容含义的 XML 标记。例如<person><firstname>。伟大的想法是 CSS 将能够格式化此类文档,但也可以轻松地从这些文档中提取有意义的信息。

【讨论】:

HTML 元素没有语义意义是一个常见的误解。 HTML 仅涵盖元素相对于文档结构的含义。 HTML 具有以文档为中心的语义而非以数据为中心的语义。 它并没有说 HTML 完全没有语义意义,我说它们对 它们的内容没有任何意义。正如您所说,HTML 是结构化的,对渲染器有意义。 HTML 与内容本身无关。 带有大写 S 的语义网是 RDF。 XML 的使用只是偶然的。 我看不出改变大小写如何改变这个词,或者 RDF 垄断了这个概念。然而,无论您是否订阅“语义”的特定实现,XML 都是传递概念的合理基础。 @AnthonyWJones:公平点,我稍微误读了你的答案!希望阅读这些 cmets 的人能从中学到一些东西。【参考方案6】:

语义网是万维网的发明者蒂姆·伯纳斯-李 (Tim Berners-Lee) 的真正意图,即万维网是一个相互关联的数据的全局图。它是a generalization of a social graph,您可以在其中使用社交数据(使用像FOAF 这样的词汇表)以及任何其他类型的机器可理解的数据并将它们相互连接。向机器描述此信息的标准格式是资源描述格式 (RDF) 和 Web 本体语言 (OWL)。 Web 上已经有很多编码数据,包括一个 RDF 版本的 Wikipedia,称为 DBPedia。

语义网将不同于今天的网络,因为计算机和人类都将理解文档包含哪些内容以及文档之间链接的重要性。这将促进信息处理任务的自动化,包括从可靠来源研究信息。 The full SemWeb stack 包括密码学、证明系统和信任网络。

【讨论】:

【参考方案7】:

Tim Berners-Lee 在他的博文Giant Global Graph(自 2007 年 11 月 21 日起)中对其进行了描述:

三个心理动作:

    互联网:“有趣的不是电缆,而是计算机” (World Wide) Web:“有趣的不是计算机,而是文档” Giant Global Graph:“重要的不是文档,而是文档所涉及的内容”

关于“Giant Global Graph”一词:

现在,我们可以使用 Graph 一词来与 Web 区分开来。

我将此图称为语义网,但也许它应该是巨型全球图!比 WWWW 还差吗? ;-) “语义网”这个术语已经建立了很长时间,我不打算改变它。但是让我们想想它是什么图。 (脚注:“Graph”也恰好是 RDF 规范使用的词,但顺便说一下。当 XML 解析器创建 DOM 树时,RDF 解析器在内存中创建 RDF 图。)

【讨论】:

【参考方案8】:

语义网是迄今为止唯一提出的修复万维网固有设计缺陷的实用解决方案。因为正如我们今天所知,互联网的设计者并没有提供机制来解决支配人类思考和交流方式的基本语言现象,例如同音异义词、同义词等。在互联网上搜索信息会导致大量虚假信息积极的一面。语义网的想法归结为为网络资源分配明确的标识符,这将有助于正确识别它们的含义。如果有一天它成功了,我们可能会忘记通常的谷歌搜索是什么样的,如果失败了,一切都会保持现在的状态。

【讨论】:

【参考方案9】:

这是一个吸引人们兴趣的流行语,类似于Web 2.0

即将来,内容将从演示文稿中分离出来,从而带来更多好处。 实际上,事实是主观的,取决于主持人的真实性和权威性。

换句话说,用户不会看到现在有太大的不同。

【讨论】:

区别在于计算机会知道可靠性和权威性 我对此表示怀疑。这些都是主观术语。 例如“美洲虎”意味着动物、汽车和其他一些东西的事实是主观的吗?以开尔文标度表示的温度是主观的吗?你在说什么? 不,这些不是主观的,但是说***文章(关于美洲虎)是否准确是主观的。未来我们会有一些语义网站,但绝大多数不会。 语义网络允许标记可信赖的来源,这将使它与现在的网络不同,因为您可以将来源检查的任务委托给计算机。【参考方案10】:

语义网是一个分布式信息系统,其中相互关联的数据通过 HTTP 以 RDF 三元组的形式发布。 RDF 三元组由主语、谓语和宾语组成,但可以附加其他内容,例如关于对象自然语言的数据类型和注释。在语义网上,URI 既用作标识符,也用作网络资源的地址。

它与 Web 不同,因为 Web 是文档和应用程序接口的分布式信息系统。

【讨论】:

以上是关于什么是语义网? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

语义网的模型定义

基于本体的语义网生成工具

SPARQL查询语言

[期末复习]《语义网与知识图谱》期末复习

快速启动语义网的最佳 rdf 数据库

我应该优先考虑对我的页面进行语义标记吗?或者语义网是一个永远不会真正落地的好主意?