语义存储和实体中心

Posted

技术标签:

【中文标题】语义存储和实体中心【英文标题】:Semantic store and entity hub 【发布时间】:2011-08-10 03:28:19 【问题描述】:

我正在开发一个内容平台,该平台应提供语义功能,例如使用 SPARQL 进行查询并为包含的内容提供 rdf 文档。

我会非常感谢一些 澄清以下内容 问题:

我说对了吗,一个实体 hub可以连接几个语义 存储到单一访问点? 如果不是,有什么区别 在语义存储和 实体中心?

您会使用哪些框架 存储内容文档以及 他们的语义注释?

解决方案能够稍后检索文档(html 页面/文档,例如 pdf、doc 等)及其带注释的版本非常重要。

提前致谢,

克里斯

【问题讨论】:

【参考方案1】:

我知道的唯一Entityhub 术语属于Apache Stanbol 项目。这是原始文档中的一段解释 Entityhub 的作用:

Entityhub 提供两项主要服务。 Entityhub 提供 连接到外部链接的开放数据站点以及使用索引 他们在当地。它的服务允许管理站点网络以 消费实体信息并在本地管理实体。

Entityhub 文档:http://incubator.apache.org/stanbol/docs/trunk/entityhub.html

Enhancer Apache Stanbol 组件提供使用 Entityhub 管理的链接开放数据站点提取与提交内容相关的外部实体。这些内容的增强被形成为 RDF 数据。然后,还可以将这些内容项存储在 Apache Stanbol 中,并在 RDF 增强的基础上运行 SPARQL 查询。 Apache Stanbol 的Contenthub 组件还提供了对提交的内容项的分面搜索功能。

Apache Stanbol 的文档:http://incubator.apache.org/stanbol/docs/trunk/

访问正在运行的演示:http://dev.iks-project.eu/

您也可以向stanbol-dev AT incubator.apache.org提问。

【讨论】:

【参考方案2】:

替代建议...

Drupal 7 具有对注释的内置 RDFa 支持,与 Semantic MediaWiki 相比,它更像是一个通用 CMS

更详细...

我不太确定你所说的实体中心是什么意思,你从哪里得到这个定义或者你的意思是什么?

是的,考虑到您的问题上下文,我假设您指的是 RDF 三重存储,可以轻松编写一个连接到多个语义存储的系统?

任何体面的 CMS 都应该为文档分配某种形式的唯一/持久 ID,因此即使您使用的系统本身不支持语义注释,您也可以为此构建自己的扩展。该扩展将简单地将针对文档 ID 的注释存储在您选择的任何存储层中(我假设三重存储是合适的),然后您可以构建适当的查询和表示层,以根据需要查询和查看此数据。

【讨论】:

感谢您的回答。我从 apache stanbol 项目中得到了“实体中心”一词。该项目涉及多个不同的 CMS 实例(其中一些是不同的产品),我的解决方案需要处理这些实例生成的内容。对我来说,理想的解决方案是一个将文档存储与 RDF 三重存储相结合的框架。如果这样的东西不可用,我会建立我的文档存储并将其连接到三重存储。【参考方案3】:

http://semantic-mediawiki.org/wiki/Semantic_MediaWiki

【讨论】:

【参考方案4】:

Apache Stanbol

【讨论】:

【参考方案5】:

您想实现一个扩展了一些语义功能的传统 CMS,还是想构建一个语义 CMS?它可能看起来相同,但实际上是两种完全相反的方法。

【讨论】:

【参考方案6】:

解决方案能够稍后检索文档(html 页面/文档,例如 pdf、doc 等)及其带注释的版本非常重要。

您可以将 Apache Stanbol 与 Alfresco 等符合 JCR/CMIS 的 CMS 集成。要获得自定义注释,我建议根据您的域创建自己的自定义增强引擎(maven 原型)并将其添加到增强引擎链中。

https://stanbol.apache.org/docs/trunk/components/enhancer/

完成后,您可以使用 Stanbol 提供的 REST API 端点来检索 RDF/Turtle 格式的结果。

【讨论】:

以上是关于语义存储和实体中心的主要内容,如果未能解决你的问题,请参考以下文章

Doctrine2:[语义错误] 不能通过标识变量选择实体而不选择至少一个根实体别名

对 Type-graphql 和 Typeorm 实体中的外键字段使用 ID 标量类型在语义上是不是正确?

基于 Java 的词映射(语义)应用程序

LTP 4.0!单模型完成6项自然语言处理任务

容联云AI问鼎“千言数据集—实体链指评测“,持续打造知识语义计算能力

RestKit 删除语义