可用于对文本进行语义分析的工具

Posted

技术标签:

【中文标题】可用于对文本进行语义分析的工具【英文标题】:Tools available to do semantic analysis of text 【发布时间】:2010-12-15 14:43:34 【问题描述】:

我正在寻找代码或产品或服务来对文本(句子和/或段落)进行语义分析,以按一般主题对文本进行分类,例如

财务 娱乐 技术 商务 艺术 等等……

【问题讨论】:

【参考方案1】:

如果您有一堆已经分类的示例,您可以使用这些示例来训练分类器。 这是一个非常简单的文档分类问题,任何一套机器学习工具都将包含用于此的算法和教程。例如,查看 weka:http://www.cs.waikato.ac.nz/ml/weka/

或快速矿工:http://rapid-i.com/content/blogcategory/38/69/

如果您的需求有限,并且只想要一个简单的 API,那么这个朴素贝叶斯库就不会出错:https://ci-bayes.dev.java.net/

祝你好运!

【讨论】:

【参考方案2】:

如果您想评估商业服务 API,请查看 VIKI 引擎 API: http://www.softwareevolution.it/en/products/viki-core-api.html

它是一个易于使用的具有特定语义特征的 Json 服务 API。

【讨论】:

【参考方案3】:

这对你有帮助吗?

http://en.wikipedia.org/wiki/Document_classification

它不是成品或服务,也不是代码,但它描述了可用于语义分析的各种算法。进一步搜索,我相信它还没有真正走出实验室。人们大多在试验 KNN 算法,结果很酷,但并不是你真正需要的:

http://www.ebi.ac.uk/webservices/whatizit/info.jsf

但如果有一些软件可以满足您的要求,它会在这个列表中:

http://www.kdnuggets.com/software/text.html

例如LPU程序,如果你给它足够的教学文件,它似乎可以学习。

http://www.cs.uic.edu/~liub/LPU/LPU-download.html

【讨论】:

【参考方案4】:

如果您喜欢 Python/解释性语言,请查看 nltk.org 上出色的 NLTK 框架。它具有出色的分页方法和最近出版的 O'Reilly 书籍。

如果您喜欢 Java 和/或需要更成熟但更难掌握的框架,请尝试使用 GATE。

【讨论】:

以上是关于可用于对文本进行语义分析的工具的主要内容,如果未能解决你的问题,请参考以下文章

潜在语义分析的介绍

NLP工具

语义分析的语言?

用R对Twitter用户的编程语言语义分析

C# 中的语义分析

语义网络分析需要建立语料库吗