使用 WEKA 进行词义消歧

Posted

技术标签:

【中文标题】使用 WEKA 进行词义消歧【英文标题】:Word sense disambiguation using WEKA 【发布时间】:2015-01-08 10:16:34 【问题描述】:

我有一个训练数据集和一个测试数据集。我们如何进行实验并获得结果? WEKA也可以用吗?

主题是使用支持向量机监督学习方法的词义消歧

这两个集合中的文档类型包括以下文件类型: 1. 2个XML文件 2. 自述文件 3. SENSEMAP 格式 4.火车格式 5.KEY格式 6.WORDS格式

【问题讨论】:

【参考方案1】:

像 SVM 这样的机器学习方法在词义消歧方面并不受欢迎。 你知道Wikify吗,映射到***可以认为是非常精细的词义消歧。 在这种情况下回答您的问题;任何机器学习技术都可以给你想要的结果。人们应该更担心要提取的特征,并确保单词特征足够独特,可以在您选择的级别上解决歧义。例如在句子中:Wish you a very Happy Christamas 你只想将Happy Christmas 区分为书籍或节日。

【讨论】:

从我参考过的各种论文中发现,SVM 是词义消歧的最佳方法之一。 我想知道如果我有使用 WEKA 或 R 的训练集,是否可以评估测试集? 评估测试集是什么意思?你的测试集是什么(任何链接?)反正我以前从未使用过 WEKA。 好吧,如果不是 WEKA,R?我将 Senseval-3 EnglishLS 用作训练和测试数据集

以上是关于使用 WEKA 进行词义消歧的主要内容,如果未能解决你的问题,请参考以下文章

NLP第十篇-语义分析

词义消歧

词义消歧

自然语言处理NLP之主题模型LDA(Latent Dirichlet Allocation)语义分析词义消歧词语相似度

第八篇:词汇语义

机器学习新手项目之N-gram分词