如何使用 imdb Movie_Reviews 语料库在 SVM 分类 (NLP) 中实现否定特征
Posted
技术标签:
【中文标题】如何使用 imdb Movie_Reviews 语料库在 SVM 分类 (NLP) 中实现否定特征【英文标题】:How to implement Negation Features in SVM classification (NLP) using imdb Movie_Reviews corpus 【发布时间】:2015-03-05 07:08:24 【问题描述】:我想了解 NLP 中的否定功能,所以我想实现它。 我正在研究 imdb 电影评论数据集。 考虑我的数据如下-
Movie was great but it's overly sentimental and at times terribly mushy , not to mention very manipulative but great action
从上面我可以提取出它过于感伤,有时非常糊状作为负面陈述,现在我有这些选择-
我提取了特定的行,直到它以一些标点符号和 我只是从肯定语句中删除这一行并运行 SVM 分类器 其余内容。 我提取了特定的行并用否定标记该行和 将其添加到否定陈述列表中以对其进行训练。我不确定我是否在这里做任何事情,所以请确切建议我应该如何处理否定特征以即兴分类。
我正在使用 scikit-learn svm.SVC() 分类器
【问题讨论】:
【参考方案1】:您可以检查此NRC Sentiment Analysis 系统以使用否定进行文本分类。解释得很好。他们还声称他们的SemEval 2014 submission 在否定处理方面有重大改进(我还没有读过)。
我假设您正在解决电影评论方面的类似任务,所以这一定是您正在寻找的。p>
【讨论】:
以上是关于如何使用 imdb Movie_Reviews 语料库在 SVM 分类 (NLP) 中实现否定特征的主要内容,如果未能解决你的问题,请参考以下文章
在 NLTK 中使用我自己的语料库而不是 movie_reviews 语料库进行分类
遗弃.Forsaken.2015.BluRay.720p.x264.DTS-beAst