如何使用 imdb Movie_Reviews 语料库在 SVM 分类 (NLP) 中实现否定特征

Posted

技术标签:

【中文标题】如何使用 imdb Movie_Reviews 语料库在 SVM 分类 (NLP) 中实现否定特征【英文标题】:How to implement Negation Features in SVM classification (NLP) using imdb Movie_Reviews corpus 【发布时间】:2015-03-05 07:08:24 【问题描述】:

我想了解 NLP 中的否定功能,所以我想实现它。 我正在研究 imdb 电影评论数据集。 考虑我的数据如下-

Movie was great but it's overly sentimental and at times terribly mushy , not to mention very manipulative but great action

从上面我可以提取出它过于感伤,有时非常糊状作为负面陈述,现在我有这些选择-

我提取了特定的行,直到它以一些标点符号和 我只是从肯定语句中删除这一行并运行 SVM 分类器 其余内容。 我提取了特定的行并用否定标记该行和 将其添加到否定陈述列表中以对其进行训练。

我不确定我是否在这里做任何事情,所以请确切建议我应该如何处理否定特征以即兴分类。

我正在使用 scikit-learn svm.SVC() 分类器

【问题讨论】:

【参考方案1】:

您可以检查此NRC Sentiment Analysis 系统以使用否定进行文本分类。解释得很好。他们还声称他们的SemEval 2014 submission 在否定处理方面有重大改进(我还没有读过)。

我假设您正在解决电影评论方面的类似任务,所以这一定是您正在寻找的。​​p>

【讨论】:

以上是关于如何使用 imdb Movie_Reviews 语料库在 SVM 分类 (NLP) 中实现否定特征的主要内容,如果未能解决你的问题,请参考以下文章

在 NLTK 中使用我自己的语料库而不是 movie_reviews 语料库进行分类

如何加速imdb的初始化

如何将 odoo 与 IMDb 集成?

遗弃.Forsaken.2015.BluRay.720p.x264.DTS-beAst

给定一个 IMDB 电影 ID,我如何以编程方式获取其海报图像?

您将如何计算 IMDB 电影评分?