使用朴素贝叶斯分类器进行意见挖掘

Posted

技术标签:

【中文标题】使用朴素贝叶斯分类器进行意见挖掘【英文标题】:opinin mining using naive bayes classifier 【发布时间】:2015-02-25 07:34:26 【问题描述】:

我正在将推文分类为正面或负面意见。我听说朴素贝叶斯分类器通常用于分类,我想为我的项目编写自己的朴素贝叶斯分类器。因为,我是数据挖掘的新手,而且朴素贝叶斯分类器无法理解什么以及如何使用朴素贝叶斯。谁能帮我解决??

【问题讨论】:

【参考方案1】:

首先,分类器需要用已经分类的数据进行训练,越多越好;例如,您需要 100 条正面推文和另外 100 条负面推文。

如果您使用的是 python,则可以从 NLTK 及其庞大的 corpora 集合开始

有关实际示例,另请参阅question。

【讨论】:

这只是个人选择,也取决于您的实际知识。如果您已经使用 java,我建议您使用完全用 java 编写的 Stanford University CoreNLP;另一方面,对于 python,您可以从 NLTK 或 pattern 开始。就我而言,我更喜欢 python 而不是 java(也因为它是一种解释型语言)

以上是关于使用朴素贝叶斯分类器进行意见挖掘的主要内容,如果未能解决你的问题,请参考以下文章

数据挖掘十大经典算法之朴素贝叶斯

数据挖掘-贝叶斯分类器

贝叶斯分类器(3)朴素贝叶斯分类器

数据挖掘之八——朴素贝叶斯分类器

数据挖掘中的朴素贝叶斯分类器

Python小案例:朴素贝叶斯分类器