哪些 Python 贝叶斯文本分类模块类似于 dbacl?

Posted

技术标签:

【中文标题】哪些 Python 贝叶斯文本分类模块类似于 dbacl?【英文标题】:Which Python Bayesian text classification modules are similar to dbacl? 【发布时间】:2010-10-17 00:16:31 【问题描述】:

快速的 Google 搜索显示,有大量的贝叶斯分类器以 Python 模块的形式实现。如果我想要类似于dbacl 的封装的高级功能,哪些模块适合我?

培训

% dbacl -l one sample1.txt
% dbacl -l two sample2.txt

分类

% dbacl -c one -c two sample3.txt -v
one

【问题讨论】:

【参考方案1】:

我想您会发现nltk 很有帮助。具体来说,classify module。

【讨论】:

我不相信 NLTK 包含特征选择算法,但它具有频率分布工具等,因此您可以自己编写并将其提供给您选择的分类器。【参考方案2】:

如果您尝试检测语言 this 即使是很短的文字也能正常工作。

这个 api 和你的很接近,但是 我不知道它是否称为贝叶斯分类器。

【讨论】:

【参考方案3】:

试试Mallet 和LingPipe。他们为分类器提供了更多的模型。

【讨论】:

这些是 Java 库,而不是 Python。

以上是关于哪些 Python 贝叶斯文本分类模块类似于 dbacl?的主要内容,如果未能解决你的问题,请参考以下文章

文本分类-贝叶斯分类器

《机器学习实战》基于朴素贝叶斯分类算法构建文本分类器的Python实现

python实现随机森林逻辑回归和朴素贝叶斯的新闻文本分类

Python微调文本顺序对抗朴素贝叶斯算法垃圾邮件分类机制

4 基于概率论的分类方法:朴素贝叶斯

Python 中使用朴素贝叶斯进行简单文本分类 - KeyError