分类 LDA 与 TFIDF

Posted

技术标签:

【中文标题】分类 LDA 与 TFIDF【英文标题】:Classification LDA vs. TFIDF 【发布时间】:2017-04-20 13:41:41 【问题描述】:

我在文本数据上运行多标签分类时,我注意到 TFIDF 的性能大大优于 LDA。 TFIDF 准确度约为 50%,LDA 约为 29%。

这是预期的还是 LDA 应该做得比这更好?

【问题讨论】:

【参考方案1】:

LDA 通常用于无监督学习,而不是用于分类。它提供了一个生成模型,而不是判别模型 (What is the difference between a Generative and Discriminative Algorithm?),这使得它不太适合分类。 LDA 对数据预处理和模型参数也很敏感。

【讨论】:

以上是关于分类 LDA 与 TFIDF的主要内容,如果未能解决你的问题,请参考以下文章

如何获得经过训练的 LDA 分类器的特征权重

自然语言处理开源书籍

什么是 LDA 分类的简单解释 [关闭]

论文写作分析之五《融合类别特征扩展与N-gram子词过滤的fastText短文本分类》

论文写作分析之五《融合类别特征扩展与N-gram子词过滤的fastText短文本分类》

基于机器学习和TFIDF的情感分类算法,详解自然语言处理