分类 LDA 与 TFIDF
Posted
技术标签:
【中文标题】分类 LDA 与 TFIDF【英文标题】:Classification LDA vs. TFIDF 【发布时间】:2017-04-20 13:41:41 【问题描述】:我在文本数据上运行多标签分类时,我注意到 TFIDF 的性能大大优于 LDA。 TFIDF 准确度约为 50%,LDA 约为 29%。
这是预期的还是 LDA 应该做得比这更好?
【问题讨论】:
【参考方案1】:LDA 通常用于无监督学习,而不是用于分类。它提供了一个生成模型,而不是判别模型 (What is the difference between a Generative and Discriminative Algorithm?),这使得它不太适合分类。 LDA 对数据预处理和模型参数也很敏感。
【讨论】:
以上是关于分类 LDA 与 TFIDF的主要内容,如果未能解决你的问题,请参考以下文章
论文写作分析之五《融合类别特征扩展与N-gram子词过滤的fastText短文本分类》