有人可以检查我的tf-idf加权是否正确吗?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了有人可以检查我的tf-idf加权是否正确吗?相关的知识,希望对你有一定的参考价值。

我有15个文档的集合,其中吸烟出现在其中10个文档中,而Health出现在其中2个文档中。

我需要在文档中的tf-idf加权之后检查这些术语的值,其中单词吸烟健康分别出现一次。

我吸烟的结果是0.875,健康的结果是0.176。这些正确吗?

谢谢!

答案

您提供的信息不足以检查。除了包含一个单词的文档数量之外,重要的是要知道它们在每个文档中出现的频率。查阅Wikipedia上的this文章,有一个计算示例。

以上是关于有人可以检查我的tf-idf加权是否正确吗?的主要内容,如果未能解决你的问题,请参考以下文章

如何在 R 中为 tf-idf 加权 dfm 训练朴素贝叶斯分类器?

如何使用朴素贝叶斯实现 TF_IDF 特征加权

MapReduce实现TF-IDF详解

对 TF-IDF 特征向量中的特定特征进行加权,用于 k-means 聚类和余弦相似度

通俗理解TF-IDF

TF-IDF介绍