如何让TF-IDF学习具有更高优先级的文档的一部分?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何让TF-IDF学习具有更高优先级的文档的一部分?相关的知识,希望对你有一定的参考价值。

我使用sklearn的TfIdf。

我想学习文档之间的相似性。但是,这些文档包含的标题比文档的其他部分带来更多信息。

是否有可能告诉TF-IDF,例如,如果标题中出现一个单词,那么它应该比其他地方的同一个单词更重要吗?

谢谢

答案

不。但是你可以单独对你的标题进行TFIDF并对该向量/矩阵应用偏差计算,以便在将其加入到其他向量/矩阵之前对其进行增强。

以上是关于如何让TF-IDF学习具有更高优先级的文档的一部分?的主要内容,如果未能解决你的问题,请参考以下文章

如何计算查询的 TF-IDF?

JS中的CSS,如何让props.className成为优先类

具有大或小的语料库大小的 Tf-idf

机器学习入门-文本数据-构造Tf-idf词袋模型(词频和逆文档频率) 1.TfidfVectorizer(构造tf-idf词袋模型)

机器学习入门-文本数据-构造Tf-idf词袋模型(词频和逆文档频率) 1.TfidfVectorizer(构造tf-idf词袋模型)

如何使 TF-IDF 矩阵密集?