如何让TF-IDF学习具有更高优先级的文档的一部分?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何让TF-IDF学习具有更高优先级的文档的一部分?相关的知识,希望对你有一定的参考价值。
我使用sklearn
的TfIdf。
我想学习文档之间的相似性。但是,这些文档包含的标题比文档的其他部分带来更多信息。
是否有可能告诉TF-IDF,例如,如果标题中出现一个单词,那么它应该比其他地方的同一个单词更重要吗?
谢谢
答案
不。但是你可以单独对你的标题进行TFIDF并对该向量/矩阵应用偏差计算,以便在将其加入到其他向量/矩阵之前对其进行增强。
以上是关于如何让TF-IDF学习具有更高优先级的文档的一部分?的主要内容,如果未能解决你的问题,请参考以下文章
JS中的CSS,如何让props.className成为优先类
机器学习入门-文本数据-构造Tf-idf词袋模型(词频和逆文档频率) 1.TfidfVectorizer(构造tf-idf词袋模型)
机器学习入门-文本数据-构造Tf-idf词袋模型(词频和逆文档频率) 1.TfidfVectorizer(构造tf-idf词袋模型)