11.1第一次相似度算法测试结果

Posted yjybupt

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了11.1第一次相似度算法测试结果相关的知识,希望对你有一定的参考价值。

测试文件在result下面,

 

1、word2vec还需要丰富训练数据,去噪音,加入博客,新增加预处理的方法。

 

2、建立评估准确率和召回率的机制

 

3、去除停用词是不是去多了,增加原文打印的结果

 

4、原文521条,最终应跑出(521*520)/2对

以上是关于11.1第一次相似度算法测试结果的主要内容,如果未能解决你的问题,请参考以下文章

文本、语音相似度算法

图片相似度判断

文本挖掘之 文本相似度判定

文本相似度之Sim_hash算法

这已经是字符串相似度算法了吗?

百度面试题 字符串相似度 算法 similar_text 和页面相似度算法