常用相似度语料

Posted rise0111

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了常用相似度语料相关的知识,希望对你有一定的参考价值。

英文语料

  • MPRC
    • 二分类 0101
      技术图片
    • 训练集4700条 测试机1700条

中文语料

  • 微众银行 共10000条数据

以上是关于常用相似度语料的主要内容,如果未能解决你的问题,请参考以下文章

使用 quanteda 在 R 中的大型语料库上计算余弦相似度

jieba gensim 相似度实现

中文句子相似度之計算與應用

基于Gensim的文本相似度计算

Python 文本相似度分析

百度 AnyQ 配置说明