pysparnn 模块使用,相似句子召回

Posted liuxinyu12378

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pysparnn 模块使用,相似句子召回相关的知识,希望对你有一定的参考价值。

import pysparnn.cluster_index as ci
from sklearn.feature_extraction.text import TfidfVectorizer

data = [
    "hello world",
    "oh hello there",
    "Play it",
    "Play it again Sam",
]


tv = TfidfVectorizer()
tv.fit(data)
#特征向量
features_vec = tv.transform(data)

#建立搜索索引
cp = ci.MultiClusterIndex(features_vec,data)

#搜索带有索引的
search_data = [
    "oh there",
    "Play it again Frank"
]

search_feature_vec = tv.transform(search_data)

#k是返回的个数,k_clusters代表聚类的个数
print(cp.search(search_feature_vec,k = 1,k_clusters=2,return_distance=False))

[[‘oh hello there‘], [‘Play it again Sam‘]]

  

以上是关于pysparnn 模块使用,相似句子召回的主要内容,如果未能解决你的问题,请参考以下文章

qa问答机器人pysparnn问题的召回

问答机器人召回优化

推荐系统的召回

个性化召回算法实践——item2vec

使用 C++ 反转句子中的每个单词需要对我的代码片段进行代码优化

DSSM:深度语义匹配模型(及其变体CLSMLSTM-DSSM)