基于短文本的标签推荐算法
Posted 红楼明月
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于短文本的标签推荐算法相关的知识,希望对你有一定的参考价值。
在做从用户输入的短文本识别小区的名字时,一直没有想到一种比较好的算法,最后用正则和模式匹配实现了,准确率还可以。
不过,实现是实现了,但是维护起来却是非常的麻烦,修东墙漏西墙,拣了芝麻丢了西瓜的事情不少发生,这是基于规则的系统的通病。这个问题比较复杂的地方在于:
短文本,上下文没有,但是人类却还是可以判断的
使用关键词提取算法,无论是TFIDF还是textrank都是没有用的
分类算法也基本用不上,因为类别不确定,而且类别的数量很大
相似性算法,这个倒是可以使用一下,实现的时候也部分使用了,但是构造样本库的成本相当大
网上搜索,貌似也没找到太多有效的信息,或许研究这个的不多,或许搜索的关键词有问题。
显示中,类似这样的场景其实是非常多的,我们有一小部分的经验样本数据,希望快速将这部分经验应用到大量的观测数据中。
以上是关于基于短文本的标签推荐算法的主要内容,如果未能解决你的问题,请参考以下文章