基于词向量匹配的对话系统 工程实践
Posted 梳下鱼
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于词向量匹配的对话系统 工程实践相关的知识,希望对你有一定的参考价值。
这个台湾作者GitHub的代码和开发日志(如https://zake7749.github.io/2016/08/28/word2vec-with-gensim/ )将聊天系统所需的知识储备以及整个系统框架都描述得特别清楚,他的思路核心是:将用户输入的句子断成若干个词,通过词向量匹配预先设定的主题词,模板以及对话等,在通过若干条设定的对话策略,得到最佳答复。
下载到的代码里其实有三个可以运行的主代码:
1. free chat的demo
这个demo可算是我碰到的最黄的机器人了,因为语料取自台湾ptt.cc网站的八卦板块
所以啊,一个优良的语料集是非常重要的,大家不要乱选语料集教坏小孩
思路:
2. 基于规则匹配的demo
这一demo的思路如下:
注:由于作者在整个系统中用的都是繁体字,所以如果用户输入和词向量模型最好统一为繁体,才好实现结果
作者设定的主题有闹钟(时间),娱乐,住宿,医药,购物,每个主题下有若干个子主题:
结果:
3. 规则+free chat
这个相当于free chat和规则组合合成的chatbot
1)首先用户输入,到free chat 的模块,若返回的结果分数高于阈值,则直接回答该结果,否则,到到(2)
2)规则匹配,匹配上了,则转到task model
3)task model有以下,每个包含一个py文件,内设置该task下的回复规则,如若是住宿,则会到网上酒店的各种信息
以上是关于基于词向量匹配的对话系统 工程实践的主要内容,如果未能解决你的问题,请参考以下文章