首页 > 技术文章 > 基于词向量匹配的对话系统 工程实践

combfish 2017-10-18 17:41 原文

follow:https://github.com/zake7749/Chatbot 
这个台湾作者GitHub的代码和开发日志(如https://zake7749.github.io/2016/08/28/word2vec-with-gensim/  )将聊天系统所需的知识储备以及整个系统框架都描述得特别清楚,他的思路核心是:将用户输入的句子断成若干个词,通过词向量匹配预先设定的主题词,模板以及对话等,在通过若干条设定的对话策略,得到最佳答复。
下载到的代码里其实有三个可以运行的主代码:
    
 1. free chat的demo
    这个demo可算是我碰到的最黄的机器人了,因为语料取自台湾ptt.cc网站的八卦板块
    所以啊,一个优良的语料集是非常重要的,大家不要乱选语料集教坏小孩
       
    思路:
         
 

 2. 基于规则匹配的demo
    这一demo的思路如下:
        
        注:由于作者在整个系统中用的都是繁体字,所以如果用户输入和词向量模型最好统一为繁体,才好实现结果
        作者设定的主题有闹钟(时间),娱乐,住宿,医药,购物,每个主题下有若干个子主题
            
          结果:
                 
    3. 规则+free chat
        这个相当于free chat和规则组合合成的chatbot
        1)首先用户输入,到free chat 的模块,若返回的结果分数高于阈值,则直接回答该结果,否则,到到(2)
        2)规则匹配,匹配上了,则转到task model
        3)task model有以下,每个包含一个py文件,内设置该task下的回复规则,如若是住宿,则会到网上酒店的各种信息
                
                
 

 

 

 
 

 



null


推荐阅读