聊天机器人(chatbot),也被称为会话代理,现已成为了一个热门话题。微软在聊天机器人上押上了重注,Facebook(M)、苹果(Siri)、谷歌 和 Slack 等公司也是如此。 新一波创业者们正在尝试改变消费者与服务的交互方式。
Chatbot Research More Info 请点击
| No. | 模块 | 描述 |
|---|---|---|
| 1 | 前端 | App H5/ios/android ... |
| 2 | 业务系统 | account, speech recognition and synthesis |
| 3 | 语言理解 | lexical analysis |
| 4 | 问答模块 | search content |
| 5 | 聊天模块 | chatbot model |
| 6 | 数据分析 | history data |
2.1 表结构定义
一期只做单轮问答,根据用户输入语句进行一次性回答,识别到推荐语义时搜索内部数据生成回答返回给用户。
后期可扩展此模块,可搜索其他数据(比如 客服系统等)支持更多业务,也可深入研究进行多轮问答。
内部数据需要新增多个索引方便搜索数据,
根据词法分析结果,理解用户意图,具体详见流程图部分
3.1.2.1 否定语义理解
判断语句是否包含否定词,若包含则属于否定语义,进行否定场景回复
3.1.2.2 推荐语义理解
- 判断语句是否包含优惠词,若包含则提取优惠词,属于推荐语义
- 遍历语句所有名词,形容词,判断是否命中分类词 category
- 遍历语句所有名词,判断是否命中券店关键词 coupon, shop etc.
- 提前排序规则,分类,券店关键词
3.1.2.3 系统功能直达
我的卡包
3.1.2.4 闲聊
其他情况认为闲聊
| No. | Title | Desc |
|---|---|---|
| 一期 | tuling 123 | 图灵机器人(tuling123) |
| 二期 | new_seq2seq_chatbot | 基于深度学习的seq2seq模型 |
数据存储类型
按照时间目录2017/11/01这样的年/月/日的方式存放
数据结构设计
| key | user_id | device_id | agent | ip | phone | type | question | answer | longitude_latitude | city_code | city_name | district_code | district_name | send_time |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | user001 | sn001 | huawei | 192.168.1.184 | 15788900001 | 湖滨银泰有哪些优惠券 | 1 | [120.164993,30.287061] | 330100 | 杭州市 | 330104 | 江干区 | 2017-11-01 10:00:00 |

