2018.12.18 丨 壹佰案例

TOP100summit分享实录 | 「来也」胡一川:吾来对话机器人解决方案

2018.12.18 丨 壹佰案例


本文内容节选自由msup主办的第七届TOP100summit,「来也」联合创始人兼CTO胡一川分享的《吾来对话机器人解决方案》实录。


分享者胡一川,「来也」联合创始人兼CTO,本科和硕士毕业于清华大学,博士毕业于宾夕法尼亚大学,创立「来也」之前,曾联合创立了影视推荐引擎”今晚看啥”并被百度收购,后加入百度任资深架构师。



编者按:2018年11月30日-12月3日,第七届全球软件案例研究峰会在北京国家会议中心盛大开幕,现场解读2018年「壹佰案例榜单」。本文为「来也」联合创始人兼CTO胡一川老师分享的《吾来对话机器人解决方案》案例实录。


今天在座的各位大部分是IT行业技术从业者,所以我会重点介绍对话式人工智能中的核心技术,并通过吾来对话机器人解决方案,让大家了解我们如何使用这些技术,去解决不同场景中人机对话的问题。


首先,简单做一个自我介绍。我是胡一川,「来也」的联合创始人和CTO。「来也」主要做智能对话的技术,为企业和个人打造智能对话机器人。今天,我重点分享我们面向企业的对话机器人解决方案“吾来”,它的核心价值在于将对话式的AI能力产品化,帮助企业解决在各种业务场景中打造对话机器人,提升效率。


适合对话机器人的三类场景


我们将适合对话机器人落地的场景分为三类第一类是一些人机交互方式比较受限的场景,比如在车载、智能音箱、可穿戴设备等,在这些场景中自然对话是唯一的体验较好的人机交互方式,因此对话机器人非常重要。第二类是生活中一些发生在人与人之间的简单重复的交互场景,在这些场景中,我们可以用对话机器人替代人工,比如在线客服、呼叫中心等。第三类场景是将对话机器人和传统图形化交互界面相结合,这更多是在一些营销和推荐场景,通过增加自然对话的交互方式让用户的体验变得更好,从而提升转化率。


三种不同的对话类型


从技术的角度,我们通常将对话分为三种类型:问答型对话、任务型对话、闲聊。


问答型对话用户有一个问题,希望对话机器人进行交互寻求关于这个问题的答案。机器人的回复来自于特定领域的知识库,机器人的效果以回答准确率来评估。


任务型对话:用户有一个意图,希望对话机器人帮他完成一个任务。机器人通过多轮对话引导、澄清并满足用户需求。在任务型对话中,机器人的效果以任务完成率来评估。


闲聊:像大家平常生活中的寒暄,例如,微软小冰就属于闲聊机器人。这种机器人是以相关性,趣味性作为评估的指标。


接下来,我将分别介绍这些对话机器人背后用到的技术、算法和模型。


基于知识库的问答型对话


下图是基于知识库的问答型对话。基于这个系统的问答机器人本质是在特定领域的知识库中,找到和用户提出的问题语义匹配的知识点。

在吾来对话机器人解决方案中,我们针对不同的情况选择相应的问答型对话解决方案,包括:基于分类模型的问答系统、基于检索和排序的问答系统、基于句向量的语义检索系统。


基于分类模型的问答系统


第一种方案,基于分类模型的问答系统将每个知识点各分一类,使用深度学习、机器学习等方法,效果较好。但需要较多的训练数据,且更新类别时,重新训练的成本较高,因此更适合数据足够多的静态知识库。


基于检索和排序的问答系统



第二种方案,基于检索和排序的问答系统能实时追踪知识点的增删,从而有效弥补分类模型存在的问题。但仍然存在检索召回问题,假如用户输入的关键词没有命中知识库,系统就无法找到合适的答案。


基于句向量的语义检索


第三种方案,是基于句向量的语义检索。通过句向量编码器,将知识库数据和用户问题作为语义向量输出,基于句向量的语义检索能实现在全量数据上的高效搜索,从而解决传统检索的召回问题。


这个架构最核心的模块是句向量编码器,它需要通过标注的句对数据来训练,基本原理如下图所示:


任务型对话系统的架构


任务机器人在特定条件下提供信息或服务,以满足用户的特定需求,例如查流量、充话费、订机票、订餐、等等。由于用户需求复杂多样,任务机器人一般通过多轮对话明确用户的目的。


下图是传统的任务型对话的整体架构,分为5个模块,分别是:语音识别(ASR)、语义理解(NLU)、对话管理(DM)、语言生成(NLG)、语音合成(TTS)。


我今天重点为大家讲述NLU模块和DM模块相关的内容。如下图所示,NLU模块的输入是用户所说的自然语言,它的输出是可被计算机处理的结构化信息,我们称为用户对话动作(User Dialog Act)。用户对话动作又会作为DM模块的输入。基于当前的对话状态,以及当前的用户对话动作,DM模块确定系统对话动作。系统对话动作确定后,对话状态也随着发生变化。


接下来我们来讲一讲关于DM的常见技术方案和模型:


第一种方案是基于有限状态机(Finite State Machine)的对话管理,它把对话状态都映射为系统动作,状态之间的跳转以用户当前的输入作为条件,然后通过有限状态机映射到下一个状态。这种方案只适合特定的对话类型,状态太多时很难维护。


第二种方案是基于帧(Frame)的对话管理。帧的定义是槽位的集合,槽位代表的是用户需要提供的信息。通过这种方式,对话状态被简化成了哪些槽位已经被填充,哪些槽位没有被填充,而系统的动作选择就是下一步应该填充哪一个槽位。这种方案虽然简单,但也有很多局限性,只适合较为简单的任务型对话场景。


第三种方案是基于计划(Agenda)的对话管理。这种方案是对Frame的改进,把它从一个没有逻辑关系的平级槽位变成一个树状的结构。这种树状的结构里面是有层次的,而且树状结构是可以动态调整的。


第四种方案是基于深度强化学习的对话状态跟踪,通过神经网络将对话上文映射到系统动作,无需显示定义对话状态。这是基于机器学习的方法,需要有大量真实的、标注的对话数据,所以不太适合冷启动。


针对不同场景,我们有什么解决方案?


场景一:智能客服


在客服场景下,对话机器人有两个用途:

1、通过对话机器人7×24实时的满足用户关于业务咨询、业务办理等方面的需求,提升用户的体验。

2、对话机器人能够提供人机协作的模式,作为人工客服的助手来减轻客服的负担,提升客服的工作效率。同时它还能完成智能质检工作,保障服务质量。



基于吾来对话机器人解决方案,我们为中国移动10086App打造了在线智能客服及个性化推荐服务。该对话机器人可为用户提供充流量、充话费等服务,既提高了服务效率也提升了用户体验。


场景二:智能下单


在图形化的用户下单的操作界面中,如果加入对话机器人,能提高用户的操作效率,实现“一句话下单”,并给用户更为个性化的体验。对话机器人能够识别多种的表达方式,利用自然语言主动交互与多轮对话控制,引导用户下单,从而提升订单的转化率,同时提升用户的满意度。



基于吾来对话机器人解决方案,我们为麦当劳打造了智能对话点餐机器人。该机器人支持对话流中的餐品查询,通过主动澄清的方式逐步引导用户下单,成为图形化交互界面的有益补充。



场景三:智能营销


在线营销的场景下,对话机器人通过检测访客行为,能主动发起关怀,提高用户激活率;同时,对话机器人还能提供全天候服务,捕获高质量销售线索,提高营销转化效率。




基于吾来对话机器人解决方案,我们为学旅家打造了销售线索生成机器人。该机器人可逐步引导用户提供基本信息及偏好,生成高质量线索表单,方便销售人员进行更有针对性的线索转化。


总结


在未来,越来越多的企业/个人会把对话机器人用于工作和生活中。一个对话机器人能否成功落地,在我看来主要有两点:一是对话机器人有清晰的领域边界,即对话机器人能干什么,不能干什么,需要事先想清楚;二是收集足够多的领域数据,这样才能训练出的一个具有语义理解、多轮对话能力的对话机器人,满足用户的需求。


以上内容来自胡一川老师的分享。


媒体联系

票务咨询:赵丹丹 15802217295

赞助咨询:郭艳慧 13043218801

媒体支持:景    怡 13920859305