这篇文章是对一些BOT相关的报道和文章的摘录和翻译,介绍了近期Dialogue System和ChatBot的发展趋势。
应用趋势
社交媒体如今茁壮发展,占据着越来越多的市场份额。一些大的公司如Facebook等投入巨资研究开发chatbot平台,这样以允许一些商业公司通过这样的平台和用户直接交流。这种交互模式将会发挥很大的作用,并且会变得越来越普遍。目前来看,这方面的发展会有三种趋势。[1]
- 信息服务操作系统化:信息的交流将会成为一个平台
- 应用问题:用户不希望安装一个新的APP
- 交流接口:在线服务接口将会使用新的模型
信息服务操作系统化
人们对信息应用 (Message APPs) 的依赖很大,这种对话的交互模式对于用户来说很自然,用户也不愿意脱离这样的框架去做其他的操作。比如说我们熟知的“点外卖”,我们就很难在微信里面直接完成这样的操作而不得不跳出到其他的应用比如“百度外卖”或者“饿了么”,这对于用户来说是不太方便的。(虽然也没有很不方便,但是多个操作总是会损失一些便利性。)另一方面,我们确实可以在微信中完成很多的事情,比如购物(京东内嵌在微信中);联系客服(很多公司都有了微信端的公众号或者服务号,可以完成一些客服操作);或者订房订票等,这样的操作是很便利的。不过这一点和BOT的关系还不是特别大,在业界的“寓言”中,将来对话式的操作才是这些服务的主流交互方式。商家都集成在相应的聊天对象中,就像我们请人帮我们订餐、订票一样方便自然,这也是BOT的热门研究方向。
总而言之,将来信息服务会作为一个和操作系统类似的大平台,依此完成一系列的操作。
解决应用问题
由于服务的细分,不同的服务领域、公司都会开发自己的APP。用户使用不同的服务就不得不安装新的应用然后在不同的应用中跳来跳去。此外,开发一个好用的APP本身就是一个难题。据调查,智能手机用户平均每个月安装0个应用,且通常只使用5~10个应用[2]。这说明,如果不同的服务是分散在不同的APP里的,那么对于企业来说,它很难有机会被用户用到。
BOT系统在这方面有很大的优势——用户不再需要安装新的APP,而是通过聊天交互的形式直接完成服务。
新交互接口的浮现
早期计算机的交互接口是黑漆漆的命令行(当然现在也还在实用中),后来进化到了图形界面,用户操作更加便利和直观。BOT是展望中的新接口,现在也已经初露端倪。近几年,苹果、微软、FB等巨头都推出了自己的语音助手,希望能够通过对话直接解决需求。手机经历了按键交互模式和屏幕交互模式,再到如今正在发展的语音对话交互模式;可穿戴智能设备(如智能手表)并没有足够的空间可控手指操控,而体感能提供的信息量又不够大,我们可以预料将来后者会逐渐成为主流。
小结
- 对话机器人(BOT)会是下一波信息热潮的载体(当前是APP)
- 它将能整合碎片化的信息市场
- 它还有待研究,巨头们已经开始布局,相信爆发不会太久
研究趋势
人机对话系统作为一个研究方向已经存在了很长时间[3],从对话目的的角度可以分为任务型对话系统和非任务型对话系统,从形式上可以分为聊天系统和问答系统。对话系统的研究目的就是使得人机对话想人人对话一样有效、快捷和自然从而的达到好的人机交互效果。[4]
读者也许会疑惑,前文提到的具有如此广阔天地的聊天机器人既然这么早就开始被研究,可为什么先在才崭露头角呢?其实不是的,聊天机器人很早就出现在人机交互的舞台上了。
对话系统的沉浮
早在1966年,MIT人工智能实验室就已经推出了对话程序Eliza,她仅仅能够简单地回复一些对话(图1)。在2000年ActiveBuddy在AIM上发表了SmarterChild这个对话机器人,随后被广泛应用在不同的领域引起了不小的风潮,这股风潮很快吹到了MSN上。后来微软收购了ActiveBuddy,更名为Colloquis,退出了MSN对话机器人。这个对话对话机器人已经具备“指令对话”的能力。[5]
同样,在大陆也发展出了各式各样的聊天机器人,包括清华大学图书馆推出的“小图”,和依托人人网而更加出名的“小黄鸡”。这两个聊天机器人可以作为任务型和聊天型对话系统的代表,前者也可以回答一些任务无关的话题,不过主要还是用于解答一些关于图书馆服务的问题;后者则能够更巧妙地和人聊天。
一度兴起的聊天机器人在智能手机普及后陷入低迷,因为丰富易用的APP极大地满足了人们对于新媒体的需求。相比之下,还很“弱智”的对话系统则显得不那么好用。近些年,机器学习技术发展尤其是深度学习的崛起大大促进了很多人工智能领域的研究,自然也包括对话机器人。所以在近几年的国际会议上,我们可以看到很多以对话、问答、聊天、语义理解为主题的论文被发表。市场和研究是相互促进的,在巨头的推动下将会有更多资源投入这一方面的研究,而研究成果又能够迅速地被这些企业投入使用。