1
人工智能
1.8.7 7.情绪识别:识别技术的更高阶段

7.情绪识别:识别技术的更高阶段

对于人工智能,一方面人们在努力使它具备超越人类的感知计算能力;另一方面人们还在努力使它与人类更加接近——这其中就包括具备与人一样的情感交流功能,这种功能能满足人的情感和心理需求。可以说,只有能与人类进行情感交流的人工智能,才称得上真正意义上的人工智能。而要做到这一步,首先相关研究人员就得从情绪识别技术上取得突破。

所谓人工智能情绪识别,指的是用人工的方法和技术让机器具有人类式的情感,使它能够理解、识别和表达喜怒哀乐之类的情绪,从而延伸和扩展人的情感。行业内普遍存在的观点认为,人工智能的情绪识别,必须建立在语音识别技术、图形识别技术获得长足发展的基础上。只有这样,机器人才能在大数据的支持下,更加精准地对微表情进行捕捉,对情绪进行判断。可以说,要想让机器人能够走进家庭提供服务,情感识别功能是其必备的能力。

情感是人类对外界事物所产生的主观反应。它通常通过人的面部表情、声音变化、肢体动作等表现出来,情绪发生变化时,会对心脏、四肢和大脑等器官产生影响。缘于人们各自的特质和经历的不同,对于同样的外部变化,所产生的情绪会各不相同。从连话也不会说的小孩到不同年龄层次的人,都会对他人的情绪变化轻易觉察到。但对机器来说,到目前为止,即使是拥有最高水平的人工智能,也不具备像人一样的情绪识别能力。那么,如何才能让人工智能具有人一样的情绪识别能力呢?

从方法上来说,人工智能理解人类情绪,同样是看脸、看动作和听声音。人的情绪变化会呈现出不同的面部表情,会改变人说话的语速和声音高低。在这一过程中,人工智能通过识别这些信息来判断人的情绪。在这方面,人工智能有一个明显的优势是,往往人们觉察不到别人故意控制的情绪变化,而它能觉察到,甚至有时哪怕是一闪而过的极微小的破绽,人工智能都可以通过高速摄像机和高性能处理器来完成情绪的识别。

从技术发展来看,仅解决了语音输入的问题还远不足以解决情绪识别。人类获取外界信息,91%是通过视觉。机器要想和人类有情感上的交互,就必须具有强大的视觉系统。在这方面,由于计算机视觉算法的发展,计算机对人们的面部表情、眼动方式、肢体语言等行为方式的理解能力大为提高。

人类情感本身就是个非常复杂的问题,对此,所采取措施的正确做法是,让人工智能不需要弄懂人类情感的本质,只需让机器能够对情绪所释放的各种信号进行分析并输出结果即可。这种思路就是从使用功能出发。比如软银推出的情感陪护机器人,其对人类面部表情所作的分析,实际上用的就是图像识别技术。人工智能发展到现阶段,已经被赋予了一定的情感,但要达到能与人类进行情感交流的地步,还有很长的一段路要走。其中重要的一项就是数据采集。

大数据对人工智能的发展具有极大的推动作用。随着管理和分析数据的新技术不断发展和对数据价值的不断认识,像图像、文本或语音等使用统计模型来进行数据概率推算的人工智能领域,可以把所建模型暴露在大数据中进行训练,让性能得到不断优化。这其中,深度学习技术在人工智能的不同领域都得到了应用。比如说,在话题分类、情感分析和语言翻译等方面,它就击败了其他机器学习技术。深度学习擅长情感分析,因而,很多人都把深度学习看成是人工智能起飞的发动机。

从满足人类情感需求的角度来看,情绪识别是人工智能发展的分水岭。目前,微软公司、软银公司和苹果公司等大型企业,都开始在人工智能研发方面布局情感识别。下面就对一些有特色的研究成果作些介绍。

(1)微软小冰。

微软小冰是2014年5月29日,微软(亚洲)互联网工程院的一款人工智能伴侣虚拟机器人。他们将该机器人命名为“微软小冰”。该机器人积累了中国近7亿网民多年来所公开的全部文献记录,借助大数据、自然语义分析、机器学习等方面的技术,能够理解对话的语境与语义,让人机交互变得更加自然。在一定程度上,该机器人掌握人类交流时的语音、手势、表情和触摸等表现方式。

微软公司将新一代人工智能的首要任务定位于具备“感性”的情感连接能力,认为只有这样才能更像真实人类的情感方式,由此来满足人类的心理和情感需求。他们构建了一个以建立情感连接为优先的完整可持续的对话系统。构建这个系统的方法,包含了语义学、搜索引擎、大数据和机器学习的系统模拟方法。而实际上人类本身也没将情感的本质弄清楚,所以也就没必要让机器来弄懂人类情感的本质。其实,人类交流时,也不会刻意去了解他人的情感本质,而只需了解对方的情感表现信号即可。比如说,开心时笑的模样、发怒时的声音呈现等。这也是微软公司人工智能情绪识别技术研发的指导思想。该思想的内容就是,让机器分析人类的情绪信号,并找出所对应的情感,再在这个基础上表达自己的情感。这样也就实现了机器与人类的情感交互。

通过将人工智能情感计算的思想注入到微软小冰中,机器人也就具备了情绪识别的能力。比如说,小冰具有情感记忆功能。当用户提到自己的一些心情时,小冰会记住这些,并不断地了解用户的情况,并以询问的方式来关心用户的身体状况。这种人机交互,首先是与用户建立起信任关系,然后再实现进一步的情感交流和需求满足。微软公司希望,小冰这样的机器人最终能够走进千家万户,成为服务用户的日常伴侣。从它在第三方平台的智能聊天、在航空领域的智能服务和担当面试官的各种表现中,充分感知到微软公司在情绪识别方面的技术进步,也能管中窥豹地感知到人工智能的发展方向。

软银Pepper是由日本软银公司开发出的一款被人描述为“情感机器人”的智能机器人。软银Pepper不仅能判断出人类的面部表情和语调方式,还能“读”出人类情感。Pepper身高4英尺,有一个旋转底座,由三个滚轮组成,还有设计十分简洁的手臂和能灵活运动的手指。当与人接近时,它黑色的大眼睛会“盯着”这个人看上一秒钟。而它说话时,它的胸口位置平板电脑的屏幕上会显示它阐明的观点。

Pepper的设计本意是陪伴,就是让它不仅能与人交流,还能模拟人类的行为和诸如同情心、爱心之类的感情。不足之处在于,它的听力并不太好,需要用户尽可能地接近它,并尽可能地大声才能让它“听”见。Pepper于2015年6月底在日本正式上市销售,每台售价为1600美元。开售一分钟内,1000台Pepper就被抢购一空。

除了微软小冰、软银Pepper外,还有如Realeyes、INTRAface、Emotient和IBM等公司,在人工智能情绪识别方面的技术应用都取得了明显的进展,有新的成果被推出。尽管情感机器人到如今还处在研发调试阶段,但可以想象的是,随着情绪识别技术的突破,拥有真正情感的机器人将会出现,成为服务于人类的好伴侣。

(2)软银Pepper。