什么是NLP(自然语言处理)
转自中原动力智能机器人 2020-07-29
自然语言处理(NLP)是一种专业分析人类语言的人工智能。(下文皆简称为“NLP”),它的工作原理是这样的:
接收自然语言,这种语言是通过人类的自然使用演变而来的,我们每天都用它来交流转译自然语言,通常是通过基于概率的算法分析自然语言并输出结果
简而言之,这就是一个创建算法的过程。
你使用过苹果公司的人工智能语音助手Siri吗?有没有好奇过Siri是如何理解你说的(大部分的)话的?Siri的工作过程就是自然语言处理在实践中应用的一个鲜活案例。
NLP正在成为我们生活中不可或缺的一部分,其与机器学习、深度学习一起达成的高度远远优于几年前取得的成就。
在本文中我们将深入了解NLP是如何应用、如何工作的。
NLP可以做些什么?
NLP应用广泛,其中包括:
Ⅰ. 机器翻译
你上一次去国外旅行并且使用手机翻译外语是什么时候?可能你用的是谷歌翻译?这种操作是NLP机器翻译的一个日常应用。
机器翻译是通过使用NLP把一种语言翻译成另一种语言。从历史上看,简单的基于规则的方法已经这样做了,但是时至今日,NLP技术是对已经存在多年基于规则的方法的一大改进。
为了使NLP在机器翻译方面做得更好,它使用了深度学习技术。这种形式的机器翻译因为利用了神经网络,所以有时被称为神经机器翻译(NMT)。因此,基于统计、试错等方法翻译语言的NMT能够联系语境翻译语言,处理语言的其他微妙之处。
除了像谷歌翻译这种应用程序,NMT也被使用在非常多商业软件上,例如:
翻译纯文本、网页或文件,如Excel、Powerpoint或者Word。Systran就是这样一家翻译服务公司。实时翻译社交软件回复,SDL Government可以提供相应服务(一家专业做公共部门翻译服务的公司)。在医疗环境下翻译,例如当一名英语语系医生正在给西班牙语病患治疗时,Canopy Speak可以提供帮助。翻译财务文件,如年报、投资评论和信息文件,专门从事财务翻译的公司Lingua Custodia可提供此类服务。Ⅱ. 语音识别
早前,我们提到Siri是NLP的一个著名应用。Siri使用NLP一个非常明显的特征就是语音识别。当然,Alexa和谷歌语音助手同样也是NLP语音识别的著名应用。
语音识别不是一项新的科学技术,距今已有50多年的历史了。直到最近,多亏有了NLP,它的准确性和易用性才有了质的提升。
语音识别的核心是识别口语单词、解释它们并将其转换为文本的能力。然后可以采取一系列行动,如回答问题、执行指示或编写电子邮件。在NLP中使用强大的深度学习的方法使今天的语音识别应用程序比以往任何时候都表现得更出色。
Ⅲ. 聊天机器人
聊天机器人是一种模仿人类对话聊天的程序。第一个聊天机器人Eliza Doolittle出现在20世纪60年代,经过几十年的发展,NLP已经成为创建聊天机器人的基础,尽管这样的系统仍不算完美,但它们可以轻松地处理标准任务。聊天机器人当前可在多种渠道上运行,包括Internet,应用程序和消息传递平台。很多公司用聊天机器人来进行客户服务、售前咨询和售后咨询。