3 前行的技术之路与何以可能的科学
当Licklider帮助认知计算形成一种哲学方法时,他几乎无法表达出前行的技术进路。随着计算机实验室之外的世界不断发展,认知计算的道路仍在被定义,且不断调整。尤其是,我们真切地意识到数据正怎样塑造着我们的未来。Gartner预计,在未来五年世界的信息将增长800%,而且80%的数据是非结构化的。其中包括人类语言记载下的每一件事 (从教科书到诗歌),图片捕捉到的每一个瞬间(CAT扫描到家庭照片)以及声音记录下来的每条信息。它是隐藏在香气、味道、文本和振动中的数据。数据来自我们的活动,来自这个布满仪器的星球。
在信息、知识和服务产生价值的全球经济和社会中,数据代表着这个世界上最丰富、最具价值、最复杂的原材料。直到现在,我们还没有方法对它进行有效开采。
可编程系统基于这样的规则:通过一系列预先设定的进程,从数据中得出结论。尽管它们强大而复杂,也是决定论的——其繁荣建立在结构化数据之上,但是无法处理定性的或不可预见的输入。而当今这个复杂而突变的世界中充斥着模糊和不确定性,死板的可编程系统难以应对这些特征。
认知系统是基于概率的,意味着它们被设计成去适应和理解非结构化语言的复杂性和不可预测性。它们可以“读”文本、“看”图像、“听”自然语音。它们解读那些信息,整理信息并提供对其意思的解释,同时伴有推论和推理过程。它们不提供最终的答案。事实上,它们并不“知道”答案。相反,它们被设计成从多个来源中去衡量信息和想法,去推理,然后提供假说以供参考。一个认知系统可以对每个可能的洞见或答案给出一个自信水平。
Watson在 Jeopardy!中犯的一个错误就是例证。在第一天的比赛将结束时, Jeopardy终局的类目是“美国城市”。线索是“它最大的机场是以某二战英雄命名的;它的第二大机场是以某二战战役为名的”。答案是芝加哥(两个机场分别是O’Hare 和 Midway)。Watson猜测,“它是多伦多?????”Watson困惑于这个问题有很多原因,包括这句话的语法结构,在伊利诺伊州有一个城市叫Toronto,而 Toronto Blue Jays在美国棒球联盟中打棒球。
结果,Watson自信水平出奇的低:14%。如果这是Jeopardy!常规线索,参赛选手必须响铃示意,但作为Jeopardy终局阶段的线索,Watson可能因为答案自信水平太低而没有响铃。Watson知道哪些事情是它不知道的,图1.2中 的五个问号暗示了这一点。

图1.2 Watson在Jeopardy!中犯的错误
然而,认知系统能够从错误中学习。通过大规模机器学习,认知系统能从训练和运用中不断得以改善。
消化语料库知识,根据任何给定主题接受专家训练,认知系统可以通过一系列Q&A的方式得以训练。人与系统互动,就系统反馈的正确性做出反馈将会提升机器的“知识”。
当Watson参加Jeopardy!时,它完成了一件事——以五种技术为基础的自然语言Q&A(提问和回答)。今天,Q&A只是Watson以应用程序界面方式提供的众多功能之一。从那以后,我们已经研发出多达二十多个新的应用程序界面,采用了五十多种不同的认知技术。这也是认知计算的技术方法和当前人工智能的关键区别。认知计算并不是单一的计算机科学,它结合许多学科知识,从硬件架构、算法策略、工业流程设计到行业专长。
我们每天使用的许多产品和服务——从搜索引擎广告应用,社交媒体网站面部识别到“智能”汽车、电话和电网——正在见证人工智能的方方面面。
绝大多数人工智能产品和服务都是为了实现某种功能,侧重于应用,专为某种特定服务而设。它们使用了一些认知计算的核心功能:有的使用了文本挖掘技术,有的通过机器学习进行图像识别。所有的产品和服务都局限于最初打造它们的构想。
相比之下,认知系统具备五个核心功能:
①加深人与系统的互动
人们与系统的互动更加充分,这种互动是以每个人偏好的模式、形式以及质量为基础的。认知系统充分利用搜集到的数据创造出有关个体的精细画面——比如,地理位置数据、网页互动、交易历史、钟爱节目的模式、可穿戴设备数据和电子医疗记录——并为这幅图景添加一些很难察觉的细节:语气、情绪、情感状态、环境条件以及人际关系的强弱和本质。它们从所有结构和非结构数据中进行推理,找出什么才是人际交流中重要的东西。通过不断学习,这些接触交流将传递出越来越大的价值,也会变得更加自然、有预见性,情感也会拿捏适中。
②拓展并提升专业技能
各种工业知识和专业知识正在以任何专家都难以追赶的速度迅速膨胀——期刊、新协议、新立法、新实践和崭新的领域。医疗保健行业有一个明显的例子,在 1950年,人们预测全世界医学知识翻一番需要50年时间;到了1980年,时间缩短为7年;2015年,不超过3年。与此同时,个人一生能产生100万 GB的健康数据,相当于3亿本书。
为了帮助组织机构跟上步伐,人们设计了认知系统,它能作为专家的伙伴提高他们的业绩。由于这些系统掌握了专业术语——医学、销售和烹调等术语——它们能够理解和传授复杂的专业技能。这大大缩短了从业者转变为业内专家所需的时间。另外,由于这些系统是由领先的从业人员训练的——不论是顾客服务,肿瘤诊断,还是判例法等任何行业——系统能让很多人获取这些领先人士的秘诀。
③将产品和服务与认知融合
认知技术让感受、推断和了解用户和周围世界的新一类产品和服务成为可能。持续改善和适应,增强功能以推出未曾想到的新用法,也因此成为可能。在汽车、医疗设备、器具和玩具行业,这些正在发生。物联网正在急剧拓展全球的数字产品和服务——哪里有代码和数据,哪里就有认知技术的用武之地。
④使认知流程和运营成为可能
认知还能转变公司的运营方式。融合认知能力的商业运营,能将内外资源中的数据表象化为财富。它让公司重视工作流程、上下文和环境,这有利于持续性学习、改善预测、提高运营效率,并按当今的数据生成速度做出决策。这对当今世界而言是个大好消息,想想看,一个市值平均10亿美元的公司每周要花1000个小时来管理供应商。
⑤提升探索并加速发现
最终,认知商业将具备的最强大的工具堪比“车前灯”,它可以照亮日益复杂、变化多端的未来之路。随着各行各业的领军人物争相在药物研发、复杂经济模型、材料科学、初创公司等方面加大筹码,这样的“车前灯”变得越来越重要。把认知技术运用到大数据上,领军人物就能找到模型、机会和可执行的假设,而仅仅通过传统研究或可编程系统,几乎不可能发现这些。
假如能像设想的那样实现认知计算,那么,底层平台必须足够宽广、足够灵活,以便在各行各业得到运用,它还必须支持跨行业运用。为此,研发工作必须从全局出发,旨在打造一个强健的平台,其中许多功能都可以支持来自开发者生态圈各种各样的应用。
这个平台必须涵盖机器学习、推理、自然语言处理、语音和图像识别、人机交互、对话和叙述生成等等。许多功能要求运用高性能计算、专业化的硬件架构,甚至是新的计算范例这样的专业基础设施。以上每种技术都源于各自的科技或学术领域,但是,这些技术必须和支持认知解决方案的硬件、软件、云平台及应用协同发展方能奏效。
随着Watson的迅速演化,未来可能已初见端倪。举个例子,一种分析X光、MRIs和超声波图像的认知医学图像应用,它能处理医学期刊、书本和文章的自然语言;它利用机器学习来矫正和增强理解力;它还可以开发深度知识表征和推理,有助于形成可能的诊断结果。为此,需要专业的图像处理器来支持大规模数据和人类专业知识,指导系统学习, 解读系统生成的结果。
这种新模型的威力能应用于任何领域。油气公司能把地震图像数据和对成千上万的论文、报告、时事、经济数据和天气预报的分析结合到一起,为开采提供风险回报分析。或者,通过分析测试成绩、出勤率和数字学习平台上的学生行为信息,学校能建立纵向的学生档案和个性化教育计划。
IBM正在与多个领先的癌症研究机构合作,加快临床识别,为患者提供个性化治疗方案,它被认为是短期内最有前途的认知计算应用之一。该计划旨在减少解读DNA、了解个人遗传信息,从医学文献搜集相关资料的时间从几周变为几分钟。由此产生的分析结果使医生能够针对患者特定的癌基因突变做出诊断。只需几分钟,Watson就能完成遗传物质和医学文献的审查过程,产生一份可视化数据的报告,并以循证医学为基础,综合患者个人独特的基因提供可行的药物方案。临床医生可以评估这些证据,以确定它的疗效是否会比标准方案更有针对性。