人工智能导论

孔德川

目录

  • 1 第一章 绪论
    • 1.1 1.1人工智能的概念
    • 1.2 1.2人工智能发展简史
    • 1.3 1.3人工智能发展现状和趋势
    • 1.4 1.4课程定位及要求
  • 2 第二章 知识表示
    • 2.1 2.1知识表示概述
    • 2.2 2.2一阶谓词逻辑知识表示
    • 2.3 2.3产生式知识表示
    • 2.4 2.4框架知识表示
  • 3 第三章 自动推理与专家系统
    • 3.1 3.1引言
    • 3.2 3.2确定性推理
    • 3.3 3.3不确定性推理
    • 3.4 3.4专家系统简介
  • 4 第四章 知识图谱
    • 4.1 4.1知识图谱概念和历史
    • 4.2 4.2经典的知识图谱
    • 4.3 4.3知识图谱的应用
  • 5 第五章 搜索技术
    • 5.1 5.1引言
    • 5.2 5.2状态空间图模型
    • 5.3 5.3盲目搜索方法
    • 5.4 5.4启发式搜索方法
    • 5.5 5.5博弈搜索
  • 6 第六章 群智能算法
    • 6.1 6.1引言
    • 6.2 6.2遗传算法
    • 6.3 6.3蚁群算法
  • 7 第七章  机器学习
    • 7.1 7.1 引言
    • 7.2 7.2 监督学习
    • 7.3 7.3 无监督学习
    • 7.4 7.4 弱监督学习
    • 7.5 7.5 强化学习
  • 8 第八章  人工神经网络与深度学习
    • 8.1 8.1 引言
    • 8.2 8.2 感知器算法
    • 8.3 8.3 前馈神经网络与BP算法
    • 8.4 8.4 卷积神经网络
1.2人工智能发展简史

图灵与人工智能

         说到人工智能,就必须提及大名鼎鼎的阿兰·图灵(1912-1954)——现代计算机的奠基人,人工智能之父。

         图灵是标准的数学天才。在1930年代,哥德尔完成了著名的不完备定理证明,但在当时没有找到实例。1936年,年仅24岁的图灵,在构造不完备定理的反例的过程中,提出了图灵机的构想,并证明了这样的设备能够解决任何可算法化的问题。实际上,这也是通用计算机的雏形。

         这些发现,使得图灵开始思考,如果机器仅仅使用几种简单指令,就可以解决数学和逻辑问题,那么是否意味着机器在理论上可以模仿人类的思想?

         1950年,图灵发表了题为《 Can machines think ?》的论文。论文的开篇是一条明确的声明:“我准备探讨‘Can machines think?’这个问题。

         针对这个问题,图灵给出了一个完全可操作的定义:如果一台机器输出的内容和人类大脑别无二致的话,那么就可以认为这台机器在“思考”。

         这就是“人工智能”的最初设想,这份设想也在无形中让图灵摘得了“人工智能之父”的桂冠。而这个模仿测试也就是著名的“图灵测试”。相当长一段时间内, “图灵测试”被认为是人工智能水平的标准测试模型。

图灵测试

         图灵测试由计算机、被测试的人和主持试验的人组成。测试过程由主持人提问,计算机和被测试的人分别做出回答。被测人在回答问题时尽可能表明他是一个 “真正的”人,而计算机也将尽可能逼真的模仿人的思维方式和思维过程。

         进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。

    历史总是充满了遗憾,1954年,年仅43岁的图灵,因同性恋倾向而遭到当时的英国政府迫害,食用浸过氰化物的苹果自杀身亡。

    此时距离达特茅斯会议召开,仅不到两年时间。

    在达特茅斯会议上,10位与会者除了给“人工智能”学科下一个清晰的定义,更重要的是将当时所有符合图灵思想的方法汇集,形成学科的研究范畴。形成了人工智能研究的几个主要流派,为学科后续发展奠定了基础。

西蒙&纽维尔:“逻辑理论家”

    如何让机器证明数学定理?

    在当时,逻辑理论家已经可以证明

《数学原理》一书第二章 52个定理中的38个定理,是会议上唯一一个可以运行的智能程序。

    后续,两人相继提出了“物理符号系统假说”、“语义网络”、“决策支持系统”等等成果,成为1970 年代主流的人工智能方法。

麦卡锡:“状态空间搜索法”。

在达特茅斯会议上,麦卡锡带来的是“状态空间搜索法”。

此前麦卡锡一直在做机器下棋的研究,他认为,智能活动可以看成若干状态之间的转移过程,当问题有多种状态可以选择时,如何快速搜索得到最优方案?

长期以来,状态空间搜索法是人工智能解决复杂问题的主流方法之一。直到“深蓝”和“沃森”系统,本质上依然使用了状态空间搜索方法。

明斯基:“人工神经网络”

        人工神经网络的早期工作可以追溯至1940 年代,明斯基正是这一领域的先行者。在普林斯顿大学念研究生时,他就建造了第一台神经网络学习机SNARC。

        在会上,明斯基提出用计算机模拟神经元及其连接,通过“人工神经网络”模拟智能。

        有趣的是,在1969年,明斯基写了《感知机》一书,几乎完全否定了人工神经网络的做用,导致该领域将近20年的低谷期。


        以上三种方法,对后续人工智能的发展起到了奠基的作用。人工智能的发展,也逐渐演变成几种主要流派。

        我们回顾一下达特茅斯会议中人工智能的纲领:学习的每个方

面或智能的任何特征都能被精确地描述到用机器来模拟的程度

        这里涉及两个维度,分别是

学习的每个方面

智能的任何特征

        第一个维度,讨论的是“智能机器如何模拟人类学习的过程和结果”,

针对这个问题,人工智能学界借用哲学观点,大致可以分为两个流派:

    理性主义、

    经验主义

    理性主义认为,人类学习得到的知识是绝对理性的,可以精确描述,因此人工智能方法需要人工进行知识的汇总、加工、抽象、归纳,并基于此建立某种理性思考的框架,并最终让计算机依据理性知识库开展思考。理性主义是人工智能早期的主流思潮,至今也扮演着重要角色,比如如今的知识图谱。

    经验主义则认为,外部世界的知识无法精确描述,而只能通过体验、经历、感受才能获得。智能机器需要通过不断感知外部世界,以尝试、探索的方式,获得知识。这其实就是机器学习的最基本思想。

我们再来看第二个维度:“机器如何模拟智能的特征?” 或者说,机器应该从什么角度出发去模拟智能?

这个问题,衍生出两种思潮:

 符号主义

连接主义

 

    符号主义认为人工智能本质是知识符号化,只要将世界知识转换为某种符号系统,智能机器就可以根据该符号体系,解决真实世界的问题。可见,与理性主义是统一的。是理性主义解决问题的方式。

    连接主义认为,大脑是智能产生的根源,因此实现人工智能应该研究大脑的结构、信息处理机制、运行方式,然后在机器上模拟大脑,实现人工智能。这就是现在阶段主流的人工神经网络方法。


按照刚才的划分,我们不难对达特茅斯会议上的主要方法进行总结,得到方法的流派划分

          明斯基:“人工神经网络”

          用计算机模拟神经元及其连接,实现自主识别判断

          经验主义、连接主义


     麦卡锡:“搜索法”

          如何选取最优方案?如何忽略低可能性方案?

          经验主义、符号主义


          西蒙&艾伦·纽维尔:“逻辑理论家”

        如何让机器证明数学定理?

        理性主义、符号主义

逻辑智能浪潮

       1956-1970,是AI发展的第一次浪潮。其中最核心的就是西蒙和纽厄尔推崇的自动定理证明方法。

       在当时的计算条件下,将人类知识表示为符号,进行推理演算,是最可行的方法。

在定理证明方面:

    1958年,AI证明了《数学原理》命题验算部分的220个命题。

    1963年,AI能够独立证明《数学原理》第二章中的全部58题。

    1976年,计算机在协助下证明了地图的四色问题


逻辑智能浪潮

    当时,形式一片大好,甚至在1958,西蒙信心满满的宣称:不出十年,AI将成为世界象棋冠军,证明所有定理,谱写优美音乐。2000年,AI将超越人类。

    然而在1970年代后期,随着人工智能需要处理的知识规模不断增大,自动定理证明方法越来越低效,1970年代兴起的专家系统很快就遭遇严重的知识爆炸瓶颈,理性主义的人工智能方法没落。

计算智能浪潮

    进入1980年代,以机器学习为代表的经验主义方法逐渐复兴,取代了逻辑智能中的理性主义。

    在这一阶段,人类的知识仍然以符号化表示,而由计算机扮演学习者的角色,通过探索试错,来自主寻求问题的解答。

    机器学习方法与状态空间搜索方法配合,成为解决复杂问题的主流方法。

    由于这些方法大都需要大量的计算过程,因此称为计算智能。

计算智能浪潮

    在这一时期,典型的代表作包括IBM的国际象棋程序:1997年,计算机“深蓝”战胜了世界象棋冠军卡斯帕罗夫。

    此后的2011年,IBM的Watson在问答节目《危险》中最终战胜了人类。计算智能在这时达到了历史最顶峰。

    2006,Hinton教授和他的学生在《科学》上发表了文章,开启了深度学习发展的浪潮。

    这篇文章有两个主要观点:

    1)多隐层的人工神经网络具有优异的特征学习能力

    2)深度神经网络可以通过“逐层训练” 来有效克服

至此,沉积几十年的人工神经网络方法再次出现在人们的视野中,并迅速点燃了认知智能浪潮,连接主义再度兴起。

    自2006年以后,深度学习得到了快速发展。

    2009年,邓力利用深度学习,把语音识别错误率大幅降低25%,达到商业应用水平(95%正确率)。在此后的数年,语音识别迅速从实验室走向市场,衍生出巨大的商业价值。

    2011年,谷歌展示了“谷歌猫,计算机自动学会了

猫”的样子,并能“想象”出猫的形象。

    2012年 Hinton教授门下的一个超级简单明了的结构,在图像分类竞赛 ImageNet 上,以绝对优势战胜巨头谷歌,引起轩然大波。

    2016年,谷歌“阿法狗利用CNN模型战胜李世乭,首次在围棋项目中战胜人类顶尖棋手。

    正式宣告,人工智能第三次浪潮来临。

    近两年里,人工智能更是以以往无法想象的速度更新发展,在多个领域开花结果。

    由于这些方法的理论基础都是连接主义,学习过程更接近人类从无到有的认知过程,因此学者们称为认知智能。