人工智能导论

孔德川

目录

  • 1 第一章 绪论
    • 1.1 1.1人工智能的概念
    • 1.2 1.2人工智能发展简史
    • 1.3 1.3人工智能发展现状和趋势
    • 1.4 1.4课程定位及要求
  • 2 第二章 知识表示
    • 2.1 2.1知识表示概述
    • 2.2 2.2一阶谓词逻辑知识表示
    • 2.3 2.3产生式知识表示
    • 2.4 2.4框架知识表示
  • 3 第三章 自动推理与专家系统
    • 3.1 3.1引言
    • 3.2 3.2确定性推理
    • 3.3 3.3不确定性推理
    • 3.4 3.4专家系统简介
  • 4 第四章 知识图谱
    • 4.1 4.1知识图谱概念和历史
    • 4.2 4.2经典的知识图谱
    • 4.3 4.3知识图谱的应用
  • 5 第五章 搜索技术
    • 5.1 5.1引言
    • 5.2 5.2状态空间图模型
    • 5.3 5.3盲目搜索方法
    • 5.4 5.4启发式搜索方法
    • 5.5 5.5博弈搜索
  • 6 第六章 群智能算法
    • 6.1 6.1引言
    • 6.2 6.2遗传算法
    • 6.3 6.3蚁群算法
  • 7 第七章  机器学习
    • 7.1 7.1 引言
    • 7.2 7.2 监督学习
    • 7.3 7.3 无监督学习
    • 7.4 7.4 弱监督学习
    • 7.5 7.5 强化学习
  • 8 第八章  人工神经网络与深度学习
    • 8.1 8.1 引言
    • 8.2 8.2 感知器算法
    • 8.3 8.3 前馈神经网络与BP算法
    • 8.4 8.4 卷积神经网络
7.3 无监督学习

有监督学习的最大问题:标注数据的稀缺和昂贵

有监督学习的最大问题:需要专业人士完成标注


无监督学习的特点:

 有明确的学习目标

 有样本数据

 不需要人工标注知识

 提升难度大

无监督学习方法:聚类

– 人类和许多动物都有“归堆” 的能力。这就是聚类。

– 聚类算法根据某种“相似程度” 或者“距离”,把距离近或者相似度高的实例归到一类。

– 与分类类似,大部分聚类也需要事先指定聚类的数目。

例7.6 支持向量机模型(SVM)

• 问题:

– 假设我们有如下的样本集合,

– 通过聚类算法,将无序样本划分为 k=3 个类别。

思路:

– 首先假设每个类别都聚集在某个“中心点”附近。

– 最初时,任选3个样本作为“中心点”。

– 逐一计算剩下的样本与“中心点”的距离,距离谁近,就归到哪类。

– 根据最新的类别划分情况,重新计算“中心点”。

– 循环该过程,直至中心点不再改变。


• 关键问题:初始选择的3个点,很重要!

– 选择两两距离最远的3个点。

– 随机划分样本成3堆,以3堆的平均重心作为初始点。

• 关键问题:距离计算方法。

– 聚类大量依赖于距离或者相似度计算。因此确定一种距离非常重要。

无监督学习方法:自动编码器

例7.7 自动编码器的应用

(1)图像抗噪

原始图像添加噪声之后再进入编码器,试图生成没有噪声的图像

例7.7 自动编码器的应用

(2)数据降维

– 原始数据生成的模型往往仍然规模比较大

– 此时可以使用自动编码器做一次降维,不损失信息的情况下,降低空间使用。