课程门户-章节详情

孔德川

1 第一章绪论
- 1.1 1.1人工智能的概念
- 1.2 1.2人工智能发展简史
- 1.3 1.3人工智能发展现状和趋势
- 1.4 1.4课程定位及要求
2 第二章知识表示
- 2.1 2.1知识表示概述
- 2.2 2.2一阶谓词逻辑知识表示
- 2.3 2.3产生式知识表示
- 2.4 2.4框架知识表示
3 第三章自动推理与专家系统
- 3.1 3.1引言
- 3.2 3.2确定性推理
- 3.3 3.3不确定性推理
- 3.4 3.4专家系统简介
4 第四章知识图谱
- 4.1 4.1知识图谱概念和历史
- 4.2 4.2经典的知识图谱
- 4.3 4.3知识图谱的应用
5 第五章搜索技术
- 5.1 5.1引言
- 5.2 5.2状态空间图模型
- 5.3 5.3盲目搜索方法
- 5.4 5.4启发式搜索方法
- 5.5 5.5博弈搜索
6 第六章群智能算法
- 6.1 6.1引言
- 6.2 6.2遗传算法
- 6.3 6.3蚁群算法
7 第七章机器学习
- 7.1 7.1 引言
- 7.2 7.2 监督学习
- 7.3 7.3 无监督学习
- 7.4 7.4 弱监督学习
- 7.5 7.5 强化学习
8 第八章人工神经网络与深度学习
- 8.1 8.1 引言
- 8.2 8.2 感知器算法
- 8.3 8.3 前馈神经网络与BP算法
- 8.4 8.4 卷积神经网络

4.1知识图谱概念和历史

知识图谱的提出和概念
– 知识图谱这一名词最早由 google 公司于 2012 年提出，名为“Knowledge Graph ”。应用于其搜索引擎，目的是增强信息检索能力，为用户提供更加智能的检索结果。
– 经过短短几年时间，知识图谱得到几乎所有搜索引擎企业的关注，并纷纷投入大力研究，形成了多种多样的技术和应用方案。

– 在现阶段，知识图谱并没有严格、绝对的学术概念，但从功能上看，目前的知识图谱具有类似的功能，它们都以结构化形式，描述客观世界中存在的概念、实体、以及实体之间关系。因此，知识图谱是这样一类知识表示和应用技术的总称。

知识图谱表现形式
– 在典型的知识图谱中，每个实体或概念用一个 ID 来标识，称为标识符。实体通过若干属性来刻画内在特性，实体之间通过多种关系来连接。所有实体相互关联，形成复杂的“图”。

1960s，符号主义知识表示
• 之前我们介绍过，在人工智能的第一次发展浪潮中：
– 采用符号主义表示知识
– 应用于专业领域的自动推理
• 典型的应用即专家系统，一般由事实库、规则库、推理机构成。
– 事实库中，以条目形式罗列事实性知识
– 规则库中，以条目形式罗列推理规则

1960，语义网络（ Semantic Network ）
– 在接近同时代，在 1960 年，认知科学家 Collins、Quillian 等人提出了语义网络(Semantic Network)的概念，目的是以网络的方式来描述概念之间的语义关系。在该设想中，语义网络将概念作为节点，边表示关系，可以用来描述语义关系。

1970s-1980s，描述逻辑
– 从 1970s 开始，许多学者开始研究语义理论的问题，代表性的工作是描述逻辑（description logic）
– 描述逻辑尝试将知识表示能力和推理计算能力结合，具有很强的表达能力，并且能保证推理能力。
– 早期的描述逻辑包括 Brachman 1980s 提出的 KL-ONE 语言，它可以刻画概念、属性、个体、关系等知识要素。

1990s Web1.0 时代
• 1990s 后，描述逻辑成为知识表示领域的重要分支。但它是一个纯理论工作，没
有数据和应用支撑。恰好此时，互联网进入应用阶段，web1.0 诞生。1989，Web 之父Tim Berners Lee 将超文本链接与因特网嫁接，使得用户可以通过超链接浏览互联网上的各类资源，发布自己的信息。
• Web1.0 诞生后，互联网上的网页数量迅速增加，网页之间相互关联形成网络，其中蕴含着大量知识。但这种知识的设计思想是面向人类阅读和理解的，无法被计算机理解和计算。比如我们很容易知道两个网页内容相关，但计算机很难理解网页的内容。

1998，语义 web 兴起和发展
• 在 1998 年， Tim Berners Lee 提出了“语义网（semantic web）”的概念，为了与语义网络区分，也常直接称为语义 web。
• 语义 web 旨在对互联网内容进行语义化表示，通过对网页进行语义描述，得到网页的语义信息，从而使计算机能够理解、推理互联网信息。
• 这是个庞大的构想，不是简单的标注 web 页面，而是需要新的知识表示手段。这样的背景下，语义 web 相继提出了“RDF 资源描述框架”和“OWL 网络本体语言”等新的框架。

1997，RDF
• RDF 是一种描述资源信息的框架，资源可以是任何东西，包括文档、人、物理对象和抽象概念。
一个 RDF 陈述描述两个资源之间的关系，主语（subject）和宾语（object）分别指两个资源，“predicate”表达了这个资源之间的关系。
因为每个 RDF 陈述包含三个元素，因此RDF 陈述也被称作 RDF 三元组（triples）。

2001，OWL
• RDF 本身是从实践出发的描述框架。
• 2001 年，W3C 组织开始将描述逻辑引入语义 web，尝试构建完美的知识表现语言，称之为 OWL，网络本体语言。
• OWL 以描述逻辑为理论基础，比 RDF，具有更强的表达能力和推理能力。比如，OWL 可以描述“中国所有湖泊”、“美国所有 4000 米以上的高山”这样的类。
• 但 OWL 复杂度非常高，在逻辑接近完美，但工程上实现却太过复杂。

语义 web 技术栈
• 从 2001 到 2006，随着 RDF 和 OWL 的提出，语义 web 技术突飞猛进，各种标准不断升级和复杂化，层次不断加深，形成了技术堆栈。
• 在这一时代，语义 web 仍然沿袭着符号主义的核心理念，尝试建立完美的符号体系
来囊括所有知识。
• 该阶段是从“弱语义”到“强语义” 的探索。

2006，linked data
• 到了 2006 年，Tim BernersLee 逐渐意识到语义 web 的发展遇到了瓶颈，体系结构日益复杂，而工程实现难度越来越大，成本越来越高，各家单位都各自为政开发语义网。
• Lee 提出“linked data”设想，号召各家单位分享自己的知识库，合并起来形成开放的语义网。目前，该设想最大的项目Linked Open Data，LOD 项目中已经包含了 1000 多个数据集。

在技术层面上，从 linked data 开始，语义 web 开始弱化“语义推理”的部分，而更强调“Web”部分。因此 linked data 可以看作是语义 web 的一个简化集合。
• 在实现层面，linked data 鼓励使用 RDF 三元组形式描述知识，而理论更完备的OWL 系列方法则很少使用。
• 从 linkded data 开始，语义 web 开始进入“弱语义”的阶段，也正是从此开始，语义 web 的体系结构开始向现如今的“知识图谱”过渡发展。

2012，谷歌知识图谱
• 2012，谷歌在收购语义 web 公司 Freebase 之后，进一步将其中基于RDF 的知识表示形式简化，升华为图数据，大大提升其应用性，称之为“知识图谱”。
• 至此，现代的知识图谱正式登上时代舞台。谷歌知识图谱进一步弱化了语义，仅保留了 RDF 三元组的基本形式，但这种简单的形式非常适合工程应用，以及知识的自动化生成。因此近年来展现出蓬勃的生命力。

图片预览