课程门户-章节详情

刘先勇（Dr. Xianyong Liu）

1 Introduction of AI
- 1.1 授课内容
- 1.2 课程PPT
2 Intelligent Angents
- 2.1 授课内容
- 2.2 课题PPT
3 Seach and Tree-search
- 3.1 授课内容
- 3.2 课程PPT
4 Graph-search and Uninformed Search
- 4.1 授课内容
- 4.2 课程PPT
5 Heuristic search algorithms
- 5.1 授课内容
- 5.2 课程PPT
- 5.3 课程视频
- 5.4 课后讨论
6 The conditions for optimality
- 6.1 授课内容
- 6.2 课程PPT
- 6.3 课程视频
- 6.4 课后讨论
7 Markov Reward Process
- 7.1 授课内容
- 7.2 课程PPT
- 7.3 课程视频
- 7.4 课后讨论
8 Markov Decision Process
- 8.1 授课内容
- 8.2 课程PPT
- 8.3 课程视频
- 8.4 课后讨论
9 Beyond classical search - Learning from the Nature
- 9.1 授课内容
- 9.2 课程PPT
- 9.3 课程视频
- 9.4 课后讨论
10 Quantifying Uncertainty
- 10.1 授课内容
- 10.2 课程PPT
- 10.3 课程视频
- 10.4 课后讨论
11 Probability reasoning
- 11.1 授课内容
- 11.2 课程PPT
- 11.3 课程视频
- 11.4 课后讨论
12 Bayesian Inference
- 12.1 授课内容
- 12.2 课程PPT
- 12.3 课程视频
- 12.4 课后讨论
13 Reinforcement Learning
- 13.1 授课内容
- 13.2 课程PPT
- 13.3 课程视频
- 13.4 课后讨论
14 Dynamic Programming
- 14.1 授课内容
- 14.2 课程PPT
- 14.3 课程视频
- 14.4 课后讨论
15 Lecture Summary
- 15.1 授课内容
- 15.2 考后分析

授课内容

授课日期：第二周 2020-9-17，下午5-6，西校区工程中心204教室

出勤统计：应到41/实到40/迟到0

如果说人类智能是物竞天择、大自然进化的产物，那么人工智能则是科学与工程的完美结合，它的设计以符合人类道德为基本准则，使其具备“行动合理性”特质。

通过前面的学习，我们已经知道，从工程技术的角度看，人工智能的主要任务是智能体设计。一般而言，智能体分为四类，分别为简单反射的智能体（simple reflex agents）、基于物理模型的智能体（model-based agents）、基于目标的智能体（goal-based agents）和基于效用的智能体（utility-based agents）。

无论智能体是一台复杂的机器人，还是一个简单的网页排序算法，一个基本的要求是，智能体在给定任务环境中，具备较好的行动合理性。那什么是行动合理性呢？就是指智能体能够做“正确”事情；这样的智能体，我们称之为“理性”智能体。

本次课程我们通过“真空吸尘器”的例子，重点讲解什么是“理性”智能体的设计方法。

假如你是这个“吸尘器”智能体的设计者之一，你该如何运用人工智能的知识，参与这项工作呢？

首先，你需要弄清楚这个智能体所处的任务环境；你可以使用“PEAS”法则。

“P”指的是性能度量：你希望它效率高、安全、省电。

“E”指的是工作环境：它工作在室内，但室内不同的区域功能分区不同，比如客厅、卧室、厨房；在这个例子中，我只考虑了左和右两个相邻区域。

“A”指的是动作或行为：它的动作可以设计得非常简单，比如只能左移、右移和吸尘。

“S”指的是感知：通过感知器，它可以知道自己所处的功能分区的位置，以及所在位置是否干净。

其次，你需要弄明白智能体所处的任务环境的性质；通常，你可以从以下几方面来分析。

1. 完全可观察的 vs. 部分可观察的: 如果 Agent的传感器在每个时间节点上都能获取任务环境的完整状态，那么我们就说该任务环境是完全可观察的；否则，是部分可观察的。噪音、不精确的传感器，或者传感器丢失了部分状态数据，都可能导致任务环境成为部分可观察的。当然，有时候，我们也需要考虑智能体的设计成本。例如，只有一个机载传感器的吸尘器 Agent可能只能观察到当前位置是否干净，而无法观察到其它方格是否有灰尘。

2. 确定性的 vs. 随机性的：如果环境的下一个状态完全取决于当前状态和Agent 所执行的动作，那么我们说该环境是确定性的；否则，它是随机性的。例如，我们可以假定所要设计的吸尘器智能体的任务环境是确定性的，但是这个智能体的环境也可以包含一些随机性，比如随机出现的尘土和吸尘器出现机械故障所导致的随机性。

3. 片段式的 vs. 延续式的：在片段式的任务环境中，Agent的状态空间被分成了一个个像原子一样，不可分割的片段。在每个片段中，Agent可以感知环境的信息并完成单个行动。关键的是，下一个片段不依赖于以前的片段中智能体采取的行动。例如，工业装配线上零件质量检验的机器人每次决策只需考虑当前零件，并不需要考虑以前的检验过程中所采用的行动决策；而且，当前决策也不会影响到下一个零件的检验结果。与之相反，在延续式任务环境中，智能体当前的决策会影响到未来的决策；例如，下棋和出租车驾驶的任务环境都是延续式的。

4. 静态的 vs. 动态的：如果任务环境在Agent 计算的时候会变化，那么我们称该 Agent的环境是动态的；否则任务环境则是静态的。

5. 离散的 vs. 连续的：任环境的状态、时间的处理方式以及 Agent观察的感知信息和采取的动作，都有离散和连续之分。

6. 已知的 vs. 未知的: 如果智能体的行动结果的概率分布是给定的，我们就称智能体的任务环境是已知的；否则，我们称任务环境是未知的。

最后，你需要定义一个合适的性能度量，帮助评估智能体的行为是合理的。

这件事并不像说得这么容易。以我们所要设计的吸尘器 Agent为例，我们可以通过统计8小时工作时间内，智能体清理的灰尘总量来评估它的工作性能。那么一个理性 Agent 可能一边吸尘，一边又把灰尘倒回地面，再吸尘，从而使得清理的灰尘总量达到最大。因此，一个更合适的性能度量则是统计智能体保持地面干净的时长。例如，在每个时间步，我们统计干净房间的数量，每个清洁的房间则奖励一分，每个有灰尘的房间则惩罚一分。

即使第二个性能度量能够避免智能体出现不合理性，但是依然有些棘手问题难以处理。例如，前面提到过的"干净地面"，是指随时间变化的平均地面清洁度。然而，两个不同的Agent 可能得到同样的平均地面清洁度，其中一个Agent在有条不紊地做着普通的清洁工作；而另一个Agent在短时间内表现得非常勤奋积极清洁，然后它会表现得非常懒惰，休息很长时间。至于哪种工作方式更可取，似乎是一个哲学问题。

在结束本次课程之前，同学们需要知道：第一，智能体的合理性必须充分考虑行为的后果；第二，行为是否理性不能由智能体自己来评估，否则，智能体可以表现得“自欺欺人”。

This course mainly discusses about the rationality of intelligent agents.

First, an agent is something that perceives and acts in an environment. The agent function for an agent specifies the action taken by the agent in response to any percept sequence.
Second, the performance measure evaluates the behavior of the agent in an environment. Third, A rational agent acts so as to maximize the expected value of the performance measure, given the percept sequence it has seen so far.
Forth, a task environment specification includes the performance measure, the external environment, the actuators, and the sensors. In designing an agent, the first step must
always be to specify the task environment as fully as possible.

Last, task environments vary along several significant dimensions. They can be fully or
partially observable, single-agent or multi-agent, deterministic or stochastic, episodic or
sequential, static or dynamic, discrete or continuous, and known or unknown.

图片预览