课程门户-章节详情

计算思维导论

吕橙

1 从这里开始你的学习
- 1.1 欢迎词
- 1.2 单元学习目标
- 1.3 课程学习说明
  - 1.3.1 课程概述与内容
  - 1.3.2 学习目标
  - 1.3.3 学习安排
  - 1.3.4 学习活动
  - 1.3.5 考核标准
  - 1.3.6 学习准则
- 1.4 先修知识与必备技能
  - 1.4.1 学习平台使用及技术支持
  - 1.4.2 必备基础要求
  - 1.4.3 学习资源使用指南
  - 1.4.4 教材电子版下载
  - 1.4.5 相关软件下载与安装方法
  - 1.4.6 答疑安排与教师课表
  - 1.4.7 作业和考试反馈
- 1.5 FAQ：常见问题解答
- 1.6 教师自我介绍和学生自我介绍
- 1.7 计算思维能力调查
- 1.8 学习风格调查
- 1.9 交流协作分组情况
- 1.10 第0讲单元测试
2 计算思维概述——第1周
- 2.1 单元学习目标
- 2.2 本章课件下载
- 2.3 课程思政
  - 2.3.1 线上思政（自主学习）
  - 2.3.2 线下课程思政
- 2.4 计算无所不在
- 2.5 计算思维概述
- 2.6 计算工具与计算机
- 2.7 第1讲单元测试
- 2.8 上机实验1-1：计算思维概述——系统自动评阅
- 2.9 延伸学习
3 计算基础——第2~3周
- 3.1 单元学习目标
- 3.2 本章课件下载
- 3.3 课程思政
  - 3.3.1 线上课程思政（自主学习）
  - 3.3.2 线下课程思政
- 3.4 初识二进制
- 3.5 二进制的运算（自主学习）
- 3.6 数制转换
- 3.7 数的表示
- 3.8 字符编码
- 3.9 声音图像编码（自主学习）
- 3.10 第2讲单元测试
- 3.11 上机实验2-1：进制转换——系统自动评阅
- 3.12 延伸学习
4 计算平台——第4周
- 4.1 单元学习目标
- 4.2 本章课件下载
- 4.3 课程思政
  - 4.3.1 线上课程思政（自主学习）
  - 4.3.2 线下课程思政
- 4.4 计算机系统
- 4.5 硬件之主板（自主学习）
- 4.6 硬件之接口与总线（自主学习）
- 4.7 硬件之CPU（自主学习）
- 4.8 硬件之内存（自主学习）
- 4.9 硬件之外存（自主学习）
- 4.10 硬件之输入输出设备（自主学习）
- 4.11 计算机基本工作原理
- 4.12 操作系统之处理机功能
- 4.13 操作系统之其他功能
- 4.14 第3讲单元测试
- 4.15 上机实验3-1：计算机硬件系统——系统自动评阅
- 4.16 延伸学习
5 问题求解——第5~7周
- 5.1 单元学习目标
- 5.2 本章课件下载
- 5.3 课程导图与设计
- 5.4 典型课例（课堂实录）
- 5.5 线上思政（自主学习）
- 5.6 线下思政
- 5.7 纸版教材在线阅读
- 5.8 什么是问题求解？
- 5.9 算法与算法描述
- 5.10 顺序结构
- 5.11 选择结构
- 5.12 循环结构
- 5.13 算法策略基础之数组
- 5.14 算法策略基础之函数
- 5.15 算法策略之枚举法
- 5.16 算法策略之递归法
- 5.17 算法策略之递推法
- 5.18 算法策略之迭代法
- 5.19 算法策略之分治法（自主学习）
- 5.20 算法策略之动态规划（自主学习）
- 5.21 算法策略之贪心算法（自主学习）
- 5.22 算法策略之回溯法（自主学习）
- 5.23 算法策略之查找
- 5.24 算法策略之排序
- 5.25 实验4-1：Raptor 软件基本操作（教师手工评阅）
- 5.26 实验4-2：算法设计与分析（生生互评）
- 5.27 实验4-3：问题求解（自主学习）
- 5.28 实验7-1：解题报告
- 5.29 实验7-2：解题报告
- 5.30 实验7-3：解题报告（自主学习）
- 5.31 第7讲单元测试
- 5.32 延伸学习
6 网络技术与信息共享——第8周
- 6.1 单元学习目标
- 6.2 本章课件下载
- 6.3 课程思政
  - 6.3.1 线上思政（自主学习）
  - 6.3.2 线下思政
- 6.4 初识网络
- 6.5 网络分类（自主学习）
- 6.6 网络体系结构
- 6.7 网络设备（自主学习）
- 6.8 局域网的搭建（自主学习）
- 6.9 IP与域名系统
- 6.10 划分子网
- 6.11 Internet 服务（自主学习）
- 6.12 数字公民与网络安全（自主学习）
- 6.13 组网实例（自主学习）
- 6.14 第4讲单元测试
- 6.15 上机实验4（PBL）：网络互联训练——生生互评
  - 6.15.1 思科网络实验室1：网络布线
  - 6.15.2 思科网络实验室2：将计算机添加到现有网络
  - 6.15.3 思科网络实验室3：连接无线路由器
  - 6.15.4 思科网络实验室4：测试无线连接
- 6.16 延伸学习
7 数据库技术与数据管理——第9-10周
- 7.1 单元学习目标
- 7.2 本章课件下载
- 7.3 课程思政
  - 7.3.1 线上思政（自主学习）
  - 7.3.2 线下思政
- 7.4 数据库基本概念（自主学习）
- 7.5 数据库的设计方法
- 7.6 数据库的规范化设计1
- 7.7 数据库的规范化设计2
- 7.8 Access数据库的创建与查询（自主学习）
- 7.9 关系代数理论
- 7.10 SQL语句编程（自主学习）
- 7.11 实验5-1：数据库设计——互评作业
- 7.12 实验5-2：窗体与报表——互评作业
- 7.13 第5讲单元测试
- 7.14 延伸学习
8 逻辑思维——第10-11周
- 8.1 单元学习目标
- 8.2 本章课件下载
- 8.3 课程导图与设计
- 8.4 典型课例（课堂实录）
- 8.5 线上思政（自主学习）
- 8.6 线下思政
- 8.7 实验6-1：逻辑推理（PBL个人项目——教师手工评阅）
- 8.8 前6章思维导图训练（PBL小组项目——互评）
- 8.9 纸版教材在线阅读
- 8.10 逻辑思维及其训练方法（自主学习）
- 8.11 命题与命题判断
- 8.12 命题符号化
- 8.13 布尔代数与真值表
- 8.14 命题演算与逻辑推理
- 8.15 习题课
- 8.16 实验6-1：解题报告
- 8.17 第6讲单元测试
- 8.18 延伸学习
9 数据分析与数据挖掘——第11~12周
- 9.1 单元学习目标
- 9.2 本章课件下载
- 9.3 课程导图与设计
- 9.4 课程思政
- 9.5 线上思政（自主学习）
- 9.6 线下思政
- 9.7 上机实验8-1：数据分析（PBL个人项目——系统自动评阅）
- 9.8 上机实验8-2：数据挖掘（自主学习）
- 9.9 纸版教材在线阅读
- 9.10 数据挖掘概述（自主学习）
- 9.11 数据采集（自主学习）
- 9.12 数据探索之数据质量分析
- 9.13 数据探索之数据特征分析
- 9.14 数据特征分析之分布分析
- 9.15 数据特征分析之集中统计分析
- 9.16 数据特征分析之离散统计分析
- 9.17 数据预处理
- 9.18 分类
- 9.19 预测
- 9.20 聚类分析（自主学习）
- 9.21 关联规则（自主学习）
- 9.22 第8讲单元测试
- 9.23 延伸学习
10 课程思政案例篇
- 10.1 课程思政案例
11 特色思维训练库
- 11.1 数学思维（50篇）
- 11.2 逻辑思维（50篇）
- 11.3 AI智能思维（50篇）
- 11.4 专业思维（50篇）
12 游戏编程案例篇
- 12.1 编程游戏关卡（30篇）
- 12.2 编程游戏制作（10关）
13 大工程思训项目库
- 13.1 综合性案例——北京冬奥会智能餐厅设计
- 13.2 综合性案例——北京冬奥会运动员密码设置
- 13.3 综合性案例——北京冬奥电脑装配
- 13.4 综合性案例——北京冬奥网络安全培训
- 13.5 综合性案例——北京冬奥会商品销售数据库系统设计
- 13.6 综合性案例——北京冬奥金牌榜预测
- 13.7 综合性案例——北京冬奥会奖牌榜自动更新算法设计
- 13.8 综合性案例——北京冬奥会线上销售大数据分析
14 考试专栏
- 14.1 教材及教材修订
- 14.2 考试纪律
- 14.3 考试注意事项
- 14.4 逻辑符号的录入方法
- 14.5 期末考试模拟样卷

分类

1 教学目标
2 视频教学
3 电子课件
4 课程思政
5 图文教学
6 巩固练习
7 主题讨论

教学目标_png

能阐述朴素贝叶斯分类原理
能阐述决策树分类原理，及C45算法思想
能用Weka软件进行贝叶斯分类和C45决策树分类，并正确分析结果
能使用Python编程实现决策树分类，并正确分析结果

视频教学_png

电子课件_png

1、新冠地区疫情风险等级分类案例分析，探讨中国制度的优势。

2、经济发展中，对于不同的客户数据分析，将客户的购买行为进行分类。

图文教学_png

数据分类是一个两步过程，第一步，建立一个模型，描述预定的数据类集或概念集。通过分析由属性描述的数据库记录来构造模型。第二步，使用模型进行分类。

（1）朴素贝叶斯

朴素贝叶斯的思想是这样的：如果一个事物在一些属性条件发生的情况下，事物属于 A 的概率>属于 B 的概率，则判定事物属于 A。

通俗来说比如，你在街上看到一个黑人，我让你猜这哥们哪里来的，你十有八九猜非洲。为什么呢？在你的脑海中，有这么一个判断流程：

① 这个人的肤色是黑色 <特征>

②黑色人种是非洲人的概率最高 <条件概率：黑色条件下是非洲人的概率>

③ 没有其他辅助信息的情况下，最好的判断就是非洲人。

这就是朴素贝叶斯的思想基础。

再扩展一下，假如在街上看到一个黑人讲英语，那我们是怎么去判断他来自于哪里？提取特征：

① 肤色：黑

②语言：英语

③ 黑色人种来自非洲的概率： 80%

黑色人种来自于美国的概率：20%

④ 讲英语的人来自于非洲的概率：10%

讲英语的人来自于美国的概率：90%

在我们的自然思维方式中，就会这样判断：

这个人来自非洲的概率：80% * 10%= 0.08

这个人来自美国的概率：20% * 90%=0.18

我们的判断结果就是：此人来自美国！

（2）贝叶斯定义与贝叶斯分类

贝叶斯的数学原理如下：

朴素贝叶斯正式定义如下：

①设x={a₁,a₂,…,a_m}为一个待分类项，而每个a为x的一个属性。

②有类别集合C={y₁,y₂,…,y_n}。如果n=2，就是分两类。

③ 计算P(y₁|x),P(y₂|x), … , P(y_n|x)。

④如果P(y_k|x) = max{P(y₁|x), P(y₂|x), … , P(y_n|x)}，则x∈y_k

那么，现在的关键就是如何计算第3步中的各个条件概率。我们可以这么做：

①找到一个已知分类的待分类项集合，这个集合叫训练样本集

② 统计得到在各类别下各特征属性的条件概率估计。

③ 如果各特征属性是条件独立的，则贝叶斯定理公式为：，因为分母对于所有类别为常数，因此将分子最大化皆可。

可以看到，整个朴素贝叶斯分类分为三个阶段：

第一阶段——准备工作阶段，这个阶段的任务是为朴素贝叶斯分类做必要的准备，主要工作是根据具体情况确定特征属性，并对每个特征属性进行适当划分，然后由人工对一部分待分类项进行分类，形成训练样本集合。这一阶段的输入是所有待分类数据，输出是特征属性和训练样本。这一阶段是整个朴素贝叶斯分类中唯一需要人工完成的阶段，其质量对整个过程将有重要影响，分类器的质量很大程度上由特征属性、特征属性划分及训练样本质量决定。

第二阶段——分类器训练阶段，这个阶段的任务就是生成分类器，主要工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率估计，并将结果记录。其输入是特征属性和训练样本，输出是分类器。这一阶段是机械性阶段，根据前面讨论的公式可以由程序自动计算完成。

第三阶段——应用阶段。这个阶段的任务是使用分类器对待分类项进行分类，其输入是分类器和待分类项，输出是待分类项与类别的映射关系。这一阶段也是机械性阶段，由程序完成。

例题1：下表数据是取自AllElectrionics顾客数据库数据记录训练集，类标号属性购买电脑顾客数据记录训练集有两个不同的类（是，否），因此由此形成了训练样本的两个类，在训练集中有14个样本，两个类中分别有9个和5个样本。

根据上表，判断未知样本X={30岁以下,中等收入，学生，信誉一般}，应属哪一类？是否会购买电脑？

解析：

根据贝叶斯公式：，y_i（i=1,2）有两个类，即y1=是，y2=否。两类的分母都一样，所以只需要判断分子即可。

P( 购买电脑 =“是” ) = 9/14 = 0.643 // 分子右侧的P(y1)

P( 购买电脑 =“否” ) = 5/14 = 0.357 // 分子右侧的P(y2)

P( 年龄≤30 | 购买电脑 =“是”) = 2/9 = 0.222

P( 年龄≤30 | 购买电脑 =“否”) = 3/5 = 0.600

P( 中等收入 | 购买电脑 =“是”) = 4/9 = 0.444

P( 中等收入 | 购买电脑 =“否”) = 2/5 = 0.400

P( 学生 =“是” | 购买电脑 =“是”) = 6/9 = 0.667

P( 学生 =“是” | 购买电脑 =“否”) = 1/5 = 0.200

P( 信用等级 =“一般”| 购买电脑 =“是”) = 6/9 = 0.667

P( 信用等级 =“一般”| 购买电脑 =“否”) = 2/5 = 0.400

P(X | 购买电脑 =“是”) = 0.222×0.444×0.667×0.667 = 0.444 // 分子左侧P(x | y1)

P(X | 购买电脑 =“否”) = 0.600×0.400×0.200×0.400 = 0.019 // 分子左侧P(x | y2)

P(X | 购买电脑 =“是”) P(购买电脑 =“是”) = 0.444×0.643 = 0.028 // 整个分子

P(X | 购买电脑 =“否”) P(购买电脑 =“否”) = 0.019×0.357 = 0.007 // 整个分子

结论：未知样本X={30岁以下,中等收入，学生，信誉一般}属于第1类，即买电脑。

决策树的基本原理是采用概率论原理，用决策点代表决策问题，用方案分枝代表可供选择的方案，用概率分枝代表方案可能出现的各种结果，经过对各种方案在各种结果条件下损益值的计算比较，为决策者提供决策依据。

通俗来说，决策树分类的思想类似于找对象。下面的对话场景：

女儿：多大年纪了？母亲：26。

女儿：长的帅不帅？母亲：挺帅的。

女儿：收入高不？母亲：不算很高，中等情况。

女儿：是公务员不？母亲：是，在税务局上班呢。

女儿：那好，我去见见。

这个女孩的决策过程就是典型的分类树决策。相当于通过年龄、长相、收入和是否公务员对将男人分为两个类别：见和不见。假设这个女孩对男人的要求是：30岁以下、长相中等以上并且是高收入者或中等以上收入的公务员，那么这个可以用下图表示女孩的决策逻辑。

WEKA的全名是怀卡托智能分析环境（Waikato Environment for Knowledge Analysis），同时weka也是新西兰的一种鸟名，而WEKA的主要开发者来自新西兰。WEKA作为一个公开的数据挖掘工作平台，集合了大量能承担数据挖掘任务的机器学习算法，包括对数据进行预处理，分类，回归、聚类、关联规则以及在新的交互式界面上的可视化。

用WEKA软件实现例题1的可视化视图如下：

巩固练习_png

主题讨论_png

图片预览