知识点:数据采集
知识点解析:数据采集原则:相关性、可靠性、有效性
知识点延伸:嫦娥五号与月壤采集
思政系列:大学生思想道德修养(科学的精神)
--------------------------------------------------------------------------------------
附:
·知识点:分类
知识点解析:贝叶斯分类,决策树分类
知识点延伸:新冠地区疫情风险等级分类
类型:习题案例
思政系列:四个自信
--------------------------------------------------------------------------------------
案例背景:
根据疫情实际情况和发展态势,综合考虑新增病例、累计确诊病例数,聚集性病例以及人口密度等因素,将县市划分为低风险区、中风险区、高风险区。
思考:
如何根据已有区域样本的情况和风险等级,对新区域进行疫情风险等级的划分?
--------------------------------------------------------------------------------------
案例:
| 编号 | 累计 | 新增 | 密度 | 聚集 | 等级 |
| 1 | 多 | 多 | 密 | 无 | 高 |
| 2 | 少 | 中 | 疏 | 无 | 低 |
| 3 | 中 | 多 | 密 | 有 | 高 |
| 4 | 中 | 少 | 密 | 无 | 低 |
| 5 | 多 | 少 | 疏 | 有 | 低 |
6
| 少 | 中 | 密 | 有 | 高 |
7
| 少 | 少 | 疏 | 有 | 低 |
8
| 中 | 中 | 密 | 有 | 高 |
9
| 少 | 多 | 疏 | 无 | 低 |
10
| 少 | 中 | 密 | 无 | 低 |
试问:新样本:X={少,多,疏,有}。如何分类?

·知识点:聚类分析
知识点解析:距离公式、聚类分析步骤
知识点延伸:西部大开发
类型:习题案例
思政系列:四个自信
--------------------------------------------------------------------------------------
案例背景:
国家实施西部大开发以来,陕西省经济水平有了显著提高。由于地理位置和自然环境的差异以及交通运输等原因,各地市经济发展存在较大差异。本文采用聚类分析方法,依据2009年陕西省各地市国民经济和社会发展统计公报中相关数字,将各地市经济发展水平分类,比较不同类城市经济发展的特点,给出相关建议。
思考:
如何根据国民经济和社会发展统计公报中相关数字,进行聚类分析?
--------------------------------------------------------------------------------------
案例:

请你对陕西地区进行聚类,并绘制谱系聚类图。
知识点:关联规则
知识点解析:k-项集、频繁项集、支持度、置信度
知识点延伸:家电下乡
类型:习题案例
思政系列:我和我的祖国
--------------------------------------------------------------------------------------
案例背景:
家电下乡补贴政策于2007年12月在山东、河南、四川开始试点,2008年12月1日扩大到12个省(区、市),2009年2月1日推广到全国,是改善农民生活条件,带动工业生产,促进消费拉动内需的一项重要举措。
2010年,国家进一步加大了家电下乡实施力度。一是大幅度提高家电下乡产品最高限价。二是大幅度增加家电下乡产品种类。三是扩大家电下乡产品补贴对象。
思考:家电下乡产品如何进行搭配?
--------------------------------------------------------------------------------------
案例:现有如下家电下乡数据库,家电产品购买情况如下图,思考如何搭配物品,才能实现双赢?

知识点:预测
知识点解析:回归预测,线性、非线性
知识点延伸:人均GDP
思政系列:四个自信
--------------------------------------------------------------------------------------
案例背景
--------------------------------------------------------------------------------------
案例:
下表是从上面视频中截取的数据,但部分年份有缺失,你能利用回归技术,将数据拟合出来吗?
| 编号 | 年份 | 人均GDP |
| 1 | 2009 | 3287.3 |
| 2 | 2010 | 3270.9 |
| 3 | 2011 | ? |
| 4 | 2012 | 5394.8 |
| 5 | 2013 | 6246.4 |
| 6 | 2014 | 6873.3 |
| 7 | 2015 | ? |
| 8 | 2016 | 8054.2 |
9
| 2017 | 8217.7 |
10
| 2018 | 9770.9 |
请你将缺失的数据拟合出来。