【实训目的】
通过本次实训,要求熟练掌握分类器中监督学习(逻辑回归、朴素贝叶斯、决策树、支持向量机)的应用。
【实训环境】
PyCharm环境、Python 3.7、Pandas、NumPy、matplotlib、sklearn
【实训内容】
一、使用身高、体重、性别数据进行是否肥胖的划分
在生活中,我们经常使用体重、身高、性别数据来判别一个人是否肥胖,超过一定阈值则认为是胖的。本实训中,已知数据见CSV文件(hws31.csv),详见图,根据身高、体重和性别,通过已知数据判定一个人是否肥胖。通过选择适当的特征项、监督学习方法、参数对人员进行“是否肥胖”分类,并评估不同方法的优劣。
提示1:首先需要对数据进行预处理,预处理要求如图所示。
可视化提高:如何实现对四维数据的可视化展现,示例如图所示,是否肥胖由形状进行标识。其中,五角星表示不胖。
二、使用身高、体重数据进行肥胖程度分类
BMI指数(即身体质量指数,简称体质指数又称体重,英文为Body Mass Index,简称BMI),是用体重公斤数除以身高米数平方得出的数字,是目前国际上常用的衡量人体胖瘦程度以及是否健康的一个标准。主要用于统计用途,当我们需要比较及分析一个人的体重对于不同高度的人所带来的健康影响时,BMI值是一个中立而可靠的指标。hws31.csv文件中包含身高、体重、性别、BMI和肥胖程度数据,如图所示。训练一个模型,可根据身高、体重、性别、BMI等信息中的一项或多项,使用不同的方法判别肥胖程度(过轻、正常、过重、肥胖),并对模型进行评估。实现过程与上面的第一题类似,不再详述。
实验报告及相关资源下载:
实验报告
项目可用资源
第一题资源
第二题资源