课堂实训:工资分析
上一节
下一节
第六周巩固练习任务简介
已知文件salary.csv中存储了工龄与工资数据,
(1) 读取数据,对数据进行统计分析、可视化。
(2)使用线性回归分析、多项式回归,实现工资预测。

实验资源下载:
实验报告doc版
实验报告ipynb版
项目资源下载:
巩固练习以上机实践为主,任务说明见以下视频:
【实训目的】
通过本次实训,要求初步掌握数据分析过程和Python数据分析常用包:Pandas、Matplotlib、sklearn的基本使用。
熟练应用相关知识点:

(来源:大数据1801 董露丹 )
【实训环境】
PyCharm环境、Python 3.7、Pandas、NumPy、Matplotlib、sklearn
【实训内容】
一、读取salary.csv中的数据集,并输出读取的结果
二、去除重复和有缺失项的数据行,并输出结果
三、筛选工龄小于12年,工资小于12万的数据行,并打印结果
四、统计每个工龄的平均工资,并打印结果
五、用柱状图展现每个工龄的平均工资,并截图

六、用柱状图、散点图分别展现每个工龄的平均工资,使用子图展现结果

七、使用线性回归分析,实现工资预测。
八、使用多项式回归进行工资的预测,令参数degree =3。


