17级实训案例:二手车数据获取与市场分析
上一节
【实训目的】
通过本次实训,要求熟练掌握数据分析的流程,学会设计和实现爬虫,掌握机器学习在数据分析中的应用。
【实训环境】
PyCharm环境、Python 3.7、Pandas、NumPy、matplotlib、scikit-learn
【实训内容】
一、设计与实现二手车的爬虫
可获取的字段包括:车型、行驶里程、时间、地区、现价、原价等。
二、对二手车的数据进行统计与分析
统计不同地区、不同车型的市场情况,分析不同时段的销售等。如下图所示的是,温州思域在一段时间的发布的价位变化。
三、对二手车市场做简单分析与预测
分析现价与原价、车型、行驶里程和使用年限之间的关系,可用于对现价的一个预估。从图可以看出,现价与原价间存在较强的关系。

四、二手车分类应用
不同车型,保值性不同,可以对汽车进行分类后,按分类结果再做现价的预测可能更加准确。
五、获取二手车的图片,实现车辆信息识别,如颜色等
人工智能的应用已经深入人们生活的方方面面。实践时,可以从网站上下载图片,对下载的图片做车辆识别。进一步地,如果是车辆,则可以对车辆的颜色做判别。

