数据可视化
统计分析结果可以通过表格式、图形式和文章式等多种形式表现出来。表格式是对统计指标加以合理叙述的形式,它使得统计资料条理化、简明清晰、便于检查数字的完整性和准确性,以及对比分析。这些统计表从形式上看,基本由标题、横行、纵栏、数字等部分所组成。
图形式的统计分析结果具有直观、醒目、易于理解的特点,在计算机大量普及的今天,统计图表在统计分析中得到了极为广泛的应用。图形式使用的传统图表类型有折线图(区域图)、柱状图(条状图)、散点图(气泡图)、K线图、饼图(环形图)、雷达图(填充雷达图)、和弦图、力导向布局图、地图,同时支持任意维度的堆积和多图表混合展现。
文章式的主要形式是统计分析报告。它是全部表现形式中最完善的形式,是统计分析研究过程中所形成的论点、论据、结论的集中表现,它是运用统计资料和统计方法、数字与文字相结合,对客观事物进行分析研究结果的表现。
任务四:图形化显示不同电影的票房情况。
参考代码如下:
# coding:utf-8
# 导入画图包
import matplotlib.pyplotas plt
# 设置中文字体为SimHei,简黑字体
plt.rcParams['font.sans-serif'] =['SimHei']
# 解决负号显示的问题
plt.rcParams['axes.unicode_minus'] =False
# 设置标题
plt.title(u'影片2010年5月后半月总票房')
# 设置x、y轴的标题,x轴显示的值为电影名
plt.xlabel(u'电影名称')
plt.ylabel(u'票房收入\万元')
# 画柱状图,x、y轴分别为电影名和票房,并设置每根柱子颜色为绿色,宽度为0.4,表示占据40%的位置
plt.bar(filmgrp_bor['filmname'], filmgrp_bor['BOR'], color='green', width=0.4)
# 显示图像
plt.show()
显示结果如下:

数据可视化相关讲解详见以下视频:
课堂练习:
排序后显示,结果如下

子图显示,结果如下

下面就数据可视化中的子图做一个简单的介绍:
格式化显示,结果如下

下面就数据可视化中的数据标签的实现做一个简单的介绍:

