1 票房分析
(1)统计显示票房榜单中的前十名
数据统计与可视化的主要代码如下:
| # 电影票房排序 |
运行显示结果如下图所示,其中票房收入第一的为《战狼2》。
(2)显示榜单第一名《战狼2》的票房变化分析
如果关注一个电影的动态变化,可以查看其趋势。下图按照日期等间隔的形式,显示了票房第1名电影《战狼2》的票房变化情况。代码可参考电子资源,书本中不再给出。

(3)票房与总场次、上座率的关系
下图的气泡图显示了平均日票房与场次和上座率的关系,其中气泡的大小表示票房的大小。显然票房与总场次和上座率之间有着较强的关系,较多的场次、较高的上座率意味着更高大的票房。

主要代码如下所示:
| film = film.groupby(['name'], as_index=False)['szl','zcc','pf'].mean() fig,ax = plt.subplots(figsize=(9,7)) bubble = ax.scatter(film['szl'], film['zcc'], s=film['pf'] / 50, linewidth=2) |
2 上座率分析
上座率即上座人数与总座位数的比值。从某种意义上来说,优秀的影片上座率就高,反之则低,因而上座率又是衡量一部影片质量优劣的重要标准之一。上座率还直接影响票房价值,上座率高票房价值自然高,所以对一部影片票房价值大小往往用上座率多少来衡量。因此,通过各种有效的办法来提高上座率,是提高票房价值最常用的办法。
(1)上座率占比分析
下图显示了不同上座率的一个占比分析。其中,上座率在21%-40%的电影最多,占到了55.5%。要得出以下结果,需要对数据进行前期统计,再展现结果。

(2)上座率统计分析
下图则显示了更为详细的上座率分布情况,呈现中间多,两边少。说明,上座率特别高的电影很少,大部分是居于25%到60%之间。

3 票价分布情况分析
电影票价是指电影放映单位出售电影门票的价格。电影票价全国不统一,由各地主管部门自行制定。各地票价水平应与当地人民的收入水平和生活水平大体相适应,大城市比中小城市的票价高一些,中小城市比县城、集镇的票价稍高一些,农村比县城、集镇更低一些,有些边远山区甚至基本免费。票价在一定上影响了电影的票房。下图显示了2017-2019年电影票价总体情况的对比和每半年内票价的分布。比如,2017年下半年的异常票价比较多,2019年的平均票价比较高。

4 评分数据分析
使用三维图形对评分的影响因素进行分析,可视化结果如下图所示。三者之间的关系并不强,相对来说,票房高的电影,评分一定比率上较高。


