1
大学计算机基础:文史类
1.6.6 4.6 统计与分析

4.6 统计与分析

Exce l2007不仅具有数据计算处理能力,而且还具有数据管理功能。Exce l2007与其他的数据管理软件一样,拥有强大的排序、检索和汇总等数据管理方面的功能。Exce l2007能够通过记录单来增加、删除和移动数据,也能够对数据清单进行排序、筛选、汇总等操作。

4.6.1 数据清单

Exce l2007具有强大的数据管理功能,可以对不同类型的数据进行排序、筛选、分类汇总等操作。要使用这些数据管理功能,必须首先创建一个数据清单。

1)数据清单的概念

数据清单是指包含一组相关数据的一系列工作表数据行。Exce l2007在对数据清单进行管理时,一般把数据清单看作一个数据库。数据清单中的行相当于数据库中的记录,行标题相当于记录名。数据清单中的列相当于数据库中的字段,列标题相当于数据序中的字段名。

一般来说,数据清单应满足以下条件:

①避免在一张工作表中建立多个数据清单。如果工作表中还有其他数据,则要与数据清单之间留出空行、空列,以便在执行排序、筛选或自动汇总等操作时,便于Exce l2007检测和选中数据区域。数据清单中应避免放置空白列或空白行。

②在数据清单的第一行中创建列标题。

③列标题名称唯一,不允许重名。每一列必须是同类型数据。

④单元格数据的对齐方式可用格式工具栏上的对齐方式按钮来设置,不要用输入空格的方法来调整。

2)建立数据清单

数据清单的具体创建方法同普通表格的创建方法完全相同。首先根据数据清单内容创建表结构(第一行的列标题),然后移动到表结构下的第一个空行,依次输入数据信息即可完成创建工作。如图4.48所示,是一个数据清单示例。

img253

图4.48 数据清单示例

对于数据清单中的数据,同样可以设置相应的格式,如设置字体、字号、对齐方式、边框、底纹等。为了突出数据清单的列标题,通常将列标题设置成不同的字体、字号和颜色,将数据清单区域加上边框,将某些行或列的数据加上底纹或设置成不同的颜色等。

如果数据清单的字段(列标题)较多,处理数据不方便时,可以使用“记录单”来管理。使用记录单可以新建、删除数据记录,按某些条件查询数据记录。记录中只显示一条记录的各个字段,在记录单中输入或编辑数据,数据清单中的相应数据也会自动更改。但要注意的是,记录单中一次最多只能显示32个字段。

打开记录单的方法是首先选中数据清单中的任意单元格,然后利用“Alt+D+O”组合键或“记录单”按钮img254都可打开记录单。在快速访问工具栏中添加“记录单”按钮img255的方法为:单击“Office按钮”→单击“Excel选项”按钮img256→选择“自定义”选项→在“从下列位置选择命令”中,选择“所有命令”,然后在其下方找到“记录单”,再按“添加”按钮,最后按“确定”按钮就会把“记录单”按钮img257添加到快速访问工具栏中。

4.6.2 数据排序

为了便于查找数据、分析数据的变化状况,经常需要对数据进行排序,有助于快速得到更直观的结果,例如快速得出排名或快速从高到低地显示数据。数据排序是指按一定规则对数据进行整理、排列,这样可以为数据的进一步处理作好准备。Exce l2007提供了多种方法对数据清单进行排序,可以按升序、降序的方式,也可以由用户自定义排序。

在Exce l2007中排序时,数值数据将根据数值的大小顺序排序;字符数据将根据ASCII码值的大小排序;日期、时间数据将根据日期、时间的远近排序,日期越晚,值越大;逻辑值“TRUE”大于“FALSE”;所有的错误值都相等;空白(不是空格)单元格总是排在最后。排序前,需要首先决定按什么字段排序,每个用来排序的字段都叫作关键字。

1)排序命令

对Exce l2007中的数据清单进行排序时,在两个选项卡中都可选择排序命令。如果按照单列的内容进行排序,可以直接选择“开始”选项卡的“编辑”组中相关命令完成排序操作。而如果要对多列内容排序,则需要选择“数据”选项卡中的“排序和筛选”组中的命令进行操作,如图4.49所示。

img258

图4.49 排序命令

2)排序的种类

排序一般分为3种情况,即简单排序、复杂排序和自定义排序。

①简单排序是指设置单一的排序条件,对工作表中的数据按照某一字段进行的排序。

②复杂排序是指按照多个条件对数据清单进行排序,这是针对简单排序后仍然有相同数据的情况进行的一种排序方式。

③当简单排序和复杂排序都不能满足需求时,用户可以根据实际情况进行自定义排序。这种排序首先要自定义序列,其方法与前面介绍的自定义填充序列方法一样,然后再利用“排序”对话框(如图4.50所示)来排序。

4.6.3 数据筛选

数据清单创建完成后,对它进行的操作通常是从中查找和分析具备特定条件的记录,而筛选就是一种用于查找数据清单中符合某些条件的数据的快速方法。经过筛选后的数据清单只显示符合条件的数据行,以供用户浏览、分析,不满足条件的数据行自动将被暂时隐藏起来(并没有被删除)。

img259

图4.50 打开“排序”对话框

Exce l2007共提供了3种数据筛选方式供用户选择:自动筛选、自定义筛选及高级筛选。自动筛选一般用在筛选条件单一的情况下;筛选条件不超过2个的,通常自定义筛选就能解决;而高级筛选一般用在筛选条件是3个或3个以上的情况。

1)自动筛选

自动筛选是使用得最多的筛选方法,适用于条件比较简单的筛选。自动筛选为用户提供了在具有大量记录的数据清单中快速查找符合某种条件记录的功能。使用自动筛选功能筛选记录时,字段名称将变成一个下拉列表框的框名。

自动筛选的使用方法为:单击数据清单中任意一个单元格后,选择“数据”选项卡的“排序和筛选”组中的“筛选”命令,在数据清单第一行的各列中将分别显示出一个下拉按钮。单击此下拉按钮,可以直接选择筛选条件或者自定义筛选条件。

2)自定义筛选

使用Exce l2007中自带的筛选条件,可以快速完成对数据清单的筛选操作。但是当自带的筛选条件无法满足需要时,也可以根据需要自定义筛选条件。在一个字段名下拉列表中选择“数字筛选”→“自定义选项…”命令,弹出“自定义自动筛选方式”对话框,然后输入具体的筛选条件,单击“确定”按钮后,将得到所需的结果,如图4.51所示。

img260

图4.51 打开“自定义自动筛选方式”对话框

3)高级筛选

如果筛选的条件比较复杂,使用简单筛选或者自定义筛选都比较麻烦时,就可以使用高级筛选。使用高级筛选功能可以实现对某列或者多列应用多个筛选条件,也允许把满足条件的记录复制到当前工作表的其他位置,原数据清单保持不变。

使用高级筛选功能,必须在数据清单的上方或下方先建立一个条件区域,用来指定筛选的数据所需满足的条件。条件区域的第一行是所有作为筛选条件的字段名,这些字段名与数据清单中的字段名必须完全一样,条件区域的其他行则用于输入筛选条件。条件区域应当满足的条件是:

①条件区域与数据清单之间至少要留一个空行,如图4.52所示的条件区域。

img261

图4.52 对数据清单进行高级筛选

②条件区域中条件的逻辑关系是:写在同一行的条件互为“与”关系;写在不同行的条件互为“或”关系。图4.52的条件理解为:系别等于“自动控制”并且考试成绩>70,或者系别等于“计算机”并且上机成绩>17。需要注意的是,由于系别是文字型数据,在写条件时,应写成:=“"自动控制"”和=“"计算机"”。

高级筛选的使用方法,具体步骤如下:

第一步是在数据清单所在的工作表中选定一个条件区域(用来指定筛选的数据必须满足的条件)并输入筛选条件。

第二步将光标定位于数据清单中的任意一个单元格内,选择“数据”选项卡的“排序和筛选”组中的“高级”命令,弹出“高级筛选”对话框,如图4.52所示。

第三步是该对话框中选择好数据区域、条件区域和筛选结果的存放位置后,单击“确定”按钮即可显示出筛选结果。在图4.52中,数据区域A1:G14中为数据清单,数据区域C16:E18中为筛选条件,数据区域A20:G23中为筛选结果。

4)取消筛选

(1)取消对某个字段的筛选条件

单击该字段的筛选箭头,选择“从‘某个字段’清除筛选”即可。

(2)取消对所有字段的筛选条件

选择“数据”选项卡“排序和筛选”组中的“清除”命令。

(3)取消对数据清单的筛选条件

选择“数据”选项卡“排序和筛选”组中的“筛选”命令即可。

4.6.4 分类汇总

分类汇总是对数据清单进行数据分析的一种方法,即在数据清单中快速汇总同类数据的方法。使用了分类汇总命令,系统会帮助用户自动计算出数据列的分类汇总和总计值,并在行号左侧显示分级显示按钮,用以快速显示或隐藏明细数据。

分类汇总对数据库中指定的字段进行分类,然后统计同一类记录的有关信息。统计的内容可以由用户指定,可以自动对所选数据进行汇总,并插入汇总行。汇总方式灵活多样,如可以统计同一类记录的记录条数,还可以对某些数值段求和、求平均值、求极值、标准方差等。要使用分类汇总,必须先按分类字段进行排序,否则有可能使同一分类出现多个汇总统计结果。

1)创建分类汇总

Exce l2007可以在数据清单中自动计算分类汇总及总计值,用户只需指定需要进行分类汇总的数据项、待汇总的数值和用于计算的函数(例如“求和”函数)即可。如果要使用自动分类汇总,工作表必须组织成具有列标志的数据清单。在创建分类汇总之前,用户必须先根据需要进行分类汇总的数据列对数据清单排序。创建分类汇总的操作步骤如下:

①先对分类字段排序。

②将光标定位在数据清单的任意一个单元格中,选择“数据”选项卡的“分级显示”组中的“分类汇总”命令,弹出“分类汇总”对话框,如图4.53所示。

img262

图4.53 打开“分类汇总”对话框

③选择分类字段、汇总方式、汇总项后,单击“确定”按钮,出现用分级形式显示数据的分类统计表。单击分类统计表左侧的“1”“2”“3”按钮,可以分级显示各级数据清单,单击“+”“-”按钮可以展开或折叠这一级的数据清单。

④如果想恢复原工作表,取消分类汇总,可以单击“分类汇总”对话框中的“全部删除”按钮。

在实际使用过程中,还可以对同一个分类字段进行多种不同方式的汇总。但为了不覆盖前面已经进行的分类汇总,一定不能选中“替换当前分类汇总”复选框。

2)显示或隐藏明细数据

为了方便查看数据,可将分类汇总后暂时不需要使用的数据隐藏起来,以减小界面的占用空间。当需要查看隐藏的数据时,可再将其显示。方法是:选择“数据”选项卡的“分级显示”组中的“隐藏明细数据”/“显示明细数据”命令。

3)分级显示

在前面介绍分类汇总操作时,已经使用了Exce l2007中的分级显示功能。使用该功能可以将某个范围的单元格关联起来,并可以将其折叠与展开,如图4.54所示。

img263

图4.54 打开“创建组”对话框

4.6.5 数据合并

通过合并计算,可以把来自一个或多个源区域的数据进行汇总,并建立合并计算表。这些源区域与合并计算表可以在同一工作表中,也可以在同一工作簿的不同工作表中,还可以在不同的工作簿中,如图4.55所示。

img264

图4.55 数据合并示例

4.6.6 数据透视表与数据透视图

Exce l2007提供了一种简单、形象、实用的数据分析工具--数据透视表及数据透视图,该工具可以生动、全面地对数据清单重新组织和统计数据。数据透视表功能能够使筛选、排序和分类汇总等操作依次完成,并生成汇总表格,是Exce l2007强大数据处理能力的具体体现。简单地说,数据透视表可实现按多个字段分类汇总的功能。

1)数据透视表的基本术语

数据透视表是用来对数据进行分析的一种特殊的工作表,具体来说是一种对大量数据进行快速汇总和建立交叉列表的交互式表格。它不仅可以转换行和列以显示原数据的不同汇总结果,也可以显示不同页面以筛选数据,还可以根据用户的需要显示区域中的细节数据,如图4.56所示。

img265

图4.56 数据透视表的示例

2)创建数据透视表

在Exce l2007工作表中创建数据透视表的步骤大致可分为两步:第一步是选择数据来源;第二步是设置数据透视表的布局,如图4.57所示。

img266

图4.57 创建数据透视表

3)使用数据透视表来分析数据

数据透视表会自动将数据源中的数据按用户设置的布局进行分类,从而方便用户分析表中的数据,如可以通过选择字段来筛选统计表中的数据,如图4.58所示。

img267

图4.58 使用数据透视表分数据

4)设置数据透视表选项

在“数据透视表工具”的“选项”选项卡中还可以设置其他常用数据透视表选项,如图4.59所示。

img268

图4.59 “选项”选项卡

5)移动数据透视表

对于已经创建好的数据透视表,用户不仅可以在当前工作表中移动位置,还可以将其移动到其他工作表中,如图4.60所示。

img269

图4.60 移动数据透视表

6)创建数据透视图

数据透视图可以看作数据透视表和图表的结合,它以图形的形式表示数据透视表中的数据。在Exce l2007中,可以根据数据透视表快速创建数据透视图,更加直观地显示数据透视表中的数据,方便用户对其进行分析,如图4.61所示。

img270

图4.61 创建数据透视图