1.组距分组的要点
(1)将变量值的一个区间作为一组
(2)适合于连续变量
(3)适合于变量值较多的情况
(4)需要遵循“不重不漏、上限不在内”的原则
(5)可采用等距分组,也可采用不等距分组
2.组距分组的步骤
(1)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5— 15
(2)确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即“组距=( 最大值 - 最小值)÷ 组数”
(3)统计出各组的频数并整理成频数分布表
3.数值型数据图示
(1)条形图、帕累托图、饼图、环形图。(与分类数据共享的图形)
(2)累计频数或累计频率图。(比顺序数据共享的图形)
(3)独有的数据图示:茎叶图、箱线图、直方图、线图、散点图、气泡图、雷达图
4、数值型数据特有的图示
(1)分组数据的图示
用矩形的宽度和高度(即面积)来表示频数分布。
(2)未分组数据的图示
茎叶图:由“茎”和“叶”两部分构成,其图形是由数字组成的,以该组数据的高位数值作树茎,低位数字作树叶,树叶上只保留最后一位数字。
箱线图(Median/Quart./Range): 由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成。找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU),连接两个四分位数画出箱子,再将两个极值点与箱子相连接。
(3)时间序列数据的图示
线图:表示时间序列数据趋势的图形。时间一般绘在横轴,数据绘在纵轴。图形的长宽比例大致为10 : 7
一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断。
(4)多变量数据的图示
散点图:展示两个变量之间的关系。用横轴代表变量x,纵轴代表变量y,每组数据(xi , yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图。
气泡图:显示三个变量之间的关系。图中数据点的大小依赖于第三个变量。
雷达图:也称为蜘蛛图(spider chart)。显示多个变量的图示方法。假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比,可用于研究多个样本之间的相似程度。
1. 下限(lower limit) :一个组的最小值
2. 上限(upper limit) :一个组的最大值
3. 组距(class width) :上限与下限之差
开口组组距=相邻组组距
4. 组中值(class midpoint) :下限与上限之间的中点值

下面附件中是某电脑公司连续4个月每天的销售量数据(单位:台)。试用Excel中的【直方图】命令制作数值数据的频数分布表。
参考步骤:
第1步:选择【数据】【数据分析】【直方图】,单击【确定】。
第2步:在【输入区域】方框内输入原始数据所在的区域;在【接收区域】方框内输入上限值所在的区域;在【输出区域】方框内输入结果输出的位置;选择【图表输出】。单击【确定】。