医学统计学(2024秋)

中国医科大学 刘红波

目录

  • 1 绪论
    • 1.1 医学统计学概述
    • 1.2 统计学若干基本理念
  • 2 定量资料的统计描述
    • 2.1 频数分布与频数分布图
    • 2.2 集中位置描述
    • 2.3 离散程度描述
    • 2.4 正态分布
    • 2.5 正态分布的应用
  • 3 定性资料的统计描述
    • 3.1 常用相对数
    • 3.2 应用相对数的注意现象
  • 4 总体均数的估计
    • 4.1 均数的抽样误差与标准误差
    • 4.2 t分布
    • 4.3 总体均数估计(1)
    • 4.4 总体均数估计(2)
  • 5 假设检验的基本思想
    • 5.1 假设检验的基本思想
    • 5.2 假设检验的基本步骤
    • 5.3 假设检验的两型错误
    • 5.4 假设检验的注意事项
  • 6 t检验
    • 6.1 t检验
  • 7 卡方检验
    • 7.1 独立样本列联表资料的卡方检验
    • 7.2 独立样本列联表资料的卡方检验
    • 7.3 配对设计资料的卡方检验
  • 8 秩和检验
    • 8.1 Wilcoxon 符号秩和检验(一)
    • 8.2 Wilcoxon 符号秩和检验(二)
    • 8.3 成组设计两样本比较的秩和检验
  • 9 双变量关联性分析
    • 9.1 直线相关的概念与性质
  • 10 直线回归分析
    • 10.1 直线回归方程的建立
    • 10.2 直线回归方程的推断
    • 10.3 直线回归方程的应用
    • 10.4 直线回归分析的注意事项
  • 11 统计表与统计图
    • 11.1 统计表的制表原则与应用
    • 11.2 统计图的制表原则与应用
统计图的制表原则与应用
  • 1 教学内容
  • 2 练习
  • 3 案例
  • 4 扩展学习


二、统计图 
(statistical chart) 
()统计图的制作原则 
1. 根据资料性质和分析目的正确选用适当的统计图。描述某连续型变量的频数分布宜选用直方图;比较相互独立的统计指标的数值大小宜选用条图;分析某指标随时间或其他连续变量变化而变化的趋势宜选用线图;描述或比较不同事物内部构成用圆图或百分比条图; 
2. 除圆图外,一般用直角坐标系的第一象限的位置表示图域(制图空间) 
3. 绘制图形应注意准确、美观,给人以清晰的印象 
()统计图的基本结构 
1. 标题高度概括资料的时间、地点和主要内容。一般放在图的正下方,左侧加序号。 
2. 标目横标目和纵标目分别表示横轴和纵轴数字刻度的意义,一般有度量衡单位。 
3. 刻度数值按从小到大的顺序排列,纵轴由下至上,横轴由左至右。纵、横轴的比例为5 :77:5 
4. 图例当统计图用不同线条或颜色表达不同事物和对象的统计量时,应附图例加以说明。图例的位置以整张图的平衡美观为原则,可放在图的右上角空隙处或下方中间等。 
()常用统计图的适用条件与绘制要求 
常用的统计图: 
条图、圆图和百分比条图、线图、直方图、散点图、箱式图和统计地图等。 
1. 条图(bar chart) / 直条图
用相同宽度的直条长短表示相互独立的统计指标(绝对数或相对数)的数值大小和它们之间的对比关系。 
常用的条图: 
①单式条图:具有一个统计指标,一个分组因素; 
②复式条图:具有一个统计指标,两个分组因素。 
条图的绘制:横轴为分组因素,纵轴为欲比较的指标,直条竖放;当分析的事物较多时,可将直条横放。直条尺度必须从0开始,且等距。直条间隔与直条等宽或一半。直条按指标值大小或分组的自然顺序排列。



23.1全国各地区1990年、2000年人口总数比较


2. 圆图(pie chart):
是以圆的总面积表示事物的全部,将其分割成若干扇面表示事物内部各构成部分所占的比重。 
圆图的绘制:
以圆形的360。角为100%,1%相当于3.6。角,以资料中各构成的百分比乘以360。即得各构成扇面的角度; 
各扇面按大小顺时针排列,以12点位置作为起点,其他项放最后。不同扇面用不同颜色或花纹时,需用图例说明,条件允许时可将各类别标目和构成比数值标在图中。



23.2 2000年各地区人口在全国总人口中的构成比()


3. 百分比条图(percent bar chart):
以矩形总长度表示事物的全部,将其分割成不同长度的段表示各构成的比重。也适合描述分类变量各类别所占的构成比。 
百分比条图的绘制:
以矩形总长度L100%,将长度L乘以各类别的构成比得到各构成的长度,按类别的自然顺序由左往右依次排列,其他项放最后。特别适合作多个构成比的比较,将不同组别、不同时间或不同地区的某分类指标的构成比平行地绘制成多个百分比条图,可以方便地比较其构成比的差异。



23.3 2005年不同性别居民公共场所吸烟构成比较


4. 线图 (line chart):

用线段的升降来表示数值的变化,适合于描述某统计量随另一连续型数值变量变化而变化的趋势,常用于描述统计量随时间变化而变化的趋势。 
横轴时间或其他连续性变量纵轴统计指标。横轴和纵轴都是算术尺度,称普通线图;横轴是算术尺度,纵轴是对数尺度,称半对数线图(semi-logarithmic linear chart) ,特别适宜作变化速度的比较。普通线图纵轴以0点作起点,否则需作特殊标记或说明;不同指标或组别用不同的线段表示,各测定值标记点间以直线连接,不可修匀成光滑曲线。



23.4 1981-1991年某城市猩红热发病率变化趋势



23.5 1989-1993年某地痢疾和斑疹伤寒发病率的变化趋势

(a)纵轴为算术尺度;(b)纵轴为对数尺度 

普通线图痢疾的下降幅度较大;

半对数线图两者下降速度基本相同。 
5. 直方图(histogram):
以直方面积描述各组频数的多少,面积的总和相当于各组频数之和,适合表示数值变量的频数分布。 
横轴尺度是数值变量值,纵轴尺度是频数且必须从“0”开始。各组组距不等时,折合成等距后再绘图。即将频数除以组距得到单位组距的频数作为直方的高度,组距为直方的宽度。



23.6 2000年某地乙型脑炎病例的年龄分布


6. 散点图(scatter plot):
以直角坐标上点的密集程度和趋势来表示两个变量间的数量关系。 
绘制散点图时,横轴代表自变量,纵轴代表因变量。对于横轴上的每个值,纵轴上可以有多个点与其相对应;点与点之间不能用直线连接。 
7. 箱式图 (box plot):
通过5个统计量(P75P25M除异常值或离群值外的最小值和最大值)反映原始数据的分布特征(中心位置、偏度、变异范围和异常值 
箱子越长,数据变异程度越大。中间横线在箱子中点表明分布对称,否则不对称。 
特别适合多组数据分布的比较。



23.7 某地不同年龄段男性农民工体重箱式图


8. 统计地图 (statistical map):
用不同的颜色和花纹表示统计量的值在地理分布上的变化,适合描述研究指标的地理分布。 
先绘制按行政区域或地理特征分区的地图,再按各区域统计指标分别标记不同颜色或花纹,并加上图例说明不同颜色或花纹的意义。



23.8 2004年四川省乙型脑炎发病率的地区分布