一、变量间的关系
(一)函数关系
1.定义:设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称? y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量。
2.特点:
是一一对应的确定关系;各观测点落在一条线上。
(二)相关关系
1.定义:变量之间存在的不确定的数量关系,称为相关关系。
2.特点:
(1)变量间关系不能用函数关系精确表达;
(2)一个变量的取值不能由另一个变量唯一确定;
(3)当变量 x 取某个值时,变量 y 的取值可能有几个;
(4)各观测点分布在直线周围。
(三)相关关系的类型
1.按照相关关系涉及变量(或因素)的多少分为
单相关——指两个变量之间的相关关系,如广告费支出与产品销售量之间的相关关系;
复相关——又称多元相关,是指三个或三个以上变量之间的相关关系,如商品销售额与居民收入、商品价格之间的相关关系。
偏相关——在一个变量与两个或两个以上的变量相关的条件下,当假定其他变量不变时,其中两个变量的相关关系称为。例如,在假定商品价格不变的条件下,该商品的需求量与消费者收入水平的相关关系即为偏相关。
2.按照相关形式不同分为
线性相关——又称直线相关,是指当一个变量变动时,另一变量随之发生大致均等的变动,从图形上看,其观察点的分布近似地表现为一条直线;例如,人均消费水平与人均收入水平通常呈线性关系。
非线性相关——一个变量变动时,另一变量也随之发生变动,但这种变动不是均等的,从图形上看,其观察点的分布近似地表现为一条曲线,如抛物线、指数曲线等,因此也称曲线相关。例如,工人加班加点在一定数量界限内,产量增加,但一旦超过一定限度,产量反而可能下降,这就是一种非线性关系。
3.按照相关现象变化的方向不同分为
正相关——当一个变量的值增加或减少,另一个变量的值也随之增加或减少。如工人劳动生产率提高,产品产量也随之增加;居民的消费水平随个人所支配收入的增加而增加。
负相关——当一个变量的值增加或减少时,另一变量的值反而减少或增加。如商品流转额越大,商品流通费用越低;利润随单位成本的降低而增加。
4.按相关程度分为
完全相关——当一个变量的数量完全由另一个变量的数量变化所确定时,二者之间即为完全相关。例如,在价格不变的条件下,销售额与销售量之间的正比例函数关系即为完全相关,此时相关关系便成为函数关系,因此也可以说函数关系是相关关系的一个特例。
不完全相关——又称零相关,当变量之间彼此互不影响,其数量变化各自独立时,则变量之间为不相关。例如,股票价格的高低与气温的高低一般情况下是不相关的。
不相关——如果两个变量的关系介于完全相关和不相关之间,称为不完全相关。由于完全相关和不相关的数量关系是确定的或相互独立的,因此统计学中相关分析的主要研究对象是不完全相关。
二、相关关系的描述与测度
(一)定性分析——散点图
用坐标的水平轴代表变量x,纵轴代表因变量y,每组数据(xi,yi)在坐标系中用一个点表示,n组数据在坐标系中形成了n个点称为散点,由坐标及其散点形成的二维数据图称为散点图。
(二)定量分析——相关系数
1.定义:根据样本数据计算的对两个变量之间线性关系强度的度量值,称为相关系数。
对变量之间关系密切程度的度量;
对两个变量之间线性相关程度的度量称为简单相关系数;
若相关系数是根据总体全部数据计算的,称为总体相关系数,记为r;
若是根据样本数据计算的,则称为样本相关系数,记为 r。
2.公式:
或简化
3. 取值及其意义
相关系数的值介于–1与+1之间,即–1≤r≤+1;
当r>0时,表示两变量正相关,r<0时,两变量为负相关;
当|r|=1时,表示两变量为完全线性相关,即为函数关系;
当r=0时,表示两变量间无线性相关关系;
当0<|r|<1时,表示两变量存在一定程度的线性相关。且|r|越接近1,两变量间线性关系越密切;|r|越接近于0,表示两变量的线性相关越弱;
一般可按四级划分:|r|<0.3可视为不相关;0.3≤|r|<0.5为低度相关;0.5≤|r|<0.8为中度相关;0.8≤|r|<1为高度线性相关。