
设(X,Y)是一个二维随机变量,若E{[X-E(X)][Y-E(Y)]}存在,则称此数学期望为X与Y的协方差,并记为Cov(X,Y)=E{[X-E(X)][Y-E(Y)]},特别有Cov(X,X)=)(XVar。从协方差的定义可以看出,它是X的偏差“X-E(X)”与Y的偏差“Y-E(Y)”的乘积的数学期望。由于偏差可正可负,故协方差也可正可负,也可为零,其具体表现如下:·当Cov(X,Y)>0时,称X与Y正相关,这时两个偏差[X-E(X)]与[Y-E(Y)]
同时增加或同时减少,由于E(X)与E(Y)都是常数,故等价于X与Y同时增加或同时减少,这就是正相关的含义。
当Cov(X,Y)<0时,称X与Y负相关,这时X增加而Y减少,或Y增加而X减少,这就是负相关的含义。
当Cov(X,Y)=0时,称X与Y不相关。也就是说,协方差就是用来描述二维随机变量X与Y相互关联程度的一个特征数。协方差Cov(X,Y)是有量纲的量,譬如X表示人的身高,单位是米(m),Y表示人的体重,单位是公斤(kg),则Cov(X,Y)带有量纲(m·kg)。



首先,我们假定要研究的两个随机变量是X和Y。他们的联合密度函数是f(x,y),X的边缘密度g(x),Y的边缘密度是h(y),他们的期望分别是EX和EY,方差是Var(X)和Var(Y),协方差为Cov(X,Y)=E(XY)-EXEY
然后,题主问的是随机变量X和Y不相关却不一定独立?
这里我们默认不相关指的是不线性相关,也就是协方差或者Pearson的线性相关系数为0
即Cov(X,Y)=E(XY)-EXEY=0 或者说 EXY=EXEY。
PS:一般来说,概率和统计中不加说明的使用不相关都是指线性相关系数为0。此外,相关系数不为0的情况,各式各样的说法有很多,有的人会说这两个随机变量相关,有的人会说两个随机变量之间有一定的线性关系,显得不严谨,因为xjb乱用的人太多了,总之怎么舒服怎么来,讲清楚就ok。此外楼主说的是随机变量,随机变量的独立要想严格讨论一定要在概率的框架下面,此外随机变量uncorrelated的定义就是协方差为0,请自行wiki。在统计中,独立只出现在假设中,样本本身是不能用来讨论独立性的,度量样本相关性的量很多,除了Pearson的线性相关系数,还有Kendall’s tau,Spearman‘s rho。
独立就是两个随机变量相互独立,等价于f(x,y)=g(x)h(y),即联合密度函数等于两个边缘密度的乘积。对于离散的随机变量会稍有不同,Pr(X=x,Y=y)=Pr(X=x)Pr(Y=y) for all x and y。
首先,很明确的告诉题主, 随机变量的 不相关 和 独立 在定义上就是不等价的。
独立是不相关的充分不必要条件,即独立可以推出不相关,反之不行。



