协方差

統計學名詞

概率论统计学中,协方差(英语:Covariance)用于衡量随机变量间的相关程度。

“Covariance”的各地常用译名
中国大陆协方差
台湾共变异数
港澳协方差
日本、韩国共分散
两变量X与Y在3种不同的协方差情况下的关系

定义

定义 — 
 样本空间  是定义在  事件族   上的概率。(换句话说,   是个概率空间

   是定义在   上的两个实数随机变量期望分别为:

 
 

则两者间的协方差定义为:

 

根据测度积分的线性性质,上面的原始定义可以进一步简化为:

 

协方差矩阵

协方差的定义可以推广到两列随机变量之间

定义 — 
 概率空间   是定义在   上的两列实数随机变量序列(也可视为有序对行向量

若二者对应的期望分别为:

 
 

则这两列随机变量间的协方差定义成一个   矩阵

 

以上的定义,以矩形来表示就是:

 

性质

统计独立

定理 — 若随机变量    是相互独立的,则

 

计算性质

如果  是实数随机变量,  是常数,那么根据协方差的定义可以得到:

 
 
 

对于随机变量序列  ,有

 

对于随机变量序列 ,有

 

相关系数

取决于协方差的相关性 

 

更准确地说是线性相关性,是一个衡量线性独立的无量纲数,其取值在 之间。相关性 时称为“完全线性相关”(相关性 时称为“完全线性负相关”),此时将  作Y-X 散点图,将得到一组精确排列在直线上的点;相关性数值介于-1到1之间时,其绝对值越接近1表明线性相关性越好,作散点图得到的点的排布越接近一条直线。

相关性为0(因而协方差也为0)的两个随机变量又被称为是不相关的,或者更准确地说叫作“线性无关”、“线性不相关”,这仅仅表明  两随机变量之间没有线性相关性,并非表示它们之间一定没有任何内在的(非线性)函数关系,和前面所说的“  二者并不一定是统计独立的”说法一致。

参见