pearson相关系数怎么算?

编辑:自学文库 时间:2024年03月09日
皮尔逊相关系数是一种用于衡量两个变量之间线性关系强度的统计方法。
  它的取值范围在-1到+1之间,接近+1表示一个正相关关系,接近-1表示一个负相关关系,而接近0则表示没有线性关系。
  计算皮尔逊相关系数的步骤如下: 1. 计算每个变量的平均值。
   2. 计算每个变量与平均值之间的差,记为偏差。
   3. 将每个变量的偏差相乘,得到两个变量的偏差乘积。
   4. 将偏差乘积的总和除以变量数量减1,得到协方差。
   5. 将协方差除以两个变量的标准差的乘积,即变量的标准差乘积。
   6. 最后得到的结果即为皮尔逊相关系数。
   值得注意的是,计算皮尔逊相关系数前,需要确保数据满足一些假设条件,如变量之间的关系是线性的,并且数据是正态分布的。
   以一个示例来说明,假设有两个变量x和y,分别有10个数据点。
  首先计算x和y的平均值(x_mean和y_mean)。
  然后计算每个数据点与平均值的差,得到x的偏差和y的偏差。
  计算每个数据点的偏差乘积,并将它们求和,得到协方差。
  接着计算x和y的标准差,并将它们相乘得到标准差乘积。
  最后将协方差除以标准差乘积,即可得到皮尔逊相关系数。
   例如,x有数据点[1, 2, 3, 4, 5],y有数据点[2, 4, 6, 8, 10]。
  计算得到x_mean=3,y_mean=6。
  偏差分别为[-2, -1, 0, 1, 2],[6, 4, 2, 0, -2]。
  偏差乘积为[-12, -4, 0, 0, -4],协方差为-4。
  x的标准差为1.58,y的标准差为3.16,标准差乘积为4.99。
  最终,将-4除以4.99,得到皮尔逊相关系数为-0.801。
   通过计算皮尔逊相关系数,我们可以评估两个变量之间的线性关系强度和方向。