回答数
3
浏览数
16521
高冷vip
当两个变量的标准差都不为零;两个变量之间是线性关系,都是连续数据;两个变量的总体是正态分布,或接近正态的单峰分布;两个变量的观测值是成对的,每对观测值之间相互独立。
1、皮尔逊相关系数的适用条件:当两个变量的标准差都不为零。两个变量之间是线性关系,都是连续数据。两个变量的总体是正态分布,或接近正态的单峰分布。
2、皮尔逊相关系数衡量随机变量X与Y线性相关程度的一种方法,相关系数的取值范围是-1到1。相关系数的绝对值越大,则表明X与Y相关度越高。当X与Y线性相关时,相关系数取值为1或-1。
3、皮尔逊相关系数的变化范围为-1到1。 系数的值为1意味着X和Y可以很好的由直线方程来描述,所有的数据点都很好的落在一条直线上,且Y随着X的增加而增加。系数的值为−1意味着所有的数据点都落在直线上,且Y随着X的增加而减少。系数的值为0则个变量之间无线性关系。
4、几何学解释:对于没有中心化的数据, 相关系数与两条可能的回归线夹角的余弦值一致。对于中心化过的数据,相关系数也可以被视作由两个随机变量向量夹角的余弦值。
吹尽也
皮尔逊相关系数变化从-1到 +1,当r>0表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;r<0表明两个变量是负相关,即一个变量的值越大另一个变量的值反而会越小。
r 的绝对值越大,则两变量相关性越强。若r=0,表明两个变量间不是线性相关,但可能存在其他方式的相关(比如曲线方式)。
扩展资料:
(1)一般认为:|r|≥时,可认为两变量间高度相关;≤|r|<,可认为两变量中度相关;≤|r|<,可认为两变量低度相关;|r|<,可认为两变量基本不相关。
(2)也有认为:|r|≥时,可认为两变量间极高度相关;≤|r|<,可认为两变量高度相关;≤|r|<,可认为两变量中度相关;≤|r|<,可认为两变量低度相关;|r|<,可认为两变量基本不相关。
(3)还有认为:|r|≥时,可认为两变量间强相关;≤|r|<,可认为两变量中度相关;≤|r|<,可认为两变量弱相关;|r|<,可认为两变量极弱相关或不相关。
参考资料来源:百度百科-皮尔逊相关系数