第二节 积差相关

您所在的位置:网站首页 标准差的定义计算公式 第二节 积差相关

第二节 积差相关

2024-07-03 11:29| 来源: 网络整理| 查看: 265

第二节  积差相关

  研究两种现象,两种行为或两个事物,一句话,研究两个变量之间的相关情况时,积差相关是应用最普遍、最基本的一种相关分析方法,尤其适合于对两个连续变量之间的相关情况进行定量分析。

一、积差相关概念及基本公式

  英国著名统计学家皮尔逊 (K Pearson)跟随英国著名科学家高尔顿(F Galton)在合作研究有关人类身高遗传问题的过程中,提出了“回归”的概念以及积差相关分析方法。   对于两个连续的变量(比率变量或等距变量),例如父辈的身高变量和子辈的身高变量之间有什么连带关系;学生的体重与身高变量之间有什么连带关系;不同学科成绩之间有什么样的相互关联;人的智力发展水平同学业成就之间相关程度如何等等,通过观测研究,可以用积差相关分析的方法,定量地描述两个变量之间的相关强度与方向。   设有两个变量X和Y ,其n 个观测点的成对数据不妨记为 。基于这些成对的观测数据,我们可以计算成对的观测数据离差均值,即有:

    

  式中:

  基于上述观测数据离差值乘积所得结果进行相关分析的方法,称为积差相关。计算积差相关系数的基本公式是:

          

  式中: 表示双变量(X,Y)数据之间的积差相关系数; 是各对观测数据的离差值乘积之和; 是变量X观测数据离差值自乘积之和,即离差平方和;同理可知,是变量Y 的离差平方和。

  因此,积差相关系数基本公式(4-1)也可以用下式表达:

      

二、积差相关系数计算方法

  积差相关系数基本公式(4-1)和公式(4-2)结构对称,容易掌握,但在具体计算时,其计算量却不少,需要分步计算,最后综合。主要步骤归纳起来是:

  (1)计算平均和;

  (2)计算离差值和;

  (3)计算各对离差值乘积以及乘积之和;

  (4)计算数据的离差平方和,即;

  (5)计算数据的离差平方和,即;

  (6)把上述有关结果代入公式(4-1)或公式(4-2),求出。

  为了有条不紊地计算相关系数,通常采用列表的方式逐个计算,这也便于检查是否计算出错以及错在何处。设计的表格一般要有7个栏目,分别记录有关数据,而在表格的最后一行进行总计。下面举一例子,说明积差相关系数的基本计算方法。   [例1] 随机观测15名高一学生在语文推理测验X和数字推理测验Y 上的成绩(两个测验的满分均为70分),其结果如表4-1中第1、第2栏所示,试求该两个测验分数之间的积差相关系数。   [分析计算] 根据公式(4-1)及上述归纳步骤进行表上操作。

  第一,准备一个表格如表4-1,共7个栏目,从左到右依次登载有关数据和。

  第二,在表4-1最底端空出一行,用以登载有关数据连加和的结果,从左到右依次是

  第三,从已知的15对观测数据出发,根据公式(4-1)的结构,先计算出和 , 和,并把这4个数据登记在最后一行所对应的总计格子里。

  第四,按表4-1结构内容,从左到右,逐个栏目地完成有关计算,最终得到需要的数据,依次是

  第五,在表格外面,把第四步得到的三个数据代入公式(4-1)或公式(4-2),计算出积差相关系数。

  一般说来,上述各步计算都可借助计算器来进行。

  表4-1  计算积差相关系数表格法示例1

  Yi

31

32

-1.4

-6.73

1.96

45.2929

9.422

23

8

-9.4

-30.73

88.36

944.3329

288.862

40

69

7.6

30.27

57.56

916.2729

230.052

19

21

-13.74

-17.73

179.56

314.3529

237.582

60

66

27.6

27.27

761.76

743.6529

752.652

15

41

-17.4

2.27

302.76

5.1529

-39.498

46

57

13.6

18.27

184.96

333.7929

248.472

26

7

-6.4

-31.73

40.96

1006.7929

203.072

32

57

-0.4

18.27

0.16

333.7929

-7.308

30

37

-2.4

-1.73

5.76

2.9929

4.152

58

68

25.6

29.27

655.36

856.7329

749.312

28

27

-4.4

-11.73

19.36

137.5929

51.612

22

41

-10.4

2.27

108.16

5.1529

-23.608

23

20

-9.4

-18.73

88.36

350.8129

176.062

33

30

0.6

-8.73

0.36

76.2129

-5.238

总和486 平均数32.4

581

38.73

0

+0.05

2495.60

6072.9335

2875.600

  从表4-1中的计算数据可知:

=2495.60;  =6072.9335;  =2875.600 

  因此,这15名高一学生在语言推理测验X 和数字推理测验Y 上的测验分数积差相关系数是:

  

     可见,这两个推理测验分数之间有较高的正相关。

三、利用原始数据直接计算积差相关系数

  如同第二章介绍标准差S的计算有两种方法一样,除了根据基本公式计算外,还可以不通过计算平均数及离差值而直接利用原始数据计算积差相关系数。     事实上,从公式(4-1)或公式(4-2)出发,通过一系列代数演算与化简,就可得到积差相关系数据的另一种计算公式,如下:

 

     公式(4-3)是利用原始数据和,直接计算积差相关系数的公式。   式中:是成对观测数据的乘积之和;是X变量观测数据之和;是Y变量观测数据之和;是两组数据各自求和之后的乘积;是X变量观测数据平方后的连加和;是Y变量观测数据平方后的连加和。

  下面以一个例子来说明这种方法的计算。

  [例2] 假定10名小学生的期末语文考试成绩和数学考试成绩如表4-2中的第2栏和第3栏中的数据所示,试求语文成绩和数学成绩之间的相关系数。   [分析计算] 我们通常把学生的考试成绩看成是连续变量,只不过实际观测分数大多是取整数。因此,这是需要计算积差相关系数。类似上例的计算方法,可以把整个计算过程归纳成如下几个有序的步骤:

  (1)可设计一个表格共6个或5个栏目,从左到右依次登记学生编号(或数据编号), , 和。

  (2)把成对的观测数据(),(),…,()分别登记在第2栏和第3栏中。本例共有10对观测数据,即n=10。

  (3)把表4-2的最后一行留出足够的空格,以记录各栏目数据的连加和数。

  (4)先计算,把结果分别写在表4-2第2栏和第3栏的最后总计格子里。

  (5)逐个计算原始数据,和,依次登记在相尖的空格位置上。为了避免计算上的疏忽,最好是按竖的方向,一个栏目一个栏目地计算。

  (6)计算连加和数据:并把它们登记在表4-2第4栏、第5栏及第6栏最底端的总计格子里。

  就本例表4-2中的计算结果可知:

n=10;=756;=837;=57352;=70245;=63369

  把上述数据代入公式(4-3)可得:

表4-2  计算积差相关系数表格法示例2

学生号 01

74

82

5476

6724

6068

02

71

75

5041

5626

5325

03

80

81

6800

6561

6480

04

85

89

7225

7921

7565

05

76

82

5776

6724

6232

06

77

89

5929

7921

6853

07

77

88

5929

7744

6776

08

68

84

4624

7056

5712

09

74

80

5476

6400

5920

10

74

87

5476

7569

6438

756 837 57352 70245 63369

  =

   =

  可见,从这10个学生的语文考试成绩和数学考试成绩得到的积差相关系数r=0.48来看,这两个科目成绩之间存在着中等程度的正相关。   值得指出的是, 相关系数的观测值r跟抽样数据的容量有关。观测数据越多, 其相关系数r值就越稳定,因而,真实性也相对越大。若抽样数据容量较小,计算相关系数r 值的抽样误差也越大。因此,解释相关系数时要考虑上述这些因素。若想要有较大的信心去认识相关系数的真实性,就要采用推断统计的方法,对观测得到的相关系数进行必要的统计检验。这些内容将在本书第十章有关章节内容中加以介绍。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3