统计推断 |
您所在的位置:网站首页 › 判断XY独立性的方法 › 统计推断 |
一、线性相关描述
问题:两变量间是否存在相关或关联? 身高与体重 尿铅排出量与血铅含量 凝血时间与凝血酶浓度 血压与年龄 1、线性相关例 在某地一项膳食调查中,随机抽取了14名40~60岁的健康妇女,测得每人的基础代谢(kJ /d)与体重(kg)数据,见表。据此数据如何判断这两变量间有无关联?
变量X和Y相关系数的详细公式如下: 例 计算上个例子中基础代谢Y与体重X之间的样本相关系数。 说明该14名40~60岁健康妇女的基础代谢和体重之间呈正相关,相关程度较大。 2、相关系数的种类 2.1、Pearson(皮尔逊)线性相关系数
当两个变量的标准差都不为零时,相关系数才有定义,皮尔逊相关系数适用于:两个变量之间是线性关系,都是连续数据,可以使用散点图查看;两个变量的总体是正态分布,或接近正态的单峰分布;两个变量的观测值是成对的,每对观测值之间相互独立。 皮尔逊相关系数的经验解释如下。 ①当 ②当 ③当 ④当 斯皮尔曼相关系数是根据等级资料研究两个变量之间相关关系的方法。它是依据两列成对等级的各对等级数之差来进行计算的,所以又被称为“等级差数法”。其计算公式为: 其中 等级相关系数是建立在等级的基础上计算的,比较适用于反映序列变量的相关。等级相关系数和通常的相关系数一样,它与样本的容量有关,尤其是在样本容量比较小的情况下,其变异程度较大,等级相关系数的显著性检验与普通的相关系数的显著性检验相同。 斯皮尔曼相关系数对数据条件的要求没有皮尔逊相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关系数来进行研究,属于非参数统计方法。 2.3、Kendall(肯德尔)等级相关系数肯德尔相关系数用希腊字母 其中C表示X和Y种拥有一致性的元素对数(两个元素为一对) D表示X和Y中拥有不一致性的元素对数。 需要注意的是,上述公式仅适用于集合X与Y中均不存在相同元素的情况(集合中各个元素唯一)。肯德尔相关系数与斯皮尔曼相关系数对数据条件的要求相同。肯德尔相关系数的取值范围在-1~1,当 例 计算例1中基础代谢 说明该14名40~60岁健康妇女的基础代谢和体重之间呈正相关,相关程度较大。 注意:以上
1. 查相关系数临界值表(样本量 2. 例
步骤: 1、对样本系数r做正曲正切变换,得到的z服从正态分布。 2、算出小z上下的95%置信区间。 3、对区间的上限、下限做反双曲正切变换。 例: (1.4086,2.5906)————>Z的上下限 (0.8872,0.9888)————>反双曲正切变换 【总结】两变量相关分析的步骤: 1、对随机变量x和y的相关关系利用散点图进行考察,是否有线性的趋势。 2、计算样本相关系数r。 3、假设检验:推断总体的相关系数 4、计算总体相关系数 5、下结论:两变量(总体)是否有相关关系?相关密切程度如何? 1.4、应注意的问题1). 散点图显示变量间有线性趋势时,才进行相关分析 2). 线性相关适用于双变量正态分布资料 3). 正确理解相关关系,“相关不等于因果” 4). 出现异常值时慎用相关 5). 分层资料盲目合并易出假象。 线性相关系数(Pearson correlation coefficient) 适用于:服从双变量正态分布;连续型定量资料。 秩相关(rank correlation, Spearman coefficient),或称等级相关。 适用于:不服从双变量正态分布;总体分布类型未知;数据本身有不确定值;等级资料。 例 某研究者研究10 例6 个月~7 岁的贫血患儿的血红蛋白含量与贫血体征之间的相关性,结果见表,试作秩相关分析。 1、分别对 2、以秩次代入公式计算 类似于积矩相关系数,关于秩相关系数的检验假设为
当 例 对以下例子的秩相关系数作假设检验。 例中算得 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |