数据分析基础

您所在的位置:网站首页 交叉嵌套什么意思 数据分析基础

数据分析基础

2024-04-19 23:47| 来源: 网络整理| 查看: 265

作用

列联(交叉)分析用于分析两两分组变量之间的交叉分布,然后比较各组的分布状况,以寻找变量间的关系。

输入输出描述

输入:一个定类变量 X 与一个或者多个字段 Y。输出:两两分组变量之间的交叉分布情况。

学习网站(案例数据免费下载)

SPSSPRO-免费专业的在线数据分析平台

案例示例

示例:不同地区(城市/农村)和性别的同学在玩电脑游戏的分布状况。

案例数据列联(交叉)分析算法案例数据案例操作

Step1:新建分析;Step2:上传数据;Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;

step5:选择【列联(交叉)分析】;step6:查看对应的数据数据格式,【列联(交叉)分析】要求输入数据一项为定量变量,其他定量/定类变量,选择对应分析类型(当变量为定量变量时,会自动进行四分位分组);step7:点击【开始分析】,完成全部操作

输出结果分析输出结果 1:相关系数表

图表说明:上表展示了以性别为分组项,以地区、玩电脑游戏情况为分析项的列联交叉分析结果,包括变量、频数、百分比等。由图可见,一周玩电脑游戏 4 个小时以上的同学占比最多。且虽然女性本身数量比男性多约百分之十,但是男女玩游戏情况比例差距不大,可认为男同学稍微更热衷于电脑游戏。而来自城市的同学比来自农村的同学多出很多,城市和农村内部的男女比例则基本跟总的男女比例一致。​输出结果 2:交叉图

图表说明:上图展示了列联交叉分析结果,包括变量、频数、百分比等。

注意事项若分析项为定量变量,SPSSPPRO 默认以四分位进行分组,若想生成更多分组,请使用数据处理—>数据编码。若想分析基于分组项下,各分析项是否存在差异以及程度,可以选择卡方分析。模型理论

列联表(contingency table) 是观测数据按两个或更多属性(定性变量)分类时所列出的频数表。它是由两个以上的变量进行交叉分类的频数分布表。

一般,若总体中的个体可按两个属性 A 与 B 分类,A 有 r 个等级 A1,A2,…,Ar,B 有 c 个等级 B1,B2,…,Bc,从总体中抽取大小为 n 的样本,设其中有 nij 个个体的属性属于等级 Ai 和 Bj,nij 称为 频数,将 r×c 个 nij 排列为一个 r 行 c 列的二维列联表,简称 r×c 表。若所考虑的属性多于两个,也可按类似的方式作出列联表,称为多维列联表。

参考文献

[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.[2] 贾俊平、何晓群、金勇.统计学(第四版):中国人民大学出版社,2009 年:246[3] 胡良平, 陶丽新. R×C 列联表资料的统计分析与 SAS 软件实现(一)[J]. Journal of Integrative Medicine(结合医学学报(英文)), 2009, 7(08):784-787.



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3