【竞赛分享】正大杯第十三届第7期:市场调研问卷分析

您所在的位置:网站首页 spss比值统计量 【竞赛分享】正大杯第十三届第7期:市场调研问卷分析

【竞赛分享】正大杯第十三届第7期:市场调研问卷分析

2023-03-24 11:41| 来源: 网络整理| 查看: 265

单变量分析规模与结构分析

概念:以频数或频率来描述,频数是变量出现的次数,频率是频数与全体观测值的比值。由频数分布表和频数分布图表示。

频数分布表:

频数分布图:

常见的有条形图、饼图、直方图、折线图、钟形分布图(正态分布、左偏分布、右偏分布)J形分布图、U形分布图

其中,还需要通过计算偏度和峰度来分析数据分布的形态特征:

偏度:反映数据偏斜程度,记为SK;SK=0时对称分布,SK0为右偏分布。

峰度:反映频数分布曲线顶端尖峭程度,记为KU;KU=0时正态分布,KU>0时尖峰峰态,KU

满意度分析指标:

其实就是对满意度进行赋分,然后进行加权评价求每个对象的满意度。

举个例子来讲

例如:在一场企业调查中,进行各个方面满意度调查,“非常满意”“比较满意”“一般”“比较不满意”“非常不满意”分别为5分、4分、3分、2分、1分,对则对其分别赋分分别为100、80、60、30、0分。

则满意度的计算公式为:

分别为这些满意程度,n为样本总量。

可以求得比如对工作量、工作环境、工资福利这些的满意度,进行比较。

SPSS实操分组

首先先进行数据分组,如果不需要可以直接跳过

1.点击转换-重新编码为不同变量

2.把要分组的数据选入,并取好名称,然后点击变化量

3.点击范围和值,分别填入范围并赋值,一一点击添加然后点继续。

4.得到了分组的数据,然后点击分组的栏,点击“值”,为值加标签,填写自己赋的值,然后打上所想要分组的标签(范围)

频率图

①如图点开“分析”-“描述统计”-“频率”

②选入想要研究的变量

③点击“统计”,勾选“偏度”“峰度”,点击“继续”

④点击“图表”,勾选自己想要的图表,点击“继续”,然后点“确定”

得到结果

集中度分析

定义:是测量一组数据的集中趋势,反映各调查数据向其中心值靠拢或聚集的程度

(一)众数

定义:数据中出现次数最多的变量值,记为M0,不受极端值影响,但不具有唯一性

计算方法:

① 观察法:定类数据中出现频数最多的数据即为众数;定距数据中众数为频数最大组的组中值。

② 插值公式:定距变量分组的数据中可使用公式:

(L表示众数所在组下限值,△1表示为与众数组下限相邻的频数,△1表示与众数组上限相邻的频数,i为组距)

(二)中位数和分位数

1.中位数

定义:是一组数据按照大小顺序排列后,位于中间位置的变量值,记为Me,将调查数据分为相等两部分,且不受极端值影响。

计算方法:先排序再找中间位置数值。

计算公式:

2.分位数

定义:将一组排序后的数据进行不同等分后,各分位点上的值就是对应的分位数,可以用来衡量数据的位置特征。如四分位数、十分位数等。

如:四分位数

四分位数是统计学中分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。

第三四分位数与第一四分位数的差距又称四分位距。

(三)均值

定义:是表示一组数据集中趋势的量数,又称平均值

计算方法:

变异性分析

定义:测量数据的离散趋势,反映各调查数据远离其中心值的程度。

(一)异众比率

定义:非众数组的频率占总频率数的比率,即总体中非众数次数与总体全部次数之比,记为Vr

作用:可以衡量众数的代表性的好坏,数值越大则众数代表性越差。

计算公式:

(二)四分位差

作用:反映中间50%数据的离散程度,数值越小说明中间数据越集中

计算公式:

(三)方差和标准差

作用:反映所有变量值对平均数的离散程度,其数值越小,平均数代表性越好。

(四)离散系数

定义:调查数据的标准差与其算数平均数的比值,也称变异系数,记为CV。

作用:用于比较不同类别数据的离散程度,是反映数据离散程度的相对指标,数值越小离散程度越小,平均指标对总体一般水平的代表性越好。

SPSS实操

① 点击“分析”-“描述统计”-“探索”

② 分别把研究的因变量也因子(自变量)放进去,然后点“图”勾选“茎叶图”、“直方图”,点“统计”选中“描述、离群值、百分位数、M-估计量”,然后点击“确定”

③ 得到结果数据

解读:

男生分数的平均值为73.62分,中位数为74.00,方差为168.256,四分位距为20;女生分数的平均值为76.47分,中位数为77分,方差为99.765,四分位距为14.

参数估计

参数估计是指在满足一定精度和把握程度的条件下,利用样本信息来估计总体特征的统计分析方法。

由样本统计量的值推断总体参数的基础和前提是样本统计量作为随机变量的概率分布,因此抽样调查中只有采用概率抽样方法获取的样本数据才能用来推断总体信息,非概率样方法获取的数据不能用于推断总体。

(一)点估计

点估计是直接用样本估计量作为总体本未知参数的估计量。

Eg.北京市宝宝平均毎月奶粉支出的均值值为769.36元,如果以769.36元直接作作为北京市全部婴幼儿奶粉消费者平均每月用于宝宝奶粉支出出的估计值,这种估计方法就是点估计。

特点:简便且直观,但由于仅以一次抽样的结果来估计总体参数值,因此无法提供误差程度的准确信息,无法知道做出估计的把握程度

(二)区间估计

①相关概念

②基本原理

根据给定的置信度构造出被估计的总体参数的上限和下限。

与点估计不同,区间估计方法是以区间的形式给出总体参数的取值范围和推断的把握程度。对于定距和定比变量,区间估计方法主要是对总体的均值和方差进行估计;对于定类和定序变量,主要是对估计总体的比例进行估计。区间估计弥补了点估计不能给出推断把握程度的不足。

③建立区间估计步骤:

1.明确被估计参数和事先确定的估计置信度。

2.根据问题的要求,构造出“概率”事件。

3.进行转化处理,以期找出估计量及其分布类型。

4.利用估计量的分布求出置信区间

④ 单个总体 N(μ,) 均值的区间估计

1.方差已知

2.方差未知

补充

SPSS实操

① 与集中度分析和变异性分析第一步相同(SPSS操作Ⅱ)选中探索性分析

② 点击“统计”,根据实际情况设置“置信度”(0-100之间不可取端点值)

③ 得到结果,可以与SPSSⅡ中的置信区间做比较

解读:在置信度为90%的情况下,男生成绩的置信区间为67.20分—80.03分,女生成绩的置信区间在72.24分—80.07分

显著性检验

(一)相关概念

统计假设:对总体参数的假设值,一般分为原假设和备择假设。

原假设: 是接受检验的假设,记作H0 。

备择假设: 是当原假设被否定时,另一种可能的假设,记作H1。

统计量:在检验原假设是否成立时,对不同的问题需要构造不同的检验统计量。如t统计量、X2统计量、F统计量等。

显著性水平:在H0成立的况下,统计量落在拒绝域的条件概率,记为a。它是判断样本估计值与H0统计假设值之间是否有显著差异的临界概率,一般取a=0.05.

显著性检验的p值: 实际样本估计值与H0下统计假设值之间不一致程度的概率值,p值越小说明实际样本估计值与H0下统计假设值之间不一致程度越大,表明检验结果越显著。

显著性检验:事先对总体分布形式或总体(随机变量)的参数做出一个假设,然后利用样本信息来判断这个假设是否合理,即判断总体的真真实情况与原假设是否有显著性差异。显著性检验可以分为为参数检验和非参数检验两种。

参数检验:在总体分布已知的情况下,先对总体参数提出假设设,然后再利用样本信息去检验该假设设是否成立。

非参数检验:在总体分布未知的情况下,先对总体提出假设,然后再根据样本资料对假设的正确性进行判断。

(二)基本原理

显著性检验的基本思想是“小概率事件”原理,即发生概率很小的随机事事件在一次试验中几平不可能发生。

显著性检验则是指在给定样本量的情况下,只限定犯第Ⅰ类错误的最大概率,不控制犯第Ⅱ类错误的概率。

根据这一原理,基于于样本数据判断原假设是否成立,但这这种判断总有可能是错误的。可能为真时,拒绝了,这类“弃真”错误称为第Ⅰ类错误;也可能 为假时接受了,这类“取伪”错误称为第Ⅱ类错误。

(三)显著性检验的步骤

(1)根据实际问题,对总体提出原假设和备择假设;

(2)确定显著性水平;

(3)确定适当的统计量和拒绝域的形式;

(4)计算检验统计量的值和拒绝域;

(5)根据样本观察值,判断接受还是拒绝原假设。

(四)检验方法

(一)常用的检验方法

总体分布形式的正态性检验,一般用来检验总体是否服从或近似服从正态分布。服从正态分布的统计量具有一系列优良性,是基本统计方法应用的前提。

1.偏度和峰度系数判定法

即分别计算样本的偏度系数和峰度系数,若两个系数都接近于0,则可以认为近似服从正态分布;

2.Q - Q 图检验法

以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,将样本表现为直角坐标系的散点,若样本点呈一条接近第一象限对角线的直线,则总体服从正态分布。

在实际调查中,大部分数据都不会是是完全服从正态分布,只要数据样本本量足够大,数据接近正态分布形态即可.

3.单变量数据分析常用方法——t检验

(一)适用范围

t检验适用于数值型数据、正态分布、方差相等的两组小样本比较情况,包括两独独立样本t检验和两配对样本t检验。

其中,两独立样本t检验是根据分别来自两个独立总体的两组样本数据,检验这两个独立总体的均值之间是否存在显著性差异的检验方法;两配对样本t检验是根据分别来自两个配对总体并且具有一一对应关系的两组样本数据,检验这两个配对总体的均值之间是否存在显著性差异的的检验方法。

SPSS实操

① 点击“分析”-“比较平均值”-“独立样本t检验”(这一步根据样本间关系而定)

②将检验变量和分组变量分别填入,再定于组,把分组变量的值填进去。点继续

③ 得到结果

解读:

由此可见,显著性为0.387>0.05,因此男女生的语文成绩不存在显著性差异,因此看表中第一行假定方差相等的t检验结果,t=-0.682,p=0.501>0.05,则在5%的情况下没有理由拒绝原假设“男女生语文成绩不存在显著性差异”

本文所用数据集:单变量分析数据集,学生成绩。所用软件为SPSS 26

https://paphi41ies.feishu.cn/docx/HvYsdy3SSoWxxNxxuGxcWIxcnNg?from=from_copylink

往期合集

【竞赛信息】正大杯第十三届第1期:市场调研如何选题? - 赛否的文章 - 知乎 https://zhuanlan.zhihu.com/p/597488605

【竞赛信息】正大杯第十三届第2期:问卷设计要掌握哪些要领? - 赛否的文章 - 知乎 https://zhuanlan.zhihu.com/p/598555205

【竞赛信息】正大杯第十三届第3期:市场调研的深度访谈要怎么做? - 赛否的文章 - 知乎 https://zhuanlan.zhihu.com/p/600119601

【竞赛信息】正大杯第十三届第4期:市场调研焦点小组访谈要怎么做?与深度访谈有何异同? - 赛否的文章 - 知乎 https://zhuanlan.zhihu.com/p/609844294

【竞赛分享】正大杯第十三届第5期:市场调研应如何进行抽样设计?该选择哪种抽样方法?怎么进行质量控制?如何计算样本容量? - 赛否的文章 - 知乎 https://zhuanlan.zhihu.com/p/609858245

【竞赛分享】正大杯第十三届第6期:市场调研之问卷信度检验和效度检验 - 赛否的文章 - 知乎 https://zhuanlan.zhihu.com/p/610151287

点击连接关注赛否公众号,解锁更多竞赛信息和资料哦~

https://mp.weixin.qq.com/cgi-bin/settingpage?t=setting/index&action=index&token=931691823&lang=zh_CN&token=931691823&lang=zh_CN



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3