统计学的几个常见的基本概念

您所在的位置:网站首页 统计学的几个基本范畴 统计学的几个常见的基本概念

统计学的几个常见的基本概念

2023-09-16 17:19| 来源: 网络整理| 查看: 265

一.切比雪夫定理

马尔科夫不等式、切比雪夫不等式只是对概率的一个估计,有可能不是很准确,但总比瞎想要准确。

马尔科夫不等式,切比雪夫不等式与年薪百万

看看这个怎么去计算百万年薪的概率

参见知乎:https://www.zhihu.com/people/matongxue/activities

二.中心极限定理

在给定任意分布的数据中随机抽取n个抽样,共抽取m组,m组的均值呈现正态分布,中心定理告诉我们,当样本足够大时,样本的均值会慢慢变成正态分布。

采用大家都采用的例子:

国家来测量国内的平均体重的时候,会怎么做?我们采用抽取1000组,每组50个,1000组的均值呈现正态分布,样本的均值就代表国内的平均体重。

需要注意的俩点:

总体的数据不要求呈现正态分布样本组的大小不能太小,一般大于等于30个,中心极限定理就能发挥作用

至于为什么是30个?目前我了解的是根据经验,或者自己可以写写代码测试一下。

在实际生活当中,我们不能知道我们想要研究的对象的平均值,标准差之类的统计参数。中心极限定理在理论上保证了我们可以用只抽样一部分的方法,达到推测研究对象统计参数的目的。

总而言之,中心定理是用样本来估计总体的,平均值和标准差

 

之前的标准差公式是,因为用样本估计总体,样本会剔除一些异常值,一般而言,样本的标准差会比总体的标准差小,所以修改样本的标准差公式

三.大数定律

讲大数定律之前,先说说小数定律,什么是小数定律?顾名思义,小数表现的是数据量的小,而其中的定律则是表现小数所呈现的规律,这里的规律就是期望,小数定律其实就是说如果统计数据足够小,那么事件就表现为各种极端情况,这这些情况,跟它的期望值一点关系都没有。

举个例子,著名的巴西的礼物,其实就是个小数定律,巴西的礼物讲的是世界杯对于巴西队胜利,下一届冠军就是举办世界杯的东道主。

看下数据:1962年,巴西夺冠,4年后英格兰本土称雄。1970年巴西三夺金杯,1974年轮到东道主西德捧杯。1994年巴西在美国夺冠,1998年法国在本土一鼓作气首次捧得大力神杯。之所以神奇,纯属巧合。

那么什么是大数定律?大数当然是数据多了,大数定律又称为大数法则,表示当数据量足够大时,数据的算术平均值就越有大的几率接近期望值。它以严格的数学形式表现了随机现象的一个性质:平稳结果的稳定性(或者说频率的稳定性)。

其中大数定律又分为弱大数定律和强大数定律,弱大数定律:也被称为辛钦定理,陈述为:样本均值依概率收敛于期望值。

期望值可以理解为上帝视角的值,以甩骰子为例:

1*1/6 + 2*1/6 + 3*1/6 + 4*1/6 + 5*1/6 + 6*1/6 = 3.5

强大数定律:样本均值以概率1收敛于期望值。

 

四.抽取样本

总体:研究所有事件的集合

样本:总体中选取相对较小的集合,用于做出关于总体本身的结论

偏倚:样本不能代表目标总体,说明该样本存在偏倚

简单随机抽样:随机抽取单位形成样本

分成抽样:总体分成几组或者几层,对每一层执行简单随机抽样

系统抽样:选取一个参数K,每到第K个抽样单位,抽样一次。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3