R语言与抽样技术学习笔记(bootstrap)

您所在的位置:网站首页 r语言随机抽样函数 R语言与抽样技术学习笔记(bootstrap)

R语言与抽样技术学习笔记(bootstrap)

2023-09-06 15:27| 来源: 网络整理| 查看: 265

R语言与抽样技术学习笔记(Randomize,Jackknife,bootstrap) Bootstrap方法

  Bootstrap一词来源于西方神话故事“The adventures of Baron Munchausen”归结出的短语“to pull oneself up by one's bootstrap",意味着不靠外界力量,依靠自身提升性能。   Bootstrap的基本思想是:因为观测样本包含了潜在样本的全部的信息,那么我们不妨就把这个样本看做“总体”。那么相关的统计工作(估计或者检验)的统计量的分布可以从“总体”中利用Monte Carlo模拟得到。其做法可以简单地概括为:既然样本是抽出来的,那我何不从样本中再抽样。

bootstrap基本方法

  1、采用重抽样技术从原始样本中抽取一定数量(自己给定)的样本,此过程允许重复抽样。   2、根据抽出的样本计算给定的统计量T。   3、重复上述N次(一般大于1000),得到N个统计量T。其均值可以视作统计量T的估计。   4、计算上述N个统计量T的样本方差,得到统计量的方差。   上述的估计我们可以看成是Bootstrap的非参数估计形式,它基本的思想是用频率分布直方图来估计概率分布。当然Bootstrap也有参数形式,在已知分布下,我们可以先利用总体样本估计出对应参数,再利用估计出的分布做Monte Carlo模拟,得到统计量分布的推断。   值得一提的是,参数化的Bootstrap方法虽然不够稳健,但是对于不平滑的函数,参数方法往往要比非参数办法好,当然这是基于你对样本的分布有一个初步了解的基础上的。   例如:我们要考虑均匀分布\( U(\theta) \)的参数\( \theta \)的估计。我们采用似然估计。

data.sim


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3