工具讲解

您所在的位置：网站首页 › 已知置信度求样本量 › 工具讲解

工具讲解

2024-07-15 07:38| 来源: 网络整理| 查看: 265

特殊情况下,如果是很大总体,计算公式变为:n= Z2σ2/e2

例如：希望平均收入的误差在正负人民币30元之间,调查结果在95%的置信范围以内,其95%的置信度要求Z的统计量为1.96。根据估计总体的标准差为150元,总体单位数为1000。

样本量:

n=150*150/(30*30/(1.96*1.96))+150*150/1000)=88

(2)于百分比类型的变量

对于已知数据为百分比,一般根据下列步骤计算样本量。已知调查结果的精度值百分比(E),以及置信度(L),比例估计(P)的精度,即样本变异程度，总体数为N。

则计算公式为:n=P(1-P)/(e2/Z2+ P(1-P)/N)

同样,特殊情况下如果不考虑总体,公式为:n= Z2P(1-P)/e2

一般情况下,我们不知道P的取值,取其样本变异程度最大时的值为0.5。

例如：希望平均收入的误差在正负0.05之间,调查结果在95%的置信范围以内,其95%的置信度要求Z的统计量为1.96，估计P为0.5,总体单位数为1000。

样本量为:

n=0.5*0.5/(0.05*0.05/(1.96*1.96)+0.5*0.5/1000)=278

2.样本量分配方法

以上分析我们获得了采用简单随机抽样公式计算得到的样本量，总的样本量需要在此基础上乘以设计效应的值得到。由于样本总量已经确定,我们采用总样本量固定方法分配样本,这种方法包括按照比例分配和不按照比例分配两类。实际工作中首先计算取得区县总的样本量,然后逐级将其分配到各阶分层中,如果不清楚各阶分层的规模和方差等,一般采取比例分配或者比例平方根分配法。如果有一定辅助变量可以使用，可以采用按照规模分配法分配样本量。

3.样本量和总体大小的关系:

在其它条件一定的情况下，即误差、置信度、抽样比率一定，样本量随总体的大小而变化。但是，总体越大，其变化越不明显；总体较小时，变化明显。其变化趋势如下：

二者之间的变化并非是线性关系。所以，样本量并不是越大越好，应该综合考虑，实际工作中只要达到要求就可以了。

三、抽样调查方案样本量的确定

我们决定首先采取简单随机抽样的方法计算区县的样本量，之所以首先对区县计算样本量,主要是考虑，虽然我们方案中没有要求对区县的估计量，但是区县一级是我们做计划和决策的基础，具有承上启下的作用，如果区县级获得的估计量精度比较高，就可以保证上一级的估计量具有更高的精度，而且各个区县的样本量可以认为是相同的，这主要是因为各个区县的总体数都比较多，而且我们也不清楚；同时也不可能事先进行区县方差估计。没有首先计算区县以下各阶分层的样本量,主要是考虑:

(1)如果计算区县以下某阶分层的样本量,然后再将计算的样本量合并,将显著增加样本量，增加基层的负担。

(2)事实上,对于计算阶可以比较好的得到它的估计量,但我们现在不需要得到区县以下各阶分层的估计量,我们仅仅需要区县的估计量,没有必要计算区县以下阶样本量。

(3)我们直接对整个区县以简单随机抽样进行抽取,然后将其样本量合理分配到各阶分层中,这样可以使用较少样本量得到区县较好的估计量。

以下我们以试点地区批零业为对象进行研究。由于没有误差限以及置信度和抽样比率的值。我们可以采用常用参数:设定区县总体为很大,置信度是95%,抽样比率保守估计是0.5,抽样误差不能大于15%,根据公式计算得到样本量为43个。由于采取多阶分层抽样,我们如何设定抽样设计效应呢?区县及以下是三阶分层抽样,只要在各阶进行合适的分层，其设计效应应该在2-3之间,我们在这里取保守值3,那么得到本区县样本量是129个,这个样本量就可以根据新方案得到区县要求误差内的估计值。

1.确定办事处、居委会、村委会样本量

根据方案,每个居委会抽取样本5-10个,那么这个样本量是否可行呢?这里涉及如何将区县样本分配到街道和居委会中去，根据方案要求，街道抽取采取先分层，后对层内进行PPS抽样；那么分配样本是否也采取同样方法呢？主要看辅助变量与样本量之间的关联程度，方案中提供了两个辅助变量：人口数和个体数，对于辅助变量是个体数的完全可以使用规模分配方法分配样本量，个体数多的分配较多的样本量；对于辅助变量是人口数的如果采

取规模分配方法，由于人口数与一个地区的个体单位数没有必然的联系，可能导致某些居委会的个体数比较多，却分配了较少的样本量，使得居委会分层变的困难，同时使居委会方差显著增大。而获得较多样本量的居委会，分层的效果和方差提高幅度有限，故采用比例分配的方法可能更加合适一些。对于居委会村委会的抽取，由于本阶可能存在市场内的抽样，分配复杂一些；如果本阶有市场内抽样，可以适当减少居委会村委会的样本量，但应该大于本阶样本量的80%，由于市场内抽样的特殊性，建议将本阶样本量全部分配给居委会村委会，我们所进行的试点就是将样本全部分配给居委会；至于市场内抽样的具体实施，可以根据方案操作完成。对居委会村委会层内，由于使用简单随机抽样完成，采用比例分配平均分配就可。

在实际工作时,由于一个区县包括全部乡镇街道或其中的一个；根据方案，区县抽取办事处的数量应该介于12-4个之间,对应于抽中乡、镇、街道的全部或其中一个，那么其每一个乡镇街道采取比例分配平均分配的样本量应该是11-32个之间；所抽中的居委会、村委会数量应该介于16-48个之间,如果个别乡镇街道抽中的居委会是2个,则其居委会总数相应减少一些；最后,每个居委会、村委会的样本量应该介于3-16个之间,大部分介于5-10之间。以上的讨论没有考虑总体的大小,如果考虑到居委会、村委会的总体有限,则每个居委会村委会的样本量可以减少一些,具体可以采用以下公式得到具体样本量的调整数:

样本量n=n1*N/(N+n1)。N是本地区总体，n1 是给本地区分配样本量

居委会样本量的调整数，应该作为本居委会样本量的底限。

确定办事处、居委会村委会的样本量,与以下几点有关:

a)估计量的误差、置信度，可以决定简单随机抽样的样本量

b)与采用的抽样方法有关系,它决定了设计效应的大小。例如:分层抽样的设计效应值小于1,多阶抽样的设计效应值大于1。可以决定整个抽样的样本量。

c)与每一阶的分层的数目有关系,所以,应该重点考虑分层的问题,分层太多,没有必要；分层太少,导致层内的方差增大,可能影响估计值的精度以及设计效应的值,所以，在每阶分层时,应该合理考虑,使得样本的变异程度在层内达到一个合理水平。

根据以上原则，我们在包头的抽样试点共抽取4个办事处,包括14个居委会；一个乡,包括4个村委会,经过清查共有批零业1042个,单位70个；餐饮业250个,单位3个。由于我们使用人口数作为辅助变量，应该采用比例分配方法平均分配样本量，这样每个街道办事处得到26个样本, 对于抽取4个居委会的办事处,每个居委会分配得到7个样本；对于抽取2个居委会的办事处,每个居委会分配到13个样本。然后根据居委会总体对样本量做出调整，得到居委会实际样本量。

2.确定居委会村委会内分层样本量

以上我们讨论如何分配给乡镇居委会村委会样本量,现在分析给居委会村委会以下各层分配样本量,这一步,清查的工作就显得非常重要了,重点应该清查规模、类别,首先是规模，规模的大小不应该根据工商注册为单位或个体决定，应该根据实际情况，即使是个体，如果规模较大，也应该归入大规模分层中，这样就可以使得每层的样本变异程度显著降低，从而提高精确度。根据实际情况可以包括两种：

(1)如果全部是规模比较小的单位个体户，我们可以根据类别进行适当的分组，将某一类单位比较多的单独分层；将另外类别比较少的，可以几类合并进行抽取具体样本，分层不要多于4层，并保证每层的样本量不小于2个。由于居委会样本量数目已经确定，我们可以直接采取比例分配方法，确定各层样本量。

(2)如果规模比较大的和规模小的并存，可以将规模比较大的单独分层，不用考虑其中的类别；将规模较小的主要是个体户可以根据类别进行分层；其中的难题是如何将样本量在规模大的和规模小的之间分配，因为大规模层内样本变异程度有可能很大，应该抽取较多的样本量，经过测试，如果大规模层总体小于等于5，应该对其进行全面调查；如果大于5个，可以采用以下的公式计算得到：

n=0.25/(e2/t2+ 0.25/N)，其中：e=30%,t=2.1,N为规模较大的数目。

其他规模较小的，使用比例分配法分配其他的样本，实际分层时，最好不要超过4层，保证每层不少于2个，由于大规模层的存在，可能占去了较多的样本量，导致其它层不够分配，这种情况下，可考虑增加层内一定样本量。

经过以上的分析、计算可以得到居委会村委会的样本数量。返回搜狐，查看更多

【本文地址】

工具讲解

工具讲解

今日新闻

推荐新闻