《规模以下工业抽样调查实施方案.docx》由会员分享,可在线阅读,更多相关《规模以下工业抽样调查实施方案.docx(28页珍藏版)》请在三一办公上搜索。
1、规模以下工业抽样调查实施方案一、 调查目的反映规模以下工业的基本总量,为国民经济核算提供基础数据。二、 调查范围(总体) 年产品销售收入500万元以下的非国有工业企业和全部个体经营工业单位。具体包括,调查年份年初在册的年产品销售收入500万元以下的非国有工业企业、全部个体经营工业单位以及当年新建的年产品销售收入500万元以下的非国有工业企业和新增的全部个体经营工业单位。三、 调查内容及表式调查内容包括500万元以下的非国有工业企业的基本情况,如:企业详细名称、地址、企业法人代码、登记注册类型、人员及生产经营状况等;个体经营工业单位的基本情况、人员及生产经营状况等。调查分为年报和定期两种。定期报
2、表包括1至3月份、1至5月份和1至9月份调查,其中,1至3月份和1至9月份调查为部分样本单位调查。年报和定期中的部分样本单位调查的主要内容包括总量结构和企业单位数指标;定期中的1至5月份调查的主要内容为基本总量和企业单位数等指标。调查表分为基层表和综合表两种,具体内容详见表式。四、 调查报告期及报送时间年报的报告期为1至11月份,报送时间为2001年12月25日前;定期报表中的1至5月份调查的报告期为1至5月份,上报时间为2002年6月25日前;部分样本单位调查的报告期分别为1至3月份和1至9月份,报送时间为当年4月8日和10月15日前。各省(自治区、直辖市)企业调查队要将调查数据(基层表)、
3、推算数据(综合表)和抽样框、样本以及抽样过程中涉及的资料等报送国家统计局企业调查总队。报送方式为计算机远程传输。五、 调查总体划分根据国民经济核算要求,首先将规模以下工业总体划分成两个子总体,即年销售收入500万元以下的非国有工业企业,以下简称企业子总体;全部个体经营工业单位,以下简称个体经营单位子总体。根据调查总体的分布状况、抽样框现状以及我国目前行政管理体制特点,各地的抽样调查设计可以将企业子总体再划分成两个子总体,即乡及乡以上年销售收入500万元以下的非国有工业企业,以下简称乡及乡以上企业;销售收入500万元以下的村及村以下工业企业,以下简称村及村以下企业。同样可以将个体经营单位划分成农
4、村个体经营工业单位和城镇个体经营工业单位两个子总体。需要强调的是,对两个子总体的进一步划分的主要目的,是为了适应各种不同的抽样框,并非要求得到各子总体的数据。各地可以根据本地区抽样框的条件,采取不同的方法划分子总体,但要求能区分出企业和个体经营单位两种类型。六、 基本抽样方法基本原则是,对调查总体中有企业名录库的部分采用目录抽样,没有企业名录库的部分采用整群抽样。若抽样框条件许可,应对所有规模以下工业企业采用目录抽样,对个体经营单位采用整群抽样。目前,考虑到各地企业名录库的状况及上述四个子总体的分布特点,方案设计了四种抽样方法,供各地选择使用:(一)一阶段目录抽样。根据省级企业名录库直接抽取样
5、本企业,有名录库的企业都应采取此方法。(二)一阶段整群抽样。在省一级直接抽取行政村,以村、街道或居委会作为群单位。主要用于农村和城镇个体经营单位和未建企业名录库的村及村以下企业。(三)二阶段整群抽样。第一阶段抽取省辖区内的市辖区、县级市和县(以下简称县、区),第二阶段抽取样本县、区内的行政村,以村作为群单位。主要用于农村个体经营单位。村及村以下企业若无名录库,也可以采取此方法。根据各地情况,有条件的省(市、区)也可对城镇个体经营单位采用以街道或居委会为群单位的整群抽样。(四)二阶段目录抽样。第一阶段抽取省辖区内的县、区,第二阶段抽取样本县、区内的个体经营单位。主要用于城镇个体经营单位。七、 总
6、体估计量及其方差方案根据不同的子总体,设计了不同的抽样方法。因此,在进行估计时,要先对子总体进行估计,然后估计总体。总体总量指标估计量与子总体总量指标估计量的关系及方差如下:(一)总体总量指标估计量:(二)的方差估计量:(三)的最大相对误差:式中,(1,2,3,4)代表不同子总体,1表示乡及乡以上企业子总体,2表示村及村以下企业子总体,3表示农村个体经营单位子总体,4表示城镇个体经营单位子总体。由于本方案规定的概率度为95,故等于1.96,以下相同。为总体总量指标的估计量,为的方差估计量。为第个子总体的总量指标的估计量,为的方差估计量。为总体总量估计量的最大相对误差。有关各子总体的抽样方法及估
7、计量计算方法在以下有关部分进行说明。八、 抽样精度规模以下工业抽样调查以省为总体控制抽样精度,具体要求是:在95的概率保证程度下,各省(区、市)的核心指标工业总产值的最大相对误差控制在10以内,即。同时,要求全省(区、市)规模以下工业总体的企业单位数指标的最大相对误差控制在15以内,即。抽样精度是以全部年销售收入500万元以下的非国有工业企业和个体经营工业单位作为一个总体设置的,即要求总体工业总产值估计值的最大相对误差不超过10,并非要求每个子总体工业总产值的最大相对误差控制都在10以内。各子总体的抽样精度与总体抽样精度的关系为: 式中,为总体总量指标值,为第个子总体的总量指标值,为总体总量指
8、标估计值的最大相对误差,为第个子总体的总量指标估计值的最大相对误差。例,若四个子总体的总量相等且取=,则可得到: 由于,所以,即四个子总体的工业总产值总量指标的最大相对误差都控制在20%以内即可。再例,若四个子总体的总量占抽样总体总量的比重分别为:乡及乡以上企业占1/4,村及村以下企业占1/2,农村个体经营单位占1/5,城镇个体经营单位占1/20,则有: 公式中,满足的、和的取值有许多种组合。比如,分别取值16%、12%、20%和25%,计算得=8.5%,可满足方案10%的要求。确定的目的是为了分别计算各子总体的样本量,各地应利用有关资料及本地区的实际情况测算并确定。不同子总体的最大相对误差可
9、以相等,也可不相等,但彼此之间的差异不宜过大。一般原则是,占总体总量比重大的子总体,应相对较小,即控制的抽样精度较高;占总体总量比重小的子总体,应相对较大。调查设计共分为4个部分,主要是针对不同的子总体及抽样框采取了不同的抽样设计。第一部分为一阶段目录抽样,第二部分为二阶段整群抽样,第三部分为二阶段目录抽样,第四部分为一阶段整群抽样。第一部分 一阶段目录抽样乡及乡以上工业企业抽样设计本部分的应用范围是所有有名录库的规模以下工业企业。无论是乡及乡以上或是村及村以下工业企业,只要有省一级企业名录库,都应采用此方法。考虑到目前各地普遍已建立乡及乡以上工业企业名录库,因此本部分以乡及乡以上工业企业为例
10、说明此方法。已建立村及村以下工业企业名录库的省(区、市)应对村及村以下工业企业采用此方法。本部分方法要求从省级企业名录库中直接抽取企业。在本部分取值1,代表乡及乡以上企业子总体。一、 抽样框抽样框的范围包括全部年销售收入500万元以下的乡及乡以上的非国有工业企业,企业年销售收入以上年数据为准,即包括上年末销售收入不足500万元的所有乡及乡以上的非国有工业企业。抽样框内容应包括企业的基本属性指标和基本价值量指标。由于抽样框中资料的时点与调查时点存在差异,各省(区、市)在调查时会遇到企业的消亡和新生的问题。企业消亡是指企业被列入抽样框,但在调查时已不存在,如破产、解体或改行;新生企业是指企业没有列
11、入抽样框,但在调查时已经产生,如新建企业或由其他行业改行而来的企业。因此,必须对新生企业和消亡企业进行相应的处理。具体处理办法将在有关部分进行说明。二、 企业分层将子总体中的全部企业按规模工业总产值或销售收入进行分层。各地可灵活掌握分层数量和分层界限,一般分为2或3个层即可。三、 样本量的确定与分配(一)样本量计算公式: 其中:式中,代表层(1,2,),为子总体内的分层总数。为子总体的工业总产值, 为第层第个企业的工业总产值,是第层的企业单位总数, 是样本企业总数,是第层企业工业总产值指标的方差,为最大相对误差。按上述公式计算得到样本量,只是理论值。在实际调查时会遇到企业消亡问题。例如,样本抽
12、到了某企业而该企业已经不存在或已改行,实际样本会因而减少。为此,需要事先对计算得到的样本量进行调整。调整方法是预先对消亡企业的比例进行大致的估计,并据此放大样本量。例如,估计约有10的企业消亡,则在计算得出样本量的基础上增加10。消亡企业的比例,可依靠经验进行判断。(二)分配样本。将上面计算得出的并经过调整的样本企业总数,采用奈曼分配方法进行分配。第层所需的样本量的计算公式为: 四、 样本抽取的方法层内抽取样本主要有两种方法,即对称等距抽样法和简单随机抽样法。各地可根据具体情况,选用其中的一种方法。(一) 对称等距抽样1.将层内企业按工业总产值数额由大到小排队、编号。2.计算每层的抽选组距:
13、。3.当层内样本量为偶数时,先将层内个企业分为个组,使得每组包含2个单位,然后在第1到第个企业中随机地确定抽样起点,按下面的公式在每组中抽取距该组两端等距离的两个单位: j0,1, , 4.当为奇数时,仍按上式进行,但j取到为止,并要增加靠近终端的一个样本单位: 。当层的抽样比时,应采用简单随机抽样法抽取样本。(二) 简单随机抽样将层内所有企业按自然顺序从1到进行编码,然后根据随机数表抽取样本,一直抽到个样本单位为止。五、 估计量在进行估计时,同样需要注意企业的消亡问题。例如,第层的样本量为100个企业,而在调查中发现有10个企业已不存在,实际只调查了90个企业。这意味着抽样框中的企业数量发生
14、了变化,因此需要进行调整。调整的方法是根据实际调查中样本企业的消亡比例,调整企业总数。仍采用上例,并假定在抽样框中该层共有1000个企业。由于该层的样本中有10(10/100)的企业已不存在,相应的要将该层的企业总数由原来的1000调整为900()。计算该层的估计量时,样本量为90,层内企业总数为900。进行上述调整的前提是企业确实消亡或不存在了。如果企业仍存在,但因某种原因没有回答,则不应做上述调整。以下计算各种估计量时,所用的样本量和都是实际调查的样本企业数,企业总数和都是经过调整后的企业数。(一)子总体总量指标估计量:式中,为第层第个样本企业的有关指标值。这里还需要注意处理新生企业问题。
15、处理办法是尽可能找到新生企业的名录,将新生企业视为一个独立的层,从中抽取一个小样本进行调查,据此计算该层的各种指标及其方差,并将结果增加到子总体的相应估计量中。此时,层总数变为,新生企业层的各种估计量的计算与其他层相同。(二)的方差估计量: 其中: ; (三)的最大相对误差:六、 有关标记注释(一)代表层(1,2,),为分层总数。企业单位编号,表示第个企业单位。(二)为企业单位总数,为第层的企业单位总数,为样本企业单位总数,为第层样本企业单位总数: ; 。(三)为子总体的总量指标值,为其估计量。为第层的总量指标值,为其估计量。为第层第个企业的指标值。(四)为的估计方差。是第层企业指标值间的方差
16、, 为第层的样本方差。为最大相对误差。第二部分 二阶段整群抽样村及村以下工业企业单位抽样设计本部分的应用范围主要是农村个体经营单位。若村及村以下企业尚无名录库,也可采用此方法。本部分以村及村以下企业和农村个体经营单位为例进行说明。在本方法中,第一阶段从省内抽取有行政村的县、区,第二阶段从抽中的县、区中抽取行政村,以行政村作为群单位。本部分取值2和3,代表村及村以下企业子总体,代表农村个体经营单位子总体。一、 建立抽样框(一) 一级抽样框一级抽样框由省内所有有行政村的县、区组成,县、区统称为一级单位。在本部分,第二阶段抽样单位为行政村,因此不含行政村的县、区不包括在抽样框内。建立一级抽样框,要求
17、至少要掌握分县、区的村及村以下企业的工业总产值资料,用于一级单位分层。(二) 二级抽样框二级抽样框由一级样本单位中的所有行政村组成。需要掌握样本县、区中所有行政村的一些基本数据,包括每个行政村中的工业企业数和个体经营单位数。建立二级抽样框,需要对样本县、区进行预先清查。通过清查,可以获得较为准确的一级样本单位及其各行政村的企业数和个体经营单位数。清查的目的有两个:一是为抽取样本村提供依据。同时,有效地利用清查数据作为抽取样本的辅助信息还可以减少样本量。二是用于计算一级样本单位的总量指标。由于本部分在一级样本单位内采用的是比率估计量,因此,企业单位数的准确与否直接关系到总量指标估计的准确性。二、
18、 一级单位分层在进行一级单位分层之前,应比较本省(市、区)的村及村以下企业与农村个体经营单位的规模和方差,选择其中规模大、方差大的子总体的总产值作为分层标识。下面以选择村及村以下企业的总产值为分层标识为例进行说明。进行一级单位分层,首先需要将所有一级单位按其村及村以下企业工业总产值从大到小排序,并按下述方法进行分层:第一步,按顺序逐个累加组合成一系列新的总体,即:由第一个一级单位组成第一个总体,第一和第二个一级单位组成第二个总体,第一、第二和第三个一级单位组成第三个总体,第一、第二、第三和第四个一级单位又组成第四个总体,依此类推,如果有100个一级单位就可组合成100个新总体。第二步,计算每个
19、新总体的平均数、方差和变异系数。设第个总体(即由第1至第个一级单位组成的总体)中的第个一级单位的村及村以下企业总产值为,则第个总体的平均数、方差和变异系数的计算如下:(一)平均数: (;)(二)方差: (三)变异系数: 第三步,观察各新总体的变异系数。这时,各新总体的变异系数一般会呈现逐渐上升的趋势,分两种情况:第一种情况,最初(从第二个总体的变异系数起,第一个总体只有一个单位,方差为0)若干个的变异系数小于0.15(非精确值);第二种情况,最初的变异系数就很大,大于0.15。在第一种情况下,以变异系数为0.15左右作为分层点,组合出第一个层。例如,当前个一级单位组成的总体的变异系数为0.15
20、6时,则将这个一级单位作为一个层。这样就得到了第一个层。确定第二个层的方法是将第一个层的单位剔除,然后对剩余的一级单位重复第一步和第二步,并以0.15作为分层点,划分出第二个层。重复此过程,可以组合出第三、第四层,。采用此方法只需分出3或4个层即可,剩余的所有一级单位都归为最后一个层。此层单位数多且变异系数较大,但总量比重小,对总体影响不大。在第二种情况下,由于最初的变异系数就大于0.15,无法按上述方法进行。此时,应将第一个一级单位剔除出去,然后重复执行第一步和第二步;若最初的变异系数仍大于0.15,再在剩余的一级单位中剔除第一个一级单位。重复此操作,直至在剩余的一级单位总体中出现第一种情况
21、。此时,以所有剔除出的一级单位组成第一个层,并对其余的一级单位按第一种情况的模式进行分层。三、 样本量计算与分配(一) 确定各阶段的抽样精度为了分别计算各阶段的样本量,需要对总的抽样精度进行分解。各阶段最大抽样误差与总的最大相对误差之间关系为: 式中,(2)为全省村及村以下企业总产值估计量的最大相对误差,为第一阶段抽样的最大相对误差,为第二阶段抽样的最大相对误差。上述等式关系表明,若取较大的,则相对较小,意味着一级样本量较小,而二级样本量增大。反之,若取较小的,则相对较大,意味着一级样本量较大,而二级样本量减少。具体操作时,要先确定的取值范围,然后确定和的取值,必须保证与之和不大于。(二) 计
22、算和分配一级样本1.计算一级样本量。以一级单位的村及村以下企业总产值及其方差为依据来计算一级样本量,采用奈曼方法分配,故有: 其中:式中,角标表示一级单位分层。在村及村以下部分,一级单位共分为个层。取值2。为全省村及村以下企业总产值,为第层第个一级单位的村及村以下企业总产值,是第层一级单位总数, 是一级样本单位总数,是第层一级单位村及村以下企业总产值指标之间的方差。需要注意,上面的分层和计算样本量只考虑了村及村以下企业的分布,各省在计算样本量时,应同时利用农村个体经营单位总产值数据测算一下一级样本需要量。计算方法是将上面计算公式中的村及村以下企业总产值改用农村个体经营单位的有关数据。如果后者需
23、要量较大,应适当增加一些样本单位。此外,由于计算样本量所依据的数据存在时间上的误差,因此应对计算所得样本量作适当调整,调整方法是在计算所得样本量基础上增大10。2.分配一级样本。将上面求得的一级样本总数,采用奈曼分配方法进行分配,第个一级单位层所需的样本量为: 按此公式计算的某层一级样本单位数可能会大于该层一级单位数,假定第一个层(即时)出现此种情况,即:。此时,该层的所有单位都须入选样本,而对于其他层,上面的公式应有所变化。仍假定第一个层的所有一级单位全部入选样本,则计算其余各层样本量的公式为: 另外,在每个层抽取的一级样本单位数须大于1,这是为了便于计算方差。若计算出某层一级样本单位数为1
24、,则需在该层增加一个一级样本单位。(三) 计算和分配二级样本 1.计算二级样本量:其中:若无法计算,可用样本数据计算或利用其他数据推算。式中,为估计第个子总体指标所需全省样本村数;为一级单位分层数;为第层第个一级样本单位中有第个子总体企业单位的村数;为第层一级单位数;为第层一级样本单位数; 为第层第个一级样本单位中第个子总体的企业平均指标;为第层第个一级样本县、区单位中第个村第个子总体的企业平均指标。计算出的样本量只是最小样本量,为了保证预期的抽样精度,各地应在计算出的样本量的基础上适当进行追加,如增加5。2.分配二级样本。将上面求出的两个样本村数()分别按比例分配给各一级样本单位,分配给第层
25、第个一级样本单位的第个子总体的样本村数()为: 式中,分母为所有一级样本单位中有第个子总体的企业单位的村数;为第层第个样本县、区中有第子总体的企业单位的村数。四、 抽取样本(一) 抽取一级样本单位在一级单位分层的基础上,每个层内按县、区的村及村以下企业工业总产值排队,采用等距抽样方法抽取一级样本单位。(二) 抽取样本村确定了每个一级样本单位中的样本村数后,在各一级样本单位中分别独立地抽取样本村。在一级样本单位中抽取样本村时需要分别分析各一级样本单位中行政村的分布情况,若各村规模(工业总产值或企业数)的差异相对较小,则可直接采用按村工业总产值或企业数排队等距抽取样本村;若各村的规模差异很大,有必
26、要进行一些处理。处理方法如下:1.对个别特别大的村单独进行调查,对其余的村按工业总产值或企业数排队采用等距方法抽取样本村。若一级样本单位中,个别村的规模特别大,而其余村相对差异较小,此方法比较适用。2.对村进行分层,按比例将样本村分配到各层,各层按村工业总产值或企业数排队采用等距方法抽取样本村。若一级样本单位中,村间差异很大,且各种规模的村都较多,此方法比较适用。由于在每个一级样本单位中,既要抽取用于估计村及村以下企业总量指标的样本村,又要抽估计农村个体经营单位总量指标的样本村,若完全独立地抽取两种样本村,无疑会增大样本村的数量。为此,本部分采用等概率的交叉抽取样本村的方法。具体步骤如下:首先
27、,采用上述方法抽取用于估计村及村以下企业总量指标的样本村()。第层第个一级样本单位中所有有估计村及村以下企业的村总数为,抽取的样本村数为。其次,抽取用于农村个体经营单位总量指标的样本村()。将第个一级样本单位中所有有个体经营单位的村()分解为两类,一是含有村及村以下企业的村();二是不含村及村以下企业的村()。抽取过程如下:1.在个村中抽取个样本村,实现的方法是在已抽取的用于估计村及村以下企业子总体的个样本村中抽取: 2.在个村中抽取个样本村: 交叉抽取样本村的优点是使不同的子总体共享样本村,减少样本村总数。五、 估计量(一) 估计第(2,3)个子总体的总量指标及其方差本小节的估计量用于估计除
28、企业数外的各种总量指标及其方差,有关企业数的估计将在下节讨论。1.子总体总量指标估计量: 其中:式中,为全省第个子总体的有关总量指标估计量;为第层第个子总体的总量指标估计量;为第层第个一级样本单位第个子总体的总量指标估计量,其计算公式可一般地表述为: 式中,右边第一项()为第个一级样本单位中需单独调查村的相应总量指标;第二项为抽样部分的估计量,在计算时应注意,需要在中剔除相应的单独调查部分。若无单独调查部分,则项为零。计算一级单位总量时应注意式中的企业单位总数。若为非清查所得,应注意对其进行调整。调整的方法可参见第一部分的有关内容,或根据调查的实际数据对已有数据进行比例调整。否则,的误差会导致
29、估计量的偏差增大。此外,若在一级样本单位内按村的规模进行了分层,应分别对各层按此公式计算,得到各层总量,然后对层总量求和,得到该一级样本单位的总量。为第层第个样本县、区第个村第个子总体的总量指标: 为第层第个一级样本单位第个样本村第个子总体第个企业的总量指标。为第层第个一级样本单位第个子总体的企业数,数据来源下节讨论。为第层第个一级样本单位第个样本村中第个子总体的企业数。2.的方差估计量: 式中,为全省第个子总体的总量指标的估计方差,为第层总量指标的方差估计量,为第层第个一级样本单位总量指标的方差估计量: 计算时应注意与前面计算的方法相互一致,在存在单独调查的村时,此公式只是抽样部分的方差(单
30、独调查部分没有抽样误差),式中的都不应包含单独调查的村,也应是抽样部分的企业平均指标,即: 注意,在这里只是第层第个一级样本单位中第个子总体抽样部分的企业平均指标,不包括单独调查村中的企业,因此并非该样本县的企业平均指标估计量。第层第个一级样本单位中第个子总体的企业平均指标的计算公式为: 当不存在单独调查部分时,与相等。 此外,若在一级样本单位内按村规模进行了分层,应分别对各层按此公式进行计算,然后进行求和,得到该一级样本单位的方差。为第层第个样本县、区第个样本村第个子总体企业平均指标: 为第层第个样本县、区第个样本村第个企业的指标值;为第层第个一级样本单位第个样本村中第个子总体的企业单位数。
31、3.子总体的企业平均指标估计量:式中,为第个子总体的企业单位总数。根据方案要求,为清查所得或通过样本数据调整得到。因此,必须依据进行估计,具体估计方法见下一小节。4.的最大相对误差:(二) 估计第(2,3)个子总体的企业单位数本小节的估计量用于估计全省村及村以下企业子总体和农村个体经营单位子总体的企业单位数及其方差。估计方法分为两种:其一,利用一级样本单位清查数据进行估计,清查数据质量较好时应采用本方法。其二,利用样本村的调查数据进行估计。1.利用清查数据估计企业单位数。此时,各一级单位被作为群单位,清查是对样本群的全面调查,因而抽样过程实际上是以县、区为群单位、以村为最小抽样单位的单级整群抽
32、样。(1)子总体的企业单位总数估计量:(2)的方差估计量: 其中:(3)的最大相对误差:为清查得到的第层第个县、区中第个子总体的企业单位总数。2.利用样本村数据估计企业单位数。此时,一级单位仍为县、区,一级单位中以村为最小抽样单位,将企业数视为村的一个指标,因而抽样过程实际上是以县、区为一级抽样单位、以村为最小抽样单位的二阶段抽样。(1)子总体的企业单位总数估计量:式中,为全省第个子总体的企业单位数估计量,为第层第个子总体的企业单位数估计量,为第层第个一级样本单位第个子总体的企业单位数估计量: ; 为第个一级样本单位中需单独调查村中的企业单位数,而且需要在中剔除需要单独调查的村数,若无此划分,
33、则项为零。为第层第个一级样本单位第个样本村中第个子总体的企业单位数。此外,若在一级样本单位内按村的规模分层,应分别对各层按此公式进行计算,得到各层总量,然后对各层总量求和,得到该一级样本单位的总量。(2)的方差估计量: 式中,为企业单位总数的估计方差,为第层企业单位总数的估计方差,为第层第个一级样本单位企业单位总数的估计方差: 与计算时一样,在存在单独调查的村时,只用于计算抽样部分的方差,且在一级样本单位内进行了分层时,应分别对各层按此公式进行计算,然后进行求和。(3)最大相对误差:六、 本部分主要符号索引(一)角标表示不同的一级单位层(=1,2, ),本部分共分个层。角标表明不同的一级单位。
34、角标表明不同的二级单位(村)。角标表明不同的企业单位。(二)为省内全部一级单位总数,为省内全部有行政村的一级单位总数,为第L层一级单位总数,为省内全部一级样本单位总数, 为第L个层一级样本单位数。(三)为全省全部行政村总数,为有第种工业的村总数,为第层第个一级样本单位中有第种工业的村数,为第个子总体的样本村数;为第层第个一级样本单位中第个子总体的样本村数。(四)为第个子总体的企业单位总数,为第层第个子总体的企业单位数,为第层第个一级样本单位中第个子总体的企业单位数,为第层第个一级样本单位第个样本村中第个子总体的企业单位数。为全省第个子总体的企业单位数估计量,为第层第个子总体的企业单位数估计量,
35、为第层第个一级样本单位第个子总体的企业单位数估计量,为第层第个一级样本单位第个子总体的村企业平均数估计量。(五)为全省第个子总体的总量指标值,为第层第个子总体的总量指标值,为第层第个一级样本单位第个子总体的总量指标值,为第层第个一级样本单位第个村第个子总体的总量指标值,为第层第个一级样本单位第个样本村第个企业的指标值。为全省第个子总体的总量指标估计量,为第层第个子总体的总量指标估计量,为第层第个一级样本单位第个子总体的总量指标估计量,为全省第个子总体的企业平均指标估计量, 为第层第个一级样本单位中第个子总体(抽样部分)的企业平均指标,为第层第个样本县、区第个村第个子总体的企业平均指标。(六)为
36、全省总量指标的估计方差,为第层总量指标的估计方差,为第层第个一级样本单位的总量指标的估计方差,为全省企业总数的估计方差,为第层企业总数的估计方差,为第层第个一级样本单位企业总数的估计方差。(七)为全省第个子总体总量指标的最大相对误差,为全省第个子总体企业单位总数的最大相对误差。第三部分 二阶段目录抽样城镇个体经营单位抽样设计本部分的应用范围是城镇个体经营单位。若有条件,各地对城镇个体经营单位也可以采用以街道为群单位的整群抽样,方法参照第二部分即可。本部分以城镇个体经营单位为例进行说明。在本方法中,第一阶段从省内抽取县、区,第二阶段从抽中的县、区中抽取城镇个体经营单位。本部分取值4,代表城镇个体
37、经营单位子总体。一、 建立抽样框(一)一级抽样框。一级抽样框由省辖区内所有县、区组成,一级抽样框中的各县、区统称一级单位。一级抽样框中资料的主要内容包括个体经营单位数和工业总产值等。建立一级抽样框,要求各省掌握全省分县、区的城镇个体经营单位工业总产值和户数资料。(二)二级抽样框。二级抽样框由一级样本单位辖区内的所有城镇个体经营单位组成,其内容应包括个体经营单位的名称、地点等资料。二级抽样框资料需要通过对二级样本单位的清查工作取得。二、 一级单位分层本部分的一级单位分为两部分:第一部分为有行政村的县、区,也即村及村以下工业的全部一级单位;第二部分为没有行政村的县、区,村及村以下工业抽样的一级抽样
38、框不包括这部分,但包括在本部分的抽样框内。在进行一级单位分层时,对于上述第一部分仍采用与村及村以下工业抽样设计相同的分层,即个层;第二部分单独构成一个层,为方便表述,以下将此层称为“纯城镇工业层”。本部分共分个层。三、 计算样本量(一)计算一级单位(县、区)样本量。本部分确定一级样本的方法以村及村以下工业部分已抽取的个一级样本单位为基础,已抽取的个样本单位仍作为本部分的样本单位,同时“纯城镇工业层”的所有一级单位都入选本部分的一级样本。一般来说,“纯城镇工业层”的一级单位个数较少,且对城镇个体经营工业总量的影响较大,因而其所有一级单位都入选样本。如果在一些省,“纯城镇工业层”中一级单位个数较多
39、,可考虑从中抽取部分样本单位,但这部分抽样比应高于其他层。本部分的一级样本来自村及村以下工业抽样设计,因此应根据实际数据测算出第一阶段抽样精度。如果测算出的与预期的值差距很大,则应适当调整一级单位样本量,并据第二部分给出的和的关系式,确定的取值。(二)确定样本企业单位数: 其中: ; 式中,可用样本数据替代: ; 式中,为第层第个一级单位第个的城镇个体经营单位的工业总产值。四、 分配样本确定第层第个一级样本单位中城镇个体经营单位子总体的样本单位数,采用等比例分配办法。计算公式如下: 式中,为第层第个一级样本单位中城镇个体经营单位总数,为全省所有一级样本单位总数,为全省城镇个体经营样本企业单位数
40、,为第层第个一级样本单位中的样本企业单位数,。五、 抽取样本确定了每个一级样本单位中的样本企业单位数后,在各一级样本单位中分别独立地抽取样本企业单位。抽取样本企业单位时同样需要分别分析各一级样本单位中城镇个体经营单位的分布情况,若单位间差异相对较小,则可直接采用按单位工业总产值排队等距抽样或简单随机抽样方法抽取样本;若单位间规模差异很大,有必要在一级样本单位中按规模进行分层。六、 估计量包括城镇个体经营单位子总体的总量指标估计和企业单位数指标估计。关于总量指标估计,本部分给出了两种方法,一是无偏估计量,二是比率估计量。两种方法各有利弊。由于各省具体情况差异较大,统一规定采用某一估计量难免顾此失
41、彼。两种估计量各省都应测算,并对结果进行比较,以确定适合本省情况的估计量。(一) 估计全省第(4)个子总体的总量指标及其方差(无偏估计量)本方法的优点是计算方法比较简单,只需掌握一级样本单位的企业单位数资料,无需知道全省的企业单位数,然而,估计量的方差通常较大。1.子总体总量指标估计量: 其中: ; 式中,为第层第个子总体总量指标估计量,为第层第个一级样本单位第个子总体总量指标估计量。此外,若在一级样本单位内按村规模做了分层,应分别对各层按此公式计算出各层的总量,然后对各层总量求和,得到该一级样本单位的总量。2.的方差估计量:式中,为总量指标的估计方差,为第层总量指标的估计方差,为第层第个一级
42、样本单位总量指标的估计方差: 其中:;计算时应注意与前面计算的方法相互一致。若在一级样本单位内按村规模进行了分层,应分别对各层按此公式进行计算,然后进行求和,得到该一级样本单位的方差。3.子总体企业平均指标估计量:4.的最大相对误差:(二) 估计全省第(4)个子总体的总量指标及其方差(比率估计量)本方法的优点主要是估计量的方差通常较小,但需预先掌握全省所有一级单位的企业单位数资料,也即全省第种企业单位总数。1.子总体总量指标估计量: 其中: ; 式中,为全省第个子总体的总量指标估计量,为第层的总量指标估计量,为第层第个一级样本单位的总量指标估计量。若在一级样本单位内按村的规模做了分层,应分别对
43、各层按此公式进行计算,得到各层的总量,然后对各层总量求和,得到该一级样本单位的总量。2.的估计方差:式中,为全省第个子总体总量指标的估计方差,为第层总量指标的估计方差,为第层第个一级样本单位总量指标的估计方差: 其中:; ;与无偏估计量中的相应方差公式类似,计算时同样应注意与计算的方法相互一致。在一级样本单位内按村规模进行了分层时,应分别对各层按此公式进行计算,然后进行求和,得到该一级样本单位的方差。3.的最大相对误差:(三) 估计全省第(4)个子总体的企业单位数1.子总体企业单位总数估计量:式中,为清查得到的第层第个县、区中第个子总体的企业单位总数。2.的估计方差:其中:3.的最大相对误差:
44、 七、 主要符号及定义(一)角标代表不同的子总体,本部分取值4,表示城镇个体经营单位子总体。代表不同的一级单位层(L=1,2,+1),本部分一级单位共分为+1个层。代表不同的一级单位。表示不同的企业单位。(二)为省内全部一级单位总数,为第层一级单位总数,为全省所有一级样本单位总数,为第层一级样本单位数;(三)为全省第个子总体的企业单位总数,为其估计量。为第层第个子总体的企业单位数,为其估计量。为第层第个一级样本单位中第个子总体的企业单位数,为其估计量。(四)为全省第个子总体的总量指标值,为其估计量。为第层的总量指标值,为其估计量。为第层第个一级样本单位的总量指标值,为其估计量。为第层第个一级样
45、本单位第个企业单位的指标值。为第层第个一级样本单位的企业平均指标估计量。为第层的企业平均指标估计量。(五)为全省第个子总体总量指标的估计方差,为第层总量指标估计量的估计方差;为全省第个子总体企业总数估计量的估计方差,为第层企业单位总数估计量的估计方差。(六)为全省第个子总体总量指标的最大相对误差,为全省第个子总体企业总数的最大相对误差。第四部分 一阶段整群抽样设计方案的第二部分中为村及村以下企业子总体设计了二阶段整群抽样方法,可能不适合一些省(区、市)的具体情况,主要表现在:1.一些省(区、市),特别是直辖市的一级单位个数很少,不适宜采用多阶段抽样,可以采用一阶段整群抽样。2.一些省(区、市)的村及村以下企业个数很少,不宜采用整群抽样,可以对村及村以下企业部分采用目录抽样。3.一些省(区、市)的村及村以下企业比较发达,部分企业规模很大,可以采用目录抽样与整群抽样相结合的办法。目录抽样方法在第一部分已经给出,本部分给出一阶段整群抽样方法,供有关的省(区、市)选择。采用本方法,无需先抽样本县、区,而是在全省范围内直接抽取行政
链接地址:https://www.31ppt.com/p-1690164.html