《统计学原理》形成性考核册答案(三).doc
统计学原理2013形成性考核册答案(三)统计学原理作业(三)(第五第七章)一、判断题1、抽样推断是利用样本资料对总体的数量特征进行的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(× )2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(× )3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。()4、抽样误差即代表性误差和登记误差,这两种误差都是不可避免的。(×) 5、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。()6、在一定条件下,施肥量与收获率是正相关关系。()7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高。( )8、利用一个回归方程,两个变量可以互相推算(× ) 二、单项选择题1、在一定的抽样平均误差条件下( A )。 A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度 2、反映样本指标与总体指标之间的平均误差程度的指标是( C )。 A、抽样误差系数 B、概率度 C、抽样平均误差 D、抽样极限误差 3、抽样平均误差是( C )。 A、全及总体的标准差 B、样本的标准差 C、抽样指标的标准差 D、抽样误差的平均差 4、当成数等于( C )时,成数的方差最大。 A、1 B、0 c、0.5 D、-1 5、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是( C )。 A、等于78% B、大于84% c、在此76%与84%之间 D、小于76% 6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差( A )。 A、甲厂比乙厂大 B、乙厂比甲厂大 C、两个工厂一样大 D、无法确定 7、反映抽样指标与总体指标之间抽样误差可能范围的指标是(B)。、抽样平均误差;、抽样极限误差;、抽样误差系数;、概率度。8、如果变量x 和变量y 之间的相关系数为 1 ,说明两变量之间( D )。 A、不存在相关关系 B、相关程度很低 C、相关程度显著 D、完全相关9、一般说,当居民的收入减少时,居民的储蓄款也会相应减少,二者之间的关系是( A )。 A、直线相关 B、完全相关 C、非线性相关 D、复相关10、年劳动生产率x(千元)和工人工资y(元)之间的回归方程为yc=30+60x ,意味着劳动生产率每提高2千元时,工人工资平均增加(B )。 A、60元 B、120元 C、30元 D、90元11、如果变量x 和变量y 之间的相关系数为-1,说明两个变量之间是( B) A、高度相关关系 B、完全相关关系 C、完全不相关 D、低度相关关系12、价格不变的条件下,商品销售额和销售量之间存在着( D )。 A、不完全的依存关系 B、不完全的随机关系 C、完全的随机关系 D、完全的依存关系三、多项选择题 1、影响抽样误差大小的因素有( A、B、C、D )。 A、抽样调查的组织形式 B、抽取样本单位的方法 C、总体被研究标志的变异程度 D、抽取样本单位数的多少 E、总体被研究标志的属性 2、在抽样推断中(A、C、D )。 A、抽样指标的数值不是唯一的 B、总体指标是一个随机变量 C、可能抽取许多个样本 D、统计量是样本变量的涵数 E、全及指标又称为统计量 3、从全及总体中抽取样本单位的方法有(B、C )。 A、简单随机抽样 B、重复抽样 c、不重复抽样 D、概率抽样 E、非概率抽样 4、在抽样推断中,样本单位数的多少取决于( A、B、C、E )。 A、总体标准差的大小 B、允许误差的大小 C、抽样估计的把握程度 D、总体参数的大小 E、抽样方法 5、总体参数区间估计必须具备的三个要素是( B、D、E )。 A、样本单位数 B、样本指标 c、全及指标 D、抽样误差范围 E、抽样估计的置信度 6、在抽样平均误差一定的条件下( A、D )。 A、扩大极限误差的范围,可以提高推断的可靠程度 B、缩小极限误差的范围,可以提高推断的可靠程度 C、扩大极限误差的范围,只能降低推断的可靠程度 D、缩小极限误差的范围,只能降低推断的可靠程度 E、扩大或缩小极限误差范围与推断的可靠程度无关7、判定现象之间有无相关关系的方法是(A、B、C、D)。、对客观现象作定性分析、编制相关表、绘制相关图、计算相关系数 、计算估计标准误8、相关分析特点有( B、 C、D、E )。 A.两变量不是对等的 B.两变量只能算出一个相关系数C.相关系数有正负号 D.两变量都是随机的 E.相关系数的绝对值介于0和1之间9、下列属于负相关的现象是( A、B、D )。 A、商品流转的规模愈大,流通费用水平越低 B、流通费用率随商品销售额的增加而减少C、国民收入随投资额的增加而增长 D、生产单位产品所耗工时随劳动生产率的提高而减少E、某产品产量随工人劳动生产率的提高而增加10、设产品的单位成本(元)对产量(百件)的直线回归方程为 ,这表示(A、C、E)A、产量每增加100件,单位成本平均下降1.85元B、产量每减少100件,单位成本平均下降1.85元C、产量与单位成本按相反方向变动D、产量与单位成本按相同方向变动E、当产量为200件时,单位成本为72.3元四、简答题1、例子说明总体、样本、参数、统计量、变量这几个概念?答:如果研究的对象是100人,这100人就是总体。从中抽取10人做研究,那就是样本。参数是反映总体统计特征的数字,如这100人的平均身高,方差等等。变量就是反应总体的某些特性的量,如身高。2、什么是抽样平均误差和抽样极限误差?二者有何关系?写出二者的计算机公式答:抽样平均误差是反映抽样误差一般水平的指标;而抽样极限误差是反映抽样误差的最大范围的指标,二者既有联系又有区别。二者的联系是:极限误差是在抽样平均误差的基础上计算得到的,即 ;二者的区别是:(1)二者涵义不同;(2)影响误差大小的因素不同;(3)计算方法不同。抽样平均误差标准差样本单位数的平方根;抽样极限误差样本平均数减去总体平均数的绝对值;抽样极限误差是T倍的抽样平均误差。 3、解释相关关系的含义,说明相关关系的特点。答:我们在理解相关关系时,需要区别相关关系与函数关系。函数关系是一一对应的确定关系,例如当银行年利率确定时,年利息额y与存款额x之间就是函数关系,它表现为yx×r。而相关关系就没有这样确定的关系了,我们把变量之间存在的不确定的数量关系称为相关关系(correlation)。比如家庭的储蓄额和家庭收入之间的关系。如果发现家庭储蓄额随家庭收入的增长而增长,但它们并不是按照一个固定不变的比率变化的,由于可能还会有其他很多较小的因素影响着家庭储蓄这个变量,因此这其中可能会有高低的偏差,这种关系就是相关关系而不是函数关系。相关关系的特点是,一个变量的取值不能由另一个变量惟一确定,当变量x取某一个值时,变量y的取值可能有几个。对这种关系不确定的变量显然不能用函数关系进行描述,但也不是无任何规律可循。通过对大量数据的观察与研究,我们就会发现许多变量之间确实存在一定的客观规律。4、请写出计算相关系数的简要公式,说明相关关系的取值范围及其判断标准?答:相关系数的简要公式: 1)相关系数的数值范围是在 1 和 +1 之间,即时 , 时为正相关, 时为负相关。5、拟合回归程yc=a+bx有什么前提条件? 在回归方程yc=a+bx,参数a,b 的经济含义是什么?答:1)拟合回归方程yc=a+bx的要求有:1)两变量之间确存在线性相关关系;2)两变量相关的密切程度必须是显著相关以上;3)找到全适的参数a,b使所确定的回归方程达到使实际的y值与对应的理论估计值 的离差平方和为最小。2)a的经济含义是代表直线的起点值,在数学上称为直线的纵轴截距,它表示x=0时y常项。 参数b 称为回归系数,表示自变量增加一个单位时因变量y的平均增加值,回归系数b 正负号可以判断相关方向,当b>0时,表示正相关,当b<0表示负相关。五、计算题1、某企业生产一批零件,随机重复抽取400只做使用寿命试验。测试结果平均寿命为5000小时,样本标准差为300小时,400只中发现10只不合格。根据以上资料计算平均数的抽样平均误差和成数的抽样平均误差。(学习指导书P177第2题)解:1)平均数的抽样平均误差: 2)成数的抽样平均误差: 2、外贸公司出口一种食品, 规定每包规格不低于150克,现在用重复抽样的方法抽取其中的100包进行检验,其结果如下: 每包重量(克)包 数 148149 149150 150151 15115210205020100 要求:(1)以99.73%的概率估计这批食品平均每包重量的范围,以便确定平均重量是否达到规格要求; (2)以同样的概率保证估计这批食品合格率范围。 3、单位按简单随机重复抽样方式抽取40名职工,对其业务情况进行考核,考核成绩资料如下: 68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 76 71 60 91 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 87 要求:(1)根据上述资料按成绩分成以下几组:60分以下,6070分,7080分,8090分,90100分,并根据分组整理成变量分配数列;(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围;(3)若其它条件不变,将允许误差范围缩小一半,应抽取多少名职工?解:1)分配数列成绩工人数(频数)f各组企业数所占比重(频率)%60以下37560706157080153758090123090100410合计401002)全体职工业务考试成绩的区间范围成绩组中值工人数fXf553165145265639086475151125608512102076895 4 380 1296合计403080=4440= 4、采用简单重复抽样的方法,抽取一批产品中的件作为样本,其中合格品为件。要求:()计算样本的抽样平均误差()以的概率保证程度对该产品的合格品率进行区间估计()答: )样本的抽样平均误差为1.1%()以的概率保证程度对该产品的合格品率区间为95.3%-99.70%5、某企业上半年产品产量与单位成本资料如下:月份产量(千件)单位成本(元)要求:()计算相关系数,说明两个变量相关的密切程度。()配合回归方程,指出产量每增加件时,单位成本平均变动多少?()假定产量为件时,单位成本为多少元?解:设产品产量为x与单位成本为y月份产量(千件)x单位成本(元/件)yxy127345329146237295184216347116504128443739532921954691647612766568254624340合计21426793026814811)相关系数答:()相关系数为09091,说明两个变量相关的密切程度为高度负相关。()回归方程为产量每增加件时,单位成本平均减少1.8128元(3)假定产量为件时,单位成本为66.4869元6、根据某地区历年人均收入(元)与商品销售额(万元)资料计算的有关数据如下: (x 代表人均收入,y 代表销售额) n=9 =546 =260 =34362 =16918计算: (1)建立以商品销售额为因变量的直线回归方程,并解释回归系数的含义;(2)若2002年人均收为14000元,试推算该年商品销售额 。答:(1)建立以商品销售额为因变量的直线回归方程,回归系数的含义:当人均收入每增加1 元,商品销售额平均增加0.9246万元; (2)若2002年人均收为14000元,该年商品销售额为12917.1965万元 。7、某地区家计调查资料得到,每户平均年收入为8800元,方差为4500元,每户平均年消费支出为6000元,均方差为60元,支出对于收入的回归系数为0.8,要求: (1)计算收入与支出的相关系数; (2)拟合支出对于收入的回归方程; (3)收入每增加1元,支出平均增加多少元。解:1)已知:2)答:(1)收入与支出的相关系数为0.89; (2)支出对于收入的回归方程;(3)收入每增加1元,支出平均增加0.8元