统计学复习参考.ppt
统 计 学(第三版),指出下面的变量哪一个属于顺序变量 A.每月的生活费支出 B.产品质量的等级 C.企业所属的行业 D.产品的销售收入,指出下面的数据哪一个属于分类数据 A.某种产品的销售价格(元):21,26,19,22,28 B.某汽车生产企业各季度的产量(万辆):25,27,30,26 C.产品的质量等级:一等品,二等品,三等品 D.上网的方式:有线宽带,无线宽带,一所大学从全校学生中随机抽取300人作为样本进行调查,其中80%的人回答他们的月生活费支出在500元以上。这里的300人是 A.总体 B.样本 C.变量 D.统计量,5.一项调查表明,在所抽取的2000个消费者中,他们每月在网上购物的平均花费是200元,这项调查的样本是 A.2000个消费者 B.所有在网上购物的消费者 C.所有在网上购物的消费者的网上购物的平均花费金额 D.2000个消费者的网上购物的平均花费金额,6.最近发表的一项调查表明,“汽车消费税率调整后,消费者购买大排量汽车的比例显著下降”。这一结论属于 A.对样本的描述 B.对样本的推断 C.对总体的描述 D.对总体的推断,某研究部门准备在全市200万个家庭中抽取2000个家庭,以推断该城市所有职工家庭的年人均收入。这项研究的总体是()A2000个家庭B200万个家庭C2000个家庭的人均收入D200万个家庭的人均收入,在2008年8月北京举办的第29届奥运会上,中国体育代表团共获得51枚金牌、银牌21枚、铜牌28枚,要描述中国队获得奖牌的构成状况,适宜的图形是 A.条形图 B.饼图 C.茎叶图 D.雷达图,某集团公司下属5个子公司。集团公司想比较5个子公司在总生产成本、销售收入、销售人员数、公司所在地的居民收入水平这4项指标的差异和相似程度,适宜采用的图形是 A.帕累托图 B.环形图 C.散点图 D.雷达图,某大学的教学管理人员想分析经济管理类专业的学生统计学的考试分数与数学考试分数之间是否存在某种关系,应该选择的描述图形是 A.散点图 B.条形图 C.饼图 D.箱线图,随机抽取500个消费者的简单随机样本,得到他们每月的消费支出数据。研究者想观察这500个消费者生活费支出的分布状况,应该选择的描述图形是 A.条形图 B.帕累托图 C.直方图 D.雷达图,与直方图相比,茎叶图()A没保留原始数据的信息B保留原始数据的信息C不能有效展示数据的分布D更适合描述分类数据,下面的哪个图形不适合描述数值型数据的分布()A帕累托图B直方图C茎叶图D箱线图,一所大学的法学院设有三个专业,其中刑法专业20名学生,民法专业50名学生,经济法专业30名学生。要描述三个专业学生人数的多少,适宜采用的图形是 A.雷达图 B.茎叶图 C.条形图 D.箱线图,某地区的个人收入不是对称分布的,平均数5000元,标准差是1000元。收入在2000元至8000元范围内的人口至少占 A.75%B.89%C.94%D.99%,最近发表的一份报告称,“由150辆轿车组成的一个样本表明,进口轿车的价格明显高于本国生产的轿车”。这一结论属于()A对样本的描述B对样本的推断C对总体的描述D对总体的推断,在对数值型数据进行分组时,所分的组数 A.通常是越多越好 B.通常是越少越好 C.应以能够适当观察数据的分布特征为准 D.应使数据分布的图形达到对称,某地区2008年新生婴儿中,男性婴儿为25万,女性婴儿为20万。男性婴儿与女性婴儿的人数之比为1.25:1,这个数值属于 A.比例 B.比率 C.频数 D.平均数,下面的哪个陈述不属于鉴别图形优劣的准则()A使复杂的观点得到简明、确切、高效的阐述B能在最短的时间内、以最少的笔墨给读者提供最大量的信息C图形应尽可能复杂D表述数据的真实情况,9名大学生每月的生活费支出(单位:元)分别是:583,618,750,495,510,550,512,456,510。生活费支出的中位数是 A.510 B.750 C.450 D.618,在第29届北京奥运会男子100米决赛中,进入决赛的8名百米运动员的成绩(单位:秒)分别是:9.69,9.89,9.91,9.93,9.95,9.97,10.01,10.03,这8名运动员百米成绩的标准差是 A.0.011 B.0.105 C.0.340 D.0.037,在某班随机抽取10名同学,统计学课程的考试分数分别为:68,73,66,76,86,74,63,90,65,89,该班考试分数的25%和75%位置上的分位数分别是()A60.5和76B65.5和81C70.5和86D75.5和91,条形图与直方图的主要区别之一是 A.直方图不能用于展示数值型数据 B.直方图的矩形通常分开排列,而条形图的矩形通常连续排列 C.条形图中矩形的高度没有实际意义,而直方图中矩形的高度则有实际意义 D.条形图的矩形通常分开排列,而直方图的矩形通常连续排列,下列叙述中正确的是()A如果计算每个数据与平均数的离差,则这些离差的和等于零B如果考试成绩的分布是对称的,平均数为75,标准差为12,则考试成绩在63-75分之间的比例大约为95%C平均数和中位数相等D中位数总是大于平均数,如果一个数据的标准分数是-2,表明该数据()A比平均数高出2个标准差B比平均数低出2个标准差C等于2倍的平均数D等于2倍的标准差,对某个调整路段行驶过的120辆汽车的车速进行测量后发现,平均车速是85公里/小时,标准差是4公里/小时,下列哪个车速可以看作离群点()A78公里/小时B82公里/小时C91公里/小时D98公里/小时,在多元线性回归分析中,若F检验表明回归方程的线性关系显著,则()A表明每个自变量同因变量的线性关系显著B表明至少有一个自变量同因变量的线性关系显著C意味着每个自变量同因变量的线性关系都不显著D意味着至少有一个自变量同因变量的线性关系不显著,如果回归模型中存在 多重共线性,则()A整个回归模型的线性关系不显著B肯定有一个回归系数通不过显著性检验C肯定导致某个回归系数的符号与预期的相反D可能导致某些回归系数通不过显著性检验,3.已知某班级学生的英语平均考试成绩为85分,标准差是5分。如果一个学生考试成绩的标准分数是-2,则该学生的考试分数为 A.95 B.80 C.75 D.65,4.某大学共有5000名本科学生,每月平均生活费支出是500元,标准差是50元。假定该校学生的生活费支出为对称分布,月生活费支出在400元至600元之间的学生人数大约为 A.4750 B.4950 C.4550 D.3400,在多元线性回归分析中,如果t检验表明回归系数bi不显著,则意味着()A整个回归方程的线性关系不显著B整个回归方程的线性关系显著C自变量xi与因变量之间的线性关系不显著D自变量xi与因变量之间的线性关系显著,多元线性回归方程y=b0+b1x1+b2x2+bkxk,若自变量xi的回归系数bi的取值等于0,则表明()A因变量对自变量xi的影响不显著B因变量对自变量xi的影响显著C自变量xi对因变量的影响不显著D自变量xi对因变量的影响显著,6.市场营销人员的平均月收入为8000元,标准差为2400元,大学教师的平均月收入为5000元,标准差为2000元。由此可知 A.市场营销人员收入的离散程度较大 B.大学教师收入的离散程度较大 C.大学教师收入的离散程度较小 D.二者收入的离散程度相等,在多元回归分析中,多重共线性是指模型中()A两个或两个以上的自变量彼此相关B两个或两个以上的自变量彼此无关C因变量与一个自变量相关D因变量与两个以上的自变量相关,在某行业中随机抽取10家企业,第一季度的利润额分别是(单位:万元):72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的平均数为()A28.46B30.20C27.95D39.19,如果某个回归系数的正负号与预期的相反,则表明()A所建立的回归模型是错误的B该自变量与因变量之间的线性关系不显著C模型中可能存在多重共线性D模型中肯定不存在多重共线性,7.在证券投资行业中随机抽取10个从业者,得到他们的月收入分别为:6800,7300,6600,7600,8600,7400,6300,9000,6500,8900,他们月收入的平均数是 A.7000 B.7500 C.6800 D.6600,为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方法是()A简单随机抽样B整群抽样C系统抽样D分层抽样,9.在抽取样本时,一个元素被抽中后不再放回总体,然后再从所剩下的元素中抽取第二个元素,直到抽取 个元素为止,这样的抽样方法称为 A.重复抽样 B.不重复抽样 C.分层抽样 D.系统抽样,7.下列数据分析方法中,属于推断统计方法的是 A.画出一个班考试分数的茎叶图 B.学生的生活费支出分成400元以下、400元500元、500元600元、600元以上,列出每一组的人数 C.随机抽取2000个家庭计算出它们的平均收入 D.随机抽取2000个家庭,根据2000个家庭的平均收入估计该地区家庭的平均收入,1.在2008年8月北京举办的第29届奥运会上,中国体育代表团共获得51枚金牌,占中国队获得奖牌总数的51%。这里的“51%”是 A.平均数 B.频数 C.比例 D.比率,指出下面的变量中哪一个属于数值型变量()A生活费支出B产品的等级C企业类型D员工对企业某项改革措施的态度,3.质检部门从某业生产一天生产的手机中随机抽取20部进行检查,推断该批手机的合格率。这项研究的总体是 A.20部手机 B.一天生产的全部手机 C.20部手机中合格的手机 D.一天生产的手机中合格的手机,8.大学生中每周的上网时间的偏态系数为0.3,这表明学生每周上网时间的分布是 A.对称的 B.左偏的 C.右偏的 D.严重左偏的,某品牌的汽车在10家4S店销售,7月份各店的销售量(单位:辆)分别为:252,209,261,208,221,257,262,272,224,223,销售量25%和75%位置上的分位数分别是 A.235和267 B.261和272 C.209和224 D.215和259,回归平方和SSR反映了y 的总变差中()A由于x与y之间的线性关系引起的y的变化部分B除了x对y的线性影响之外的其他因素对y的变差的影响C由于x与y之间的非线性关系引起的y 的变化部分D由于x与y之间的函数关系引起的y 的变化部分,离散系数的主要用途是()A反映一组数据的离散程度B反映一组数据的平均水平C反映多组数据离散程度D比较多组数据的平均水平,两组数据的平均数不等,但标准差相等,则()A平均数小的,离散程度大B平均数大的,离散程度大C平均数小的,离散程度小D两组数据的离散程度相同,回归平方和占总平方和的比例为()A相关系数B回归系数C判定系数D估计标准误差,对于有线性相关关系的两变量建立的直线回归方程y=b0+b1x中,回归系数b1()A可能为0B可能小于0C只能是正数D只能是负数,在回归估计中,给定自变量的取值x0,求得的置信区间与预测区间相比()A二者的区间宽度是一样的B置信区间比预测区间宽C置信区间比预测区间窄D置信区间有时比预测区间宽,有时比预测区间窄,离散系数()A只能消除一组数据的水平对标准差的影响B只能消除一组数据的计量单位对标准差的影响C可以同时消除数据的水平和计量单位对标准差的影响D可以准确反映一组数据的离散程度,如果一组数据的分布是对称的,则偏态系数为()A等于0B等于1C大于0D大于1,如果偏态系数明显不等于0,则表明数据的分布是()A非对称的B对称的C左偏的D右偏的,在某班随机抽取10名同学,统计学课程的考试分数分别为:68,73,66,76,86,74,63,90,65,89,该班考试分数的中位数是()A72.5B73.0C73.5D74.5,在多元线性回归分析中,t检验是用来检验()A总体线性关系的显著性B各回归系数的显著性C样本线性关系的显著性DH0:b1=b2=.=bk=0,一组数据的离散系数为0.4,平均数为20,则标准差为()A80B0.02C4D8,在多元线性回归模型中,若自变量xi对因变量y 的影响不显著,那么它的回归系数bi的取值()A可能接近0B可能为1C可能小于0D可能大于1,残差平方和SSE反映了y 的总变差中()A由于x与y之间的线性关系引起的y的变化部分B除了x对y的线性影响之外的其他因素对y的变差的影响C由于x与y之间的非线性关系引起的y 的变化部分D由于x与y之间的函数关系引起的y 的变化部分,如果误差项服从正态分布的假定成立,那么在标准化残差图中,大约有95%的标准化残差落在()A-2-+2之间B01之间C-1-+1之间D-10之间,在多元线性回归方程y=b0+b1x1+b2x2+bkxk中,回归系数bi表示()A自变量xi变动一个单位时,因变量y的平均变动数量为biB其他变量不变的条件下,自变量xi变动一个单位时,因变量y变动的平均变动量为biC其他变量不变的条件下,自变量xi变动一个单位时,因变量y变动的总量为biD因变量y变动一个单位时,自变量xi的平均变动数量为bi,如果时间序列存在自相关,适合的预测模型是()A线性模型B指数模型C自回归模型D季节性多元回归模型,只含有随机波动的序列称为()A平稳序列B周期性序列C季节性序列D非平衡序列,对某时间序列建立的指数曲线方程为Y=1500*(1.2)t,这表明 该现象()A每期增长率为120%B每期增长率为20%C每期增长率为1.2个单位D每期的观测值为1.2个单位,对某时间序列建立的趋势方程为Y=100-5t,这表明该序列()A没有趋势B呈现线性上升趋势C呈现线性下降趋势D呈现指数下降趋势,平滑法适合于预测()A只含有随机波动的序列B含有多种成分的序列C含有趋势成分的序列D含有季节成分的序列,在多元回归分析中,通常需要计算调整的多重判定系数,这样可以避免多重判定系数的值()A由于模型中自变量个数的增加而越来越接近1B由于模型中自变量个数的增加而越来越接近0C由于模型中样本量个数的增加而越来越接近1D由于模型中样本量个数的增加而越来越接近0,自相关是指不同点的时间序列()A观察值之间的相关B残差之间的相关C预测值之间的相关D观测值有线性趋势,在多元线性回归分析中,如果F检验表明线性关系显著,则意味着()A在多个自变量中至少有一个自变量与因变量之间的线性关系显著B所有的自变量与因变量线性关系显著C在多个自变量中至少有一个自变量与因变量之间的线性关系不显著D所有的自变量与因变量之间的线性关系都不显著,虚拟自变量的回归是指在回归模型中含有()A分类自变量B数值型自变量C分类因变量D数值型因变量,如果现象的发展没有季节变动,则各期的季节指数应()A等于0B等于100%C小于100%D大于100%,设回归方程的形式为E(y)=b0+b1x,若x是取值为0,1的虚拟变量,则b0的意义是()A代表与虚拟变量值0所对应的那个分类变量水平的平均值B代表与虚拟变量值1所对应的那个分类变量水平的平均值C代表与虚拟变量值1所对应的那个分类变量水平的平均响应与虚拟变量值0所对应的那个分类变量水平的平均值D代表与虚拟变量值1所对应的那个分类变量水平的平均响应与虚拟变量值0所对应的那个分类变量水平的平均值的差值,在多元线性回归分析中,利用逐步回归方法可以()A避免回归模型的线性关系不显著B避免所建立的回归模型存在多重共线性C提高回归方程的估计精度D使预测更加可靠,时间序列在长时期内呈现出来的某种持续向上或下降的变动称为()A趋势 B季节变动C循环波动D不规则波动,如果时间序列的残差存在自相关,使用最小二乘法拟合的回归模型进行预测()A违背了残差齐性的假定B违背了残差独立性的假定C违背了残差正态性的假定D结果比较准确,根据各季度商品销售额数据计算的季节指数分别为:一季度125%,二季度70%,三季度100%,四季度105%。受季节因素影响最大的是()A一季度B二季度C三季度D四季度,下列不属于描述统计问题的是()根据样本信息对总体进行的推断了解数据分布的特征分析感兴趣的总体特征利用图表等对数据进行汇总和分析,一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。调查结果表明:45%的年轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题,15%的年轻人愿意与其父母讨论爱情问题。该调查所收集的数据是()A分类数据B顺序数据C数值型数据D实验数据,8.为了解大学生的上网时间,从全校所有学生宿舍中随机抽取50个宿舍,然后对抽中宿舍中的每个学生进行调查,这种抽样调查方法是 A.分层抽样 B.简单随机抽样 C.系统抽样 D.整群抽样,根据各季度商品销售额数据计算的季节指数分别为:一季度125%,二季度70%,三季度100%,四季度105%。不受季节因素影响的是()A一季度B二季度C三季度D四季度,如果某一月份的商品销售额为84万元,该月的季节指数等于1.2,在消除季节因素后该月的销售额为()A60万元B70万元C90.8万元D100.8万元,1.下面关于相关分析的陈述中,不正确的是 A.相关系数的数值越大,说明两个变量之间的线性关系越强 B.相关系数是一个随机变量 C.相关系数的绝对值不会大于1 D.相关系数只度量两个变量之间的线性关系2.在一元回归模型 中,反映的是 A.由于x的变化引起的y的线性变化部分 B.由于y的变化引起的x的线性变化部分 C.由于x和y的线性关系对y的影响 D.除x和y的线性关系之外的随机因素对y的影响,3.在一元线性回归模型 中,对误差项e有三个基本假定,即正态性、方差齐性和独立性。其中的独立性是指 A.对于一个特定的x值,它所对应的e与其他x值所对应的不相关 B.对于一个特定的y值,它所对应的e与其他y值所对应的不相关 C.对于所有的x值,e的方差 都相同 D.对于所有的y值,e的方差 都相同4.在回归分析中,残差平方和是指 A.各实际观测值 与其均值 的离差平方和 B.各实际观测值 与回归值 的离差平方和 C.回归预测值 与因变量均值 的离差平方和 D.因变量 与自变量 的平方和,5.在一元线性回归分析中,利用所求得的一元线性回归方程,对于自变量x的一个给定值,求出因变量的平均值的区间,这一区间称为 A.因变量平均值的置信区间 B.因变量个别值的预测区间 C.自变量平均值的置信区间 D.自变量个别值的预测区间6.残差除以相应的标准差,其结果称为 A.残差平方和 B.残差 C.标准化残差 D.估计标准误差,7.下面陈述中错误的是()A相关系数是度量两个变量之间线性关系强度的统计量B相关系数是一个随机变量C相关系数的绝对值不会大于1D相关系数不会取负值,8.下面的相关系数取值哪一个是错误的()A-0.8 B0.78 C1.25 D09.下面关于相关系数的陈述中哪一个是错的A数值越大说明两变量之间的关系越强B仅仅是两变量的线性关系的度量C不一定意味着两变量间存在因果关系D绝对值不会大于1,10.如果相关系数为0,则两变量间()A相关程度低 B不存在任何关系C不存在线性相关关系D存在非线性相关关系,11.在回归分析中,被预测或被解释的变量称为A自变量 B因变量 C随机变量 D非随机变量12.在回归分析中,描述因变量如何依赖于自变量和误差项的方程称为()A.回归方程 B.回归模型C估计的回归方程 D经验回归方程,13.在回归分析中,根据样本数据求出的回归方程的估计称为()A回归方程B回归模型C估计的回归方程D理论回归方程,14.下面关于回归模型的假定中哪一个是错的A自变量是随机的B误差项是一个期望值为0的随机变量C对于所有的x值,误差项的方差都相同D误差项是一个服从正态分布的随机变量,15.根据最小二乘法拟合直线回归方程是使()最小。16.在一元线性回归方程中,回归系数的实际意义是()A当x=0时,y的期望值B当x变动一个单位时,y的平均变动数量C当x变动一个单位时,y增加的总数量D当y变动一个单位时,x的平均变动数量,16.对不同年份的产品成本配合的直线回归方程为y=280-1.75x,回归系数表示时间增加一个单位,产品成本平均增加1.75个单位17.在回归分析中,F检验主要是用来检验A相关系数的显著性B回归系数的显著性C线性关系的显著性D估计标准误差的显著性,18.在直线回归方程中,若回归系数为0,则Ay对x的影响是显著的By对x的影响是不显著的Cx对y的影响是显著的Dx对y的影响是不显著的,19.下面关系判定系数的陈述不正确的是A回归平方和占总平方和的比例B取舍范围是-1,1C取值范围是0,1D评价回归方程拟合优度的一个统计量,20.下面关于估计标准误差的陈述中不正确的是()A均方残差的平方根B对误差项的标准差的估计C排除了x对y的线性影响后,y随机波动大小的一个估计量D试题了两个变量之间的关系强度,21已知SSR=4854,SSE=146,则判定系数为97.08%22.在因变量的总离差平方和中,如果回归平方和所占比例大,则两变量之间A相关程度高 B相关程度低C完全相关 D完全不相关,23.若变量x与y之间的相关系数r=0.8,则回归方程的判定系数为()A0.8 B0.89 C0.64 D0.4024.标准化残差是()A残差除以残差的标准差B残差的标准差除以残差C因变量的观测值除以残差D自变量的实际值除以残差,