第4章参数估计和假设检验ppt课件.ppt
《第4章参数估计和假设检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《第4章参数估计和假设检验ppt课件.ppt(93页珍藏版)》请在三一办公上搜索。
1、中央财经大学统计学院,参数估计与假设检验,4.1参数估计4.2假设检验,中央财经大学统计学院 2,4.1 参数估计,4.1.1参数估计的基本概念4.1.2总体均值和比例的区间估计4.1.3必要样本容量的确定,中央财经大学统计学院 3,4.1.1 参数估计的基本概念,用来推断总体参数的统计量称为估计量(estimator),其取值称为估计值(estimate)。同一个参数可以有多个不同的估计量。参数是唯一的,但估计量(统计量)是随机变量,取值是不确定的。,中央财经大学统计学院 4,点估计,点估计:用估计量的数值作为总体参数的估计值。一个总体参数的估计量可以有多个。例如,在估计总体方差时,和 都可
2、以作为估计量。,中央财经大学统计学院 5,点估计量的常用评价准则:无偏性,无偏性:估计量的数学期望与总体待估参数的真值相等:,中央财经大学统计学院 6,点估计量的常用评价准则:有效性,在两个无偏估计量中方差较小的估计量较为有效。,中央财经大学统计学院 7,估计量的常用评价准则:一致性,指随着样本容量的增大,估计量越来越接近被估计的总体参数。,中央财经大学统计学院 8,区间估计,根据事先确定的置信度1-给出总体参数的一个估计范围。置信度1-的含义是:在同样的方法得到的所有置信区间中,有100(1-)%的区间包含总体参数。抽样分布是区间估计的理论基础。,抽样分布 Sampling Distribu
3、tion,从总体中抽取一个样本量为n的随机样本,我们可以计算出统计量的一个值。如果从总体中重复抽取样本量为n的样本,就可以得到统计量的多个值。统计量的抽样分布就是这一统计量所有可能值的概率分布。,中央财经大学统计学院 10,抽样分布:几个要点,抽样分布是统计量的分布而不是总体或样本的分布。在统计推断中总体的分布一般是未知的,不可观测的(常常被假设为正态分布)。样本数据的统计分布是可以直接观测的,最直观的方式是直方图,可以用来对总体分布进行检验。抽样分布一般利用概率统计的理论推导得出,在应用中也是不能直接观测的。其形状和参数可能完全不同于总体或样本数据的分布。,中央财经大学统计学院 11,抽样分
4、布的一个演示:重复抽样时样本均值的抽样分布(1),设一个总体含有4 个个体,分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差及分布如下。,均值和方差,中央财经大学统计学院 12,抽样分布的一个演示:重复抽样时样本均值的抽样分布(2),现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表.,中央财经大学统计学院 13,抽样分布的一个演示:重复抽样时样本均值的抽样分布(3),各样本的均值如下表,并给出样本均值的抽样分布,中央财经大学统计学院 14,所有样本均值的均值和方差,1.样本均值的均值(数学期望)等于总体均值2.样本均值的方差等于总体方
5、差的1/n,M为样本数目,中央财经大学统计学院 15,样本均值的抽样分布与总体分布的比较,中央财经大学统计学院 16,样本均值的抽样分布,一般的,当总体服从 N(,2)时,来自该总体的容量为n的样本的均值X也服从正态分布,X 的期望为,方差为2/n。即XN(,2/n)。,中心极限定理,从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布。,中央财经大学统计学院 18,标准误(Standard Error),简单随机抽样、重复抽样时,样本均值抽样分布的标准差等于,这个指标在统计上称为标准误。统计软件在对变量进行描述统计时一
6、般会输出这一结果。,中央财经大学统计学院 19,有限总体校正系数Finite Population Correction Factor,简单随机抽样、不重复抽样时,样本均值抽样分布的方差略小于重复抽样的方差,等于 这一系数称为有限总体校正系数。当抽样比(n/N)0.05时可以忽略有限总体校正系数。,中央财经大学统计学院 20,4.2 总体均值和比例的区间估计,中央财经大学统计学院 21,相关理论,总体正态?,n30?,2已知?,否,是,是,否,否,是,实际中总体方差总是未知的,因而这是应用最多的公式。在大样本时t值可以用z值来近似。,根据中心极限定理得到的近似结果。未知时用s来估计。,增大n?
7、数学变换?,中央财经大学统计学院 22,当 时总体比例的置信区间可以使用正态分布来进行区间估计。(样本比例记为,总体比例记为),总体比例的置信区间,中央财经大学统计学院 23,关于置信区间的补充说明,置信区间的推导:有限总体不重复抽样时,样本均值或比例的方差需要乘以“有限总体校正系数”(当抽样比f=n/N小于0.05时可以忽略不计),前面的公式需要进行相应的修改。,中央财经大学统计学院 24,关于置信度含义的说明,样本均值的 抽样分布,在所有的置信区间中,有(1-)*100%的区间包含 总体真实值。对于计算得到的一个具体区间,“这个区间包含总体真实值”这一结论有(1-)*100%的可能是正确的
8、。说“总体均值有95%的概率落入某一区间”是不严格的,因为总体均值是非随机的。,Example:用SPSS进行区间估计,例:儿童电视节目的赞助商希望了解儿童每周看电视的时间。下面是对100名儿童进行随机调查的结果(小时)。计算平均看电视时间95%的置信区间。,SPSS输出结果(数据:tv.xls)操作:分析-描述统计-探索,中央财经大学统计学院 27,总体比例的置信区间:例子,解:显然有因此可以用正态分布进行估计。/2=1.645,结论:我们有90的把握认为悉尼青少年中每天都抽烟的青少年比例在19.55%23.85%之间。,1986年对悉尼995名青少年的随机调查发现,有216人每天都抽烟。试
9、估计悉尼青少年中每天都抽烟的青少年比例的90%的置信区间。,SPSS的计算结果,在SPSS中将“是否吸烟”输入为取值为1和0的属性变量,权数分别为216和779。计算这一变量均值的置信区间即为比例的置信区间。,中央财经大学统计学院 29,4.3 必要样本量的计算,样本量越大抽样误差越小。由于调查成本方面的原因,在调查中我们总是希望抽取满足误差要求的最小的样本量。,中央财经大学统计学院 30,关于抽样误差的几个概念,实际抽样误差抽样平均误差最大允许误差,中央财经大学统计学院 31,实际抽样误差,样本估计值与总体真实值之间的绝对离差称为实际抽样误差。由于在实践中总体参数的真实值是未知的,因此实际抽
10、样误差是不可知的;由于样本估计值随样本而变化,因此实际抽样误差是一个随机变量。,抽样平均误差,抽样平均误差:样本均值的标准差,也就是前面说的标准误。它反映样本均值(或比例)与总体均值(比例)的平均差异程度。例如对简单随机抽样中的样本均值有:或(不重复抽样)我们通常说“抽样调查中可以对抽样误差进行控制”,就是指的抽样平均误差。由上面的公式可知影响抽样误差的因素包括:总体内部的差异程度;样本容量的大小;抽样的方式方法。,中央财经大学统计学院 33,最大允许误差,最大允许误差(allowable error):在确定置信区间时样本均值(或样本比例)加减的量,一般用E来表示,等于置信区间长度的一半。在
11、英文文献中也称为margin of error。置信区间=最大允许误差是人为确定的,是调查者在相应的置信度下可以容忍的误差水平。,中央财经大学统计学院 34,如何确定必要样本量?,必要样本量受以下几个因素的影响:1、总体标准差。总体的变异程度越大,必要样本量也就越大。2、最大允许误差。最大允许误差越大,需要的样本量越小。3、置信度1-。要求的置信度越高,需要的样本量越大。4、抽样方式。其它条件相同,在重复抽样、不重复抽样;简单随机抽样与分层抽样等不同抽样方式下要求的必要样本容量也不同。,中央财经大学统计学院 35,简单随机抽样下估计总体均值时样本容量的确定,式中的总体方差可以通过以下方式估计:
12、根据历史资料确定通过试验性调查估计,中央财经大学统计学院 36,简单随机抽样下估计总体比例时样本容量的确定,式中的总体比例可以通过以下方式估计:根据历史资料确定通过试验性调查估计取为0.5。,中央财经大学统计学院 37,不重复抽样时的必要样本量,比重复抽样时的必要样本量要小。式中n0是重复抽样时的必要样本容量。,中央财经大学统计学院 38,样本量的确定(实例1),需要多大规模的样本才能在 90%的置信水平上保证均值的误差在 5 之内?前期研究表明总体标准差为 45.,中央财经大学统计学院 39,样本量的确定(实例2),一家市场调研公司想估计某地区有电脑的家庭所占的比例。该公司希望对比例p的估计
13、误差不超过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)?,解:已知E=0.05,=0.05,Z/2=1.96,当未知时取为0.5。,中央财经大学统计学院 40,实例3,你在美林证券公司的人力资源部工作。你计划在员工中进行调查以求出他们的平均医疗支出。你希望有 95%置信度使得样本均值的误差在$50 以内。过去的研究表明 约为$400。需要多大的样本容量?,中央财经大学统计学院,4.2 假设检验,4.2.1 假设检验的基本问题4.2.2 单个总体参数的检验4.2.3 两个总体参数的检验,中央财经大学统计学院 42,4.2.1 假设检验的基本问题,基本原理零假设和备
14、择假设检验统计量和拒绝域两类错误与显著性水平,中央财经大学统计学院 43,实际中的假设检验问题,假设检验:事先作出关于总体参数、分布形式、相互关系等的命题(假设),然后通过样本信息来判断该命题是否成立(检验)。,产品自动生产线工作是否正常?某种新生产方法是否会降低产品成本?治疗某疾病的新药是否比旧药疗效更高?厂商声称产品质量符合标准,是否可信?,中央财经大学统计学院 44,案例,美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进行的一项研究调查了50名失业者,平均失业时间为15.54周。根据调查结果能否认为费城的平均失业时间高于全国平均水平?澳大利
15、亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为Roy Morgan的结果显著高于统计局的数字吗?,中央财经大学统计学院 45,假设检验的基本原理,利用假设检验进行推断的基本原理是:小概率事件在一次试验中几乎不会发生。如果对总体的某种假设是真实的(例如学生上课平均出勤率95%),那么不利于或不能支持这一假设的事件A(小概率事件,例如样本出勤率=55%)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了(样本出勤率=55%),就有理由怀疑该假设的真实性,拒绝提出的假设。,中央财经大学统计学院
16、 46,假设检验的步骤,根据实际问题提出一对假设(零假设和备择假设);构造某个适当的检验统计量,并确定其在零假设成立时的分布;根据观测的样本计算检验统计量的值;根据犯第一类错误的损失规定显著性水平;确定决策规则:根据确定检验统计量的临界值并进而给出拒绝域,或者计算p值等;下结论:根据决策规则得出拒绝或不能拒绝零假设的结论。注意“不能拒绝零假设”不同于“接受零假设”。,中央财经大学统计学院 47,1、零假设和备择假设的选择,零假设和备择假设是互斥的,它们中仅有一个正确;等号必须出现在零假设中;最常用的有三种情况:双侧检验、左侧检验和右侧检验。检验以“假定零假设为真”开始,如果得到矛盾说明备择假设
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数估计 假设检验 ppt 课件
链接地址:https://www.31ppt.com/p-5761522.html