管理定量分析第5章假设检验.ppt
第5章 假设检验,引例1,假设在某企业随机抽取的l00个新雇员的样本中,你发现拥有大学本科文凭、无工作经验的新雇用的女性管理人员的年平均工资是30 000元,而那些拥有同样文化程度也无工作经验的新雇用的男性管理人员的年平均工资是32 000元。这2 000元的差异是否足以说明存在性别歧视?,引例2,假设我们需要评估一项针对青少年罪犯的咨询项目的效果。从随机抽取的样本中,你发现参与这个项目的青少年罪犯中有25的人在一年内又犯案了,那些没有参与这个项目的青少年罪犯有40的人在一年内又犯案了。这15%的差异是否足以说明这个项目是有成效的?,假设检验的基本思想可以用小概率原理来解释。所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。也就是说,对总体的某个假设是真实的,那么不支持这一假设的事件A在一次试验中是几乎不可能发生的;要是在一次试验中事件A竟然发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设。,假设以下陈述为真:你打了某种疫苗P,就不会得某种流行病Q。我们把这个先决条件表述如下:如果P 则非Q 其中,P表示打了疫苗P,Q表示得流行病Q 或者,更形式化一点:if P then NOT Q 然后,如果观察到你得了流行病Q,那么就可以推出你没有打疫苗 P这个推断只不过是上述前提条件的逆反命题而已。我们把以上推理过程表述如下:if P then NOT Q(先决条件)Q(前提)then NOT P(结论),假设检验的步骤,1)提出原假设和备择假设;2)确定统计量;3)规定显著性水平;4)计算统计量的值;5)根据计算结果作出拒绝或接受原假设的判断。,案例一,公安系统近期开展了“清网行动”,目的是将多年潜逃的网上追逃的罪犯捉拿归案。在开展“清网行动”之前,某警察局平均每天抓到的网上逃犯人数是3人(被捕人数的分布是正态分布)。上级突然要对该警察局的“清网行动”的业绩进行检查,由于事先没有通知,全面的统计该行动展开以来的所有被捕人数情况来不及,但是,局长命令办公室主任必须马上拿出客观的依据向上级汇报,以说明该局最近的工作力度很大,业绩明显。办公室主任决定采用抽样推断的方法来解决这个问题。他认为,只要现在平均每天抓到的网上追逃人员的数量大于3个,那就说明最近工作业绩有改善。但是,在没有总体数据的情况下,如何证明现在的平均抓捕人数大于3个了呢?办公室主任随机抽取了10天的抓捕人数,列表如下:,第一步:构造假设,第二步:确定统计量,第三步:确定显著性水平,在这个例子中,我们选取=0.05,第四步:计算统计量的值,第五步:根据计算结果作出拒绝或接受原假设的判断,据此可以推断,在95%的置信水平下,可以认为警察局的工作是有显著效果的。,5.2单侧与双侧检验,案例一的原假设是警察局平均每天抓捕的网上逃犯人数没有增加,我们在检验这个假设的过程中只需考虑t分布的一侧,就是均值大于3的这一侧,因此,可以称其为单侧检验。而实际问题中有一些需要单侧检验。例如,工作的效率是否低于某个值、缺勤率是否高于某个值、产品的是寿命是否低于某个值等问题。另一些则需要做双侧检验。例如,螺丝的长短、食品中某种微量元素的添加剂量等问题。,案例二,食品药品监督管理局查扣了一批食盐,怀疑其中的碘含量不符合标准。食盐中国家标准碘含量是30mg/kg。随机抽取的10袋食盐,所得碘含量数据如下表(碘含量单位mg/kg),以95%的置信度检验这批食盐中的碘含量是否合格。,查表可得,3.069大于2.27,落入拒绝域,拒绝原假设,接受备择假设,说明该批食盐的碘含量超标。,案例三,某地区在各政府部门间进行了一次缺勤率的调查,如果平均缺勤率高于0.18,政府将考虑采用新的绩效考核办法,随机抽取的9个政府部门的缺勤率数据如下表,在95%的置信水平上推测总体的缺勤情况。,查表可得,2.2739大于1.86,落入拒绝域,拒绝原假设,接受备择假设,说明该各部门的平均缺勤率已经超过了0.18,需要采用新的考核办法。,5.3均值之差的检验,一些管理问题:校长想了解经过专门的阅读课程训练后,中学高年级的阅读水平是否有所提高,他想对训练之前与之后的阅读水平作一比较;精神健康专家想了解某一类型的治疗方法是否比另一类型的要好;董事长想了解广告效果是否影响销售量,这可进行一项试验,一些区域做广告而另一些区域不做广告。这些情况是要了解两个样本是否有差别,采用技术就是均值之差的检验,两个样本均值之差的检验可以根据总体的方差相等于否,分成如下三种情况用不同的方法进行检验:第一,两个样本独立,方差不等第二,两个样本独立,方差相等第三,不独立样本(配对样本),案例四,公务员局的办公室主任想了解一种新的招聘方案是会减少聘用一个公务员所花费的时间。他抽了10个部门作为样本,计算了在采用新方法前和采用新方法后,聘用一个公务员所花的平均时间。数据如下(单位:小时):,第一种情况,两个样本独立,方差不等,第二种情况,两个样本独立,方差相等,总体标准差采用如下公式计算:总体标准误采用如下公式计算:,第三种情况,不独立样本(配对样本),根据n-1即 9个自由度来计算t值,看均值是否与0有显著差异:,注意:,第一,在本例中,为了演示总体方差不等、方差相等,配对样本等三种不同情况下的假设检验方法,我们使用了相同的一个案例,在实际问题中,一个案例一般只用以上三种方法中的一种处理即可。第二,同等条件下,独立样本方差不等的假设下t值一般小于等方差假设下的t值,因此,在总体方差未知的情况下,独立样本不等方差假设是最保守的。,H0:无罪,假设检验中的两类错误(决策结果),假设检验就好像一场审判过程,统计检验过程,主讲人:刘兰剑,(二)第类错误与第类错误第类错误 即原假设为真,而我们却作出了否定这一假设的判断。第类错误 即原假设为伪,而我们却作出了接受这一假设的判断。,主讲人:刘兰剑,错误和 错误的关系,主讲人:刘兰剑,影响 错误的因素,1.总体参数的真值随着假设的总体参数真值与统计量之间距离的减少而增大2.显著性水平 当 减少时增大3.总体标准差 当 增大时增大4.样本容量 n当 n 减少时增大,主讲人:刘兰剑,犯第一类错误的概率可以通过降低拒绝原假设所要求的概率来降低。减少第二类错误的方法之一是增大样本容量。在其他条件不变的情况下,样本容量越大,均值的标准误(差)就越小,这样,拒绝真实假设的可能性就越小。,本章到此结束!,谢谢各位!,