《复变函数》教学资料第八章第一节.ppt
概率论与数理统计,第八章 假设检验,太原理工大学 统计系,目录,1 基本概念,4 检验法,6 分布拟合的 检验法,2 检验法,3 检验法,5 检验法,8.11 基本概念,8.1.1 假设检验,在实际工作中,往往能够根据过去,称为原假设)。一种是关于总体参数的,假设,即参数假设。另一种是关于总体,分布的假设,即非参数假设。,的资料,对总体作出某种假设(记为,对于一种假设是否成立,需要根据,样本提供的信息,按照一定的规则和程,序来进行 检验,决定接受这种假设,还,验。为了具体说明假设检验解决哪类问,题,下面看几个例子。,例1某炼铁石生产的生铁含硅量服从,是拒绝这种假设。这一过程称为假设检,正态分布。由过去大量数据算得含硅量平,有了改变,从改变原料后的生产记录中,没有改变,问生铁含硅量有无显著变化?,得平均含硅量,若均方差,例 2 某厂生产某种产品,由经验知,,其强力服从正态分布,强力均方差,。后改变原料,从新产品中抽,平值为。现在炼铁厂原料,生产记录中随机地抽取 的样本,,16件进行测试,得样本标准差为8.5kg,,问新产品的强力标准差是否有明显增加?,例3 对某电话交换台在一分钟内得到,的呼叫次数统计得几录如下:,试检验该交换台在一分钟内得到的电话呼,唤次数 是否服从泊松分布?,以上三个例子都是假设检验中常见的问,题。在例1、例2中,总体分布类型已知,,仅对总体中的未知参数有关性质进行判,断,这种检验称为参数假设检验。设总,体分布类型不知,若检验其分布属于某,种类型(如例3中的问题)或两变量是,否独立,或量总体的分布函数是否相,同等,称为非参数假设检验。,8.1.2 假设检验的基本原理及步骤,下面我们以例1为代表来说明假设,检验的基本原理。,若把原料改变后生铁的含硅量看作,一个整体,把原来的生铁含硅量看作另,一总体,难么,例1的问题就化为两个生,铁含硅量的总体均值有无差异的问题。,为此,我们先作出假设,即原假设,记为,(或对立假设),记为。即,:假设原料改变后的生铁含硅量并无变,这样,例1的假设检验问题,就是根据样,本所提供的信息判断,中哪个成立。,同时我们把原假设 的反面作为备择假设,:,化,其均值仍为。即,:,即是检验假设,中,故有,,即,其,由抽样分布知,样本均值,若 为真,则可认为生铁含硅量,到,若 的观察值 达到一定程度,就认,为样本不是来自原来的总体,从而拒绝原,假设,否则就接受原假设.,就有偏大的趋势.因而自然会想,因而,的观察值 就较集中在零的周围.,对于给定的 查正态分布,若 不真(即 为真),则 的观察值,例如,取a=0.05,查得,使,表得分位数,使,这样表明,当 为真时,由总体中抽出容,成的统计量 的观察值,落在 之外的概率仅为0.05,这是一,因而可以认为在一次实际抽样中,这个小,概率事件(即落在 之外)几乎是不,可能发生的.也即,若对样本的一次观察,由怀疑 不真,从而拒绝.否则就接受.,个较小的概率.如抽取100个容量为 的,样本,大约只有5个的 值在这个区间外,值,算得的 落在此区间之外,自然就有理,例1中,由于,故拒绝.认为原料改变后,生,铁的含硅量有显著变化.,综上所述,我们要对作出的假设按一,定的程序进行推断,而推断的依据是所谓,小概率原理.即小概率事件,再一次试验中,认为实际上不会发生的.把小概率原理应,用在假设检验上,是指,首先假设 成立,根据一定的规则和程序,依照事先给定的,0.05,0.01,0.1等值),构造一个小概率事件.,然后根据一次抽样试验的结果,若之一概,率事件发生了,那么就认为原来的假设是,不真的,从而作出拒绝 的推断,否则,就接,受.这种先假设成立,后进行反证的方,法,称为概率论的反证法.,概率(又称显著性水平,或检验水平,常取,假如在前面讨论过程的 中,事件 是小概率事件.为使否定原假设,前例中,临界值为-1.96,1.96,.,综上所述,我们可以得出进行假设检,验的步骤:,(1)提出原假设 及备择假设;,称为拒绝域,记为,称为临界值.,具有较强的说服力,一般 应取的较小,并将,水平 的条件下,查统计量所服从的,(3)确定 的拒绝域;在给定显著,(4)推断:有样本观察值算出统计量,否则接受。,分布表,求出临界值,从而确定拒绝域;,的观察值,若落在拒绝域 中,则绝。,8.1.3 假设检验的两类错误,假设检验,就是对做出的假设,按,一定的程序进行检验,最后对所给假设作,出接受还是拒绝的推断。这种推断是在一,定的概率定义下进行的。因此,所做出的,推断,就可能产生错误。那么,会犯什么,样的错误呢?犯错误的概率是多大呢?,首先我们看到,若 为真,小概率事,件虽然是发生的可能性很小的事件,但并,非绝对不发生。因此,按上面的原则拒绝,,就不免要犯“弃真”错误,称为第一类,错误。犯第一类错误的概率为,这个概率是小概率,也称为检验水平。,此外,若 不真,而样本观察值未落,入拒绝域,这时就要犯“取伪”错误,称为,第二类错误。犯第二类错误的概率为,两类错误分析表如下:,我们当然希望犯这两类错误的概率,(拒绝 为真)=,时,这是办不到的。只有增大样本容量,很小,但当,给定,样本容量 固定,,才能使,都变的小些。,