统计学基础知识.ppt
《统计学基础知识.ppt》由会员分享,可在线阅读,更多相关《统计学基础知识.ppt(78页珍藏版)》请在三一办公上搜索。
1、第二章 统计学基础知识,2.1 基本概念2.2 概率基础2.3几种常见的概率分布2.4抽样分布,总体具有共同性质的个体所组成的集团,称为总体;特征:(1)同质性;(2)变异性;(3)大量性。总体中的一个成员称为个体;含有有限个个体的总体称为有限总体;包含有无限多个个体的总体叫无限总体;样本从总体中随机抽取一部分个体所组成的集合。,第二章 统计学基础知识 第一节 基本概念,一、总体与样本,为了能可靠地从样本来估计总体,要求样本必须能够代表总体,才能正确估计总体。只有从总体中随机抽取的样本才具有代表性。随机抽取的样本是指总体中的每一个个体都有同等的机会被抽取组成样本。(等可能性)总体中所包含的每个
2、总体单元都是相互独立、相互无依存关系,被抽取的每个个体必须具有偶然性,这是随机抽样应遵守的基本原理。,第二章 统计学基础知识 第一节 基本概念,样本中所包含的个体数目叫样本容量或大小(sample size),常记为n。小样本:n30的样本;大样本:n 30的样本。划分大样本和小样本是必要的,因为二者的统计方法不同。研究的目的是要了解总体,然而能观测到的却是样本,通过样本来推断总体是统计分析的基本特点。,第二章 统计学基础知识 第一节 基本概念,二、随机变量,第二章 统计学基础知识 第一节 基本概念,按变量的性质不同,一般可以分为数量性状资料、质量性状资料和半定量(等级)资料(一)数量性状资料
3、(quantitative trait)数量性状是指测试、调查的对象具有可度量或计数的性质,观察测定数量性状而获得的数据就是数量状资料。连续型变量又称计量资料,能用量测手段直接测定。离散型变量(不连续性或间断性)若某变量各变量之间只能以整数断开而不能表现为小数的。它只能用计数的方法取得。,(二)质量性状资粮 质量性状是指能观察到而不能之间测量的性状。如叶片的颜色,麦芒的有无等;污染水体的颜色、污染物的气味等。赋值法统计分析。,第二章 统计学基础知识 第一节 基本概念,(三)半定量或等级资料 半定量或等级资料是指观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得到的资料。
4、,三、参数与统计数,第二章 统计学基础知识 第一节 基本概念,在同质性的前提下,总体具有变异性和大量性的特性。用于反映总体内部个体间的变异程度或集中性趋势等特征的指标为总体参数,简称参数。常用希腊字母表示参数,例如用表示总体平均数,用2表示总体方差;参数是反映某类事物的总体规律的数值,科研上目的就在于求得对总体参数的了解,总体参数是常数,但不易获得。利用样本资料计算得到的用于描述样本内部个体间的变异程度或集中趋势等特征的一些指标,如样本的平均数x、样本的标准差S等成为样本统计数,简称统计数,它是总体参数的估计值。,四、误差与错误,(一)误差系统误差:由某种确定的原因所引起的误差。特点是在相同条
5、件下重复测定时,可重复出现。是可以测定并校正或消除的。来源:(1)方法误差;(2)仪器误差;(3)试剂误差;(4)操作误差;(5)环境条件的变化误差。,偶然误差:是由很多不可避免且无法控制的偶然因素引起的误差。产生的原因不确定,其误差大小无规律性,不具“单向性”和“重现性”。偶然误差虽不可避免,也不能校正,但若在同样条件下对同一试样进行多次测定,就会发现随机误差的出现是服从统计规律的。可以利用数理统计方法对试验数据进行分析处理,增加重复次数。,第二章 统计学基础知识 第一节 基本概念,四、误差与错误,(二)错误 由于工作人员的粗心大意或不负责任(如仪器使用不当,错读数据,记录不准,任意涂改,凭
6、空杜撰等)所产生的测定值与真值的偏差,称为错误。错误不是统计学的研究内容 在试验和调查中,错误应当、同时也可以加以消灭,第二章 统计学基础知识 第一节 基本概念,五、准确性与精确性,准确性是指观测对象的观察值与其真值的偏离程度,偏离越小则试验越准确。精确性是指同一观测对象的重复观察值之间的彼些相符程度,即试验误差的大小,误差越小则试验越精确。在统计工作中,常用样本的统计数来估计总体参数。因此,我们用统计数接近参数的程度来衡量统计数的准确性高低,而用统计数的变异程度来衡量统计数的精确性高低。可见,准确性与精确性是不同的概念。在一般试验中真值为未知数,所以试验的准确性难以确定。精确性一般是指试验误
7、差,是可以估计的。如何正确估计试验误差,并减小试验误差以提高试验精度是试验方法设计的主要内容。,第二章 统计学基础知识 第一节 基本概念,一、随机现象与随机事件,(一)确定性现象与随机现象根据客观现象的特征,一般将其分为两类:一类是在一定条件下必然出现(或不出现)某种结果的现象,称之为确定性现象。另一类现象是在一定条件下具有多种可能过结果,具体出现哪一种结果事先是不能确定的,这种在给定条件下不能确定哪一种结果会出现的现象,称之为随机现象。随机现象是概率论中的主要研究对象。,第二章 统计学基础知识 第二节 概率基础,对随机现象进行观测称作随机试验。随机试验应具下列有三个特性:可重复性:即可以在相
8、同的条件下重复进行试验;非唯一性:即每次试验的可能结果不止一个,并且事先能明确试验的所有可能结果;随机性:即进行一次试验之前,不能确定哪一个结果会出现。随机试验的每一种结果或随机现象的每一种表现称作随机事件,简称为事件。一般用字母A,B,C,(必要时加下标)表示事件。有时也可用表示事件,括号中写明事件的内容。,第二章 统计学基础知识 第二节 概率基础,(二)随机试验与随机事件,二、概率的概念及其计算,对于一个随机事件来说,它在一次试验中,可能发生,也可能不发生。既然是可能性,就有可能性的大小问题。,第二章 统计学基础知识 第二节 概率基础,(一)概率的概念,在相同条件下,重复进行统一随机试验,
9、A是这个试验的一个结果(事件)。设试验的次数为n,在n次重复试验中A出现的次数为m,则事件A的频率为:,二、概率的概念及其计算,(一)概率的概念,当试验次数n较小时,频率的数值有较大的波动;当n充分大时,频率数值的波动明显减小,并且随着n的增大会趋于稳定在某个常数P。通过大量观测可以发现,随机试验的频率具有随试验次数增加而趋向稳定的性质,而频率的稳定值可以用来反映事件发生的可能性的大小。因此,可以说频率的稳定值P是随机事件A的概率。即,第二章 统计学基础知识 第二节 概率基础,二、概率的概念及其计算,设事件A的概率为P(A),它则具有如下性质:非负性,即 0 P(A)1规范性,即 P()=1(
10、必然事件)P()=0(不可能事件)对于两两互不相容事件Ai(i=1,2,),则有,(二)概率的性质,第二章 统计学基础知识 第二节 概率基础,小概率事件:随机事件的概率很小。例如小于0.05、0.01、0.001,这样的时间被称为小概率事件。小概率原理:把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。,(二)概率的性质,二、概率的概念及其计算,第二章 统计学基础知识 第二节 概率基础,例1:袋中盛有除颜色外其他完全相同的50个不同颜色的小球,其中有10个白球,充分混匀后
11、随意摸出一球。求所摸为白球的概率。,(三)概率的计算1、古典型概率 如果一项随机试验的全部基本事件总数有限,并且各基本事件出现的可能性都相同,事件A由若干基本事件所组成,则A的概率可用下式计算,第二章 统计学基础知识 第二节 概率基础,2、概率的加法公式(1)任意事件加法公式 任意两个事件和(并)的概率,等于两事件概率的和再减去两事件同时发生的概率。即P(A+B)=P(A)+P(B)-P(AB)(2)互斥事件的加法公式 两个互斥事件A与B之和的概率,等于这两个事件的概率之和。即P(A+B)=P(A)+P(B),(三)概率的计算,第二章 统计学基础知识 第二节 概率基础,3、条件概率和乘法公式
12、在实际问题中,除了要知道事件A发生概率外,有时还需要知道在“事件B已发生”的条件下,事件A发生的概率,这种概率成为条件概率,记作P(AB)。,(三)概率的计算,例2:在某厂一天两个班次生产的350件产品中,第一班生产200件,含次品9件;第二班生产150件,含次品4件。现随机抽出一件产品,发现它是次品。问这件产品出自第一班的概率是多少?,第二章 统计学基础知识 第二节 概率基础,把上式的分子、分母同时除以350,得这里AB=所抽产品是第一班生产的次品。,解:记A=所抽产品是第一班生产的,B=所抽产品是次品。显然有但在已知事件B发生的条件下,A发生的概率就不同了,可以直观的写出条件概率为:把,第
13、二章 统计学基础知识 第二节 概率基础,由这个定义,可得到概率的乘法公式:设A与B是任意两个事件,且P(A)0,P(B)0,则P(AB)=P(B)P(AB)P(AB)=P(A)P(BA),这就导出了条件概率下列一般定义:设A,B是任意两个事件,且P(B)0,则称为“在事件B发生的条件下,事件A发生的条件概率”,简称“A关于B的条件概率”。,第二章 统计学基础知识 第二节 概率基础,例3:设一批产品共N件,其中有M件次品,不放回地抽取2件,求事件第一件抽到的是正品,第二件抽到的是次品的概率。解:记A=第一件是正品,B=第二件是次品,所求事件为AB。根据乘法公式,有P(AB)=P(A)P(BA)=
14、,第二章 统计学基础知识 第二节 概率基础,4、全概率公式 当计算比较复杂事件的概率时,如果可以把它分解成互不相容的一些简单事件,就可以用全概率公式计算其概率。全概率公式表述如下:设B1,B2,Bn为n个互不相容事件,且P(Bi)0(i=1,2,,n)。则任一事件A的概率为:,第二章 统计学基础知识 第二节 概率基础,例4:有3个工人被指定制作一批产品。第一个人制作这批产品的40%,第二个人制作35%,第三个人制作25%。第一个人废品率为0.04,第二个人废品率为0.06,第三个人废品率为0.03。现随机抽取一件产品,问这件产品为废品的概率是多少?解:记A=抽出的一件产品是次品,Bi=抽出的产
15、品是第i个工人制作的,(i=1,2,3)。显然,B1+B2+B3=,且B1,B2,B3两两互不相容。所以可以用全概率公式算出所抽一件是废品的概率。,第二章 统计学基础知识 第二节 概率基础,5、贝叶斯公式 由全概率公式可导出另一个重要公式贝叶斯公式,它是由英国数学家贝叶斯(Bayes Thomas)在1763 年发表的,其陈述如下:设B1,B2,Bn为n个互不相容事件,且P(Bi)0(i=1,2,,n)。A是任一事件,且P(A)0。则对任一Bi(i=1,2,,n),有,第二章 统计学基础知识 第二节 概率基础,例5:在例4中,若随机抽出的一件产品为废品,那么,这件产品由第一个、第二个、第三个工
16、人所制作的概率各是多少?解:,第二章 统计学基础知识 第二节 概率基础,贝叶斯公式的意义在于:设事件A已发生,我们需要判断引起A发生的“原因”。如果已知A发生的可能“原因”共有n个:B1,B2,Bn且两两互不相容。那么我们希望知道其中某个“Bi”的概率,也就是条件概率P(Bi/A)。在实际应用中,我们往往要求出每一个P(Bi/A)(i=1,2,n),然后找出其中最大的一个P(Bi/A),则Bi就是引起事件A 发生的最可能的“原因”。,贝叶斯公式在“风险决策”、“模式识别”等中有着广泛的应用。,第二章 统计学基础知识 第二节 概率基础,6、事件的独立性 对于两个事件A和B,假若事件B的发生会对事
17、件A发生的概率产生影响,即P(AB)P(A),称事件A与B之间统计相依。假若事件B的发生并不影响事件A发生的概率,称事件A与B之间统计独立。在事件A与B独立时,显然有P(AB)=P(A),这时,乘法公式成为:P(AB)=P(B)P(AB)=P(A)P(B)通常把这个关系式作为事件独立性的定义。即 设A与B是任意两个事件,如果满足 P(AB)=P(A)P(B)则称事件A与B独立,否则称事件A与B相依。,第二章 统计学基础知识 第二节 概率基础,(一)随机变量的概率分布随机变量的概率随机变量的一切可能值的集合(值域)及其相应的概率。在随机试验中,随机变量的各种取值是由一定的概率规律的,这种规律就是
18、随机变量的概率分布。随机变量有离散型随机变量和连续型随机变量两类,因而,其概率分布也也分为离散型概率分布和连续型概率分布。,三、随机变量的概率分布,第二章 统计学基础知识 第二节 概率基础,离散型随机变量x的每一个可能取值xi和随机变量取该值的概率p(xi)之间所确立的对应关系称作这个离散型随机变量的概率分布。这里x通过点数取得,其取值是离散的。P(x=xi)=pi(i=1,2,3,)称作离散型随机变量x的概率分布或概率函数。,三、随机变量及其概率分布,(二)离散型随机变量的概率分布,概率分布的性质,第二章 统计学基础知识 第二节 概率基础,离散型随机变量的分布律也可表示为,第二章 统计学基础
19、知识 第二节 概率基础,连续型随机变量其概率用概率分布密度函数来确定。即经测度取得的数值分布于某一数值区间,无法一一列举,只能列出随机变量的取值区间及其相应概率,或列出随机变量取值小于某一值的累积概率;连续型随机变量的概率分布可以用对应于一定区间的函数曲线下的面积来表示概率。对应于一连续型随机变量的整个取值区间,函数曲线下的面积设为1,该区建制内的某段对应的函数曲线下的面积为大于0且小于1的一个数值。,(三)连续型随机变量的概率分布,第二章 统计学基础知识 第二节 概率基础,概率分布的性质,第二章 统计学基础知识 第二节 概率基础,(三)连续型随机变量的概率分布,1、正态分布的重要性,正态分布
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 基础知识

链接地址:https://www.31ppt.com/p-6015757.html