心理与教育统计学第6章概率分布.ppt
《心理与教育统计学第6章概率分布.ppt》由会员分享,可在线阅读,更多相关《心理与教育统计学第6章概率分布.ppt(143页珍藏版)》请在三一办公上搜索。
1、心理与教育统计学,第6章 概率分布,6.1 概率的基本概念6.2 二项分布6.3 正态分布6.4 样本分布,6.1 概率的基本概念,在个别试验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性的现象,称为随机现象。例如掷硬币、抛骰子等概率论与数理统计是研究和揭示随机现象统计规律性的一门数学学科。,6.1.1 什么是概率,随机事件的频率,当n无限增大时,随机事件A的频率会稳定在一个常数P,这个常数就是随机事件A的概率。,(一)后验概率(或统计概率),(6.1),(6.2),观察随机事件A出现的次数的方式来决定A的概率,称为后验概率。,(二)先验概率(古典概率),古典概率模型要求满足两
2、个条件:试验的所有可能结果(或基本事件)是有限的;每一种基本事件出现的可能性相等。,n为基本事件的总数;m为事件A包含的基本事件的数目。,(6.3),在事件A发生之前,可以通过计算确定的概率,称为先验概率。,Dewey.G统计了约438023个字母,得到的英语中特定字母的频率,历史上的投掷硬币试验,投掷硬币的概率是统计概率与古典概率?,6.1.2 概率的基本性质,1任何随机事件的概率都是在0与1之间的正数,即:0 P(A)12不可能事件的概率等于零,即:P(A)=0 3必然事件的概率等于1,即:P(A)=1,(一)概率的公理系统,(二)概率的加法定理,若事件发生,则事件就一定不发生,这样的两个
3、事件为互不相容事件。两互不相容事件和的概率,等于这两个事件概率之和,即,(6.4a),(6.4b),(三)概率的乘法定理,若事件发生不影响事件是否发生,这样的两个事件为互相独立事件。两个互相独立事件同时出现的概率,等于这两个事件概率的乘积,即,(6.5a),(6.5b),例:某一学生从个试题中任意抽取一题,进行口试。如果抽到每一题的概率为15,则抽到试题或试题的概率是多少?如果前一个学生把抽过的试题还回后,后一个学生再抽,则个学生都抽到试题1的概率是多少?,该学生抽到试题1或者试题2为不相容事件:,四个学生均抽到试题1为独立事件:,例:一个口袋装有6只球,其中4只白球、2只红球,从袋中取球两次
4、。考虑两次取球方式(a)放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一球。(b)不放回抽样,第一次取一球不放回袋中,第二次从剩余的球中再取一球。请问这两种情况下取到一只白球和一只红球的概率。,放回取样,第一次取到白球,第二次取到红球:,第一次取到红球,第二次取到白球:,取到一只白球和一只红球的概率:,不放回取样,第一次取到白球,第二次取到红球:,第一次取到红球,第二次取到白球:,取到一只白球和一只红球的概率:,问题:小明的班上有83名同学,至少有一位同学与小明的生日相同的概率?(一年按365天计算),82名同学与小明的生日均不相同的概率为:,至少一位同学与小明的生日相同的概率为:,问
5、题:83人的班上,至少两人生日相同的概率为多少?,“与小明生日相同的概率”与“班级人数”的关系,“至少两人生日相同的概率”与“班级人数”的关系,人数,概率,人数,概率,小明的小组有6人,(1)有人与小明出生月份相同的概率为多少?(2)至少2人出生月份相同的概率为多少?,信不信?可以试一试!,(1),(2),6.1.3 概率分布类型,概率分布是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。概率分布是总体的分布,而频率分布是样本的分布。概率给出的是单个结果发生的可能性,概率分布是对随机变量所有可能结果的可能性分布描述,通常可以写成某个函数式形式。,学生身高次数分布表,次数,频率,
6、频率密度,150 159 168 177,150 159 168 177,150 159 168 177,151 160 169 178,151 160 169 178,151 160 169 178,学生身高次数分布图,全国学生身高概率分布图,151 160 169 178,151 160 169 178,概率,概率密度,概率分布中的曲线高度一般为概率密度,面积表示概率,横坐标为样本值;有少数情况下,曲线高度表示概率(如P179二项分布)。,(一)离散分布与连续分布,依随机变量的类型,可将概率分布分为离散分布与连续分布。当随机变量只取孤立的数值时,这种随机变量称为离散随机变量,离散随机变量的
7、概率分布称为离散分布。连续随机变量的概率分布称为连续分布。心理与教育统计学中最常用的离散型分布是二项分布,最常用的连续型分布是正态分布。,(二)经验分布与理论分布,依分布函数的来源,可将概率分布分为经验分布与理论分布。经验分布是指根据观察或实验所获得的数据而编制的次数分布或频率分布。经验分布往往是总体的一个样本。理论分布有两个含义,一是随机变量概率分布的函数(如正态分布),二是按某种数学模型计算出的总体的次数分布(如二项分布)。,(三)基本随机变量分布与抽样分布,依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布。基本随机变量分布是随机变量各种不同取值情况的概率分布,如二项分
8、布与正态分布。抽样分布是从同一总体内抽取的不同样本的统计量的概率分布,如平均数分布,方差分布,相关系数分布等。,谢谢!,复习,古典概率与统计概率,加法原理:,乘法原理:,频率与概率频率分布与概率分布,6.2 二项分布,二项分布是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里创立的,所以又叫贝努里分布。二项分布是心理与教育统计中常用的一种基本随机变量分布。,6.2.1 二项试验,二项试验又称为贝努里试验,它必须满足以下几个条件:任何一次试验恰好有两个结果,成功与失败。共有n次试验,并且n是预先给定的任一正数。每次试验各自独立,各次试验之间无相互影响。某种结果出现的概率在任何一次试验中都
9、是固定的。,是否为二项试验?(1)投掷硬币试验(2)一个口袋装有6只球,其中4只白球、2只红球,从袋中取球两次。(a)放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一球。(b)不放回抽样,第一次取一球不放回袋中,第二次从剩余的球中再取一球。,6.2.2 二项分布函数,二项定理:,项数:二项展开式中共有n1项。指数:p的指数,从n0下降;q指数从0n为上升。每项p与q指数之和等于n。系数:n个元素中依次取0n个元素的组合数。,11 11 2 11 3 3 11 4 6 4 11 5 1 0 10 5 11 6 15 20 15 6 1,杨辉三角形,用 n 次方的二项展开式来表达在 n 次
10、二项试验中成功事件出现的不同次数(X0,1)的概率分布,叫做二项分布函数。二项分布是一种离散型随机变量的概率分布。,设有n次试验,各次试验彼此独立的,每次试验某事件出现的概率都是p,某事件不出现的概率都是q(1-p),则对于某事件出现X次(0,1,2,n)的概率分布为:,式中:,(6.6),例 10个硬币投掷一次,或1个硬币投掷10次,问5次正面向上的概率是多少?,解:根据题意,n=10,p=q=0.5,X=5,例 已知某长一批产品中一级品率为0.2现在从中随机地抽查20只。问20只元件中恰好有6个一级品的概率是多少?,解:n=20,p=0.2,q=0.8.x=6,某人进行射击练习,如果每次射
11、击击中的命中率为0.02,独立射击400次,试求至少击中两次的概率。,解:击中的次数为x,其对应概率为:,一个口袋装有6只球,其中4只白球、2只红球,从袋中取球两次。放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一球。求取到一只白球与一只红球的概率。,解:实验次数n=2,取到白球的次数x=1,白球的概率p=4/6,红球的概率q=2/6.,6.2.3 二项分布的性质,(一)二项分布是离散型分布,概率直方图是阶跃式。因为X为不连续变量,用概率条图表示更为合适。,1个硬币投掷5次,正面向上0,1,2,3,4,5次的概率分别为:,5次,10次,20次,40次,80次,160次,当p=q时,图形
12、是对称的。当n趋近于无穷大时,二项分布趋近于正态分布。,p=q=0.5,p=0.2,q=0.8,当pq,二项分布为负偏态。当n很大,偏态逐渐降低,最终趋近于正态。当pq时,且nq5.这时二项分布为正态分布的近似形。,5次,10次,20次,40次,80次,160次,(二)二项分布的平均数和标准差,如果二项分布满足pq且 nq5(或者pq且 np5时,二项分布接近于正态分布。可用下面的方法计算二项分布的平均数和标准差。二项分布的平均数为,二项分布的标准差为,(67),(68),求p=0.2,q=0.8,n=160次的二项分布的平均值和标准差。,解:np=0.2160=325,该二项分布接近正态分布
13、。,6.2.4 二项分布的应用,二项分布函数除了用来求成功事件恰好出现X次的概率之外,在教育中主要用来判断试验结果的机遇性与真实性的界限。,例如,一个学生凭猜测做10个是非题,平均可以猜对5题。什么情况下可以说他是真会而不是猜测呢?,做对8道题的累加概率达到0.989,8道题以上即可认为是真会做。,例如,一个学生凭猜测做10个四选一的选择题,什么情况下可以说他是真会而不是猜测呢?,做对5道题以上即可认为是真会做。,统计游戏,小时候经常看到有这样的游戏,在一块倾斜的板上有n排钉子,在钉子的下方有n1个格子,对应的奖励。自侧方弹出一个玻璃球,任其自由下落,在下落的过程中让小球碰到钉子时,会改变下落
14、方向。每碰装一次时,玻璃球向两边下落的可能性相等。一块钱可以玩5次,中间对应的奖励很小,两侧对应的奖励可能有5元、10元。,Galton钉板概率模型,请问每个格子内的概率是多少?,0.5,0.5,1,0.25,0.5,0.25,10.5 0.50.25 0.5 0.250.125 0.375 0.375 0.1250.0625 0.25 0.375 0.25 0.0625,实践作业:每人投掷硬币10次,记录数字向上的次数。小组收集数据后发给班长,请班长在周六前发给我。,谢谢!,复习,式中:,(6.6),二项分布函数:,p=q=0.5,80次,160次,20次,6.3 正态分布,正态分布也称为常
15、态分布,是连续型随机变量概率分布的一种,是在数理统计的理论与实际应用中占有最重要地位的一种理论分布。心理与教育中大量的现象均按正态形式分布,如智力高低、成绩好坏、社会态度等。正态分布由棣莫弗于1733年发现的。拉普拉斯、高斯对正态分布的研究也做出了贡献,故有时称正态分布为高斯分布。,是圆周率 3.14159e是自然对数的底 2.71828X为随机变量取值为理论平均数;为理论标准差;y为概率密度,即正态分布的纵坐标。,(6.7),6.3.1 正态分布的特征,正态分布的形式是对称的,它的对称轴是经过平均数的垂线。正态分布的中央点(即平均数)最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯
16、,拐点位于正负1个标准差处,曲线两端向X轴无限接近。,3.正态曲线下的总的面积为1,经过平均数的垂线将正态曲线下的面积划分为相等的两个部分,各为0.5。曲线下的面积为概率,可由积分公式计算:,(6.8),4.正态分布是一族分布。它随随机变量的平均数、标准差的大小与单位的不同而有不同的分布形态。标准正态分布的=0,=1。标准正态分布通常写作N(0,1)正态分布。,(6.9),=2,=1,=0,=1,=-2,=1,平均数决定了正态曲线在横轴上的位置,=0,=0.5,=0,=1,=0,=2,标准差大的正态曲线低阔,标准差小的正态曲线高窄。,5.正态分布中各差异量数值相互间有固定的比率。P102,P1
17、63s=1.2533AD=1.4826Qs标准差;AD平均差;Q四分位差。,6.正态分布曲线下,标准差与概率(面积)有一定的数量关系。,6.3.2 正态分布表的编制和使用,(一)正态分布表的编制与结构 利用积分公式可求出正态曲线下任何区间的面积,但需要计算。统计学家编制了标准正态分布表,使其使用非常方便。使用正态分布表时,首先应该确定其编制方法:1)从Z=-开始。2)Z=0开始。本书中采用Z=0开始。,P概率,Y概率密度,Z分数,正态分布表一般分为三栏:1)Z分数(X-)/,一般罗列到3.99。2)概率密度(y)某一Z分数对应的曲线纵坐标高度。当Z=0时,y=0.39893)概率值(P)不同Z
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理 教育 统计学 概率 分布
链接地址:https://www.31ppt.com/p-5727567.html