matlab数学实验七.ppt
《matlab数学实验七.ppt》由会员分享,可在线阅读,更多相关《matlab数学实验七.ppt(89页珍藏版)》请在三一办公上搜索。
1、1,实验七 MATLAB在概率统计中的应用,21实验目的,概率论与数理统计是研究随机现象统计规律性的学科,随着现代科学技术的迅猛发展,它的理论与方法已广泛地应用于许多科学技术领域。本实验的目的是学会用MATLAB软件求解一些随机性问题,特别是解决数理统计中的大量问题。,2.2实验内容,一、随机变量分布及数字特征,随机变量的分布主要有随机变量的概率密度函数与分布函数,所谓随机变量的数字特征是指能够描述随机变量某些特征的数量指标,随机变量常用的数字特征有均值(数学期望)、方差和矩等。,2,下面给出几个常用的概率分布,1、正态分布,若随机变量,的概率密度为,其中,和,为常数,且,,则称随机变量,参数
2、为,和,的正态分布,或高斯(Gauss)分布,,记为,服从,正态分布的分布函数为,3,当参数 时,称 服从标准正态分布,记为 其密度函数记为,分布函数记为,即有,正态分布是概率统计中最重要的一种分布,它的重要性不仅在于自然解中许多随机变量服从正态分布,而且它具有许多良好的性质。,4,2、二项分布,若随机变量,的分布律为,其中,则称,服从参数为,的二项分布,记为,3、泊松分布,若随机变量,的分布律为,其中,是常数,则称,服从参数为,的泊松分布,,记为,5,4、均匀分布,若随机变量,的概率密度为,则称,在区间,上服从均匀分布,记为,5、指数分布,若随机变量,的概率密度为,其中,是常数,则称,服从参
3、数为,的指数分布。,6,6、,分布,(n),若随机变量X1,X2,Xn相互独立,都服从标准,服从自由度为n的,分布,记为,7、t分布 t(n),若X,Y,且相互独立,则随机变量,服从自由度为n的t分布,记为Tt(n).,正态分布N(0,1),则随机变量,7,8、F分布 F(),若X,(n1),Y,(n2),且相互独立,则随机变量,服从自由度为(n1,n2)的F分布,记作,F F().,8,用MATLAB求随机变量分布及数字特征的常用函数。,9,下面给出如何利用MATLAB中的函数来计算两个常用分布的分布函数、概率密度函数值、均值、方差等,其它分布的计算方法基本相同。,(1)正态分布 X,1)概
4、率密度函数:,例1 画出正态分布,和,的概率密度函数图形.,在MATLAB中输入以下命令:,x=-6:0.01:6;,y=normpdf(x);,z=normpdf(x,0,2);,plot(x,y,x,z),结果见图7.1,10,2)概率分布函数:,例2计算标准正态分布的概率P-1X1.,输入命令为:,P=normcdf(1)-normcdf(-1),结果为:P=0.8413-0.1587=0.6826,3)分位数:,即求出x,使得PXx=p.,例3 取,,求,的含义是:,PX,=,时,P=0.975,norminv(0.975)=1.96,11,例4 公共汽车门的高度是按成年男子与车门顶碰
5、头的机会不超过1%设计的。设男子身高X(单位:cm)服从正态分布N(175,36),求车门的最低高度。,解:设h为车门高度,X为身高,求满足条件,的h,,即,所以命令:,h=norminv(0.99,175,6),h=188.9581,12,命令为:,m,v=normstat(3,5),结果为:m=3,v=25,如果命令为:,m,v=normstat(1:4,2:5),m=1 2 3 4v=4 9 16 25,结果为:,5)随机数生成:,.,产生mn阶的正态分布随机数矩阵.,例5 求正态分布N(3,)的均值与方差.,4)均值与方差:,13,例6 命令:M=normrnd(1,0.1,2,3),
6、结果为:,M=0.9904 1.0294 1.0714 0.9168 0.8664 1.1624,(2),1)概率密度函数:,例7 画出卡方分布,和,的概率密度函数图形.,在Matlab中输入以下命令:,x=0:0.01:20;,y=chi2pdf(x,2);,z=chi2pdf(x,10);,plot(x,y,x,z),结果见图7.2,分布,(n),x,14,2)概率分布函数:,例8,命令为:,P=chi2cdf(10,5)-chi2cdf(3,5),结果为:P=0.9248-0.3000=0.6248,3)分位数:,即求出x,使得,.,例9 取,.,的含义是:,即有,时,n=10,=chi
7、2inv(0.95,10)=18.3070,设X,15,4)均值与方差:,例10 求卡方分布,的均值与方差.,命令为:,m,v=chi2stat(6),结果为:m=6,v=12,如果命令为:,m,v=chi2stat(1:5),结果为:,m=1 2 3 4 5v=2 4 6 8 10,16,5)随机数生成:,.产生ms阶的卡方分布随机数矩阵.,例11 命令:M=chi2rnd(7,2,3),结果为:,M=17.9138 6.3660 12.8508 1.0171 4.8249 8.8440,17,二、数据特征,一个简单随机样本,在n次,抽样以后得到样本的一组观察值,样本是总体的代表及反映,但在
8、抽取样本后,并不直接利用样本的n个观察值进行推断,而需要对这些值进行提炼和加工,把样本所包含的我们所关心的事物的信息集中起来,这便是针对不同问题构造样本的某种函数,这种样本函数称为统计量。,对容量为,的样本,其常用的统计量如下:,平均值:(或均值,数学期望):,。,18,中位数:,将数据由小到大排序后位于中间位置的那个数值.,标准差:,它是各个数据与均值偏离程度的度量.,方差:,标准差的平方.,极差:,样本中最大值与最小值之差.,几何平均:,19,调和平均:,20,常用的数据特征MATLAB命令如下表7.2:,21,例12 已知数据:459 362 624 542 509 584 433 74
9、8 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 649 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 609 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 5
10、31 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851 计算其数据特征。,22,解:输入命令,a=459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 649 697 515 628 954 771 609 402 960 885
11、 610 292 837 473 677 358 638 699 634 555 570 84 416 609 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851;,y1=mean(a),结果:y1=600.9192,y2=median(a),结果:y2=608,y3=geomean(a),结果:y3=560.2135,算术平均,中位数,几何平均,23,y4=harmmean(a),结果:y
12、4=498.9577,y5=range(a),结果:y5=1069,调和平均,极差,方差,y6=var(a),结果:y6=3.8978e+004,标准差,y7=std(a),结果:y7=197.4288,平均绝对偏差,y8=mad(a),结果:y8=151.5160,24,三、直方图与概率纸检验函数,为了直观地了解随机变量的分布特征,如对称性,峰值等,频数直方图是广泛使用的方法。,直方图是将样本的观察值数据按顺序分成若干间隔相等的组,以组距为底边,以落入各组的数据频数为依据,按比例构成的若干矩形条排列的图形。,若,是取自总体X的一组样本值,把样本,值 进行分组,先将它们依大小次序排列,得,25
13、,在包含,的区间a,b内插入一些等分点:,注意要使每一个区间,(i=1,2,k-1)内,都有样本观测值xi(i=1,2,n-1)落入其中.,统计出样本观测值在每个区间,中出现的次数,,它就是这区间或这组的频数,计算频率.,在直角坐标系的横轴上,标出,各点,,为底边,作高为,(或,)的矩形,,即得频数(或频率)直方图.,分别以,26,直方图能够直观地表述数据的整体分布情况,它能够显示各组频数的分布情况,并且易于显示各组间的频数的差别。,(1)绘制直方图格式:hist(data,k).,附加有正态密度曲线的直方图格式 histfit(data,k).,说明:data 是原始数据,该命令将区间(mi
14、n(data),max(data)分成k等份,并且绘出频数直方图,k 的缺省值为10。,(2)概率纸检验函数格式(仅给两种):,1)normplot(data):如果数据data 服从正态分布,则作出的图基本上都位于一条直线上。,2)weibplot(data):如果数据data 服从威布尔分布,则作出的图基本上都位于一条直线上。,27,例3 为了研究400m赛跑后学生心率变化情况,体育老师统计了全班45名同学在赛跑后分钟内的脉搏次数,结果如下:,按组距为绘制频数分布直方图。,解:由给定数据可知,最小数据为132,最大数据为168,按组距为5,可取区间130,170分为8等分,输入命令如下:,
15、28,a=132 136 138 141 143 144 144 146 146 147 148 149 149 151 151 152 153 153 154 154 154 156 156 157 157 157 158 158 158 159 159 159 161 161 162 162 163 163 164 164 164 164 166 168;,hist(a,8),可得频数直方图如图7-3所示.,29,histfit(a,8),可得附加有正态密度曲线的频数直方图如图7-4所示.,30,例14 作出例12中数据的直方图,该数据服从正态分布还是威布尔分布?,输入命令hist(a,3
16、0),可得图7.3,a=459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 649 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 609 1062 484 120 447 654
17、 564 339 280 246 687 539 790 581 621 724 531 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851;,31,从图7.3可看出数据比较接近正态分布,如何检验这一猜测,我们利用MATLAB命令normplot(a)进行检验。,从图7.4中可见数据点基本上都位于直线上,故可认为数据服从正态分布。由例12已经计算出该数据的均值为600.9192,标准差为197.4288,所以数据服从,。,32,四、参数估计,参数估计是数理统计中的一个基本概念,它是指用样本对总体分布中的未知参数作出估计
18、,这种估计我们常见的有点估计和区间估计两种。,1、极大似然法的思想是:,若抽样的结果得到样本观测值x1,x2,xn,则我们,的值,使这组样本观测值出现的,应当这样选取参数,可能性最大.,构造似然函数:,33,使,达到最大,从而得到参数,的估计值,此估计值叫极大似然估计值.,称为似然函数.,函数,求极大似然估计值的问题,就是求似然函数,的最大值的问题,,则由,即,求出参数,的估计值,34,2、区间估计的思想:,设总体X的分布中含有未知参数,若对于给定的概率,存在两个统计量,X1,X2,Xn)和,X1,X2,Xn),使得,为参数,的置信水平为,的置信区间.,称为置信下限;,称为置信上限.,则随机,
19、区间(,区间估计常见的有正态总体均值与方差的区间估计。,35,设已给定置信水平,并设,为总体,的样本,和,和样本方差.,分别是样本均值,(1),已知,均值,的置信区间,由于,因此,对给定的,由标准正态分布的上,分位点的定义,有,即,36,所以,的一个置信水平为,的置信区间为,这样的置信区间通常也写成,(2),未知,均值,的置信区间,当,未知时,由于,由,分布的上,分位点的定义,有,37,即,所以,的一个置信水平为,的置信区间为,(3)方差,的置信区间,从理论上讲,对总体方差,作区间估计,也应分成,已知和,未知两种情况.此处只讨论,未知的情况.,由于,由,分布的上,分位点的,定义,有,38,所以
20、,的置信水平为,的置信区间为,的置信水平为,的置信区间为,39,3、MATLAB软件提供的一些常见分布的参数估计函数命令。,(1)正态分布数据的参数估计函数,muhat,sigmahat,muci,sigmaci=normfit(x,alpha),此命令表示在显著性水平alpha下估计数据X的参数(alpha缺省时设定为0.05),返回值muhat是X的均值的点估计值,sigmahat是标准差的点估计值,,muci是均值的区间估计,sigmaci是标准差的区间估计。,40,(2)指数分布数据的参数估计函数,muhat,muci=expfit(X,alpha),此命令表示在显著性水平alpha下
21、,求指数分布的数据X的均值的点估计值muhat及其区间估计值muci.,(3)泊松分布数据的参数估计函数,lambdahat,lambdaci=poissfit(X,alpha),此命令表示在显著性水平alpha下,求泊松分布的数据X 的参数的极大似然估计值muhat及其置信区间muci.,(4)Weibull分布数据的参数估计函数,phat,pci=weibfit(X,alpha),此命令表示在显著性水平alpha下,求Weibull分布的数据X 的参数的点估计值phat及其区间估计值pci.,41,(5)均匀分布数据的参数估计函数,ahat,bhat,aci,bci=unifit(x,al
22、pha),此命令表示在显著性水平alpha下估计数据X的参数(alpha缺省时设定为0.05),返回值ahat是X的参数a的极大似然估计值,bhat是X的参数b的极大似然估计值,,aci是参数a的置信区间,bci是参数b的置信区间。,(6)二项分布数据的参数估计函数,phat,pci=binofit(X,n,alpha),此命令表示在显著性水平alpha下,求二项分布的数据X 的参数的极大似然估计值phat及其置信区间pci.,(7)分布数据的参数估计函数,phat,pci=betafit(X,alpha),此命令表示在显著性水平alpha下,求分布的数据X 的参数的极大似然估计值phat及其
23、置信区间pci.,42,说明:以上命令中alpha缺省时设定为0.05;样本数据如果是以矩阵形式给出,则按每列数据分别给出参数估计。,例15 分别随机产生50、500和5000个分布数据,相应的分布参数真值为4和3。分别求出参数4和3的最大似然估计值和置信度为99%的置信区间。,解,分布函数为,其中,先用命令betarnd生成50个分布的随机数,,x=betarnd(4,3,1,50),43,x=0.4000 0.7035 0.4543 0.5349 0.4157 0.4263 0.5844 0.3610 0.7694 0.8602 0.7495 0.4248 0.7065 0.7527 0.
24、3133 0.6375 0.3220 0.5204 0.8064 0.4764 0.5058 0.6150 0.6958 0.34290.6011 0.7345 0.3654 0.4775 0.6416 0.5163 0.3777 0.4200 0.6083 0.8478 0.3248 0.66410.2957 0.6422 0.5341 0.7043 0.5058 0.9168 0.7545 0.7168 0.4546 0.6105 0.3664 0.51090.7234 0.5026,phat,pci=betafit(x,0.01)%求置信度为99%的置信区间和参数a、b的估计值,结果显示
25、,44,估计值4.7632的置信区间是3.2117 6.3147,,phat=4.7632 3.5199,pci=3.2117 2.2797 6.3147 4.7601,估计值3.5199的置信区间是2.2797 4.7601。,若用命令betarnd生成500个分布的随机数,x=betarnd(4,3,1,500);%不显示数据,phat,pci=betafit(x,0.01),结果显示,45,phat=4.1209 2.9496,pci=3.4283 2.4630 4.8136 3.4361,估计值4.1209的置信区间是3.4283 4.8136,,估计值2.9496的置信区间是2.46
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- matlab 数学 实验

链接地址:https://www.31ppt.com/p-6511930.html