《医药数理统计学习指导.docx》由会员分享,可在线阅读,更多相关《医药数理统计学习指导.docx(21页珍藏版)》请在三一办公上搜索。
1、随机事件与概率一、学习目的和要求1 .掌握事件等的基本概念及运算关系;2 .熟练掌握古典概率及计算;3 .理解统计概率、主观概率和概率的公理化定义;4 .熟练掌握概率的加法公式、乘法公式及计算;5 .理解并掌握条件概率与事件独立性的概念并进行计算;6 .掌握并应用全概率公式和贝叶斯公式进行计算。二、内容提要(一)基本概念概念符号概率论的定义集合论的含义随机试验(试验)E具有以下特征的观测或试脸:1 .试脸在相同的条件下可重复地进行2 .试验的所有结果事先已知,且不止一个3 .每次试验恰好出现其中之一,但试脸前无法预知到底出现哪一个结果。样本空间试验所有可能结果组成的集合,即所有基本事件的全体全
2、集基本事件(样本点)试验的每个不可再分的可能结果,即样本空间的元素元素随机事件(事件)A试脸中可能发生也可能不发生的结果,是由基本事件组成的样本空间的子集子集必然事件在试验中一定发生的事件全集不可能事件0在试验中一定不发生的事件,不含任何基本事件空集(二)事件间的关系关系符号概率论的定义集合论的含义包含AUB事件A的发生必然导致事件8的发生力是8的子集相等A=B力=8而且B-4与8相等和(并)A+B(AU0)事件彳与8中至少有一个事件发生4与8的并积(交)事件彳与8同时发生/1与8的交差A-B事件力发生同时8不发生彳与8的差互不相容AB=事件力与8不可能同时发生彳与8不相交对立A事件彳不发生A
3、的补集(余集)(三)事件的运算规律运算律公式交换律A+FB+A,AFBA结合律(8)+C=(8+。,38)OA(Be)分配律(8)OAOBCy麻(BC)=(A+B)(C)差积转换律A-B=AB=A-AB对立律AA=0,4A=德摩根对偶律A+B=ABfAB=A+B(四)概率的定义类型定义公式古典概率P(八)二m_A所含的基本事件数基本事件总数统计概率P(/4)=P(m(八)=-)n公理化定义(基本性质)对样本空间中任意事件4对应的一个实数。(,满足公理1(非负性):OWHWl公理2(规范性):P()=1,P(0)=O公理3(可加性):若4,4,,4,,两两互不相P(4+4+4+)=P(4)+P(
4、八)+P(八))+则称P3)为随机事件彳的概率。(五)概率的计算公式名称计算公式加法公式P(48)=P(八)+P(B)P(AB)若48互不相容3生0):P5B)=P(八)+P(B)对立事件公式P(4=1P(W);P(八)=I-P(事件之差公式P(A-B)=P(Ay)-PQA由若84P(A-B)=P3)-P(B)条件概率公式P(BlQ=(Pa)0)尸(八)乘法公式若P3)0,P(AB)=P3)P(A)若P(B)0,P(48)=PQB)P3IB)当P(4A-1)。时,有P(444)=P(4)P(4I4)P(4I44)P(4444)独立事件公式A.8相互独立:P(A的=P5P4,4,4相互独立:P(
5、444)=P(4)P(4)P(八)全概率公式若4,A2f,4为完备事件组*,对事件8MB)=SP(八)P(BIAj)1-1逆概率公式(贝叶斯公式)若4,4,,4为完备事件组*,P(0OP(Aj)P(81Aj)P(AjB)=-一L之P(Aj)P(8A)Z=I*完备事件组1.4,4,,4互不相容且P(4)0(H,2,,4,4,42o4+4+Xf第三章随机变量及其分布一、学习目的和要求1o理解随机变量及其分布函数的概念;2 .熟练掌握离散型、连续型随机变量的分布及性质;3 .熟练掌握常用数字特征:数学期望(心和方差。(心及其性质;4 .熟练掌握二项分布、泊松分布、正态分布等的性质及概率计算;5 .了
6、解随机变量函数的分布:6o了解随机向量及分布函数的概念、性质;7o掌握离散型随机向量和连续型随机向量及其分布;8o掌握二维随机向量的数字特征;9. 了解契比晓雪夫不等式和大数定律及其意义;10. 掌握中心极限定理及其应用;11. 了解用EXCel计算二项分布、泊松分布、正态分布等常用分布的概率.二、内容提要(一)随机变量及常用分布1 .离散型随机变量及常用分布名称定义性质或背景备注分布律Pxf=pt,tA=1,2,或1oA0,A=1,2,2pt=1hlXXiXiXkPPPlPk01分布P或XPz1=P,P*0=q01QP二项分布方1的特例:8(1,p)(一重贝努里试验)E器PD()-pq二项分
7、布B(“)Px=/(=CpkqfA=O,1,,n彳为重贝努里试验中彳事件发生的次数ERnpP()=-npq泊松分布A)PX=k=3Le-fkA=O,1,2,-,0是常数二项分布泊松近似公式c:PLsS今(=np)(很大,夕较小)E能D(X)=超几何分布kz-PX=k=LMLN-M./A=1,2,min(Kn)无放回产品抽样试验当M+8时,/N时,IimCWM=CPkqi+禺E能也NnvM(Nti)(N-M)D(X)=;M(N-I)2 .连续型随机变量及常用分布名称定义性质或背景备注密度函数f(x)对任意水6有Pa-fbf()dxJa1. O202. fff(x)dx=J-B3o对任意常数a,有
8、PX三a=0等价定义:对X的分布函数有F(X)=-+正态分布N(,2)f(X)=1e-_8K+Pab=Zb-IA、4一、(-)-(-)E(X)二DCX)=2标准正态分布N(0,1)(X)二-7Uj2-ooK+oo1. (-x)=1(X)2. (x)可查表EX)=0P(X)=1计算其中(X)是分布函数指数分布()/*)=exyx0(),x0x0若/服从对数正态分布LN(/,2),则InM,2)E(X)=eZXX)=(e2-l)e2韦布尔分布欣叫,)F0,()xaxa加二1且二0时为指数分布;加=3o5时近似于正态分布分布函数为(x-afr(x)=l-e,(X)3 .随机变量的分布函数类型定义性质
9、备注通用定义F(X)=P启x,-oo+oo1. 0F(x)1;2. 7(-oo)=O,FG)=13o厂(x)对X单调不减4oF(%)为右连续Pab=Ab)一尸(a)离散型X户(X)NP,,xlx-8VxV+8Pk=PX=k=F(Xk)-F(Xk-O)连续型XF(x)=j刈,-+尸(x)=F(x)Pa)2J1. D(0=0(C为常数)2. D(C)C)=C2P(八)3o若Ky相互独立,则DXr)=D(Z)+D4.D(X)=F(Y)-(E2描述随机变量取值相对于均值的平均离散程度标准差(X)(x)=D(x)=JEKX-EX协方差COV(尤Cov(X,X)=(/-(X)(/-(r)=(/r)-E(X
10、)-E(力1 oCov(aX、bY)-abCov(尤Y)2 .Cov(%H,Y)=Cov(%,Y)+Cov(,力3 .4与Y独立Cov(其力二O40D(/及=P(Z)+P(K)2Cov(X,Y)描述X与y的偏差的关联程度相关系数XY_COV(XMPxY呵X)氏Y)1. IXYI1;2. |=1存在常数a、b使得P右ab=1;3. 彳与y独立彳与y不相关,反之不一定成立。描述彳与y间线性相关程度;XY=0,称X与y不相关;(三)随机变量函数的分布类型)的分布函数片仪刀的分布数学期望公式离散型X的分布律P*z*J二04,A=1,2,y的分布律为P()=Pk,H,2,。若有某些g(x,)相等,则对其
11、作适当的并项,即对应概率相加E(Y)=EIg(X)=Zg(XJp*连续型方的密度为分布函数法:Fy(S=Pry=Pg(X)y=fx(x)dxJ(xg(x),vX右g()的密度:fy(。二尸(y)E(Y)=Elg(X)fx(X)定理公式法:=+1g(x)(x)dx若y=g/7W)是f(y)=(X)在分(X)非零区间上严格单调,*g(x)的反函数(,)(y)Lay2op,=lf=l=li联合分布律的列表结构(概率分布表)X的边缘分布PX=Xj=ZPy=Pr,?=z=l,2随机变量彳的分布律由联合分布律“行值相加”y的边缘分布户卜=力=gp*=P./,/=1,2,.随机变量Y的分布律由联合分布律“列
12、值相加“独立性彳与丫相互独立Pij=PiPrAj=1,2,.Ky的边缘分布完全确定其联合分布律按定义验证独立性,实用中由试验独立性得2o二维连续型随机向量名称定义性质或试验背景备注联合密度f(,y)对平面上的区域。p(x,r)D)=/(x,yy)dxdyD1. f(x,y)202.JU匕f(x.y)dxdy=PxiXx2,yiYy2=J;:f(x,y)dxdy*的边缘密度Fx(X)=匕f(xyy)dy随机变量彳的密度A(x)-Fx(x)Y的边缘密度随机变量y的密度(y)=Fy(力独立性X与y相互独立f(y)=fxMf(y)Ky的边缘分布完全确定其联合分布律按定义验证独立性;实用中由试脸独立性得
13、二维正态分布(/,Y)N(U1,2,CTl2,P)XN(d,l2)YN(z2,),与V相互独立二0;是才与y的相关系数3o二维随机向量的分布函数名称定义性质或试验背景备注联合分布函数定义F(x,V)=PXxtYWH-8V,y+1.GWF(x,y)1;2oF(oo,0=0,尸(x,)=0,F(-,-O)=0,厂(+8,+oo)=1;3oF(x,y)对X,V均为右连续;4oFix,y)对X和y单调不减;F(x,y)可以描述任意类型(尤r)的分布S)=吆等oxy离散型(%Y)a,y)=EZ%XmXy产F-ooZiy+oo连续型(X,Y)尸(,y)=匕匕/(%y)加加-X,y=F(X,+8)FX(x)
14、为4的分布函数由F(x,y)可确定FX(G与历(y),反之未必y的边缘分布函数Fy(x)=Iim尸(x,y)X=F(+,y)Fy(y)为y的分布函数(五)大数定律和中心极限定理名称条件结论备注契贝晓夫不等式X的E(冷、D(X)均存在有限对任意0,有HX-E(X)Ie,X-E(X)0,有IXkM=IPk-=0当足够大时,l将依概率收敛n*三4于其均值贝努里大数定律设;B5,p);(或为重贝努里试验中事件力发生的次数,P(八)-p)对任意imPlTlfBI即A发夕0,有良-Pn一的频率2=0。-p7以严格数学形式描述“频率的稳定性”.在试验次数很大时,用事件A的频率作为其概,率的近似值勒维一林德贝
15、格中心极限定理(独立同分布中心极限定理)设%为相互独立且服从同一分布的随机变量序列,又F(X)=,P(X)=2(A=1,2,)均存在有限Xk-n令匕=、=,则ynlimPx=(x)n即很大时,Y:N(0,1)(近似)足够大时,tXfi近Jl=I似服从N(n,n2)德莫佛一拉普拉斯中心极限定理设ffB(n,p);(或”为。重贝努里试验中令一IimP工Woo展丝,则QnPqx=(X)当很大(30)时,有(贝努里情形中事件4发生的次即n很大时,YLN(0,1)Panb心极限定理)数,P3)=p)(近似),或npq)(近似)nN5p,小力一叩、一叩、(7当一(一一).WPq5pq第四章抽样分布一、学习
16、目的和要求1.正确理解总体、样本、统计量等数理统计的基本概念;20 了解2分布、t分布、尸分布定义及其性质和应用;21 熟练掌握查表求2分布、分布、尸分布的临界值;22 了解用EXCel计算2分布、七分布、尸分布的概率和临界值。二、内容提要(一)数理统计的基本概念名称定义特性意义总体彳研究对象的全体才将总体理解为服从某一分布的随机变量X利用随机变量X的性质来研究总体样本乂,Xn*,用,尤满足:1o(独立性)相互独立;2o(代表性)与总体才同分布。样本具有二重性:(1)随机变量%,左,Xn(理论分析)(2)观察值Xi,2f,Xn(数值计算)样本是从总体中随机抽取部分个体组成,用于推断总体有关统计
17、特征统计量(%,尤)样本%,%,,X的不含任何未知参数的函数泛指时为随机变量,特指时为相应数值对样本所含信息进行加工提炼,用于估计推断总体参数(二)常用统计量名称定义应用意义样本均值X=ii用于分析总体均值(,且有E(X)=E(X),。=皿n刻画了样本的位置(集中)特征,反映样本观察值的平均水平。样本方差S2=-(Xi-X)2W-II-II”、一=-(之X:一(X)2)用于分析总体方差D(第,且有E()=D(X)刻画了样本的离散特征,反映样本观察值偏离样本均值的分散程度。样本标准差SS=用S与X的度量单位一致刻画样本观察值偏离样本均值的绝对偏差,且与取值数据的量纲一致。变异系数CVCV=-=-
18、100%IXI反映样本的相对离散程度的无量纲统计量刻画样本观察值偏离样本均值的相对偏差,可用于比较不同均值样本相对变异程度标准误反映样本均值的变异程度用来衡量以样本均值来推断估计总体均值时的平均误差(三)统计三大常用分布名称定义性质2分布F)设外,%,,尤相互独立,均服从N(0,1),则力2=g、j2/=!2(力其中为2分布的自由度1.h2(n),则Ea)=,。(心=2/720人2Mt入2(e)且彳与y独立,则z+Y-2(+)士分布t()设XN(0,1),入2(),且才与丫相互独立,则1 .t-(n)-t(/7)2 .当7oo时,t()的极限分布就是NS,1)T=Y=yY11其中为2分布的自由
19、度厂分布F5,m)设2(n),Xi2(),且为与独立,则产=XJ17(T,)XJn2其中外4为2分布的自由度1.设厂亡(),则尸尸(1,ri)2o设4厂5,优),则7FFgCl)65,%)=Fa(n2,nx)(四)正态总体的抽样分布???总体类型抽样分布说明单个正态总体样本均值又的抽样分布XN(,U)n又作为正态变量的线性组合仍服从正态分布N(0,l)1nX的标准化变量服从标准正态分布XN,1、1=t(n-1)SIa将包二打中的换成S相应n分布由(0,1)修正为七(/7-D样本方差S相关抽样分布-D522,n21)C与刀还是相互独立的两个正态总体样本方差之比的抽样分布;1,丐1)Sy/iJ2用
20、于两个总体方差的统计推断样本均值之差的抽样分布当2=黄时(5-7)-(%一%)。力=-/(n1+n2-2)用于两个总体均值的统计推断其中e(n-)S+(m-)SjS-=+22第五章参数估计一、学习目的和要求1 .理解点估计与区间估计的概念和基本思想;2 .掌握点估计的矩估计法;3 .了解最大似然估计法;4 .了解估计的优良性;5 .熟练掌握正态总体参数(均值和方差)的区间估计;6 .掌握二项分布总体率的区间估计;7 .了解泊松分布的区间估计;8 ,了解用Excel进行正态总体参数的点估计与区间估计的运算.二、内容提要(一)总体参数的点估计法点估计法基本思想计算步骤矩估计法用样本矩估计相应的总体
21、矩,从而得到总体未知参数的估计值设未知参数为,021o由总体力的分布计算A),EQ2)2o解方程组1”_E(X)=-YXi=XOX?尸_Lx:r=l得,出的矩估计a最大似然估计法根据样本来选择参数,使得该样本出现的可能性最大设未知参数为1o写出似然函数在(王,。),离散型?)=7jf,e),连续型、r-2.选择,使()最大。即解似然方程暇。或曙二。3.解之得,即为,的最大似然估计(二)估计量的判别标准判别标准定义备注无偏性E(0)=样本均值又是总体均有效性设a,a均为。的无偏估计量,若O(八)VO(E),则称。比。有效值的无偏一致估计量;样本方差S?是总体方差标的无偏一致估计量;样本率。是总体
22、率P的无偏一致估计量。一致性对任意给定的0,有Iimp-f=1,即占依概率收敛于。(三)总体参数的区间估计总体分布参数条件IOoX(I-)%置信区间正态分布均值2已知-CrI未知6飞(n-)-j=,x+%(-1);:“7wJ2未知大样本(30)(-x-ua-j=,x+ua-=yn-J方差2未知C、(DS2(n-)S2292XaZ1I2,2J二项分布总体率P大样本(730)Pij型二包,P+包、TVnTVny小样本(/730)查附表8泊松分布参数大样本(730)XxXx小样本(n30)-0:0(或:o)UU-U(或v)2 .配对比较总体均值的假设检验条件检脸假设统计量临界值拒绝域配对总体4d0t
23、/1Itt/2(4为差值)dR(或(0)dRt一/t(或t-1)3 .正态总体方差的假设检验条件检验假设统计量临界值拒绝域单个总体吊:2=O2:2O22,-i)s2心xlT或力?之力;:2O2(或:22FFNFa4 .两个正态总体的均值比技检验条件检验假设统计量临界值拒绝域2?已知:1-2H:1,2X-y用?UIH:1)2(或”:tA:12(或:12(或H:30)12(或H:1(2)OUUU(或tU)2.单个总体率的假设检验条件检验假设统计量临界值拒绝域大样本(30)压:P=Pq:P丰POP-PaXI)U/2II2U:PPq(或“:PPo(或:PR)U(或-U)u(或4-)*0=2arcsinyp,0=2arcsin麻3两个总体率的比较检验条件检验假设统计量临界值拒绝域大样本5、30)施Py=PiK.RP2,_PP2U,Jp(l-p)(-+)V/2(=叼+%)外+/I2UAIuUAH;PJP1(或:4P2(或HMPKPD小小*ni+n2U(或-U)u(或t-U)=2arcsinp,2=2arcsinp
链接地址:https://www.31ppt.com/p-6823792.html