概率论与数理统计(理工类,第四版)吴赣昌主编课后习题答案第八章.doc
由于工作太忙,现在才把答案更新完整,多谢广大网友的支持与厚爱。第八章 方差分析与回归分析习题8.1 单因素试验的方差分析习题1粮食加工厂试验5种贮藏方法,检验它们对粮食含水率是否有显著影响. 贮藏前这些粮食的含水率几乎没有差别,贮藏后含水率如下表所示,问不同的贮藏方法对含水率的影响是否有明显差异(=0.05)? 含水率(%) 试验批号 1 2 3 4 5 因素A(贮藏方法)A17.38.3 7.68.48.3A25.47.4 7.1 A38.16.4 A47.99.510.0 A57.1 解答:本问题是在=0.05下检验假设 H0:1=2=3=4=5, H1:1,2,3,4,5不全相等.计算出结果见表: 1 2 3 4 5 Ti Ti2 j=1nixij2A1A2A3A4A57.3 8.3 7.6 8.4 8.35.4 7.4 7.18.1 6.47.9 9.5 10.07.1 39.9 19.9 14.5 27.4 7.1 1592.01 396.01 210.25 750.76 50.41 319.39 134.33 106.57 252.66 50.41 T=108.8 i=15Ti2ni856.19 i=15j=1nixij2=863.36 则 ST=i=15j=1njxij2-T2n=863.36-114×108.8217.8286, SA=i=15Ti2ni-T2n=856.19-114×108.8210.66, SE=ST-SA=17.8286-10.667.17.方差分析表(见下表): 方差来源 平方和 自由度 均方差 F值 F临界值 组间(因素A)组间(误差E) 总和SA=10.66SE=7.17ST=17.83 r-1=4n-r=9 13SA¯=2.665SE¯0.797 F=SA¯SE¯3.344 F0.05(4,9)=3.63 F<F,接受H0因为F=3.344<3.63=F0.05(4,9), 所以F未落在拒绝域中,接受H0, 即认为不同的贮藏方法对含水率的影响没有显著差异.习题2设有三种机器A、B、C制造一种产品,对每种机器各观测5天,其日产量如下表所示,问机器之间是否真正存在差别(=0.05)? 试验批号 1 2 3 4 5日产机器量机器型号 A4148414957 B6557547264 C4551564848解答:本问题是在=0.05下检验假设 H0:A=B=C,H1:A,B,C不全相等为简化计算,将原表各数据减去40,然后计算,结果如表: 1 2 3 4 5 Ti Ti2 j=15xij2 A,B,C1,25,5 8,17,11 1,14,16 9,32,8 17,24,8 36,112,48 1296,12544,2304 436,2710,530 T=196 i=13Ti25=3228.8 i=13j=15xij2=3676 则 ST=i=13j=15xij2-T2n=3676-115×19621114.933, SA=i=13Ti2nj-T2n=3228.8-115×1962667.733, SE=ST-SA=1114.93-667.733=447.2.从而得方差分析表(见下表):方差来源平方和自由度 均方差 组间(因素A)SA=667.733r-1=2SA¯=333.8665组内(误差E)SE=447.2n-r=12SE¯37.267总和ST=1114.93314 方差来源F值 F临界值 组间(因素A)F=SA¯SE¯8.959F0.05(2,12)=3.89组内(误差E) 总和 F>F,拒绝H0因为F=8.959>3.89=F0.05(2,12), 所以F落在拒绝域中,拒绝H0, 即认为机器与机器之间存在显著差异.习题3有某型号的电池三批,它们分别是A、B、C三个工厂所生产的,为评比其质量,各随机抽取5只电池为样品,经试验得其寿命形式如下:A4048384245B2634302832C3940435050试在显著性水平0.05下,检验电池的平均寿命有无显著的差异,若差异是显著的,试求均值差A-B,A-C及B-C的置信度为95%的置信区间,设各工厂所生产的电池的寿命服从同方差的正态分布.解答:本问题是在=0.05下检验假设 H0:A=B=C, H1:A,B,C不全相等为简化计算,将原表各数据减去40,然后计算,结果如下: A 0 8-2 5 5B-14-6-10-8-8C-1 0 3 10 10 T=i=13j=1niXij=-15, ST=i=13j=1niXij2-T2n=847-15215=832, SA=i=13Ti2ni-T2n=615.6, SE=ST-SA=832-615.6=216.4,从而得方差分析表(r=3,n=15)方差来源平方和自由度均方和F(=0.05) 因素A615.6s-1=2S¯A=307.8S¯A/S¯E17.0684因素E216.4n-s=12S¯E18.0333F0.05(2,12)=3.89总和T832n-1=14 F=17.0684>3.89由上表可知,拒绝H0, 即认为电池一平均寿命有显著差异.由于置信度为0.95的置信区间为 (Xj¯-Xk¯±ta2(n-r)SE(1nj+1nk)¯),且t0.025(12)=2.1788, SE(1nj+1nk)¯=18.033×(25)2.6858,X1¯=2.6, X2¯=-10, X3¯=4.4, 则A-B的置信值为0.95的置信区间为 (2.6+10±2.1788×2.6858)=(2.6+10±5.852), 即(6.75,18.45);A-C的置信度为0.95的置信区间为 (2.6-4.4±5.852), 即(-7.652,4.052);B-C的置信度为0.95的置信区间为 (-10-4.4±5.852), 即(-20.252,-8.548).习题4一个年级有三个小班,他们进行了一次数学考试,现从各个班级随机地抽取了一些学生,记录成绩如下:班级73,66,89,60,82,45,43,93,80,36,73,7788,77,78,31,48,78,91,62,51,76,85,96,74,80,5668,41,79,59,56,68,91,53,71,79,71,15,87试在显著性水平0.05下检验各班级的平均分数有无显著差异,设各个总体服从正态分布,且方差相等.解答:分别以1,2,3表示,班的平均分数,我们需检验(=0.05) H0:1=2=3, H1:1,2,3不全相同,由于r=3,n1=12,n2=15,n3=13,n=40. ST=i=13j=1niXij2-T2n=13685.1, SA=i=13Ti2ni-T2n335.35, SE=13349.75, SA¯=SA/2=167.675, SE¯=SE/37660.80, F=SA¯/SE¯0.4647, F0.05(2,37)=3.23>0.4647=F,故接受H0,即认为各班级的平均分数无显著差异。习题8.2 双因素试验的方差分析习题1酿造厂有化验员3名,担任发酵粉的颗粒检验. 今有3位化验员每天从该厂所产的发酵粉中抽样一次,连续10天,每天检验其中所含颗粒的百分率,结果如下表所示. 设=5%, 试分析3名化验员的化验技术之间与每日所抽取样本之间有无显著差异?百分率(%) 因素B(化验时间)B1B2B3B4B5 因素A(化验员)A1A2A310.110.010.24.74.9 4.83.13.1 3.03.03.2 3.07.87.8 7.8 百分率(%) 因素B(化验时间)B6B7B8B9B10 因素A(化验员)A1A2A38.2 8.28.47.8 7.77.86.0 6.26.14.9 5.15.03.4 3.43.3解答:本问题是在=0.05下检验假设 H0A:A1=A2=A3, H1A:A1,A2,A3不全相等 H0B:B1=B2=B10, H1B:B1,B2,B10不全相等计算结果如下表: 因素A(化验员)因素B(化验时间)B1B2B3B4B5B6B7 10.110.010.24.74.94.83.13.13.03.03.23.07.87.87.88.28.28.47.87.77.8Ti30.314.49.29.223.424.823.3Tj2918.09207.3684.6484.64547.56615.04542.89Ti2306.0569.1428.2228.24182.52205.04180.97i=13xij2 (接上表) 因素A(化验员)因素B(化验时间)Ti Ti2B8B9B10 6.06.26.14.95.15.03.43.43.359 3481 59.6 3552.1659.4 3528.36Ti18.31510.1T=i=13Ti=178Tj2334.89225102.01j=110Tj2=3662.12Ti2111.6575.0234.01i=13Ti2=10561.52i=13xij2 i=13j=110xij2=1220.86 ST=i=13j=110xij2-130T2=1220.86-130×1782164.727,SA=110I=13Ti2-130T2=110×10561.52-130×17820.01867,SB=13i=13Tj2-130T2=13×3662.12-130×1782164.57,SE=ST-SA-SB=0.13833.从而得方差分析表(见下表)方差来源平方和自由度均方和因素ASA=0.01867r-1=2SA¯=0.009335因素BSB=164.57s-1=9SB¯18.286误差ESE=0.13833(r-1)(s-1)=18 SE¯0.00769总和TST=164.72729 方差来源F值F临界值因素AFA=SA¯SE¯1.214F0.05(2,18)=3.55因素BF0.05(9,18)=2.46误差EFB=SB¯SE¯2377.89FA<F,接受H01总和TFB>>F,拒绝H02由于FA<F0.05(2,18),说明FA未落在拒绝域中,故接受H0A,即认为3名化验员的化验技术之间无显著差异; 由于 FB>>F0.05(9,18),说明FB落在拒绝域中,故拒绝H0B, 即认为每日所抽样本之间有显著差异.习题2下表给出某种化工过程在三种浓度、四种温度水平下得率的数据,假设在诸水平搭配下得率的总体服从正态分布,且方差相等,试在=0.05水平下检验在不同浓度下的率有无显著差异;在不同温度下得率是否有显著差异;交互作用的效应是否显著?浓度%温度(C)10243852214,1011,1113,910,1249,710,87,116,1065,1113,1412,1314,10解答:以A表示因素“浓度”,以1,2,3表示相应水平的效应;以B表示因素“温度”,各水平的效应记为1,2,3,4; 以ij(i=1,2,3;j=1,2,3,4)表示交互作用A×B的效应.本题是在=0.05下检验假设 H01:i=0(i=1,2,3), H02:j=0(j=1,2,3,4), H03:ij=0(i=1,2,3;j=1,2,3,4),将计算结果列表如下:浓度%因素A温度(C)因素B10243852TiTi221410(24)1111(22)139(22)1012(22)908100497(16)108(18)711(18)610(16)6846246511(16)1314(27)1213(25)1410(24)928464Tj56676562Ti=j=14Tj=250,j=14Tj2=15694j=14Ti2=21188,i=13j=14k=12xijk2=2752Tj23136448942253844i=13Tij21088153714331316 r=3,s=4,t=2,=0.05, ST=i=13j=14k=12xijk2-T2rst=2752-250224147.83, SA=1sti=13Ti2-T2rst=18×21188-25022444.33, SB=1rtj=14Tj2-T2rst=16×15694-250224=11.5, SA×B=1ti=13j=14Tij2-T2rst-SA-SB =12(1088+1537+1433+1316)-250224-44.33-11.5 =27.033, SE=ST-SA-SB-SA×B=64.967 方差分析表方差来源平均和自由度均方和F比浓度(A)44.33r-1=2SA¯=22.165SA¯/SE¯4.09F0.05(2,12)=3.89温度(B)11.5s-1=3SB¯3.833SB¯/SE¯0.708F0.05(3,12)=3.49交互作用 A×B27.033(r-1)(s-1)=6SA×B¯4.5SA×B¯/SE¯0.558误差E64.967rs(t-1)=12SE¯=5.414F0.05(6,12)=3.00总和T147.83rst-1=23 拒绝H01,接受H02及H03由方程分析表可见,只有浓度因素的效应是显著的习题3为了研究金属管的防腐蚀功能,考虑了4种不同的涂料层,将金属管埋设在3种不同性质的土壤中,经历了一定的时间,测得金属管腐蚀的最大深度如下所示以计: 土壤类型(因素B)涂层(因素A) 1 2 31.63,1.34,1.19,1.30 1.35,1.30,1.14,1.09 1.27,1.22,1.27,1.32试在=0.05水平下检验下腐蚀的最大深度的平均值有无显著差异;在不同土壤下腐蚀的最大深度的平均值有无显著差异?设两因素间没有交互作用效应.解答:分别以a1,a2,a3,a4表示4种不同的涂料涂层下腐蚀的最大深度的效应,以b1,b2,b3表示三种不同土壤下腐蚀的最大深度的效应,检验假设 H01:a1=a2=a3=a4H11:a1,a2,a3,a4不全相等, H02:b1=b2=b3H12:b2,b2,b3不全相等, 这里 r=4,s=3. T1=i=1rXi1=5.46, T2=i=1rXi2=4.88, T3=i=1rXi3=5.08, T1=i=1sX1i=4.88,T2=i=1sX2i=3.86, T3=i=1sX3i=3.6,T4=i=1sX4i=3.71, T=i=1rj=1sXij=15.42, ST=i=1rj=1sXij2-T2rs=1.632+1.322-15.42212=0.2007, SA=1si=1rTi2-T2rs=13(4.252+3.862+3.62+3.712)-15.42212 =0.0807, SB=1rj=1sTj2-T2rs=14(5.462+4.882+5.082)-15.42212 =0.0434, SE=ST-SA-SB=0.0766,得方差分析表如下方差来源 平方和自由度均方和F比因素ASA=0.080730.0269FA=SA¯/SE¯2.1065因素BSB=0.043420.0217FB=SB¯/SE¯1.6993误差SE=0.076660.01277 总和ST=0.207711 由于 F(r-1,(r-1)(s-1)=F0.05(3,6)=4.76>2.1065, F(s-1),(r-1)(s-1)=F0.05(2,6)=5.14>1.6993,故在=0.05水平下,接受H01,H02, 即认为两种因素的影响均不显著.习题8.3 一元线性回归习题1在某种产品表面进行腐蚀刻线试验,得到腐蚀浓度y与腐蚀时间t对应的一组数据如下表所示.时间t(s)5 10 15 20 30 40 50 60 70 90 120浓度y(m)6 10 10 13 16 17 19 23 25 29 46试求腐蚀浓度y对时间t的回归直线方程.解答:n=11, 所需计算如下表所示: ti yi ti2 yi2 tiyi 5,10,15,20,30,40,50,60,70,90,120 6,10,10,13,16,17,19,23,25,29,46 25,100,225,400,900,1600,2500,3600,4900,8100,14400 36,100,100,169,256,289,361,529,625,841,2116 30,100,150,260,480,680,950,1380,1750,2610,5520510 214 36750 5422 13910 Ltt=i=111ti2-111(i=111ti)2=36750-111×5102 =13104.54545, Lty=i=111tiyi-111(i=111ti)(i=111yi)=13910-111510×214 =3988.181818, b=Lty/Ltt0.304, a=111i=111yi-(111i=111ti)b=111×214-111×510×0.304 =5.36,故所求的回归直线为 y=a+bt=5.36+0.304t.习题2随机抽取12个城市居民家庭关于收入与食品支出的样本,数据如下表所示,试判断食品支出与家庭收入是否存在线性相关关系,求出食品支出与收入间的回归直线方程(=0.05).家庭收入mi8293105130144150160180200270300400每月食品支出yi(单位:元)7585 92105120120130145156200200240解答:设食品支出与收入间有线性关系y=0+1m,首先在=0.05下检验假设 H0:1=0, H1:10.选取统计量F=S回DivS剩(n-2), 在H0成立的条件下, FF(1,n-2),且此检验问题的拒绝域为F>F(1,n-2).n=12, 所需计算如下表所示:mi8293105130144150160180yi758592105120120130145mi267248649110251690020736225002560032400yi25625722584641102514400144001690021025miyi6150790596601365017280180002080026100(接上表)mi200270300400i=112mi=2214yi156200200240i=112yi=1668mi2400007290090000160000i=112mi2=507434yi224336400004000057600i=112yi2=261000miyi31200540006000096000i=112miyi=360745 Lmm=i=112mi2-112(i=112mi)2=507434-112×22142=98951, Lmy=i=112miyi-112(i=112mi)(i=112yi) =360745-112×2214×1668=52999, Lyy=i=112yi2-112(i=112yi)2=261000-112×16682=29148, S回=Lmy2/Lmm=5299929895128386.717, S剩=Lyy(1-Lmy2LmmLyy)=29148×(1-52999298951×29148)761.283, F=S回DivS剩(n-2)372.880,查表得F0.05(1,10)=4.96.显然F=372.880>>4.96=F0.05(1,10), 说明F落在拒绝域中,从而拒绝H0, 即认为10, 亦即食品支出与收入间的线性关系显著,设线性关系为y=0+1m,则 1=Lmy/Lmm0.54, 0=112i=112yi-(112i=112mi)1=112×1668-112×2214×0.54 =39.37,故所求的回归直线为y=39.37+0.54m.习题3根据下表中的数据判断某商品的供给量s与价格p间的回归函数类型,并求出s对p的回归方程(=0.05).价格pi(元) 7 12 6 9 10 8 12 6 11 9 12 10供给量si(吨)57 72 51 57 60 55 70 55 70 53 76 56解答:首先作出散点图(如图所示). 由散点图可见,p与s之间存在近似的线性关系,为证实这一点,先在=0.05下检验假设 H0:1=0, H1:10.选取统计量F=UQ/(n-2), 在H0成立的条件下, FF(1,n-2),且此检验问题的拒绝域为F>F(1,n-2).n=12, 所需计算如下表所示:pi71269108126si5772515760557055pi24914436811006414436si232495184260132493600302549003025pisi399864306513600440840330(接上表)pi1191210i=112pi=112si70537656i=112si=732pi212181144100i=112pi2=1100si24900280957763136i=112si2=45454pisi770477912560i=112pisi=7011 Lpp=i=112pi2-112(i=112pi)2=1100-112×112254.6667, Lps=i=112pisi-112(i=112pi)(i=112si)=7011-112×112×732 =179, Lss=i=112si2-112(i=112si)2=45454-112×7322=802, S回=Lps2/Lpp586.1155,, S剩=Lss(1-Lps2LppLss)215.845. F=S回DivS剩(n-2)27.15,查表知F0.05(1,10)=4.96.显然F=27.15>4.96=F0.05(1,10), 说明F落在拒绝域中,从而拒绝H0, 即认为10, 认为某商品的供给量s与价格p间存在近似的线性关系,设线性关系为 s=0+1p,则 1=Lps/Lpp3.27, 0=112i=112si-(112i=112pi)1=112×732-112×112×3.27 30.48,即近似的线性关系为 s=30.48+3.27p.习题4有人认为,企业的利润水平和它的研究费用间存在近似的线性关系,下表所列资料能否证实这利论断(=0.05)?时间1955 1956 1957 1958 1959 1960 1961 1962 1963 1964研究费用 10 10 8 8 8 12 12 12 11 11利润(万元)100 150 200 180 250 300 280 310 320 300解答:n=10, 所需计算如果下表所示:xi101088812yi100150200180250300xi2100100646464144yi2100002250040000324006250090000xiyi100015001600144020003600(接上表)xi12121111i=110xi=102yi280310320300i=110yi=2390xi2144144121121i=110xi2=1066yi2784009610010240090000i=110yi2=624300xiyi3360372035203300i=110xiyi=25040 Lxx=i=110xi2-110(i=110xi)2=1066-110×1022=25.6, Lxy=i=110xiyi-110(i=110xi)(i=110yi)=25040-110×102×2390 =662 Lyy=i=110yi2-110(i=110yi)2=624300-110×23902=53090. 设研究费用x与利润y之间有线性关系y=a+bx,检验假设H0:b=0, H1:b0, H0的拒绝域为F>F(1,n-2), 其中 F=UQ/(n-2), U=Lxy2/Lxx=17118.90625, Q=Lyy(1-Lxy2LxxLyy)=35971.094, 则F=UQ/(n-2)3.807,查表知F0.05(1,8)=5.32. 显然F=3.807<5.32=F0.05(1,8), 说明F没有落在拒绝域中,从而接受H0, 即认为b=0, 这说明用原表中所列资料不能证实企业的利润水平和它的研究费用之间存在线性关系.习题5在钢线碳含量对于电阻的效应的研究院中,得到以下的数据:碳含量x(%)0.10 0.30 0.40 0.55 0.70 0.80 0.95电阻(20C微欧) 15 18 19 21 22.6 23.8 26设对于给定的x,y为正态变量,且方差与x无关,(1)建立线回归方程y=a+bx;(2)检验假设H0:b=0,H1:b0;(3)若回归效果显著,求b的置信度为0.95的置信区间;(4)求x=0.5处的置信度为0.95的预测区间.解答:(1)由题意知 Lxx=i=1nxi2-1n(i=1nxi)2=2.595-17×14.440.532, Lyy=i=1nyi2-1n(i=1nyi)2=3104.2-17×2114.6=84.03, Lxy=i=1nxiyj-1n(i=1nxi)(i=1nyi)=85.61-78.93=6.6086, b=LxyLxx12.5537, a=1n(i=17yi)-1n(i=17xi)b=17×145.4-17×3.8×12.5537 13.9566, 则回归方程为 y=13.9566+12.5537x.(2)检验 H0:b=0, H1:b0;已知拒绝域为t=bLxx>ta2(n-2),又2=Lyy-bLxyn-20.03777, t47.1144, t0.052(5)=2.5706=2.5705t>t0.052(5),故拒绝H0, 即回归效果显著.(3)由于b的置信度为1-的置信区间为 (b±ta2(n-2)×Lxx),故b的置信度为0.95的置信区间为(11.8688,13,2386).(4)由于x=x0处的置信度为1-的预测区间为 (y0±ta2(n-2)×1+1n+(x-x0)2Lxx),代入可得 (19.67,20.80). 习题6假设儿子的身高(y)与父亲的身高(x)适合一元正态线性回归模型,观察了10对英国父子的身高(英寸)如下:x60626465666768707274y63.665.26665.566.967.167.463.370.170(1)建立y关于x的回归方程;(2)对线性回归方程作假设检验(检验水平取为0.05);(3)给出x0=69时,y0的置信度为95%的预测区间.解答:(1)按所给数据计算 i=110xi=668, x¯=66.8, i=110xi2=44794, i=110yi=665.1, y¯=66.51, i=110yi2=44283.93, i=110xiyi=44492.4, Lxx=i=110xi2-10(x¯)2=171.6, Lxy=i=110xiyi-10x¯y¯=63.72, 1=LxyLxx0.3713, 0=y¯-x¯141.7072,故所求回归方程为 y=41.7072+0.3713x.(2)待解决的原假设为H0:1=0的显著性假设检验问题,检验统计量是 F=U/Qn-2,检验水平为的拒绝域为F>F(1,n-2), 由所给数据可得 Lyy=i=110yi2-10(y¯)2=48.12