《第参数估计与分析.ppt》由会员分享,可在线阅读,更多相关《第参数估计与分析.ppt(37页珍藏版)》请在三一办公上搜索。
1、第12章 参数估计与分析,参考资源:http:/218.192.12.13/kcpt/jkx.html,大学计算机,2023/6/27,1,广东金融学院,2023/6/27,广东金融学院,2,第三篇数据统计分析篇,要求,内容,目的,教学目的,2023/6/27,广东金融学院,3,利用Excel掌握概率理论和正态分布密度函数的图像制作,掌握利用Excel计算总体均值的区间估计方法,掌握利用Excel计算样本容量的方法,了解总体方差的区间估计方法,教学内容,2023/6/27,广东金融学院,4,概率与概率分布,1,总体均值的区间估计,2,总体比例P的估计,3,样本容量的确定,4,总体标准差及方差的
2、估计,5,教学方法,2023/6/27,广东金融学院,5,启发式教学法,1,多媒体教学法,2,案例教学法,3,学习要求,2023/6/27,广东金融学院,6,多讨论,1,多思考,2,多上机,3,多交流,4,12.1概率与概率分布,在现实生活中,许多现象发生的结果都是不确定的,这类具有多种可能结果的现象称为随机现象。随机现象的每一可能结果都是一个随机事件,换句话说,随机变量的每一可能取值都是一个随机事件。概率是度量随机事件出现或发生的可能性大小的一种尺度。实践和理论都证明:有一种特殊而常用的分布,它的分布曲线是有规律的,这就是正态分布。正态分布曲线取决于这个随机变量的一些表征数,其中最重要的是平
3、均值和差异度。平均值也叫数学期望,差异度也就是标准差。正态分布在它在各种概率分布中居首要地位,是抽样和抽样分布的理论基础。,7,Excel为正态分布提供了4个函数,它们是:正态分布函数NORMDIST用于计算给定均值和标准差的正态分布的函数值。其语法结构为:NORMDIST(x,mean,standard_dev,cumulative)。其中:X为需要计算其概率的数值;mean为正态分布的均值;standard_dev为正态分布的标准差;cumulative为一个逻辑值,指明函数的形式。如果cumulative为TRUE,函数NORMDIST返回累积分布函数F(x);如果为FALSE,返回概率
4、密度函数。标准正态分布函数 NORMSDIST用于计算标准正态分布的函数值,该分布的均值为0,标准偏差为1。其语法结构为:NORMSDIST(z)。其中:Z为需要计算其分布的数值。正态分布函数NORMDIST的反函数NORMINV能够根据已知概率等参数确定正态分布随机变量值。其语法结构为:NORMINV(probability,mean,standard_dev)。其中:probability为正态分布的概率值;mean为正态分布的均值;standard_dev为正态分布的标准差。标准正态分布函数的反函数NORMSINV能够根据概率确定标准正态分布随机变量的取值。其语法结构为:NORMSINV
5、(probability)。其中:Probability为正态分布的概率值。利用Excel的正态分布函数可以快速而简便地解决实际问题。,8,【例12-1】已知某校入学考试成绩为正态分布,求低于500分的百分比是多少?打开一个空白工作表,选定A1单元格,然后输入公式:“NORMDIST(500,600,100,TRUE)”结果为0.15865”,即成绩低于500分者占总人数的15.87%。【例12-2】假定已知某国际贸易公司的某类供应商在目的港的交货期XN(21,102)。对于海运的实际交货期,客户通常认为:两个星期内非常好;三个星期内是一般水平;一个月内尚可接受。如果该国际贸易公司选择此类供应
6、商,那么该供应商能够在两个星期内交货的可能性有多大?若客户要求明确交货日期,而公司希望违约的可能性不超过10%,那么公司应在销售合同中承诺订单签定后多少天交货为宜?,9,依题意,上述问题相当于要求解P(X14)=?和P(X?)=90%的问题,其操作步骤如下:(1)打开一个空白工作簿,在A1单元格输入“=NORMDIST(14,21,10,1)”按Enter键则得到0.242,也就是说该供应商能够在两个星期内交货的可能性只有24.2%;(2)在B1单元格输入公式“NORMINV(0.9,21,10)”按Enter键则得到33.8,这就是说如果公司按期交货的可能性为90%,则销售合同中承诺签订34
7、天为好。【例12-3】利用Excel绘制两个正态分布密度函数图,一个是均值为“0”,标准差为1标准正态分布;另一个是均值与标准差可以变化的一般正态分布。,10,(1)打开位于光盘文件夹“第3篇 Excel数据分析与处理章节实例第12章 参数估计与分析.xls”工作簿,选定“例12-3密度函数”工作表;如图12-2所示。图中A列数据为正态随机变量,在A1单元格输入“-3”,在A2单元格输入“-2.9”,选定A1和A2单元格,拖动填充柄到A62,完成随机变量的输入,B列代表一般正态分布密度值,C列代表标准正态分布密度值。单元格E1和E2中的“0”和“1”是一般正态分布的特征值,此时其取值与标准正态
8、分布相似。,图12-2“密度函数”工作表,11,11,(2)选择B2单元格,单击【插入】菜单的【函数】选项,弹出【插入函数】对话框。(3)在“函数分类”列表中选择“统计”,在“函数名”列表中选择正态分布函数“NORMDIST”,单击【确定】按钮,打开正态分布函数对话框,如图12-3所示。(4)在“X“中输入A2单元格,在“Mean”中按绝对地址输入E1单元格,以便复制公式时能使其保持不变,在“standard_dev”中按绝对地址输入E2单元格,以使公式不变,在“cumulative”中输入“0”,说明使用概率密度函数;如果输入“1”,则使用累积分布函数。,图12-3正态分布函数对话框,12,
9、(5)单击确定按钮,在B2单元格出现值0.004431848。(6)选定C2单元格,在编辑栏里输入公式:“=NORMDIST(A2,0,1,0)”,按Enter键在C2单元格里也出现值0.004431848。(7)选择B2:C2单元格区域,将其公式复制到B3:C62单元格区域中,由此可得一般正态分布与标准正态分布的关于随机变量-33的概率密度值。(8)单击【插入】菜单中的【图表】选项,Excel则弹出【图表向导】对话框。(9)在“图表类型”列表中选择XY散点图,在“子图表类型”列表选择“平滑线散点图”,然后单击【下一步】按钮。(10)在数据区域中输入“A1:C62”,便会看到一个图形预览,如果
10、觉得满意,可以单击【下一步】按钮。(11)因为不加任何标题,可单击【完成】按钮,得到如图12-4所示的正态分布图,图12-4正态分布图,13,【例12-4】用Excel绘制t分布正态分布图。(1)打开位于光盘文件夹“第3篇 Excel数据分析与处理章节实例第12章 参数估计与分析.xls”工作簿,选定“例12-4 t分布”工作表,如图12-7所示。图中A列数据为随机变量,在A1单元格输入“-4”,在A2单元格输入“-3.9”,选定A1和A2单元格,拖动填充柄到A82,完成随机变量的输入,B列代表Z分布值,C列代表t分布值。单元格D1输入“自由度”。,图12-7“t分布”工作表数据,14,(2)
11、在单元格E1中输入“10”,它是t分布所使用的自由度。(3)在B2单元格中输入标准正态分布函数公式“=NORMSDIST(A2)”,用来确定一个小于A2单元格变量值的标准正态变量的概率,此值为3.17E-0.5。(4)在C2单元格输入t分布函数公式“=TDIST(ABS(A2),$E$1,1)”,这个公式是以单元格A2的绝对值为变量,以单元格E1的数值为自由度的单侧t分布的概率,此值是0.001259166。(5)在B3单元格中输入公式“=NORMSDIST(A3)-NORMSDIST(A2)”,用来计算单元格A3与单元格A2之间的正态分布概率。(6)在C3单元格中输入公式“=TDIST(AB
12、S(A3),$E$1,1)-TDIST(ABS(A2),$E$1,1)”,用来计算单元格A2到单元格A3之间的 t 分布的概率。注意这个公式中的单元格E1是绝对引用,这样便于复制公式,在C3单元格中显示为0.000221338。,15,(7)将B3单元格与C3单元格中的公式复制至第82行。找到第38行,单元格A38应显示-0.4,B38应显示0.036041,C38应显示0.034837。如果正确,便可以拟合两种图形了。(8)单击C43单元格,在其公式前面加上绝对值函数,以避免出现负值。其公式为:“=ABS(TDIST(ABS(A43),$E$1,1)-TDIST(ABS(A42),$E$1,
13、1)”,并复制此公式到C44:C82中的各单元格中。(9)在【插入】菜单中选择【图表】选项,打开【图表向导】对话框。(10)在第1步的“图表类型”中选择“折线图”,在“子图表类型”中选择“数据点折线图”,单击【下一步】按钮。(11)在第2步“图表源数据”对话框中,在数据区域输入A1:C82。打开“系列”页面,在系列中删除“变量值”,在分类X轴标志中输入“=t分布!$A$2:$A$82”,单击【下一步】按钮。(12)在3步的“图表选项”对话框中,不选标题,打开“图例”页面,选择图例在底部。,16,(13)在E1单元格中分别输入8,5,3,1,可以看出随着自由度的值变小,两个分布的差异便更加明显。
14、(14)在E1单元格中分别输入20,100,1000,10000和100000,可以看到随着自由度的增加,两个分布的差异逐渐变小,甚至相同,图12-8是正态分布与自由度为3时的t分布的图示。T分布正态分布图12-8正态分布Z与t分布比较所以,结论是随着自由度增加,t分布将越来越接近于正态分布。,17,122总体均值的区间估计,【例12-5】某厂家生产的挂面包装上写明“净含量450克”。在用天平称量了商场中的48包挂面之后,得到样本量为48的关于挂面重量(单位:克)的一个样本。具体数据见“第3篇 Excel数据分析与处理章节实例第12章 参数估计与分析”工作簿中的“例12-5挂面均值”工作表。试
15、以95%的置信度计算得到挂面样本均值及总体均值的置信区间。(1)打开位于光盘文件夹“第3篇 Excel数据分析与处理章节实例第12章 参数估计与分析”工作簿,选定“例12-5挂面均值”工作表;如图12-9所示。,图12-9“例12-5挂面均值”工作表,18,(2)选定D1单元格,在【插入】菜单中选择【函数】选项,打开【插入函数】对话框。(3)在“函数分类”列表中选择“统计”,在“函数名”列表中选择计数函数“Count”,单击【确定】按钮,弹出【函数参数】对话框,如图12-10所示。,图12-10【函数参数】对话框,(4)在Value1中输入数据范围。选择A列列头,或输入“A:A”,这相当于选择
16、整个列。单击【确定】按钮。D1单元格中会显示结果为48,即A列中数据的个数。,19,(5)在单元格D2中输入公式“=AVERAGE(A:A)”,计算A列的均值,显示值为449.0104;在单元格D3中输入公式“=STDEV(A:A)”,计算A列的标准差,显示值为5.50;在单元格D4中输入公式“=D3/SQRT(D1)”,计算标准误差,即标准差除以样本容量的平方根,D4中显示值为0.79;在单元格D5中输入显示性水平0.05。(6)在D6单元格中使用NORMSINV函数计算显著性水平为0.05下的Z值。在单元格D6中输入公式“=NORMSINV(1-D5/2)”,计算Z值,显示值为1.96。(
17、7)在D7单元格中输入计算抽样极限误差的公式,它是Z值和标准误差的乘积,公式为“=D6*D4”,显示值为1.56。(8)在D8单元格和D9单元格中输入计算置信区间上限和下限的公式,下限为样本均值减抽样极限误差,上限为样本均值加抽样极限误差。其公式分别为“=D2-D7”和“=D2+D7”,显示值为447.45和450.57。,20,这样,总体区间估计结果如图12-11所示,即以95%的置信度估计总体均值的置信区间为:447.45450.57。如果计量单位规定一包净含量450克的挂面重量的浮动范围为50克,则厂家生产的挂面包装上写明“净含量450克”是不合格的。,图12-11“例12-5挂面均值”
18、工作表计算结果,21,【例12-6】某工厂想检验一批灯泡的质量,抽取10个样本对其耐用小时进行检测,结果如下:1326 1336 1351 1365 1209 1343 1259 1365 1308 1349,以95%的置信度估计这批灯泡的平均耐用小时。具体操作步骤如下:(1)打开位于光盘文件夹“第3篇 Excel数据分析与处理章节实例第12章 参数估计与分析”工作簿,选定“例12-6灯泡均值”工作表;如图12-12所示。,图12-12“例12-6灯泡均值”工作表,22,(2)选定D1单元格,在【插入】菜单中选择【函数】选项,弹出【插入函数】对话框。(3)在“函数分类”列表中选择“统计”,在“
19、函数名”列表中选择计数函数“Count”,单击【确定】按钮,打开计数函数对话框。(4)在Value1中输入数据范围。在单击A列列头,或输入“A:A”,这相当于选择整个列。单击【确定】按钮。在D1单元格中会显示结果10,即A列中数据的个数。(5)在D2单元格中输入公式“=AVERAGE(A:A)”,计算A列的均值,显示值为1321.1。在D3单元格中输入公式“=STDEV(A:A)”,计算A列的标准差,显示值为50.38397。在D4单元格中输入公式“=D3/SQRT(D1)”,计算标准误差,即标准差除以样本容量的平方根,则显示结果为15.932.81。在D5单元格中输入置信度95%,注意加上百
20、分号。,23,(6)在D6单元格中使用TINV函数计算在95%置信度下的t值。选择D6单元格,在【插入】菜单中选择【函数】选项,弹出【插入函数】对话框,在“函数分类”列表中选择“统计”,在“函数名”列表中选择“TINV”函数。单击【确定】按钮,打开TINV函数对话框,如图12-13所示。(7)在“Probability”中输入“1-D5”,所显示的值是0.05;在“Deg_freedom”中输入自由度的表达式,即“D1-1”,所显示值是9,单击【确定】按钮,在D6单元格中显示值为2.262159。,图12-13 TINV函数,24,(8)在D7单元格中输入计算抽样极限误差的公式,它是Z值和标准
21、误差的乘积,公式为“=D6*D4”,显示值为36.04255。(9)在D8单元格和D9单元格中输入计算置信区间上限和下限的公式,下限为样本均值减抽样极限误差,上限为样本均值加抽样极限误差。其公式分别为“=D2-D7”和“=D2+D7”,显示值为1285.06和1357.14。这样,总体均值的95%的置信区间为:1285.0571357.143。说明这批灯泡的平均耐用时间在95%的置信度下是1285.06小时到1357.14小时之间,根据这个数据可以制定工厂的一系列生产、销售策略。由于所创建公式具有动态链接功能,所以只需在单元格D5中输入99%,便可以得到置信度为99%的置信区间,其结果如下:1
22、299.061372.87。可以输入不同的置信度,以观察其置信区间的变化。置信度越高,下限值越低,上限值越高,置信区间越宽;反之,置信度越低,置信区间越小。,25,总体均值区间估计结果如图12-14所示。,图12-14【例12-6】结果,26,123总体比例P的估计,【例12-7】某食品厂准备上市一种新产品,并配合以相应的广告宣传,企业想通过调查孩子们对其品牌的认知情况来评估广告的效用,以制定下一步的市场推广计划。他们在该地区随机抽取350个小孩作访问对象,进行儿童消费者行为与消费习惯调查,其中有一个问句是“你听说过这个牌子吗?”,在350个孩子中,有112个小孩的回答是“听说过”。根据这个问
23、句,可以分析这一消费群体对该品牌的认知情况。所以,食品厂市场部经理要求,根据这些样本,给定95的置信度,估计该地区孩子认知该品牌的比例。(1)打开位于光盘文件夹“第3篇 Excel数据分析与处理章节实例第12章 参数估计与分析”工作簿,选定“例12-7比例估计”工作表。(2)在B2单元格中输入n值为350。(3)在B3单元格中输入公式“=112350”,用Excel来计算抽样比例值为0.32。(4)在B4单元格中输入公式“=SQRT(B3*(1-B3)/B2)”计算比例标准误差,其显示值为0.024934;,27,(5)在E2单元格中输入置信度0.95。(6)使用函数NORMSINV可以确定Z
24、值。选定E3单元格,输入公式“=ABS(NORMSINV(0.025)”或“=NORMSINV(E2+(1-E2)/2)”,便可确定Z值,单元格E3中将显示1.9599640。(7)在E4单元格中输入公式“=E3*B4”,计算极限误差,其结果显示为0.04887。(8)在E5单元格中输入“=B3-E4”计算置信下限,在E6单元格中输入“=B3+E4”计算置信上限。结果分别显示为0.2711299和0.3688701。结果如图12-15所示。,图12-15【例12-7】结果,28,12.4 样本容量的确定,【例12-8】假定某地区有18000户家庭,对这些家庭进行人均经济收入的简单随机抽样调查。
25、若已知该地区家庭的人均收入的标准差为3000,要求按95%的可靠程度,并将抽样的极限误差控制在500元以内,问至少要对多少人进行调查。(1)打开位于光盘文件夹“第3篇 Excel数据分析与处理章节实例第12章 参数估计与分析”工作簿,选定“例12-8样本容量”工作表。(2)在B1单元格中输入极限误差500,在B2单元格中输入置信度0.95(或95%)。(3)在B3单元格中输入公式“=NORMSINV(B2+(1-B2)/2)”,计算与B2的置信度相应的Z值。显示对应于95%的置信度的Z值为1.959964。(4)在B4单元格中输入标准差3000。(5)在B5单元格中根据样本容量的计算公式,输入
26、公式“=(B32*B42)/B12”,计算样本容量,显示值为138.2925。如图12-16所示。所以至少要对139人进行调查。,29,【例12-9】某仓库对贮藏的一批禽蛋的变质率进行抽样调查,根据以往资料,禽蛋贮藏期的变质率为49%左右,若抽样原极限误差不超过5%,试以90%置信度概率进行抽样调查,问至少要抽取多少禽蛋进行检查?(1)打开位于光盘文件夹“第3篇 Excel数据分析与处理章节实例第12章 参数估计与分析”工作簿,选定“例12-9样本容量”工作表。(2)在B2单元格中输入值49%,在B3单元格中输入置信度0.90(或90%),在B4单元格输入抽样极限误差5%。,图12-16【例1
27、2-8】结果,30,(3)在B5单元格中输入公式“=NORMSINV(B3+(1-B3)/2)”,计算与B3的置信度相应的Z值,显示对应于90%的置信度的Z值为1.64485。(4)在B6单元格中根据样本容量的计算公式,输入公式“=(B2(1-B2)*B52)/B42”,计算样本容量,显示值为270.44612,如图12-17所示。故至少应抽取271个禽蛋进行检查。,图12-17【例12-9】结果,31,12.5 总体标准差及方差的估计,【例12-10】假设上市公司预计的每股收益率服从正态分布,现有8个公司组成一个简单随机样本,2007年的有关数据如表12-1所示,试建立总体方差、总体标准差的
28、95%的置信区间。,表12-1 2007年度上市公司预计的每股收益率,32,(1)打开位于光盘文件夹“第3篇 Excel数据分析与处理章节实例第12章 参数估计与分析”工作簿,选定“例12-10方差估计”工作表。(2)将表12-1中的数据输入“方差估计”工作表的相应单元格中,输入后的工作表如图12-19所示。,图12-19“例12-10方差估计”工作表,33,(3)在D2单元格输入样本容量(n)的值8,在D3单元格计算样本方差得值2.618971。(4)在D4单元格输入置信度:95%。(5)在G2单元格输入右侧置信度0.025,在G3单元格输入左侧置信度0.975。(6)选定G4单元格,打开【
29、插入】菜单,从中选择【函数】选项,打开【插入函数】对话框。(7)在“函数分类”列表中选择“统计”,在“函数名”列表中选择函数“CHIINV”,单击【确定】按钮,打开CHIINV对话框,如图12-20所示。,图12-20 函数CHIINV对话框,34,(8)在“Probability”中输入右侧置信度0.025或E2,在“Deg_freedom”中输入自由度8-1或D2-1,单击【确定】按钮,计算结果为16.01276;(9)在G4单元格重复上面的步骤,打开函数CHIINV对话框,在在“Probability”中输入右侧置信度0.975或E3,自由度不变,单击【确定】按钮,计算结果为1.689869;(10)在D7单元格输入公式:“=(D2-1)*D3)/G4”得方差下限为1.145;(11)在D8单元格输入公式:“=(D2-1)*D3)/G5”得方差下限为10.849;(12)在D9和D10单元格分别对D7和D8单元格开平方,即在D9单元格中输入公式“=SQRT(D7)”按Enter键得1.070,在D10单元格中输入公式“=SQRT(D8)”按Enter键得3.294,结果如图12-21所示。,35,图12-21【例12-10】结果,36,Thank You!,
链接地址:https://www.31ppt.com/p-5337288.html