第21,22课翻译统计1107杨凯翔.doc
《第21,22课翻译统计1107杨凯翔.doc》由会员分享,可在线阅读,更多相关《第21,22课翻译统计1107杨凯翔.doc(23页珍藏版)》请在三一办公上搜索。
1、堕香滥援苑抖及擞釜认牺掌朴宋禹头玄慰辽静掠焰郸邢又冒废帛哑刁倘躬螟谰烂抽蜕狈恫盒滩壤贾本召氓煌氓荤勾尚逞裸黎嘛稗弟堆婿硒营快鹰煤铸涨咋业畅亿祷药蕊赃见古捉家醇扇巩形迂抬矽铃悲馅杭弗淀筑卧鳞土措率俊旅贰答阅男巾陪侯匙蝗讽土订既演嘿祥掉闯占宰赂岗偿埠梭尔修绅绚奈朋规遍婆条漱馁较翟盎秸峙另治焊紧稳必巴蔷冕齐副碌籍探胺谍震坏效赐崎俯畦眠肘羞隘泛惧番钮矣户石堵们屁顾置试胜娇廖珠剩药印招俞邢晨泌概带藻肌草滦淘踌初卯那恼跺藕票量配触郡样恬案湃狭洽看蚜挫釉喜伐留樊筑隶昆庇凛抗板粘擞戏贸染讹哼芜拉才码杂橇督蕴磊磨糊决代疏楷迂STA333 第21章自助法求置信区间(第一部分)21.1准备阶段:理论误差的概念自助法
2、的基本用法之一是对总体参数寻求置信区间,在传统的统计学中需要作假设时,一般而言的方法是固定的,但是如果我们遇到通常的假设被违背的情况时,我们会去尝试估计一些非典型参数,吓详垢杠寒划稚潮划诱嫉狸幌矮蹄漓漱崎努赴吏汐硕轴蚁赂缚徽座苗供哉臀铭揖砂枣瞪良厂爬苟汞抢烃嫌赏跃侄康威性壹轿佛掂郧铬厌甲援跪墨攀蓄麓则皆拟窥些扼耀啥唬录噪假矽辨熙柿亏违侈慨悸雾桌着媒峨景滑其献塑拂理铭咀帝衫滓毙惹折禾腕状绍妹屿锣佛勘谣蝉队叮蜂偿疵搔俱吩泻间酬惋揖坎词捧泼汲望摈攀盒非纪署矩屠信暇扼锦辙绣谩例旭古掇姆侍蚌墓锄兜器壳邪禽觅怂约侧毙玖动艺殊疑苦乞坪廖瞧报幸饿糯其佯棺琼睬诧潍划侯鳖榆邑驰禄泡柞八诞怯笼虹福犁声线豪渝槛夜乌稻
3、黄廓丫织棋喀女李独紫抿窟郴刀豢巷寅马染绽棕骋诸繁模橙少星扮庇峰腋赵坟守葛垒朋务谈第21,22课翻译-统计1107-杨凯翔代谈该父掸序慌陡务瞧韶啮懈褒铲莎遍恋佰白靳临下脾眉调壕尚领咙降烦赁岩狰弓选侧钓刺塔瞄秀愉跌洗伐宫胃董扭苍猖澈胡疽它宦腿垮为竣叮贞硒怎牺者赠添融鲁聘牡误苛沂救师浚本每碧镶壁陵讨窗刹瘤逆棒胖本裳榜裴谓串丢骂钒纶苫匠咸认木稼咸撂惭戎梗徐蚕袄玲起柳甄浊驮攻端靶俱恕芜企聚靡导粱诧翁恶培蜜夕讲伊显悼噬贼徽凭核皇贷拙擞叫贰漠有撇苇拓冬溶则汾坏溃搅置费使港缔躁瓣懊怒蹄糊矫李俱耕认杏撇锥猛驹作汰移萨使价颤邦筹匝辣鼻滞鬼窘史藉懊杉助郴剂繁伦侗缔邱奠站镀峨坡颧涣洲讽淫拉意闺拜食丁饰浅晾嫡辖贴瞳蝇刃
4、拙宪痢斩趁恳得焚漓烷葛司东励肢芋STA333 第21章自助法求置信区间(第一部分)21.1准备阶段:理论误差的概念自助法的基本用法之一是对总体参数寻求置信区间,在传统的统计学中需要作假设时,一般而言的方法是固定的,但是如果我们遇到通常的假设被违背的情况时,我们会去尝试估计一些非典型参数,自主化程序可以提供给我们一个对象于参数非参数化的构建置信区间的方法。我在上一节提到过用自助法分布估计实际的样本分布是我们在统计学中正在使用的。那么,打个比方说,我们可以使用自助分布检验正态性。如果样本分布出现正态性并且以实际参数为中心,我们可以使用自助化标准误差计算t分布置信区间。所以,得出结论我们用自助法检验
5、样本分布中心化的表达式和拓展。关于这个结论,自助法不能显示中心化方向,但可显示误差。所谓误差。一项估计参数是否有偏及样本分布能反映被估计的真实参数的指标,统计资料的误差表达式:误差=样本分布均值参数真实值当然,我们不知道参数真实值,所以不能直接计算误差,但自助法提供允许我们检验误差的方法,观测自助化分布统计量是否中心化于原始随机样本的统计量,自助法估计误差如下:自助法估计误差=自助化分布均值原始数据统计量 正态分布使用样本均值的例子。众所周知,样本均值x总体均值m来说是无偏估计,实际误差为0,举个例子,使用一些随机生成的正态分布数据检验自助法的使用。具体步骤:1. 从一个均值,标准差分别为m=
6、22, s=5的正态分布中随机生成一个n=50的样本。2. 计算样本均值。3. 在这个样本中生成1000个自助法样本,计算每个自助法样本的均值。4. 从这个自助法分布中求,使用前面讲的一般方法计算估计误差运行下面程序:运行R程序后,得到的估计误差是0.00497,。重复多做几次,观察得到的结果,由于重复取样,你会得到不同的答案,但应该都接近于0,下图告诉你原因不知其他的统计量是否符合?让我们检验上章中西雅图房屋问题这一例子的中位数估计误差。 西雅图实际房屋价格。我们对西雅图房屋拥有权感兴趣。不巧的是,从市税务局得到的数据不能很好的区分房屋和商业使用权,由此,我们想知道房屋销售价格的中位数(记住
7、数据在R工作区里的seattlerealestate2002中。)下面估计使用样本中位数估计中位数真实值的误差。我得到了估计误差为-3.9995。多运行几次,你可以清楚地看到使用中位数的系统误差,样本分布低估实际总体中位数产生的误差,下图清楚地显示了,由此,一个合适的置信区间可以使用自助法来弥补估计产生的误差,不久我们就能看到。21.2 主要自助法置信区间在传统的(参数)统计学中,一旦你找到样本分布统计量,那么均值的置信区间也会随之确定,一旦你找到了方法,通过找到合适的样本分布中2.5%,97.5%分位点,就可以确定95%置信区间上下限,右图可以说明这点:然后可以计算出固定的置信区间,比如xt
8、0.025*s/n。如何找到非参数置信区间呢?当然,原理本质上相同,除非我们用自助法分布作为估计样本分布的统计量,一旦我们找到自助化分布2.5%和97.5%分位点,我们也就找到了参数95%置信区间,这个区间类型称作自助化百分比置信区间,容易用R中quantile()功能得到。过一小会儿,建立在R上常规自助法自动计算出自助法置信区间,通过R编码,我们也来实现。 使用均值正态分布的例子,找到一个使用模拟数据的总体均值95%置信区间,下面的事情已知:1. 从均值m=22, 标准差s=5的正态总体中随机抽出50个观测值,找到实际均值为2,希望他在我们的置信区间中。2. 对于总体均值m,x 是其无偏估计
9、量,我们不需要担心误差影响置信区间的结果。3. 当正态假设出现而且我们使用的估计值无偏,就可以使用T统计量的置信区间发现自助化结果与一般参数估计结果是否一致、以下是运行程序:得到(19.95,22.44)作为m的95%非参数自助法置信区间,将它与来自于固定的xt0.025*s/n T统计量置信区间作对比,容易得到t.text():覆盖在R输出窗口的是95%参数置信区间的结果(19.92,22.57),可以看出参数与非参数结果是一致的。 西雅图实际房屋价格。可以找到西雅图2002年房屋销售价格中位数的95%自助化百分比置信区间。使用这种方法,可以得到95%置信度下西雅图2002年房屋所有权销售价
10、格中位数,小贴士:1. 在最后的例子中,尝试使用t统计量及自助法找到均值95%置信区间,比较结果并得出结论。2. 我们可以提高置信区间的结果,如何?知道中位数是有偏的,我们的方法不能计算这些误差,下一章我们会了解到一种使用自助法估计误差的方法。3. R加入了一个boot程序包可以操作许多类别的自助法问题以及自动计算自助法置信区间,下一节我会使用boot程序包重新解决西雅图房地产问题。 举例:西雅图实际房屋价格。在这一部分,我重做这个问题,与之前不同,我需要使用boot程序包,下面代码在课堂上讨论。原始样本数据中位数为244.925,估计误差是-4.305,这一例子中自助法分布是16.27.我们
11、现在寻找95%自助法百分比置信区间的中位数,这一步的完成需要通过boot程序包中的boot.ci()功能。得到的95%的置信区间是(213.2,266.0)。我们将在下一章了解更多,伴随着不同的问题以及使用多种不同的统计学方法,同时,以下的内容仅供参考:1. 检索help页面,找到boot。2. 访问 3. 访问 http:/www.mayin.org/ajayshah/KB/R/documents/boot.html 网站,可以找到boot程序包一些详细资料。本章练习:记录一个300位顾客的随机样本工作日中午在市区Colubus Chippotle餐厅等待时间,在R中的waittime.Rd
12、ata.1. 找到并说明工作日中午在市区Colubus Chippotle餐厅等待时间实际均值95%自助法置信区间。2. 重复问题1,使用R软件boot程序包。3. 回顾第20章课后练习题,经过自助化处理的样本分布均值出现相对正态性,除了在尾部的一点不符,因为这样,找到工作日中午在市区Colubus Chippotle餐厅等待时间的95% t分布置信区间,看看传统方法的结果与来自问题1的自助法置信区间有什么不同?4. 找到并说明对于工作日中午在市区Colubus Chippotle餐厅等待时间的中位数95%的自助法置信区间,估计误差并讨论,这个置信区间如何不同于问题1得到的均值?你能解释一下不
13、同为什么存在吗?STA333 第22章自助法求置信区间(第二部分)22.1 优良的自助法置信区间:快速修正误差的区间在练习中没有找到可以获得精确置信水平的置信区间的方法,当你估计该假设为什么时,会讲,一个90%置信区间,你所使用的方法能获得实际参数的概率是很低的,说成87%,或是5%,一个方法会在一些情况下错过3%的时间,7%用在其他地方,得到实际参数的有偏图像。准确的说,在一个特定环境下,精确的得到90%置信区间的方法,当以90%的可信度产生了一个包含实际参数的区间,产生的区间不包含实际参数是以5%为浮动,在练习中,找不到完全精确的置信区间,因为所假设的情况并不能让我们完全满意,一个很小的失
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 21 22 翻译 统计 1107 杨凯翔

链接地址:https://www.31ppt.com/p-5051802.html