高级医学统计学课件.pptx
《高级医学统计学课件.pptx》由会员分享,可在线阅读,更多相关《高级医学统计学课件.pptx(62页珍藏版)》请在三一办公上搜索。
1、BootStrap,研究生医学统计学2课程,主要内容,Bootstrap简介参数和非参数Bootstrap不同资料的Bootstrap处理Bootstrap应用实例,统计学的基本过程,我们需要知道的是某些变量的平均和误差执行某些测量若干次误差随着测量次数的增加而减少,中心极限定理,有时候,R2的分布?独立性假设被违背时,回归系数的分布?某些先进方法中的指标分布?随机森林分析中的重要性得分?预测模型的AUC?,“Pulling oneself up by ones bootstraps”,“I found myself stunned,and in a hole nine fathoms und
2、er the grass,when I recovered,hardly knowing how to get out again.Looking down,I observed that I had on a pair of boots with exceptionally sturdy straps.Grasping them firmly,I pulled with all my might.Soon I had hoist myself to the top and stepped out on terra firma without further ado.-Campaigns an
3、d Adventures of Baron Munchausen,1786.吹牛大王历险记,Bootstrap,一种估计抽样误差和计算可信区间的方法。1979 Efron BradleyEfron B(1979).Bootstrap methods:Another look at the jackknife.Ann.Statist.7 12620世纪70年代以来统计学上“唯一的伟大进展”。Kotz and Johnson,1992,Efron Bradley,Bradley Efron博士现任斯坦福大学统计系Max H.Stern讲席教授。Efron教授是公认的当今世界最有影响力的统计学领域的
4、权威。他的主要贡献包括Bootstrap再抽样方法。经验贝叶斯方法,微分几何在统计推断中的应用,生存分析方法,生物芯片数据分析方法等。Efron教授是麦可阿瑟奖获得者,美国国家科学院院士,美国科学与艺术学院院士。他还获得过统计学领域几乎所有的著名奖项,包括著名的Wilks奖章,Parzen奖,Rao奖。2005年,Efron教授获得了美国国家科学奖章(美国自然科学最高奖)以表彰他在统计学领域所作出的杰出贡献。这一奖章在2007年7月27日在白宫举行的一个特别仪式上由时任美国总统乔治 W.布什亲自颁发。,Bootstrap的前身:Jack-knife(刀切法),一种特殊的Bootstrap每个J
5、ackknife样本包括原样本-1个个体,Bootstrap的基本流程,从一个给定的数据中有放回地重复抽样若干次数,得到若干个样本;对于某个样本,计算相应的统计量;得到这个统计量的分布是其真实分布的估计;,Bootstrap:resampling with replacement,D、E、A、C、E、B、A、D、A、,Bootstrap对资料的基本要求,样本必须是总体的代表;照着苹果永远画不出一个桔子出来!,一个最简单的小例子,假设总体是均数为5,标准差为3的正态分布;现有样本包含100个个体;如何求中位数的方差及其95%CI?理论上,手头样本,data 13 4 10 5 5 10 6 1
6、3 4 9 12 6 6 5 3 10 6-1 7 4 2 4 23 2 3 3 0 8 5 2 9 6 4 8 34 8 7 7 7 5 4 4 3 4 1 12 45 9 2 4 4 7 5 6 5 5 9 4 56 10 0 7 5 6 6 3 4 2 2 6 67 6 5 8 11 4-2 8 3 3 8 4 78 1 6 5 5 6 4 7 4 6 8 6 89 4 8 8 7 6 3 9 3 12 10 4 100 2,从中有放回地抽取100个个体,重复20次,resamples1 1 3 12 6 5 3 4 7 2-1-1 7 0 4 5 5 4 7 3 4 7 2 12 8
7、8 10 4 4 0 11 30 7 3 1 4 10 8 4 4 7 10 5 4 6-1 2 4 8 4 12 12 8 0 2 6 8 9 6 6 3 59 4 8 6 4 5 3 5 7 8 7 10 6 6 3 1 6 1 3 10 4 1 2 8 5 4 2 10 4 6 88 2 10 5 9 9 1 4 8 6 4 9 4 5r.median-sapply(resamples,median)5.0 5.0 5.0 5.0 5.0 5.0 5.0 5.0 5.0 4.0 4.5 5.0 5.0 4.0 5.0 5.0 5.0 5.0 5.0 5.0sqrt(var(r.media
8、n)0.5250313 mean(r.median)4.875,求95%CI,利用近似正态分布的原理利用百分位数区间(4,5),什么时候可以用Bootstrap法?,当统计量的理论分布过于复杂或者难于获得时;样本含量偏小,不足以进行统计推断;当需要进行效能计算时,且手头有个小预实验时;需要一个快速的答案。,Bootstrap的分类,参数Bootstrap假设样本来自的总体分布已知;利用手头样本估计总体参数;按照估计出的总体分布产生样本;根据样本计算统计量的分布非参数Bootstrap将手头样本当成总体,从中抽样;,参数和非参数Bootstrap,出生体重和70-100体重间的关系,非参数Boo
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高级 医学 统计学 课件

链接地址:https://www.31ppt.com/p-3905616.html