欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    初识统计Firstview.ppt

    • 资源ID:6361996       资源大小:512.50KB        全文页数:19页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    初识统计Firstview.ppt

    统计学导论,第一讲:初识统计,中心任务:有效利用数据,Data Collection:实验设计、抽样调查Descriptive Statistics:summary statistics,graphical methods,smoothingInferential Statistics:参数估计、假设检验、回归分析、分类、预测,统计是科学方法(cf.Wiki)的一部分,Define the questionGather information and resources(observe)Form hypothesis Perform experiment and collect data Analyze data Interpret data and draw conclusions that serve as a starting point for new hypothesis Publish the results Retest(frequently done by other scientists),霍乱的流行病学调查(Snow,1855),关于霍乱(cholera)致病与流行的根源:Imbalance in the humors(choler)of the bodyMiasma,or bad airPoison in the groundJohn Snow(1855)的生物致病学说:致病生物经水、食物到达人体内大量繁殖)病人的排泄物携带致病生物,污染水源和食物)传染给其他人,支持Snow学说的证据,Spread along the tracks of human commerceWhen a ship entered a port where cholera was prevalent,sailors contracted the disease only when they came into contact with residents of the port,对1848 年伦敦霍乱流行的研究,首位病例John Harnold:刚从流行地区汉堡回来的海员第二个病例Blenkinsopp:Harnold死后住进了Harnold的房间两栋邻近的公寓住房:一个发生严重的传染:饮用水受到污染一个未发生传染:饮用水比较干净,1854年的大爆发,通过绘制spot map,发现发病地区集中在the Broad Street pump供水区域此地有些机构传染病例很少,甚至没有:一个是酒厂,工人喜欢酒甚于水,并且有自己的供水泵一个是贫民院,也有自己的供水泵其它地区的受到传染者:多数是因为饮用了the Broad Street pump提供的水,Snow的统计研究,自来水厂的取水河段(Thames河)的污染程度vs 死亡率:水质越差,死亡率越高例外:Chelsea水厂,取水区域污染严重,但它有相当现代的净化设施,绝妙的“实验”,Lambeth水厂1852年从污染河段移到上游干净河段取水Southwark&Vauxhall仍然留在严重污染河段取水两个水厂竞争激烈:客户的特征没有明显差异;相邻住户常常使用不同厂家的水样本量很大,1853-54年的流行病数据,若干统计学名词,Population:全体London居民Sample:两个水厂的供应对象Random sample,sample sizeVariables:饮用水质(好、坏),传染风险Hypothesis:坏的水质是高死亡率的原因Association vs causal relationExperiments vs observational studies,模型:数据的生成机制,随机变量:取值无法预先确知的量随机变量的刻画:分布、分布函数、分布密度、均值、方差统计模型:数据:随机变量(多次重复)的观测值刻画随机变量分布的数学表达式:属于先验知识或假设,本例中的模型,水质X:X=0代表干净水,X=1代表污染水传染风险Y:Y=0代表不受传染,Y=1代表受到传染模型:P(Y=1)=a+bX,其中a,b为非负常数参数估计问题:求a,b的值假设检验:原假设b=0 vs 备择假设b0如何求解:属于统计学的职责,可以采取不同的思路,概率论是必备工具,本例是两组重复Bernoulli实验,Bernoulli实验:投掷硬币(flip coin),实验结果 2 成功,失败,成功概率p20,1N次投掷成功n次的概率CnNpn(1-p)N-n二项分布:n随机变量,N已知数,p参数,受污染水厂:N0=40046,p0=a+b未污染水厂:N1=26107,p1=a观测值:n0=1263,n1=98,参数估计,主要方法:最大似然估计,Bayes估计,矩估计本例:似然函数L(a,b)=(1-a-b)38783(a+b)1263(1-a)26009a98最大似然估计(a,b)=argmaxa,bL(a,b).矩估计:概率a=E(Y|X=0)=P(Y=1|X=0)可以用频率37/104估计,a+b=P(Y=1|X=1)可以用315/104估计,假设检验,考虑新参数q=p0(1-p1)/p1(1-p0),交比b=0,q=1,b0,q1给定t=n0+n1=1361,n1的分布只与q有关,q=1时P(n1=n|n0+n1=t)=CMt-n CNn/CtM+N,其中M=40046,N=26107如果q=1,则在n0+n1=1361的情况下,观测值n198的概率太小了)拒绝b=0,有关霍乱的其他工作,结局,纽约霍乱流行的应对措施:1832、1849年,克制情绪避免胆汁(choler)分泌,用水清洗街道以减少毒气)死亡率没有影响1866年采取隔离措施)死亡率明显降低1878年,Pasteur提出细菌理论,1883年Koch分离出霍乱菌(vibrio)1892年汉堡:von Pettenkofer采取降低地面毒素的措施;最后求助Koch才解决问题,初步的结论,统计远不止报表、计算百分比、平均值统计通常是科学研究的一个关键环节统计通常来自数学以外的应用领域统计很有用概率论是统计学的主要理论工具统计需要数值计算统计不大像传统的数学,作业:搜索Wiki网站的相关内容,目的:认识什么是科学方法,以及统计学在其中发挥的作用不要查阅中文Wiki,其内容很少,

    注意事项

    本文(初识统计Firstview.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开