欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    统计学第9章分类数据分析.ppt

    • 资源ID:6599305       资源大小:335KB        全文页数:38页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学第9章分类数据分析.ppt

    第 9 章 分类数据分析,第 9 章 分类数据分析,9.1 分类数据与c2统计量 9.2 拟合优度 检验9.3 列联分析:独立性检验9.4 列联分析中应注意的问题,学习目标,1.理解分类数据与c2 统计量掌握拟合优度检验及其应用掌握独立性检验及其应用掌握测度列联表中的相关性,9.1 分类数据与c2统计量,9.1.1 分类数据9.1.2 c2统计量,9.1.1 分类数据,数据的类型与列联分析,分类数据,分类变量的结果表现为类别例如:性别(男,女)各类别用符号或数字代码来测度使用分类或顺序尺度你吸烟吗?1.是;2.否你赞成还是反对这一改革方案?1.赞成;2.反对对分类数据的描述和分析通常使用列联表可使用检验,9.1.2 统计量,统计量,用于检验分类变量的拟合优度计算公式为,作用:判断实际观察值与理论期望值是否一致。,9.2 拟合优度检验(一个分类变量的检验),拟合优度检验(例题分析),【例9.1】1912年4月15日,豪华巨轮泰坦尼克号与冰山相撞沉没。当时船上共有共2208人,其中男性1738人,女性470人。海难发生后,幸存者为718人,其中男性374人,女性344人,以0.05的显著性水平检验存活状况与性别是否有关。,拟合优度检验(例题分析),解:1.提出假设:H0:观察频数与期望频数一致(无关)H1:观察频数与期望频数不一致(有关)2.构建统计量:,拟合优度检验(例题分析),3.求临界值:自由度的计算为df=R-1 R为分类变量类型的个数。在本例中,分类变量是性别,有男女两个类别,故R=2,于是自由度df=2-1=1,经查分布表,0.05(1)=3.84154.决策:拒绝H05.结论:说明存活状况与性别显著相关,9.3 列联分析:独立性检验,9.3.1 列联表9.3.2 独立性检验(两个分类变量的相关(独立)性检验),9.3.1 列联表(contingency table),检验在列联表中的应用(独立性检验),1.列联表的基本概念(1)列联表(Contingency table)是由两个或两个以上定类变量进行交叉分类的频数分布表。一般形式为:RC,注意:R行,C列;Nij表示的是第i行第j列的频数。,(2)列联表中变量的独立性:如果变量x与变量y之间没有关系,就称其相互独立。即P(AB)=P(A)P(B),独立性检验(例题分析),【例】一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如下表。检验各地区与原料等级之间是否存在依赖关系(0.05),独立性检验(例题分析),独立性检验(例题分析),提出假设:H0:地区与原料等级之间独立H1:地区与原料等级之间不独立=0.05;df=(3-1)*(3-1)=4临界值(s):,统计量:,决策:在=0.05的水平上拒绝H0结论:地区和原料等级之间存在依赖关系,2.列联表独立性检验例:检验收看节目与年龄是否有关,随机抽取100人调查。,第一步:提出假设H0:节目与年龄无关(相互独立)H1:看节目与年龄有关(相互不独立)第二步:构建统计量利用公式:先计算期望频数分布,如上表括号中的数据,第三步:求临界值:,(注意:列联表的df=(r-1)(c-1);按右侧检验方法),第四步:决策:,第五步:结论:所以看节目与年龄有关。,练习题,一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生调查,得到的结果如下,,以显著性水平为0.05检验男女学生对上网收费的看法是否相同。,练习题分析,提出假设:H0:男女看法相同H1:男女看法不同=0.05,df=(2-1)(2-1)=1临界值:,统计量:,决策:在=0.05的水平上不能拒绝H0结论:可以认为男女学生对上网收费的看法是相同,9.4 列联表中的相关测量,9.4.1 相关系数9.4.2 列联相关系数9.4.3 V 相关系数,列联表中的相关测量,品质相关对品质数据(分类和顺序数据)之间相关程度的测度列联表变量的相关属于品质相关列联表相关测量的统计量主要有 相关系数 c相关系数V 相关系数,9.4.1 相关系数(correlation coefficient),测度22列联表中数据相关程度对于22 列联表,相关系数的值在01之间 相关系数计算公式为,相关系数(原理分析),一个简化的 22 列联表,相关系数(原理分析),列联表中每个单元格的期望频数分别为,将各期望频数代入 的计算公式得,相关系数(原理分析),将入 相关系数的计算公式得,ad 等于 bc,=0,表明变量X 与 Y 之间独立若 b=0,c=0,或a=0,d=0,意味着各观察频数全部落在对角线上,此时|=1,表明变量X 与 Y 之间完全相关,列联表中变量的位置可以互换,的符号没有实际意义,故取绝对值即可,9.4.2 列联相关系数(coefficient of contingency),用于测度大于22列联表中数据的相关程度计算公式为,c的取值范围是 0c1c=0表明列联表中的两个变量独立c的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大根据不同行和列的列联表计算的列联系数不便于比较,V 相关系数(V correlation coefficient),计算公式为,V的取值范围是 0V1V=0表明列联表中的两个变量独立V=1表明列联表中的两个变量完全相关不同行和列的列联表计算的列联系数不便于比较当列联表中有一维为2,min(r-1),(c-1)=1,此时V=,列联表中的相关测量(例题分析),【例】一种原料来自三个不同地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如下表。分别计算系数、c系数和V系数,并分析相关程度,列联表中的相关测量(例题分析),解:已知n=500,19.82,列联表为33,结论:三个系数均不高,表明产地和原料等级之间的相关程度不高,、c、V 的比较,同一个列联表,、c、V 的结果会不同不同的列联表,、c、V 的结果也不同在对不同列联表变量之间的相关程度进行比较时,不同列联表中的行与行、列与列的个数要相同,并且采用同一种系数,本章小结,拟合优度检验独立性检验测度列联表中的相关性作业:P234T9.2 P234T9.3,结 束,

    注意事项

    本文(统计学第9章分类数据分析.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开