欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOCX文档下载  

    医学统计学重点终极笔记.docx

    • 资源ID:3340307       资源大小:43.68KB        全文页数:12页
    • 资源格式: DOCX        下载积分:6.99金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要6.99金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    医学统计学重点终极笔记.docx

    医学统计学重点终极笔记Medical Statistics 医学统计工作的内容 实验设计:最关键、最重要 收集资料:最基础 原始资料 实验数据,现场调查资料,医疗卫生工作记录、报告、报表 质量控制:精度和偏倚 整理资料:资料的逻辑、一致性检查,原始数据的加工(频数分布表) 分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断 资料的类型 计量资料:定量方法测定数值大小所得的资料 计数资料:按性质或类别分组,然后计数 等级分组资料:具有计数资料的特性,又有半定量的性质(“+ , -”表示) 变异:不同个体在相同环境下,对外界环境因素发生的不同反应,即个体差异 总体:同质的个体所构成的全体。 同质性,大量性,差异性 样本:从总体中抽取部分个体的过程称为抽样,所抽得的部分是样本。 样本包含的个体数目称为样本含量 样本的特征:代表性 随机性 可靠性 *抽样的要求:代表性,随机性,可靠性,可比性 完全随机设计:将受试对象随机分配到各处理组或对照组中,或分别从不同总体中随机抽样进行研究。可为两样本或多样本得比较,但样本含量不宜相差太大。 随机区组设计:也称配伍设计,是配对设计的扩展。配对设计的每一“对子”中的受试对象分别随机分到两个处理组中,而配伍组设计中的每个“配伍组”,包含多个受试对象,要将它们分别随机分到各处理组中。 误差:泛指观测值与真实值之差,以及样本统计量与总体参数之差 系统误差:在收集资料过程中,由于仪器调整、试剂校验、医生对疗效的掌握等因素,造成观察结果倾向性的偏大活偏小。要尽量查明原因,必须克服。 随机测量误差:在收集资料过程中,即使系统误差已经避免,由于各种偶然因素的影响造成对同一对象多次测定的结果不完全一致。譬如操作员技术、电压、环境温度的差异。 没有固定的倾向,时高时低;应采取措施加以控制。 抽样误差:由抽样不同引起的样本均数与总体均数之间的差异。原因是个体之间存在变异,抽样时只能抽取总体的一部分作为样本。 不可避免,要用统计方法进行正确分析。 概率:描写某一事件发生可能性大小的一个度量。 频率:样本实际发生率 小概率事件:P<=0.05(差别有统计学意义)或P<=0.01(差别有高度统计意义)的事件 变量:观察单位的某些特征 变量值:观察、测定的结果 频数表:同时列出观察指标的可能取值区间及各区间的频数 集中趋势:变量值的集中位置 离散趋势:变量值围绕集中位置的分散情况 平均数:描述一组观察值集中位置或平均水平的统计指标。常作为一组数据的代表值用于分析或进行组间比较。 适用条件:对称分布或偏度不大的资料,尤其适合正态分布 算术均数:简称均数,说明一组观察值平均水平或集中趋势(描述计量资料) 几何均数(G):描述观察值间按倍数关系变化的资料的平均水平,如滴度、浓度、血清效价、细菌计数。 中位数(M):观察值按从小到大排列时,居于中心位置的数值。 n为奇数时,M=第(n+1)/2项 n为偶数时,M=第n/2项和第(n/2+1)项的平均值 适用条件:分布明显呈偏态;频数分布的一端或两端无确切值 百分位数(P):在一组数据中找到一个数值Px,全部观察值的x%小于Px。 P25, P75描述资料的离散程度 P2.5, P97.5规定医学95%的参考值范围 极差(R):即全距,观察值中最大值与最小值之差。不适用于开口资料 四分位数间距(Q):一组观察值按大小排序后,分成四个数目相等的段落,每段观察值占总例数的25%,去掉两端含有极端数值的25%,取中间50%的数据范围即为Q。 Q=P75 - P25 Q越大,则数据变异越大 平均偏差:各观察值偏离平均数的平均差距。即各观察值与均数之差的绝对值之和的平均。 离均差平方和:通过取平方避免正负抵消 方差:离均差平方和再取平均,分母用自由度v=n-1代替 *自由度(v):在所有的n个离均差平方项中,只有n-1个是独立的。 标准差(S):将方差取平方根,还原为与原始观察值单位相同的变异量度 标准差变异系数(CV):均数相差较大或单位不同的几组观察值的变异程度的比较 正态分布曲线下的面积 横轴: f=2.58, 1.96, 1, 0(居中) 对应99%, 95%, 68.3% 单侧,f=2.33,1,645, 1, 0 正态分布的特征 均数处最高,以均数为中心,两端对称 中心对应的f(x)最大;x越远离,f(x)越趋近于0,但不会为0 永远不与x轴相交的钟型曲线 有两个参数:均数位置参数;标准差形状参数 正态曲线下的面积分布有一定规律 正态分布具有可加性 标准正态分布:均数=0,标准差=1的正态分布。 转化公式: 适用条件总结:样本标准差 正态,对数正态 变异系数 单位不同或均数相差较大 四分位数间距 偏态 医学参考范围:也称正常值范围,正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各数据的波动范围。 制定方法 单侧 双侧 参考范围对应的百分位数 (Px=) 5 , 95; 1 , 99 2.5 , 97.5; 0.5 , 99.5 参考范围对应的正态分布区间(f=) 1.65; 2.33 1.96; 2.58 抽样误差:由抽样造成的样本均数和总体均数的差异。是不可避免的 中心极限定理:在样本含量n很大(>=50)的情况下,无论原始测量变量服从什么分布,的抽样分布都近似服从正态分布N 标准误:反映样本均数间变异的标准差。 理论值 估计值 参数估计:由样本统计量估计总体参数。 点估计:使用单一的数值直接作为总体参数的估计值。如用估计相应的 区间估计:按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。 可信度:事先给定的概率1-(通常取0.95或0.99);计算得到的是可信区间 95%可信区间 假设检验:即显著性检验,是统计推断的重要内容,比较总体参数之间有无差别。 首先对所需比较的总体提出一个无差别假设,然后通过样本数据去推断是否拒绝这一假设。 基本步骤:建立假设和确定检验水准 选择检验方法和计算检验计量 确定P值,作出统计推断 无效假设:H0,指需要检验的假设,如*值治疗前后无差别 即H0:d=0 通常与我们要验证的结论相反,是计算检验统计量和P值的依据 备择假设:是在H0成立证据不足的情况下而被接受的假设 即H1:d0 双侧检验:无论正或负方向的误差,若显著超出检验水准则拒绝H0 单侧检验:仅在正方向或负方向误差超出规定的水准时拒绝H0 P值:假设检验下结论的主要依据,是指在原假设成立的条件下,观察到的样本差别是由于机遇所致的概率。 P>0.05 不显著 0.01<P<=0.05 显著 P<=0.01 非常显著 单样本的t检验 配对样本均数t检验:受试对象依特征配对,随机分别分配到两个实验组 两独立样本均数t检验:两总体服从正态分布,且总体方差齐 方差齐性:两独立样本的总体方差 方差不齐时两样本均数的t检验 方差齐性检验 (P>0.05,可认为总体方差齐) t检验 u检验:总体标准差已知,或样本量较大时,样本均数与总体均数的比较 t检验中的注意事项 样本资料必须能代表相应总体 t检验以正态分布为基础;非正态数据尝试变换为正态,或用非参数检验 完全随机设计的两样本均数比较,要求两组方差齐 对同一资料作单侧检验更容易获得显著结果 假设检验用于推断总体均数间是否相同;可信区间用于估计总体均数所在范围 假设检验中的两类错误 第一类错误:当为真时,拒绝接受。又称假阳性错误,阳性指两者总体参数有差异。检验水准是预先规定的犯错概率的最大值 第二类错误:当为假时,不拒绝。又称假阴性错误。概率大小用表示,只取单侧,一般未知。 可证,越大越小,越小越大。增大样本含量可同时减小两类错误。 方差分析:将全部观测值的总变异按影响因素分为相应的若干部分变异,在此基础上,计算假设检验的统计量F值,实现对总体均数是否有差别的推断。 条件:来自于正态分布总体,且总体方差相等的k个样本均数的比较(k>=3) 完全随机设计:又称单因素方差分析,将实验对象随机分配到不同处理组的单因素设计方法。只考虑一个处理因素 总变异 :n个观测值的离均差平方和 组间变异 :组内均值与总均值之差的平方和 组内变异 :组内各个观测值与本组内均值之差的平方和 完全随机设计的方差分析表 F= 随机区组设计:又称配伍组设计,先将受试对象按条件相同或相近组成m个区组,每个区组中有k个受试对象,再将其随机地分到k个处理组中。 随机区组设计的方差分析表 相对数:比较分析现象间的发展关系。把基数化作相等,便于比较 *绝对数:研究事物现象的基本资料 率 构成比 相对比 相对数使用的注意事项 构成比只能说明某事物内部各组成部分的比重和分布,不能说明该事物某一部分发生的强度和概率。 分母过小时相对数不稳定 用以比较的资料应是同质的 要考虑存在的抽样误差,对总体进行推断时应作统计学检验 率的标准化:为了比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成的影响。 标准构成:选取有代表性、较稳定、数量较大的人群构成为标准 选择相互比较的各组例数合计为标准构成 从比较的各组中任选其一作为标准构成 死亡率:某地某年每1000人中的死亡率 年龄别死亡率:某地某年龄组每1000人口中的死亡数 死因别死亡率:某年每10万人中,由于患某疾病死亡的人数 死因构成:相对死亡比,某种死因引起的死亡人数占总死亡人数的百分比 发病率:某一时期内特定人群中患某病新病例的频率 患病率:某一时点某人群中患某病的频率 病死率:某期间内,某病患者因某病死亡的频率 治愈率:接受治疗的病人中治愈的频率 检验:英国统计学家Peason提出的一种用途广泛的假设检验方法。该检验以分布为理论依据,可以推断两个总体率以及构成比之间有无差异。 四格表资料的检验 理论频数 四格表资料检验专用公式 四格表检验校正公式 通常规则:n40且所有的T5 基本公式 n40但有1T<5 校正公式 n<40,或T<1 Fisher确切概率法 配对四格表资料的检验 观察结果的四种情况:A+, B+ a A+, B- b A-, B+ c A-, B- d 公式:, =1 (b + c) 40 , =1 (b + c) < 40 行列表资料的检验 专用公式:, =(行数- 1)(列数- 1) 条件:1<T<5的格子数,不能超过总格子数的1/5;不能有T<1 与分类变量的顺序无关 对于有序的RC表资料不宜用检验 非参数检验:不考虑总体的参数和总体的分布类型,对总体的分布或分布位置进行检验的方法。 适用于:总体分布为偏态或分布未知的计量资料 等级资料 个别数据偏大,或数据的某一端无确定数值 各组离散程度相差悬殊,即各总体方差不齐 特点:适用范围广,不限方差齐性、变量类型、样本量 损失了部分信息,检验效率低 极度偏态,犯第二类错误的概率较大 编秩次,求秩和 依差值绝对值, 两样本比较的秩和检验 Wilcoxon Mann-Whitney test 相同资料较多时,采用校正公式 多个样本比较的秩和检验 H检验 相关系数:说明具有直线关系的两个变量间相关密切程度和相关方向的统计量 lXY表示X与Y的离均差平方和;相关系数r没有测量单位,-1<=r<=1 线性相关分析的注意事项 首先绘制散点图,若呈直线趋势,再计算相关系数和作假设检验判断相关关系 两变量都服从正态分布 相关系数仅是样本相关系数,不能直接估计总体 相关系数不能描述因果关系 线性回归 回归系数 应用:分析两个变量之间是否存在线性依存关系 利用回归方程对因变量Y进行估计 利用回归方程进行统计控制 线性回归分析的注意事项 两个内在有联系的变量,回归分析才有意义 若存在依存因果的关系,则原因变量设为X,结果变量设为Y 因变量是服从正态分布的随机变量;自变量可随机,可给定 不要把估计范围扩大到建立方程时的自变量取值范围之外 线性相关与回归的区别 相关系数的计算只适用于两个变量都服从正态分布的情形; 回归分析中,因变量随机,自变量随机;或是给定的量 线性相关表示两个变量间的相互关系,是双向的; 回归反映两个变量之间的依存关系,是单向的 线性相关与回归的联系 同一资料进行相关与回归分析,相关系数r与回归方程中的b正负号相同 同一样本的r与b的假设检验是等价的 相关与回归可以互相解释 确定系数:,越接近1,回归效果越好 *等级相关 (Spearman) 的假设检验 确定P值:n50时,由等级相关系数界值表确定 n>50时,可查r界值表,自由度=n-2 统计表 结构:标题,标目,线条,数字,备注 三横线表:顶线,中间线,底线 统计图 结构:标题,图域,标目,图例,刻度 直条图 纵坐标从0开始 单式 复式 构成图 百分比条图 线图:线段的升降表示指标的连续变化趋势。<变化速度> 适用于描述一个变量随另一个变量的变化趋势 半对数线图:主要数据随分组变量变化的趋势 相对数指标 <发展趋势> 两组数据相差大时,表示发展速度 直方图:用直条矩形面积代表各组频数,各矩形面积的总和代表频数之和。 表示连续变量频数分布的情况 纵轴刻度必须从0开始 箱图:用于比较两组或多组资料的集中趋势和离散趋势。 中间的横线表示中位数 长度表示四分位数间距 两端分别是P75和P25 散点图:用点的密集程度和变化趋势来表示两指标之间的直线相关关系。 数值变量:其变量值是定量的,表现为数值大小,可经测量取得数值,多有度量衡单位。如身高、体重、血压、脉搏和白细胞计数等。这种由数值变量的测量值构成的资料称为数值变量资料,亦称为定量资料。

    注意事项

    本文(医学统计学重点终极笔记.docx)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开