医学统计学重点.docx
《医学统计学重点.docx》由会员分享,可在线阅读,更多相关《医学统计学重点.docx(32页珍藏版)》请在三一办公上搜索。
1、医学统计学重点 医学统计学 医学统计学重点 第一章 绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、
2、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: 定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所 得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的 数值,有度量衡单位。 分类资料:包括无序分类资料和有序分类资料 计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及
3、其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。 1 医学统计学 第二章 实验研究的三要素 1.实验设计三要素:被试因素、受试对象、实验效应 2.误差分类:随机误差、系统误差、过失误差。 3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。 4.实验设计方法 有 析因设计 正交试验设计 均匀试验设计 交互作用 两组 :异体
4、配对设计 同体配对设计 交叉设计 无 随机同期对照实验设计 扩展 多组:单因素多水平 配伍组设计 拉丁方设计 配伍组设计:也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配到各处理组中。 析因设计:考察两个或两个以上的处理因素,将各个因素的水平进行全面组合,每个组合下至少有两个以上的观察对象重复测量。一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。 拉丁方设计:用于三因素等水平无交互。 第三章 定量资料的统计描述、参考值范围 1.频数表编制过程 找出样本数据的最大值和最小值,计算极差 R;
5、分组:确定分组的组距 d 和组数 k; 一般n100,10-15组 求频率密度:统计频数,算出频率、频率密度和累积频率; 画出直方图。 2.频数表和直方图的作用:用于观察个数较多资料的统计描述,可以直观提示资料的分布特征和分布类型。 2 医学统计学 3.集中趋势、离散趋势的指标及适用范围 集中趋势:x,G,M,Px,M0 算术均数:适用于对称分布; 不适用于偏态分布和资料中出现极值的资料。 几何均数:适用于呈倍数关系的资料或对数正态分布的资料,尤其是正偏态分布。 不适用与观察值中有0或正负数值同时出现的资料。 中位数:适用于大样本偏态分布或分布情况不明的资料或资料中有不确定数值的资料。 百分位
6、数的作用:多个百分位数结合使用,全面描述数据分布的特征; 用于确定医学参考值范围。 众数:适用于大样本,较粗糙。 离散趋势: 极差:优点:简单明了、容易使用。 缺点:只反映最大值和最小值间的差异,不能反映其他观察值的变异程度。 样本容量越大,极差可能越大。 极差的抽样误差大,不稳定。 四分位数间距:适用于确定医学参考值范围,与中位数一起描述偏态分布资料变异程度。 缺点:类似于极差,利用度低。 方差与标准差:与均数一起描述对称分布,特别是正态分布的分布特征。 变异系数:适用于:适用于比较度量衡单位不同资料的变异度。 比较均数相差悬殊的资料的变异度。 衡量实验精密度和稳定性的常用指标。 频数分布特
7、征 高峰在中间,左右大致对称,称为对称分布。 平均数=中位数=众数 高峰偏向小值的一侧,称正偏态分布。 平均数中位数众数 高峰偏向大值的一侧,称负偏态分布。 平均数中位数众数 对称分布 正特点:f关于x=对称 x=时取得最大值 在x=处为拐点,且以 x 轴为水平渐近线 f大于0 P=0 若 f(x) 在点 x 处连续,则F=f(x) 意义:+-f(x)=1,f在负无穷到正无穷的积分值为1,即曲线下方面积为1。 5.和2的意义 :位置参数,当固定时,增大,曲线沿横轴向右移动;减小,曲线沿横轴向左移动。 2:形状参数,当固定时,越大,曲线越矮胖;越小,曲线越高瘦。 6.标准化变换 x- xN zN
8、 x-x- F= P=1- P=1- P= 4 医学统计学 8.正常值范围及意义 概念:医学临床中,常将就诊者的某些生理、生化、免疫学指标的测定结果,与排除了对研 究指标有影响的疾病和有关因素的大多数“正常人”的相应数值进行比较,以就诊者 的测定值是否超出了大多数“正常人”相应指标的波动范围,作为临床诊断的重要参 考,又称医学参考值范围。 意义:95%的参考值范围含义是指:样本中有95%的个体测定值在所求范围之内。 以95%的置信区间来说,意义是:该区间以95%的概率包含了待估计的参数,这种 估计的可信度是95%,会冒5%的风险。 公式: 双侧95%的界限值:x1.96s 单侧95%的上限值:
9、x+1.645s 单侧95%的上限值:x-1.645s 第四章 总体均数的估计、假设检验 1.标准误 概念:每次样本计算出的x不同,这些x的标准差称为均数的标准误。 意义:是衡量样本统计量抽样误差大小的统计指标。 与标准差的区别:二者都是描述变异程度的指标,标准差描述个体值的变异,标准误描 述统计量的变异。 均数标准误的公式:Sx=s n2.置信区间 定义:设为总体的未知参数,若由样本确定的两个统计量1=1-, 则称随机区间为的1-置信区间,其中称为1置信下限,称为2 置信上限,1-称置信度。 5 医学统计学 意义:区间包含有参数的概率为1-,不能说在的概率为 1-。 例:可以说包含均数的概率
10、为95%,不能说在的概率为95%。 公式:单个正态总体均数的区间估计 已知: 双侧:xzas 即 xzasx 2n2 z分布 单侧:xzasn 未知: 即 xzasx s 即 xtasx n2 双侧:xta2 小样本 t分布 单侧:xta 双侧:xza2s 即 xtasx ns 即 xzasx n2 大样本 z分布 单侧:xza 两要素: 准确度:由1- 决定,1- 越大,准确度越高。 精确度:由区间长度决定。 99%置信区间准确度高于95%置信区间。95%置信区间精确度更高。 s 即 xzasx n3.抽样分布 t分布 定义: 来自正态总体的一组样本,x和s分别是样本的均数和标准差。则t=x
11、-m s/n t分布,自由度 df=n-1,极限分布是标准正态分布。 图形分布特征: 以0为中心,左右对称的单峰分布。 自由度越大,越高瘦 6 医学统计学 界值: 双侧: P(|t|t)=1- P(tt)= 222 单侧: 上限: 下限: P=1- P= P= P=1- 2分布 定义:若从均数为,标准差的正态总体中,每次抽取样本含量为n的样本,计算 样本标准差s,则2=s2/2服从自由度df=n-1的2分布。 图形分布特征: 曲线偏向左边 自由度越小曲线越偏 界值: 双侧: 2a2x1- P(xx)= P(x 2)=1-2222a222x1- P(xx)=1- P(xF)= P(FF221-a
12、)=1- 22 P(FF)=1-22 P(F,则接受 H0,拒绝H1 ;若P时,接受H0,可能犯类错误。此时,虽然未知,但P值越大,犯 类错误的概率越小,结论越可靠。 减少I型错误,将会增加II型错误 增大n,可以同时降低两类错误。 第五章 方差分析 1.方差分析基本思想 目的:根据各个总体的样本观测值,检验各个总体均值间和两两总体均值间是否存在显著性 差异。 基本思想:根据离差来源的不同,将总离差平方和分解为两部分: 由试验的随机因素引起的组内离差, 由因素的作用引起的组间离差。 总离差平方和 = 组内离差平方和+ 组间离差平方和 2.方差分析 单因素方差分析、配伍组设计方差分析、析因设计方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 重点
链接地址:https://www.31ppt.com/p-3340252.html