数值变量资料的统计分析-统计推断.ppt
《数值变量资料的统计分析-统计推断.ppt》由会员分享,可在线阅读,更多相关《数值变量资料的统计分析-统计推断.ppt(44页珍藏版)》请在三一办公上搜索。
1、,第二节 数值变量资料的统计分析统计推断 Statistical inference,信阳职业技术学院 赵玉霞,主要内容,一 均数的抽样误差与标准误二 t分布三 总体均数的估计四 均数的假设检验,学习目标,1.说出抽样误差的概念2.记住标准误计算公式并能说出公式的含义3.描述t分布的特征及应用4.说出参数估计的含义及方法5.描述均数检验t检验和u检验的方法,统计推断,如:总体均数 总体标准差 总体率,如:样本均数 样本标准差S 样本率 P,内容:参数估计(estimation of parameters)包括:点估计与区间估计2.假设检验(test of hypothesis),统计推断 st
2、atistical inference,一 均数的抽样误差,抽样误差(sampling error):由于个体差异导致的样本统计量之间或与总体参数间的差别。,从某正态分布总体中,随机抽取样本含量n100的样本,每次抽样获得其均数分别为,他们之间及与 总体均数总是不相等。这种差异就是抽样误差。,1.抽样试验,从正态分布总体N(5.00,0.502)中,每次随机抽取样本含量n5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。按上述方法再做样本含量n10、样本含量n30的抽样实验;比较计算结果。,抽样试验(n=5),
3、抽样试验(n=10),抽样试验(n=30),1000份样本抽样计算结果,3个抽样实验结果图示,抽样实验小结,均数的均数围绕总体均数上下波动。均数的标准差即标准误 与总体标准差 相差一个常数的倍数,即 样本均数的标准误(Standard Error)=样本标准差/从正态总体N(,2)中抽取样本,获得均数的分布仍近似呈正态分布N(,2/n)。,2.中心极限定理(central limit theorem),即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。随着样本量的增大,样本均数的变异范围也逐渐变窄。,随机变量XN(m,s2),标准正态分布N(0,12),u变换,均数,标准正态分布N(0,1
4、2),Student t分布自由度:n-1,二 t分布,t分布曲线,t 分布有如下特征:是以0为中心随自由度而变化的一簇左右对称的曲线 单峰分布,曲线在t0 处最高,并以t0为中心左右对称与正态分布相比,曲线最高处较矮,自由度越小,两尾部翘得越高(见绿线)随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。,t分布曲线,t 分布有如下特征:自由度相同时,t越大,p值越小p值相同时,自由度越大,t值越小 t值相同时,自由度越大 p值越小,(t1t2,p1p2),(n1n2,t1t2),(n1n2,p1p2),t分布曲线下面积,单侧t0.05,91.833双侧t0.05/2,92.262
5、 单侧t0.025,9单侧t0.01,92.821双侧t0.01/2,93.250 单侧t0.005,9双侧t0.05/2,1.96 单侧t0.025,单侧t0.05,1.64,3.250,2.821,三 总体均数的估计,1.总体均数的估计(1).总体均数的点估计(point estimation)与区间估计(2).总体均数的可信区间(confidence interval,CI)(3).大样本总体均数的可信区间2.可信区间的解释,1.总体均数的估计,(1).总体均数的点估计与区间估计,参数的估计,点估计:由样本统计量 直接估计 总体参数,区间估计:在一定可信度(1-)下,同时考虑抽样误差,区
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数值 变量 资料 统计分析 统计 推断
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6050038.html