《应用统计复习》PPT课件.ppt
《《应用统计复习》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《应用统计复习》PPT课件.ppt(63页珍藏版)》请在三一办公上搜索。
1、第一章 数据与统计学,统计学的产生和发展统计数据的来源统计数据的质量统计学的基本概念,统计调查的方式,统计调查(主要用来取得社会经济数据),统计数据的质量,第二章 统计数据的描述,数据的计量尺度统计数据的整理分布集中趋势的测度分布离散程度的测度分布偏态与峰度的测度统计表与统计图,第二章 统计数据的描述,数据的计量尺度列名尺度(nominal scale)性别、民族顺序尺度(ordinal scale)产品等级、满意度 间隔尺度(interval scale)百分制成绩、温度、年龄比例尺度(ratio scale)产量、产值、利润,品质标志,数量标志,第二章 统计数据的描述,分布集中趋势的测度众
2、数中位数均值对分组数据进行计算的公式,常用函数,平均值 average(array)众数 mode(array)中位数 median(array)四分位数 quartile(array,n)n=01234几何平均数 geomean(array)切尾均值 trimmean(array,percent)偏态系数 skew(array)峰度系数 kurt(array)方差(样本)var(array)标准差(样本)stdev(array),第三章 概率分布与抽样分布,概率分布常用抽样方法抽样分布中心极限定理的应用,正态分布,XN(、2),其概率密度为:NORMDIST(X,0)正态分布随机变量的均值和
3、标准差 均值 E(X)=方差 D(X)=2,-x,正态分布曲线的主要特性,关于x=对称的钟形曲线参数决定正态曲线的中心位置参数 决定正态曲线的陡峭或扁平程度以X轴为渐近线,即当x 时,f(x)0,标准正态分布,0、1的正态分布,记为N(0,1)其概率密度(x)分布函数(x),NORMSDIST(Z)XN(、2),则:ZN(0,1)若 ZN(0,1),则有:P(|Z|a)2(a)1(-a)=1(a),标准化,正态分布,正态分布,常用的抽样方法,抽样调查是一种常用的统计技术,其目的在于用样本统计量推断我们所关心的总体参数。,中心极限定理(central limit theorem),中心极限定理:
4、设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,样本均值抽样分布的特征,样本均值的数学期望样本均值的方差重复抽样不重复抽样,抽样平均误差抽样标准误差,样本比例(率)抽样分布的特征,当样本容量很大时,样本比例的抽样分布可用正态分布近似 样本比例的数学期望样本比例的方差重复抽样不重复抽样,中心极限定理的应用,例3.33练习题3-23,第四章 参数估计,基本原理一个总体均值的区间估计一个总体比率的区间估计,由样本统计量所构造的总体参数的区间估计,称为置信区间(confidence interval),其中区间的最小值称
5、为置信下限,最大值称为置信上限。将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率称为置信水平(confidence level),或称为置信系数(confidence coefficient)。一般将称为显著性水平,1-置信水平,置信区间示意图,一个总体均值的区间估计,总体均值m所在(1-a)置信水平下的置信区间为:,za/2是标准正态分布上侧面积为/2时的z值。,表5.3 常用置信水平的za/2值,99%,95%,0.05,置信水平,a,a/2,za/2,1.645,90%,0.10,0.05,0.01,0.025,1.96,0.005,2.58,允许误差,不同情况总
6、体均值的区间估计,总体分布,样本容量,s未知,大样本(n30),s已知,正态分布,小样本(n30),大样本(n30),非正态分布,一个总体比率的区间估计,样本比例置信区间的确定如在40000个家庭中抽取了400个家庭,样本中拥有家用计算机的家庭有72个,试估计总体拥有计算机比例的置信区间。怎么算?,第五章 假设检验,基本原理一个总体均值的检验一个总体比率的检验,基本问题,假设的陈述“假设”(hypothesis)就是对总体参数的具体数值所作的陈述。假设检验(hypothesis test)也就是利用样本信息判断假设是否成立的过程。比如:一家食品生产企业以生产袋装食品为主,每天的产量为8000袋
7、左右。按规定每袋的重量应为100g。为对产品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。,在假设检验中,首先需要提出两种假设,即原假设和备择假设。原假设(null hypothesis)通常是研究者想收集证据予以反对的假设,也称为零假设,用H0表示。备择假设(alternative hypothesis)通常是利用研究者想收集证据予以支持的假设,也称为研究假设,用H1和H表示。备择假设通常是用于支持你自己的看法。确定原假设和备择假设,在假设检验中十分重要,它直接关系到检验的结果。,在假设检验中,研究者感兴趣的备择假设的内容,可以是原假设H0在某一特定方向的变化,也可以
8、是一种没有特定方向的变化。如果备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)。研究者感兴趣的备择假设没有特定的方向,只是关心备择假设H1是否不同于原假设H0,并不关心是大于还是小于,如果备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或称双尾检验(two-tailed test)。,表5.1 假设检验的基本形式,两类错误与显著性水平,两类错误与显著性水平当原假设为真时拒绝原假设,所犯的错误为第I类错误(type I error),又称为弃真错误。犯第I类错误的概率通常记为a。当原假设为假时没有拒绝原假设,所犯的
9、错误称为第II类错误(type II error),又称为取伪错误。犯第II类错误的概率通常记为b。,假设检验的结论与后果,显著性水平、拒绝域和临界值,利用P值进行决策如果原假设H0为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值(P-value),也称为观察到的显著性水平(observed significance level)。要测量出样本观测数据与原假设中假设的值m0的偏离程度,则需要计算P值。如果仅根据显著性水平来检验假设,所有的可靠性都是一样的。,显著性水平,如果事先确定了一个显著性水平a,也就意味着要求用于拒绝原假设H0的证据必须强到P值小于a的程度。如果P值



- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用统计复习 应用 统计 复习 PPT 课件

链接地址:https://www.31ppt.com/p-5505737.html