《统计学复习》PPT课件.ppt
《《统计学复习》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计学复习》PPT课件.ppt(85页珍藏版)》请在三一办公上搜索。
1、统计学 Statistics for Business and Economics,什么是统计学?,不列颠百科全书 统计学是一门收集、分析、表述和解释数据的科学。,统计学的特点,以归纳为主要思维方式的统计不是以演绎为主的数学。从整体观念出发,研究大量普遍存在的整体特征,说明事物的规律性。研究客观事物数量方面的方法论科学。,统计学的分科,统计学的分科,总体、个体和样本,总体(population),所研究对象的全体。分为有限总体和无限总体有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的个体(individual),或总体单位,组成总体的元素。样本(sampl
2、e)从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本容量,参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值只要总体不发生改变,总体参数不会改变总体参数通常用希腊字母表示 统计量(statistic)用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数大小取决于所抽取的样本样本统计量通常用小写英文字母表示,参数和统计量,平均数标准差比例,统计数据是对客观现象计量的结果。,数据的计量尺度,一、数据的计量尺度,由低级到高级分为四个层次,二、抽样调查,从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果
3、推断总体数量特征。,抽样方法,简单随机抽样,分层抽样,整群抽样,系统抽样,多阶段抽样,概率抽样,非概率抽样,抽样方式,误差,抽样误差由抽样随机性造成,只存在于概率抽样中。(样本的特征不一定和总体完全一样,这种差异不是错误而是必然会出现)非抽样误差覆盖误差被调查总体范围被人为减小无响应误差调查回收率太低响应误差没有反映真实观点(理解有误,有意欺瞒)道德误差调查人员缺乏业务培训或职业道德测量误差测量工具不准确,一个样本可以得到总体参数的一个点估计,该点估计值与总体参数真值之间的差异,即为抽样误差。(一)实际抽样误差:,抽样误差(Sampling Error),(二)抽样极限误差,一定概率下抽样误差
4、的可能范围(也称允许误差,误差幅度):,统计数据的收集方法,1、访问调查(派员调查):调查者与被调查者通过面对面的交谈获取调查资料;2、邮寄调查:通过邮寄或其他方式将问卷送至被调查者,由被调查者填写问卷并寄回或投放到指定收集点;3、电话调查:调查者利用电话同受访者进行语言交流以获取信息;4、座谈会(集体访谈):将受访者集中在调查现场,使其对调查主题发表意见以获取调查资料;5、个别深度访问:一次只有一名受访者参加的特殊的定性研究。,调查方案设计,1、确定调查目的Why?2、确定调查对象和调查单位 Who?3、拟订调查项目和调查表What?-调查项目要少而精;-调查项目含义要明确;-尽可能做到各个
5、调查项目之间有一定的联系。4、确定调查时间和期限 When?-调查时间是指调查资料所属的时间(时点或时期);-调查期限是指调查工作的起讫时间。5、编制调查的组织计划How?,第三章 描述性统计:数据的图表展示,第四章 描述性统计II:数值描述,数据分布的特征,集中趋势的度量,位置平均数,集中趋势的度量,离散程度的度量(变异度),异众比率极差四分位差方差和标准差离散系数,偏态,峰态,偏态与峰态分布的形状,推断统计,统计量和估计值,样本的(不包含未知总体参数的)函数称为统计量;统计量是随机变量,并有其分布。如果样本已经得到,把数据带入之后,统计量就有了一个数值,称为该统计量的一个实现(realiz
6、ation)或取值,也称为一个估计值(estimate)。,三种不同性质的分布,总体分布 样本分布 抽样分布,一个样本中各观察值的分布 也称经验分布 当样本容量n逐渐增大时,样本分布逐渐接近总体的分布,样本分布(sample distribution),样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 样本统计量是随机变量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本,抽样分布(sampling distribution),考察样本均值的概率分布形式。分两种况:1)总体分布已知且为正态分布;2)总体分布未知;,(1)当总体
7、分布已知且为正态分布或接近正态分布时,则无论样本容量大小如何,样本均值都为正态分布。,样本均值的抽样分布,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为,方差为2/n。即xN(,2/n),(2)当总体分布未知时,需要用到中心极限定理(Central limit Theorem),经验上验证,当样本容量等于或大于30时,无论总体的分布如何,样本均值的分布则非常接近正态分布。因此统计上常称容量在30(含30)以上的样本为大样本(large-sample-size)。,抽样分布与总体分布的关系,总体分布,正态分布,非正态分布,大样本,小样本,样
8、本均值正态分布,样本均值正态分布,样本均值非正态分布,样本方差的分布,在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为(n-1)的2分布,即,3、比例的抽样分布,1、期望值:,有限总体:,无限总体,2、标准差:,3、样本比例抽样分布的形状(Form of the sampling distribution of p)根据中心极限定理有:当样本容量增大时(大样本),样本比例抽样分布趋向于以样本期望值为中心、以样本方差为方差的正态分布。,区间估计则是根据样本估计量以一定的可靠程度推断总体参数所在的区间范围。,区间估
9、计(Interval Estimation),抽样极限误差,一定概率下抽样误差的可能范围(也称允许误差,误差幅度):,置信区间的一般形式,点估计(临界值)(标准误差)临界值:根据置信水平和抽样分布确定标准误差:根据抽样分布确定,将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为(1-为是总体参数未在区间内的比例常用的置信水平值有 99%,95%,90%相应的 为0.01,0.05,0.10,置信水平(置信度)(confidence level),置信区间(95%的置信区间),重复构造出的20个置信区间,点估计值,样本容量的确定,估计总体均值时样本容量的
10、确定,估计总体均值时样本容量n为样本容量n与总体方差 2、边际误差E、可靠性系数Z或t之间的关系为与总体方差成正比与误差幅度的平方成反比与置信水平成正比 样本容量的圆整法则:当计算出的样本容量不是整数时,将小数点后面的数值一律进位成整数,如24.68取25,24.32也取25等等,定义:误差幅度(边际误差)E=,根据比例区间估计公式可得样本容量n为,估计总体比例时样本容量的确定,未知时,可以选取试验样本估计总体比例;也可取使方差最大值p=0.5(此时波动性p(1-p)达到最大,可确保样本量满足要求。如果抽样水平超过了承受能力,只能牺牲置信水平或增加误差幅度E。),其中:,假设检验,什么是假设检
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学复习 统计学 复习 PPT 课件
链接地址:https://www.31ppt.com/p-4848317.html