统计学复习资料抽样分布.ppt
《统计学复习资料抽样分布.ppt》由会员分享,可在线阅读,更多相关《统计学复习资料抽样分布.ppt(53页珍藏版)》请在三一办公上搜索。
1、第四章 抽样分布,主要内容第一节 抽样的概念与方法第二节 简单随机样本的抽样分布第三节 抽样其它组织形式及其分布特征,统计应用:两个例子,The purpose of Statistics inference is to obtain information about a population from information contained in sample.例1:一汽车轮胎制造商生产一种被认为寿命更长新型轮胎。例2:某党派想支持某一候选人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估计支持该候选人的民众占全部登记投票人总数的比例。由于时间及财力的限制:,抽样估计方法主
2、要用在下列两种情况:1、对所考查的总体不可能进行全部测度;2、从理论上说可以对所考查的总体进行全部测度,但实践上由于人力、财力、时间等方面的原因,无法或没有必要(不划算)进行全部测度。注意:抽样调查必须遵循随机原则。抽样估计只能得到对总体特征的近似测度,因此,抽样估计还必须同时考察所得结果的“可能范围”与“可靠程度”。,第一节 抽样的概念与方法,一、抽样的基本概念二、简单随机抽样的方法,一、抽样的基本概念,例3:某大公司人事部经理整理其2500个中层干部的档案。其中一项内容是考察这些中层干部的平均年薪及参加过公司培训计划的比例。总体:2500名中层干部(population),如果:上述情况可
3、由每个人的个人档案中得知,可容易地测出这2500名中层干部的平均年薪及标准差。假如:1:已经得到了如下的结果:总体均值=51800 总体标准差=4000,2、同时,有1500人参加了公司培训,则参加公司培训计划的比例为:P=1500/2500=0.60 参数是总体的数值特征(A parameter is a numerical characteristic of a population.)。如:例3中的中层干部平均年薪,年薪标准差及受培训人数所占比例均为该公司中层干部这一总体的参数。抽样估计就是要通过样本而非总体来估计总体参数。,假如抽取30名,得到样本平均数、标准差和成数是,则,样本:抽取
4、到的30名中层干部。统计量:根据样本分布计算的综合指标,是样本变量的函数。另注意区分样本容量和样本个数:样本容量是指一个样本所包含的单位数。样本个数是指样本的可能数目。,二、简单随机抽样的方法,(一)放回抽样n个单位的样本是有n次试验的结果构成每次试验都是独立的每次试验都在相同条件进行样本的可能个数为(考虑顺序)或(不考虑顺序),(二)不放回抽样,n个单位的样本是有n次试验的结果构成每次试验不是独立的每个单位在多次试验中中选机会是不等的样本的可能个数为N(N-1)(N-2)(N-n+1)(考虑顺序)或(不考虑顺序),在社会经济统计中,往往采用的是较大总体(视为无限总体)下的无序不重复抽样。,第
5、二节 简单随机样本的抽样分布,一、重置抽样的抽样分布二、不重置抽样的抽样分布,一、重置抽样的抽样分布,样本统计量的分布就是抽样分布(一)样本均值的抽样分布容量相同的所有可能样本的样本均值的概率分布一种理论概率分布进行推断总体总体均值的理论基础,【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为x1=1、x2=2、x3=3、x4=4。总体的均值、方差及分布如下,均值和方差,总体特征值,现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为,样本均值的抽样分布,样本均值的抽样分布,计算出各样本的均值,如下表。并给出样本均值的抽样分布,样
6、本均值的分布与总体分布的比较,=2.5 2=1.25,总体分布,显然,不同的样本对应着不同的样本统计量,而由于样本抽取的随机性,样本统计量即为一种随机变量。一般地,样本统计量的可能取值及其取值概率,形成其概率分布,统计上称为抽样分布(sampling distribution)。正是抽样分布及其特征使得用样本统计量估计总体参数的“精确程度”能够给予概率上的描述。由于样本统计量的随机性及其抽样分布的存在,同样可计算其均值、方差、标准差等数字特征来反映该分布的中心趋势和离散趋势。,1、样本平均数的期望值 由于不同的样本可得到不同的样本均值,因此,考察样本均值的期望就显得非常重要。用 表示样本均值的
7、期望值,表示总体均值,可证明在简单随机抽样中。,结论:,样本平均数的标准差可得:样本均值的标准差可用来测度样本均值与总体均值的“距离”,即可用来计算可能的误差,它也被称为均值标准误(standard error of the mean)或抽样平均误差。,2.样本平均数的标准差,(二)样本比例的抽样分布,在经济与商务的许多场合,需要用样本比例p对总体比例P进行统计推断。样本比例抽样分布是样本比例所有可能值概率分布。同样地,要考察样本比例p与总体比例P的接近程度,需要有样本比例抽样分布的相关信息。,结论,根据p的期望值、标准差及前面样本平均数的特性(抽样分布形状)。1、期望值:E(p)=P 2、标
8、准差:,现从总体中抽取n2的简单随机样本,在不重复抽样条件下,共有12个样本。所有样本的结果为,二、不重置抽样的抽样分布(一)样本均值的抽样分布,样本均值的抽样分布,计算出各样本的均值,如下表。并给出样本均值的抽样分布,X,样本均值的分布与总体分布的比较,=2.5 2=1.25,总体分布,结论:(不放回抽样),1、样本平均数的期望值 2、样本平均数的标准差 称为有限总体修正因子(finite population correction factor),(二)样本比例的抽样分布,不放回抽样p的期望值、标准差分别为。1、期望值:E(p)=P 2、标准差:,附注:正态分布理论与中心极限定理,1、正态
9、分布的密度函数式中 为正态分布的平均数,是它的标准差。这两个参数决定正态分布密度函数的形状。也可简记为N,正态分布密度函数特性:,(1)对称性。(2)非负性。(3)当x处于中心位置时,密度函数值最大。(4)在 处为密度函数的拐点,越大图形越 扁平。,(5)当x 时,密度函数f(x)0,即曲线向两边下垂,伸向无穷远处。,2、正态分布标准化,正态分布函数为:,不同的正态分布参数也就有不同的正态分布形式,利用上式分布函数计算各类不同的正态分布形式某点或某区间的概率是很困难的。必须对各种正态分布加以标准化,才能求其概率,标准化:要求平均数为0,方差为1,用N(0,1)来表示。即是原变量变为新变量:,例
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 复习资料 抽样 分布

链接地址:https://www.31ppt.com/p-6015762.html