《数理统计CH3描述统计ppt课件.ppt》由会员分享,可在线阅读,更多相关《数理统计CH3描述统计ppt课件.ppt(57页珍藏版)》请在三一办公上搜索。
1、2023/6/3,王玉顺:数理统计03_描述统计,1,第三章 描述统计 Descriptive Statistics,2023/6/3,王玉顺:数理统计03_描述统计,2,3 描述统计,什么叫描述统计?,统计方法分类,2023/6/3,王玉顺:数理统计03_描述统计,3,3 描述统计,什么叫描述统计?,描述统计任务搜集数据整理数据展示数据描述数据描述统计目的描述数据分布描述分布特征,推断统计任务参数估计假设检验推断统计目的用样本数据对总体分布类型或分布参数作出推断,2023/6/3,王玉顺:数理统计03_描述统计,4,将抽样获得的样本观察值(数据)整理成频数或频率分布,绘制统计图展示样本观察值
2、的分布状况,计算感兴趣的统计量观察值,从而概括和描述样本观察值的分布特征,使无序庞杂的样本数据成为有序清晰的信息资料,以此描述样本数据的规律或特征,称作描述统计。,3 描述统计,什么叫描述统计?,2023/6/3,王玉顺:数理统计03_描述统计,5,样本,3 描述统计,描述统计的工作流程,统计描述,2023/6/3,王玉顺:数理统计03_描述统计,6,描述统计的工作流程,3 描述统计,2023/6/3,王玉顺:数理统计03_描述统计,7,描述统计量分布特征:样本频数和频率集中特征:样本均值变异特征:样本的方差、标准差和变异系数关联特征:样本相关系数形态特征:样本偏度和样本峰度统计图 散点图,折
3、线图,柱形图,直方图,网格图和表面图。,3 描述统计,描述统计的统计量,2023/6/3,王玉顺:数理统计03_描述统计,8,统计样本观测的频数和频率,制作频数和频率分布表;绘制频数、频率的散点图、折线图、柱形图、直方图、饼形图等统计图形;基于观测计算均值、方差、标准差、变异系数、相关系数、偏度和峰度;基于频数计算均值、方差、标准差、变异系数、偏度和峰度。,3 描述统计,描述统计的工作内容,2023/6/3,王玉顺:数理统计03_描述统计,9,不致混淆前提下,以后在许多场合,统计量和统计量观测值不再严格区分,以简化对问题的陈述。如样本均值和样本均值观测值统称为样本均值或均值,只是在大小写上加以
4、区分。,3 描述统计,陈述问题时的术语简称,2023/6/3,王玉顺:数理统计03_描述统计,10,展示和定位异常数据,识别数据收集过程中的可能错误;描述观测数据的分布区间、分布状况、集中趋势、分散程度和形态特征;交流数据分析的结果;探索变量间的关系和变化趋势;作出初步结论。,3 描述统计,描述统计的作用,2023/6/3,王玉顺:数理统计03_描述统计,11,3 描述统计,描述统计的作用,展示和定位异常数据,2023/6/3,王玉顺:数理统计03_描述统计,12,3 描述统计,描述统计的作用,分布区间分布状况集中趋势分散程度形态特征,2023/6/3,王玉顺:数理统计03_描述统计,13,3
5、 描述统计,描述统计的作用,交流数据分析结果,帧种子数分布的检测结果,2023/6/3,王玉顺:数理统计03_描述统计,14,3 描述统计,描述统计的作用,探索变量间的关系和变化趋势,2023/6/3,王玉顺:数理统计03_描述统计,15,3.1 离散样本的频数统计3.2 连续样本的频数统计3.3 三维统计图3.4 基于观测的统计计算3.5 基于频数的统计计算,本章内容,3 描述统计,2023/6/3,王玉顺:数理统计03_描述统计,16,3.1 离散样本的频数统计Frequency Statistic based Discrete Sample,3 描述统计,2023/6/3,王玉顺:数理统
6、计03_描述统计,17,离散随机变量X的样本观察值x1,x2,xn简称作离散样本。统计频数的步骤如下:确定观察到的样本值序列,如0,1,2,k;按样本值序列将样本观察值分组,即值相同的分为一组,则n个观察值归属k+1个组;统计每组含有样本观察值的个数,即统计样本值的频数;再计算累积频数、频率和累积频率。,3.1 离散样本的频数统计,离散样本频数统计方法,2023/6/3,王玉顺:数理统计03_描述统计,18,3.1 离散样本的频数统计,(1)样本观察值的获得,样本容量n,2023/6/3,王玉顺:数理统计03_描述统计,19,(2)样本频数频率分布表,x样本值或观察值,本例指十字路口单位时间间
7、隔通过的汽车数,简称汽车数。n(x)频数,样本中含有样本值x的个数cn(x)累积频数,到样本值x的频数累加和fn(x)频率,频数与样本容量n的比值cf(x)累积频率,到样本值x的频率累加和,3.1 离散样本的频数统计,定义符号:,样本按样本值分组从小到大顺序排列,2023/6/3,王玉顺:数理统计03_描述统计,20,汽车数样本频数频率分布表,3.1 离散样本的频数统计,(2)样本频数频率分布表,三线表,频数总和等于样本容量n,2023/6/3,王玉顺:数理统计03_描述统计,21,(3)频数散点图,3.1 离散样本的频数统计,2023/6/3,王玉顺:数理统计03_描述统计,22,(4)累积
8、频数散点图,3.1 离散样本的频数统计,2023/6/3,王玉顺:数理统计03_描述统计,23,3.1 离散样本的频数统计,(5)频率散点图,2023/6/3,王玉顺:数理统计03_描述统计,24,(6)累积频率散点图,3.1 离散样本的频数统计,2023/6/3,王玉顺:数理统计03_描述统计,25,3.1 离散样本的频数统计,(7)频数柱形图,2023/6/3,王玉顺:数理统计03_描述统计,26,3.1 离散样本的频数统计,(8)累积频数柱形图,柱高等于累积频数值,按与累积频数的固定比例绘制。,2023/6/3,王玉顺:数理统计03_描述统计,27,3.1 离散样本的频数统计,(9)频率
9、柱形图,将柱宽看作一个单位,则柱面积之和等于1。,2023/6/3,王玉顺:数理统计03_描述统计,28,3.1 离散样本的频数统计,(10)累积频率柱形图,柱高等于累积频率值,按与累积频率的固定比例绘制。,2023/6/3,王玉顺:数理统计03_描述统计,29,3.2 连续样本的频数统计Frequency Statistic based Continuous Sample,3 描述统计,2023/6/3,王玉顺:数理统计03_描述统计,30,连续随机变量X的样本观察值x1,x2,xn简称作连续样本。统计频数的步骤如下:确定一个覆盖全部观察值的数值区间,并将其分割成k个互斥的子区间(组区间);
10、统计每个组区间含有观察值的个数,即统计频数,则n个样本值分别归属k个组;再计算累积频数、频率、累积频率和组中值。获得频数频率分布表。,连续样本频数统计方法,3.2 连续样本的频数统计,2023/6/3,王玉顺:数理统计03_描述统计,31,(1)样本观察值的获得,3.2 连续样本的频数统计,样本容量n,2023/6/3,王玉顺:数理统计03_描述统计,32,3.2 连续样本的频数统计,(2)样本频数频率分布表,x组中值,本例指电冰箱检测重量格式化分组的组区间中值。n(x)频数,即组区间x包含样本值的个数cn(x)累积频数,至组区间x的频数累加和fn(x)频率,即频数与样本容量n的比值cf(x)
11、累积频率,至组区间x的频率累加和,定义符号:,2023/6/3,王玉顺:数理统计03_描述统计,33,电冰箱重量样本频数频率分布表,3.2 连续样本的频数统计,(2)样本频数频率分布表,三线表,频数总和等于样本容量n,2023/6/3,王玉顺:数理统计03_描述统计,34,步骤1:样本观察值记为xi,i=1,2,n,容量n;步骤2:找出样本观察值的最小值:a=min(x1,x2,xn,)步骤3:找出样本观察值的最大值:b=max(x1,x2,xn,)步骤4:计算极差:R=b-a 步骤5:用Sturges(1926)公式计算分组数k:k=1+log2n=1+3.322log10n,数据的格式化分
12、组,3.2 连续样本的频数统计,(3)样本分组与频数统计,2023/6/3,王玉顺:数理统计03_描述统计,35,样本容量n与合理分组数k,k的计算结果取整,对称型分布k取为奇数亦可参考下表确定分组数k,3.2 连续样本的频数统计,(3)样本分组与频数统计,2023/6/3,王玉顺:数理统计03_描述统计,36,步骤6:计算组距I(又称组间极差),即组上限和组下限之差,用下式计算I=R/(k-1)I 的计算结果需要规范化,即应是位数较少的小数,且组距的整数倍具有小数位不增加的特点,以使计算的分组组限小数位至少不增加。步骤7:按分组数k和组距I将数轴划分成k个组区间并编号 j=1,2,k,3.2
13、 连续样本的频数统计,(3)样本分组与频数统计,2023/6/3,王玉顺:数理统计03_描述统计,37,步骤8:确定第一组区间的下限L1,并满足下述原则:第一组的组下限L1a(最小观察值),且组中值L1+I/2接近a;同时最后一组的组上限Ukb(最大观察值),且组中值Uk-I/2接近b;两侧偏差尽可能对称,组中值位数尽可能少以便于计算,计算而得的各个组中值具有小数位不增加的特点。步骤9:计算各组区间的组限 组下限:Lj=L1+(j-1)I,j=1,2,k 组上限:Uj=L1+jI,j=1,2,k,3.2 连续样本的频数统计,(3)样本分组与频数统计,2023/6/3,王玉顺:数理统计03_描述
14、统计,38,步骤10:计算组中值xj=(Lj+Uj)/2,j=1,2,k步骤11:写出分组数列Lj,Uj),j=1,2,k步骤12:统计样本观察值落入各组的频数和频率,3.2 连续样本的频数统计,(3)样本分组与频数统计,组中值是组区间样本观察值的代表值,格式化分组三原则:互斥原则,即一个样本值只能属于一个组区间;完全原则,即分组必须覆盖全部样本值;一致原则,即k个组的组距均相同。分组不合适则可重新调整上述计算。,2023/6/3,王玉顺:数理统计03_描述统计,39,3.2 连续样本的频数统计,(3)样本分组与频数统计,电冰箱重量的分组统计结果,三线表,2023/6/3,王玉顺:数理统计03
15、_描述统计,40,(4)频数折线图,3.2 连续样本的频数统计,2023/6/3,王玉顺:数理统计03_描述统计,41,3.2 连续样本的频数统计,(5)频率折线图,2023/6/3,王玉顺:数理统计03_描述统计,42,3.2 连续样本的频数统计,(6)频数直方图,2023/6/3,王玉顺:数理统计03_描述统计,43,3.2 连续样本的频数统计,(6)频数直方图,2023/6/3,王玉顺:数理统计03_描述统计,44,3.2 连续样本的频数统计,(7)频率直方图,2023/6/3,王玉顺:数理统计03_描述统计,45,3.2 连续样本的频数统计,(7)频率直方图,2023/6/3,王玉顺:
16、数理统计03_描述统计,46,3.2 连续样本的频数统计,(8)累积频数直方图,2023/6/3,王玉顺:数理统计03_描述统计,47,3.2 连续样本的频数统计,(9)累积频率直方图,2023/6/3,王玉顺:数理统计03_描述统计,48,由于频率等于频数n(x)与样本容量n之比(即正比于频数),故两统计图从外观形状上是相同的,实际应用中仅做频数统计图或频率统计图。绘图要点是:柱高、柱宽、柱边、柱中点、图起点和图终点。涉及:组数、组距、组上限、组下限、组频数和组频率。,3.2 连续样本的频数统计,(10)频数频率统计图小结,2023/6/3,王玉顺:数理统计03_描述统计,49,3.3 三维
17、统计图3D Chart or 3D Graphics,3 描述统计,2023/6/3,王玉顺:数理统计03_描述统计,50,三维统计图主要用于展示二维变量的响应面或响应值的场合。,3.3 三维统计图,2023/6/3,王玉顺:数理统计03_描述统计,51,3.3 三维统计图,(1)3D散点图_展示样本观察值,2023/6/3,王玉顺:数理统计03_描述统计,52,3.3 三维统计图,(1)3D散点图_展示试验点布局,2023/6/3,王玉顺:数理统计03_描述统计,53,3D网格图,垂直坐标表示因变量y两个水平坐标分别表示x1和x2网格图表达y=f(x1,x2),网格颜色按光谱顺序从小到大表示y值的多少,3.3 三维统计图,(2)3D网格图_展示响应面,2023/6/3,王玉顺:数理统计03_描述统计,54,3.3 三维统计图,(2)3D网格图_展示试验点和响应面,2023/6/3,王玉顺:数理统计03_描述统计,55,3.3 三维统计图,(2)3D网格图_附等值线展示曲面结构,2023/6/3,王玉顺:数理统计03_描述统计,56,垂直柱形标尺表达了灰度与变量值的对应关系,3D曲面图可填充成灰度或彩色。灰度大小表示垂直变量的大小;色彩按光谱顺序表示垂直变量的大小,3.3 三维统计图,(3)3D表面图_展示响应面,2023/6/3,王玉顺:数理统计03_描述统计,57,结束,
链接地址:https://www.31ppt.com/p-5092027.html