统计中数据的处理方法.ppt
天津八中 陈健,1,统计中数据的处理方法,1、随机数的产生,2、样本估计总体,2.1.样本数字特征的获取,2.2.样本统计图的制作,3、回归分析,4、独立性检验,天津八中 陈健,2,人教版高中数学课标教材(A版),普通高中课程标准实验教科书必修3,选修1-2,选修2-3,统计案例简 介,天津八中 陈健天津师范大学 张楠,请多指导 2023年7月7日星期五,天津八中 陈健,3,数学1,数学3,数学4,数学2,数学5,选修2-3,选修2-2,选修2-1,选修1-2,选修1-1,选修3-5,选修3-4,选修3-3,选修3-2,选修3-1,选修3-6,选修4-10,选修4-9,选修4-3,选修4-2,选修4-1,系列1,系列2,系列3,系列4,选修,必修,天津八中 陈健,4,数学3:统计:随机抽样、用样本估计总体、变量间的相关关系概率:随机事件的概率、古典概型、几何概型选修2-3(选修1-2):概率:离散型随机变量及其分布列、二项分布及其应用、离散型随机变量的均值与方差、正态分布回归分析的基本思想及其初步应用、独立性检验的基本思想及其初步应用选修4-9 风险与决策,天津八中 陈健,5,数学3知识结构图,天津八中 陈健,6,回归分析知识结构图,天津八中 陈健,7,独立性检验知识结构图,天津八中 陈健,8,一元统计数据的处理方法,1、随机数的产生,2、样本估计总体,天津八中 陈健,9,例1.人教(A版)必修3第56页(2)随机数法假设要检测某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数法抽取样本。,操作示范,1、随机数的产生,用户手册13-12,天津八中 陈健,10,1、随机数的产生,在随机抽样中等可能地抽取编号,1.ONHOME(计算界面)SHIFT+DEL(清屏),2.MATH()Prob.(概率函数)()RANDOM OK,3.HOME界面中:RANDOM(正整数)ENTER,4.读取计算结果的整数部分,5.反复读取:RANDOM(正整数)ENTER,直接获取所需的随机数,用户手册13-12,天津八中 陈健,11,一元统计数据的处理方法,1、随机数的产生,2、样本估计总体,天津八中 陈健,12,2、样本估计总体,2.1.样本数字特征的获取,2.2.样本统计图的制作,天津八中 陈健,13,例2.人教(A版)必修3第82页A组第7题有20种不同的零食,它们的热量含量如下:110,120,123,165,432,190,174,235,428,318249,280,162,146,210,120,123,120,150,140(1)以上述20个数据组成总体,求总体平均数与总体标准差;(2)设计恰当的随机抽样方法,从总体中抽取一个容量为7的样本,计算样本的平均数与标准差;(3)利用上面的抽样方法,再抽取容量为7的样本,计算样本的平均数与标准差,这个样本的平均数与标准差和(2)中的结果一样吗?为什么?(4)利用(2)中的随机抽样方法,分别从总体中抽取一个容量为10,13,16,19的样本,求样本的平均数与标准差.分析样本容量与样本平均数和样本标准差对总体的估计效果之间有什么关系.,2.1.样本数字特征的获取,用户手册10-6,操作示范,天津八中 陈健,14,2.1.样本数字特征的获取,用户手册10-6,一元变量,2.ONAPLET Statistics()START(或ENTER)(进入),3.C1栏内:数据ENTER 数据ENTER(反复操作),1.ONAPLET Statistics()RESETYES(清理内存),4.数据删除:()错误数据DEL(逐个删除)SHIFTCLEAR(DEL)C1 OK(全删),5.数据插入:()插入位置INS 输入数据ENTER,1VAR(2VAR)1VAR START(查看数字特征值),一元变量样本数字特征对照表,天津八中 陈健,15,2、样本估计总体,2.1.样本数字特征的获取,2.2.样本统计图的制作,天津八中 陈健,16,2.2.样本统计图的制作,用户手册10-14,操作示范,人教(A版)必修3第66页居民用水量问题,天津八中 陈健,17,2.2.样本统计图的制作,Histogram(直方图),BoxWhisker(箱线图),2.制图:1VARPLOT,1.进入统计功能并输入数据,3.调整:1VARSHIFTPLOT,STATPLOT(选图):CHOOSHist/BoxWhiskerOK HWIDTH(组距):Hist 组距 OKXRNG,YRNG,HRNG(范围):Hist()数据 OK,XTICK,YTICK(坐标单位):Hist PAGE 数据 OK _AXES(坐标系),_INV.CROSS(交叉点),_GRID(网格点),_LABELS(坐标轴名称):Hist PAGE CHK PLOT,4.自动:1VARVIEWSAuto Scale OK,用户手册10-14,天津八中 陈健,18,例3.人教(A版)必修3第79页练习第3题下列数据是30个不同国家中每100000名男性患某种疾病的死亡率:,(1)作出这些数据分布的频率分布直方图;(2)请由这些数据计算平均数、中位数和标准差,并对它们的含义进行解释.,2.2.样本统计图的制作,用户手册10-14,天津八中 陈健,19,二元统计数据相关性研究方法,1、回归分析,2、独立性检验,天津八中 陈健,20,1、回归分析,用户手册10-1,例4.人教(A版)选修2-3第79页从某大学中随机选取8名女大学生,其身高与体重数据如表所示,求根据女大学生的身高预报体重的回归方程,并预报一名身高为172厘米的女大学生的体重.,操作示范,天津八中 陈健,21,确定两个变量的相关关系,1.ONAPLET Statistics RESETYES(清理内存),2.进入统计功能并在C1与C2栏内分别输入相应数据,3.自动绘制散点图:2VARVIEWSAuto Scale OK,4.调整:2VARSHIFTPLOT,5.建立回归直线:PLOTMENUFIT,直接获取数字特征:NUM2VARSTATS,用户手册10-1,1、回归分析,6.查看直线方程:SYMBSHOW,二元变量样本数字特征对照表,预报数据:HOMEMATHStat-TwoPREDYOK数据ENTER,天津八中 陈健,22,二元统计数据相关性研究方法,1、回归分析,2、独立性检验,天津八中 陈健,23,课例欣赏,学生探究,天津八中 陈健,24,一元变量样本数字特征对照表,N,TOT,MEAN,PVAR,SVAR,PSDEV,SSDEV,MIN,Q1,MEDIAN,Q3,MAX,统计符号,样本数据的最大值,第三个四分位数,中位数,第一个四分位数,样本数据的最小值,样本标准差,总体标准差,样本方差,总体方差,样本数据的平均值,样本数据的总和,样本数据的个数,数字含义,用户手册10-13,天津八中 陈健,25,二元变量样本数字特征对照表,MEANX,X,X2,MEANY,Y,Y2,XY,SCOV,PCOV,CORR,RELERR,统计符号,相对误差,相关系数,总体方差,样本的协方差,XY的总和,Y2的总和,Y的总和,Y的平均值,X2的总和,X的总和,X的平均值,数字含义,用户手册10-13,