数学实验10数据的统计与分析课件.ppt
《数学实验10数据的统计与分析课件.ppt》由会员分享,可在线阅读,更多相关《数学实验10数据的统计与分析课件.ppt(54页珍藏版)》请在三一办公上搜索。
1、大学数学实验,Mathematical Experiments,实验10 数据的统计与分析,数据的统计与分析的两类方法,第一类:一般意义的统计(普查),对生产的全部1000件产品逐一检验,发现18件次品,对全区居民逐一调查,得到月平均支出为828元,次品率:1.8%;月平均支出为828元,优点:结果完全确定,可信,缺点:调查、收集的数据量可能很大,经费投入大;有些产品不允许全部检验,如灯泡、电器的寿命等,缺点:结果是随机的,是否可信?,第二类:数理统计(抽查),全部产品中随机抽取100件,发现2件次品,随机调查了200位居民,得到月平均支出为788元,次品率:2%;月平均支出788元,优点:调
2、查、收集的数据量小,经费投入小,适合不允许全部检验的产品,如灯泡、电器的寿命等,任务:怎样用它来估计整体的状况(全部产品的次品率,全体居民的月平均支出),本实验基本内容,2.数据的整理和描述,3.随机变量的概率分布及数字特征,1.实例及其分析,4.用随机模拟计算数值积分,5.实例的建模和求解,1.实例及其分析,实例1:报童的利润,报童每天购进报纸零售,晚上将卖不掉的报纸退回;每份报纸购进价a,零售价 b,退回价c:bac;为获得最大利润,该报童每天应购进多少份报纸?,设a=0.8元,b=1元,c=0.75元,为报童提供最佳决策,159天报纸需求量的情况,分析:每天报纸需求量随机,报童每天利润也
3、随机;以每天平均利润最大为目标,确定最佳决策。,数学模型近似:,决策变量:报童每天购进报纸的份数n,每天需求为r的天数所占的百分比,记做f(r);如200(-219)份所占的百分比为35/159=22%,平均利润:V(n),实例1:报童的利润(续),实例2:路灯更换策略,管理部门:不亮灯泡,折合计时进行罚款。,路政部门:路灯维护,条件:需要专用云梯车进行线路检测和更换灯泡;向相应管理部门提出电力使用和道路管制申请;向雇用的各类人员支付报酬等,更换策略:整批更换,路政部门的问题:多长时间进行一次灯泡的全部更换?换早了,很多灯泡还没有坏;换晚了,要承受太多的罚款。,2.数据的整理和描述,数据的收集
4、和样本的概念 数据的整理、频数表和直方图 统计量 MATLAB命令,数据的收集,银行随机选了50名顾客进行调查 测量每个顾客感觉舒适时的柜台高度(单位:厘米),银行怎样依据它确定柜台高度呢?,样本:统计研究的主要对象,总体-研究对象的全体。如所有顾客感觉舒适的高度个体-总体中一个基本单位。如一位顾客的舒适高度样本-若干个体的集合。如50位顾客的舒适高度样本容量-样本中个体数。如50,顾客群体的舒适高度随机变量X,概率分布F(x)n位顾客的舒适高度 xi,i=1,n(样本)相互独立的、分布均为F(x)的一组随机变量。,样本:随机取值的一组数据;一组相互独立的、同分布的随机变量。,数据的整理,比较
5、直观,比较清晰的结论2150岁的中青年患者大约占总发病人数的 3/4,提醒民众中青年是易感人群。,北京地区SARS患者的统计数据(截至2003年5月5日),频数表,将数据的取值范围划分为若干个区间,统计这组数据在每个区间中出现的次数,称为频数,得到一个频数表。,柜台高度频数表,作用:推测出总体的某些简单性质。如上表表明选择柜台高度在107.10至125.90的有31人,占总人数的62%,柜台高度设计在这个范围内,会得到大多数顾客的满意。,直方图(histogram):频数分布图,柜台高度直方图,平均值,平均值(mean,简称样本均值)定义为,频数表和直方图给出某个范围的状况,无法直接给出具体值
6、,如确定柜台具体高度,可作为设计柜台高度的参考值,例:两个班的一次考试成绩,现象1:甲班平均值:82.75分,乙班平均值:81.75分结 论:大致表明甲班的平均成绩稍高于乙班现象2:甲班90分以上7人,但有2人不及格,分数分散 乙班全在73分到90分之间,分数相对集中,考试成绩直方图,甲,乙,描述数据的分散程度(统计上称为变异),样本x=(x1,x2,xn)的标准差(Standard deviation)为:,甲班的标准差为10.98分,乙班的标准差为3.98分,表明甲班成绩的分散程度远大于乙班。,统计量:由样本加工出来的、集中反映样本数量特征的函数。,三类统计量:位置,变异程度,分布形状,标
7、准差,偏度(skewness):分布对称性,峰度(kurtosis):分布形状,表示位置的还有:,中位数(median):将数据由小到大排序后处于中间位置的那个数值。,n为奇数时,中位数唯一确定;n为偶数时,定义为中间两数的平均值,表示变异程度的还有:,极差(range):x1,x2,xn的最大值与最小值之差。方差(variance):标准差的平方s2。,表示分布形状的:,统计量,MATLAB数据描述的常用命令,求银行柜台高度的频数表、直方图及均值等统计量:,示例,输出图和下列结果:N=4 4 3 6 8 12 5 4 2 2Y=95.3500 100.0500 104.7500 109.45
8、00 114.1500 118.8500 123.5500 128.2500 132.9500 137.6500 x1=115.2600,x2=116.5000 x3=47,x4=10.9690 x5=-0.0971,x6=2.6216,3.随机变量的概率分布及数字特征,频率与概率概率密度与分布函数 期望和方差 常用的概率分布MATLAB命令,频率与概率,保证抽取样本的随机性和独立性:样本容量无限增大时,频率会趋向一个确定值;这个值称为随机变量 X 落入区间(a,b的概率(Probability),记作,频率:样本数据在一个确定区间(a,b 的频数k与样本容量n的比值,概率密度与分布函数,概率
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学实验10 数据的统计与分析课件 数学 实验 10 数据 统计 分析 课件
链接地址:https://www.31ppt.com/p-3051724.html