MATLAB的数值分析.ppt
《MATLAB的数值分析.ppt》由会员分享,可在线阅读,更多相关《MATLAB的数值分析.ppt(100页珍藏版)》请在三一办公上搜索。
1、第十章MATLAB的数值分析,制作:陈学明数据拟合在第53页幻灯片,集中趋势的测定,在统计研究中,需要搜集大量数据并对其进行加工整理,对这些数据进行整理之后发现:大多数情况下数据都会呈现出一种钟形分布,即各个变量值与中间位置的距离越近,出现的次数越多;与中间位置距离越远,出现的次数越少,从而形成了一种以中间值为中心的集中趋势。这个集中趋势是现象共性的特征,是现象规律性的数量表现。,集中趋势的描述一,均值函数算术平均数mean(x)调和平均数 harmmean(x)几何平均数geomean(x)切尾均值trimmean(x,percent),集中趋势的描述二,中位数(中位次数)函数中位数是指全体
2、数值按大小排列后,位于中间的数值。如果参数集合中包含有偶数个数字,中位数函数将返回位于中间的两个数的平均值。Median(x),集中趋势的描述三,众数函数众数是一组数列中出现次数最多的数值,众数函数返回某一数组或数据区域中出现频率最多的数值。最大(小)值函数最大(小)值函数可以返回数据集中的最大(小)数值。range(X)Max(x)-min(x),三种平均数的特点,众数是一组数据中出现次数最多的变量值,它用于对分类数据的概括性度量,其特点是不受极端值的影响,但它没有利用全部数据信息,而且还具有不惟一性。一组数据可能有众数,也可能没有众数;可能有一个众数,也可能有多个众数。中位数是一组数据按大
3、小顺序排序后处于中间位置上的变量,它主要用于对顺序数据的概括性度量。均值是一组数据的算术平均,它利用了全部数据信息,是概括一组数据最常用的一个值。,离中趋势的测定,在研究现象总体标志的一般水平时,不仅要研究总体标志的集中趋势,还要研究总体标志的离中趋势,如研究价格背离价值的平均程度。研究离中趋势可以通过计算标志变异指标来进行。标志变异指标是同统计平均数相联系的一种综合指标,用于度量随机变量在取值区间内的分布情况,主要有平均差、标准差、方差、四分位数、百分位数等。,样本标准差,样本标准差函数用来估算样本的标准偏差,反映相对于平均值(mean)的离散程度,计算样本标准差采用不偏估计式(亦即自由度n
4、-1),其计算公式为:std(X),总体标准差,总体标准差函数返回以参数形式给出的整个样本总体的标准偏差,反映相对于平均值(mean)的离散程度。计算总体标准差使用整个总体的变量,通常采用偏性估计式(亦即自由度为n),其计算公式为,四分位数,四分位数是将中值的前后两部分数值再等分为二,以数值小的一端算起,前半部的分区点称为第1四分位数,后半部的分区点称为第3四分位数,而中值即为第2四分位数。四分位数通常用于在销售额和测量值数据集中对总体进行分组。w为数据序列,Q1为上四分位值,Q3为下四分位值,计算如下:Q1=prctile(w,25);Q3=prctile(w,75);prctile()函数
5、实现计算样本的百分位数功能,分布形态的测定,只用集中趋势和离中趋势来表示所有数据,难免不够准确。分析总体次数的分布形态有助于识别整个总体的数量特征。总体的分布形态可以从两个角度考虑,一是分布的对称程度,另一个是分布的高低。前者的测定参数称为偏度或偏斜度,后者的测定参数称为峰度。峰度是掌握分布形态的另一指标,它能描述分布的平缓或陡峭程度。如果峰度数值等于零,说明分布为正态;若峰度数值大于零,说明分布呈陡峭状态;若峰度数值小于零,说明分布形态趋于平缓。,偏度函数,偏度函数返回分布的偏斜度。偏斜度反映以平均值为中心的分布的不对称程度。正偏斜度表示不对称边的分布更趋向正值(偏右),负偏斜度表示不对称边
6、的分布更趋向负值(偏左)。其计算公式为 skewness(X),峰度函数,峰度函数返回数据集的峰值,表示次数分布高峰的起伏状态。峰值反映与正态分布相比某一分布的尖锐度或平坦度。正峰值表示相对尖锐的分布,负峰值表示相对平坦的分布。其计算公式为:kurtosis(X),插值与拟合,插值与拟合属数值分析中函数逼近内容。在数学建模中,插值与拟合是一种常用的数据分析手段,被公认为建模中的十大算法之一。,插值问题与拟合问题,矿井中某处的瓦斯浓度 y 与该处距地面的距离x有关,现用仪器测得从地面到井下500米每隔50米的瓦斯浓度数据(xi,yi)(i=0,1,10),根据这些数据完成下列工作:(1)寻找一个
7、函数,要求由此函数可近似求得从地面到井下500米之间任意点处的瓦斯浓度;(2)估计井下600米处的瓦斯浓度。,第一个问题可归结为“已知函数在x0,x1,xn处的值,求函数在区间x0,xn内其它点处的值”,这种问题适宜用插值方法解决。插值问题可描述为:已知函数在x0,x1,xn处的值y0,y1,yn,求函数p(x),使p(xi)=yi。但对第二个问题不宜用插值方法,因为600米已超出所给数据范围,用插值函数外推插值区间外的数据会产生较大的误差。,第一个问题可归结为“已知函数在x0,x1,xn处的值,求函数在区间x0,xn内其它点处的值”,这种问题适宜用插值方法解决。插值问题可描述为:已知函数在x
8、0,x1,xn处的值y0,y1,yn,求函数p(x),使p(xi)=yi。但对第二个问题不宜用插值方法,因为600米已超出所给数据范围,用插值函数外推插值区间外的数据会产生较大的误差。解决第二个问题的常用方法是,根据地面到井下 500 处的数据求出瓦斯浓度与地面到井下距离x之间的近似函数关系f(x),由f(x)求井下600米处的瓦斯浓度。插值函数过已知点,拟合函数不一定过已知点。通常,插值主要用于求函数值,而拟合的主要目的是求函数关系。当然,某些问题既可以用插值也可以用拟合。,插值方法-概述,为什么需要插值?,(1)函数关系y=f(x)没有明确的表达式(2)y=f(x)表达式复杂,不便于研究和
9、使用,一般地称g(x)为逼近函数,f(x)为被逼近函数。如果要求构造的函数g(x)取给定的离散数据,则称g(x)为f(x)的插值函数。当g(x)为代数多项式时,与之相应的插值逼近称为代数多项式插值。插值多项式存在且唯一,一 维 插 值,若已知的数据集是平面上的一组离散点集(x,y),则其相应的插值就是一维插值。常用插值方法:拉格朗日插值(lagrange插值)分段线性插值三次样条插值,拉格朗日插值,在数值分析中,拉格朗日插值法是以法国十八世纪数学家约瑟夫路易斯拉格朗日命名的一种多项式插值方法。许多实际问题中都用函数来表示某种内在联系或规律,而不少函数都只能通过实验和观测来了解。如对实践中的某个
10、物理量进行观测,在若干个不同的地方得到相应的观测值,拉格朗日插值法可以找到一个多项式,其恰好在各个观测的点取到观测到的值。这样的多项式称为拉格朗日(插值)多项式。数学上来说,拉格朗日插值法可以给出一个恰好穿过二维平面上若干个已知点的多项式函数。拉格朗日插值法最早被英国数学家爱德华华林于1779年发现1,不久后(1783年)由莱昂哈德欧拉再次发现。1795年,拉格朗日在其著作师范学校数学基础教程中发表了这个插值方法,从此他的名字就和这个方法联系在一起,拉格朗日(Lagrange)插值,已知函数f(x)在n+1个点x0,x1,xn处的函数值为 y0,y1,yn。求一n次多项式函数Pn(x),使其满
11、足:Pn(xi)=yi,i=0,1,n.解决此问题的拉格朗日插值多项式公式如下,其中Li(x)为n次多项式:,拉格朗日(Lagrange)插值,特别地:两点一次(线性)插值多项式三点二次(抛物)插值多项式,线性插值,线性插值的几何意义:用通过A、B两点的直线近似地代替曲线 y=f(x)。由解析几何知道,这条直线用点斜式表示为,例:已知y=f(x)的函数表 求线性插值多项式,并计算x=1.5 的值,X 1 3 y 1 2,解:由线性插值多项式公式得,抛物插值,抛物插值又称二次插值,它也是常用的代数插值之一。设已知f(x)在三个互异点x0,x1,x2的函数值y0,y1,y2,要构造次数不超过二次的
12、多项式使满足二次插值条件:,例:已知x=1,4,9 的平方根值,用抛物插值公式,求,(x0 x1)(x0 x2),(xx1)(xx2),y0,+,(x1x0)(x1x2),(xx0)(xx2),y1,+,(x2x0)(x2x1),(xx0)(xx1),y2,p2(7)=,x0=1,x1=4,x2=9,y0=1,y1=2,y2=3,(14)(19),(74)(79),1,+,(41)(49),(71)(79),2,+,(91)(94),(71)(74),3,=2.7,p2(x)=,=2.6458,拉格朗日插值多项式,两个插值点可求出一次插值多项式,而三个插值点可求出二次插值多项式。插值点增加到n
13、+1个时,也就是通过n+1个不同的已知点来构造一个次数为n的代数多项式P(x)。拉格朗日插值多项式结构对称,使用方便。但由于是用基函数构成的插值,这样要增加一个节点时,所有的基函数必须全部重新计算,不具备承袭性,还造成计算量的浪费。多数情况下,Lagrange插值法效果是不错的,但随着节点数n的增大,Lagrange多项式的次数也会升高,可能造成插值函数的收敛性和稳定性变差。如龙格(Runge)现象。,高次插值中的Runge现象,通常选用多项式作为插值函数。在研究插值问题的初期,所有人都认为插值多项式的次数越高,插值精度越高。Runge 通过对一个例子的研究发现,上述结论仅仅在插值多项式的次数
14、不超过 七时成立;插值多项式的次数超过七时,插值多项式会出现严重的振荡现象,称之为Runge现象。避免 Runge 现象的常用方法是:将插值区间分成若干小区间,在小区间内用低次(二次,三次)插值,即分段低次插值,如样条函数插值。,考察函数,右图给出了和 的图像,当n增大时,在两端会发出激烈的振荡,这就是所谓龙格现象。该现象表明,在大范围内使用高次插值,逼近的效果往往是不理想的,高次多项式插值产生的不收敛现象-Runge 现象,插值多项式的误差,在插值区间a,b上用插值多项式p(x)近似代替f(x),除了在插值节点xi上没有误差外,在其它点上一般是存在误差的。若记 R(x)=f(x)-p(x)则
15、 R(x)就是用 p(x)近似代替 f(x)时的截断误差,或称插值余项。,x0 x1 xixi+1 xn-1 xn,y=f(x),y=p(x),a,b,分段线性插值法,从舍入误差来看,高次插值误差的传播也较为严重,在一个节点上产生的舍入误差会在计算中不断扩大,并传播到其它节点上。因此,次数太高的高次插值多项式并不实用,因为节点数增加时,计算量增大了,但插值函数的精度并未提高。为克服在区间上进行高次插值所造成的龙格现象,采用分段插值的方法,将插值区间分成若干个小的区间,在每个小区间进行线性插值,然后相互连接,用连接相邻节点的折线逼近被插函数,这种把插值区间分段的方法就是分段线性插值法。,分段线性
16、插值法,分段线性插值法在几何上就是用折线替代曲线,例:已知f(x)在四个节点上的函数值如下表所示,30 45 60 90,1,求f(x)在区间30,90上的分段连续线性插值函数S(x),解:将插值区间30,90分成连续的三个小区间 30,45,45,60,60,90 则S(x)在区间30,45上的线性插值为,S(x)在区间45,60上的线性插值为,S(x)在区间60,90上的线性插值为,将各小区间的线性插值函数连接在一起,得,样条函数插值法,给定n+1个节点上的函数值可以作n次插值多项式,但当n较大时,高次插值不仅计算复杂,而且可能出现Runge现象,采用分段插值虽然计算简单、也有一致收敛性,
17、但不能保证整条曲线在连接点处的光滑性如分段线性插值,其图形是锯齿形的折线,虽然连续,但处都是“尖点”,因而一阶导数都不存在,这在实用上,往往不能满足某些工程技术的高精度要求。如在船体、飞机等外形曲线的设计中,不仅要求曲线连续,而且要有二阶光滑度,即有连续的二阶导数这就要求分段插值函数在整个区间上具有连续的二阶导数。因此有必要寻求一种新的插值方法这就是样条函数插值法,三次样条函数,设函数定义在区间a,b上,给定n+1个 节点和一组与之对应的函数值,若函数满足:在每个节点上满足 S(xi)=f(xi)(i=0,1,n)在a,b上有连续的二阶导数在每个小区间xi,xi+1(i=0,1,n-1)上是一
18、个三次多项式。则称S(x)为三次样条插值函数。三次样条插值函数S(x)是一个分段三次多项式。另一方面,要求分段三次多项式S(x)及其导数S(x)和S(x)在整个插值区间a,b上连续,则要求它们在各个子区间的连接点 上连续。,三次样条函数,用三次样条绘制的曲线不仅有很好的光滑度,而且当节点逐渐加密时,其函数值在整体上能很好地逼近被插函数,相应的导数值也收敛于被插函数的导数,不会发生龙格现象。因此三次样条在计算机辅助设计中有广泛的应用。,几种插值方法的比较,插值法中的拉格朗日插值多项式是研究数值微积分与微分方程数值解的重要工具。牛顿插值多项式是拉格朗日插值多项式的变形,具有承袭性,比拉格朗日插值多
19、项式节省计算量。分段低次多项式插值由于具有良好的稳定性与收敛性,且算法简单,便于应用。特别是应用广泛的三次样条插值,不但有较好的稳定性和收敛性,而且具有较好的光滑性,从而满足了许多实际问题的要求。,一维插值函数,yi=interp1(x,y,xi,method),nearest 最邻近插值;linear 线性插值;spline 三次样条插值;cubic 立方插值;缺省时 分段线性插值,注意:所有的插值方法都要求x是单调的,并且xi不能够超过x的范围,nearest 最邻近插值;linear 线性插值;spline 三次样条插值;cubic 立方插值;缺省时 分段线性插值,nearest 最邻近
20、插值;linear 线性插值;spline 三次样条插值;cubic 立方插值;缺省时 分段线性插值,例:从1点12点的11小时内,每隔1小时测量一次温度,测得的温度的数值依次为:5,8,9,15,25,29,31,30,22,25,27,24试估计每隔1/10小时的温度值,hours=1:12;temps=5 8 9 15 25 29 31 30 22 25 27 24;h=1:0.1:12;t=interp1(hours,temps,h,spline);plot(hours,temps,+,h,t,hours,temps,r:)%作图xlabel(Hour),ylabel(Degrees
21、Celsius),例 已知飞机下轮廓线上数据如下,求x每改变0.1时的y值,x0=0 3 5 7 9 11 12 13 14 15;y0=0 1.2 1.7 2.0 2.1 2.0 1.8 1.2 1.0 1.6;x=0:0.1:15;%插值及作图在下页,plot(x0,y0,kp,x,y1,r),plot(x0,y0,kp,x,y2,r),plot(x0,y0,kp,x,y3,r),y1=interp1(x0,y0,x,nearest);y2=interp1(x0,y0,x);y3=interp1(x0,y0,x,spline);,二维插值函数(网格点),z=interp2(x0,y0,z0
22、,x,y,method),nearest 最邻近插值;linear 双线性插值;cubic 双三次插值;缺省时 双线性插值.,要求x0,y0单调;x,y可取为矩阵,或x取行向量,y取为列向量,x,y的值分别不能超出x0,y0的范围,例:测得平板表面35网格点处的温度分别为:82 81 80 82 84 79 63 61 65 81 84 84 82 85 86 试作出平板表面的温度分布曲面z=f(x,y)的图形,x=1:5;y=1:3;temps=82 81 80 82 84;79 63 61 65 81;84 84 82 85 86;mesh(x,y,temps),1.先在三维坐标画出原始数
23、据,画出粗糙的温度分布曲线图.,xi=1:0.2:5;yi=1:0.2:3;zi=interp2(x,y,temps,xi,yi,cubic);mesh(xi,yi,zi)画出插值后的温度分布曲面图.,2以平滑数据,在 x、y方向上每隔0.2个单位的地方进行插值.,通过此例对最近邻点插值、双线性插值方法和双三次插值方法的插值效果进行比较,x=0:400:5600;y=0:400:4800;z=370 470 550 600 670 690 670 620 580 450 400 300 100 150 250;.510 620 730 800 850 870 850 780 720 650 5
24、00 200 300 350 320;.650 760 880 970 1020 1050 1020 830 900 700 300 500 550 480 350;.740 880 1080 1130 1250 1280 1230 1040 900 500 700 780 750 650 550;.830 980 1180 1320 1450 1420 1400 1300 700 900 850 840 380 780 750;.880 1060 1230 1390 1500 1500 1400 900 1100 1060 950 870 900 930 950;.910 1090 1270
25、 1500 1200 1100 1350 1450 1200 1150 1010 880 1000 1050 1100;.950 1190 1370 1500 1200 1100 1550 1600 1550 1380 1070 900 1050 1150 1200;.1430 1430 1460 1500 1550 1600 1550 1600 1600 1600 1550 1500 1500 1550 1550;.1420 1430 1450 1480 1500 1550 1510 1430 1300 1200 980 850 750 550 500;.1380 1410 1430 145
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MATLAB 数值 分析

链接地址:https://www.31ppt.com/p-6511994.html