《曲线回归》PPT课件.ppt
第十一章 曲线回归,第一节 曲线的类型与特点第二节 曲线方程的配置第三节 多项式回归,曲线回归(curvilinear regression)或非线性回归(non-linear regression):两个变数间呈现曲线关系的回归。曲线回归分析或非线性回归分析:以最小二乘法分析曲线关系资料在数量变化上的特征和规律的方法。,曲线回归分析方法的主要内容有:确定两个变数间数量变化的某种特定的规则或规律;估计表示该种曲线关系特点的一些重要参数,如回归参数、极大值、极小值和渐近值等;为生产预测或试验控制进行内插,或在论据充足时作出理论上的外推。,第一节 曲线的类型与特点,一、指数函数曲线二、对数函数曲线三、幂函数曲线四、双曲函数曲线五、S型曲线,一、指数函数曲线,指数函数方程有两种形式:图11.1方程 的图象,二、对数函数曲线对数函数方程的一般表达式为:图11.2 方程=a+blnx 的图象,三、幂函数曲线幂函数曲线指y是x某次幂的函数曲线,其方程为:图11.3 方程 的图象,四、双曲函数曲线双曲函数因其属于变形双曲线而得名,其曲线方程一般有以下3种形式:图11.4 方程 的图象,五、S型曲线S型曲线主要用于描述动、植物的自然生长过程,故又称生长曲线。Logistic曲线方程为:,第二节 曲线方程的配置,一、曲线回归分析的一般程序二、指数曲线方程 的配置三、幂函数曲线方程的配置四、Logistic曲线方程的配置,一、曲线回归分析的一般程序,曲线方程配置(curve fitting):是指对两个变数资料进行曲线回归分析,获得一个显著的曲线方程的过程。由试验数据配置曲线回归方程,一般包括以下3个基本步骤:,1根据变数X 与Y 之间的确切关系,选择适当的曲线类型。2对选定的曲线类型,在线性化后按最小二乘法原理配置直线回归方程,并作显著性测验。3将直线回归方程转换成相应的曲线回归方程,并对有关统计参数作出推断。,表11.1 常用曲线回归方程的直线化方法,应用上述程序配置曲线方程时,应注意以下3点:(1)若同一资料有多种不同类型的曲线方程配置,需通过判断来选择。统计标准是离回归平方和 最小的当选。(2)若转换无法找出显著的直线化方程,可采用多项式逼近,(3)当一些方程无法进行直线化转换,可采用最小二乘法拟合。,二、指数曲线方程 的配置,(111)两边取对数:(112)令,可得直线回归方程:(113)若 与x的线性相关系数:(114),显著,就可进一步计算回归统计数:(115)三、幂函数曲线方程 的配置(116),当 y 和 x 都大于0时可线性化为:(117)若令,即有线性回归方程:(118)若线性相关系数:(119),显著,回归统计数:(1110)四、Logistic曲线方程的配置(a、b、k均0)(1111),K 可由两种方法估计:如果y是累积频率,则显然k=100%;如果y是生长量或繁殖量,则可取3对观察值(x1,y1)、(x2,y2)、和(x3,y3),代入(1111)得:,若令,解得:移项,取自然对数得:,(1113),(1112),令,可得直线回归方程:(1114)和 x 的相关系数:(1115)回归统计数 a 和 b 由下式估计:,(1116),第三节 多项式回归,一、多项式回归方程 二、多项式回归的假设测验,一、多项式回归方程,(一)多项式回归方程式多项式回归(polynomial regression):当两个变数间的曲线关系很难确定时,可以使用多项式去逼近。二次多项式,其方程为:(1117),三次多项式的方程式为:(1118),多项式方程的一般形式为:(1119)(二)多项式方程次数的初步确定多项式回归方程取的次数:散点所表现的曲线趋势的峰数谷数。若散点波动较大或峰谷两侧不对称,可再高一次。,(三)多项式回归统计数的计算可采用类似于多元线性回归的方法求解多项式回归的统计数。令,(1119)可化为:(1120),可采用矩阵方法求解。即由和,求得、和()-1,并由 b=()-1()获得相应的多项式回归统计数。(四)多项式回归方程的估计标准误 y 的总平方和 SSy 可分解为回归和离回归两部分:SSy=Uk+Qk,(1121),k 次多项式的离回归标准误可定义为:即是多项式回归方程的估计标准误。,(1122),(1123),二、多项式回归的假设测验多项式回归的假设测验包括三项内容:总的多项式回归关系是否成立?能否以k-1次多项式代替k次多项式,即是否有必要配到k次式?在一个k次多项式中,X 的一次分量项、二次分量项、k-1次分量项能否被略去(相应的自由度和平方和并入误差)?,(一)多项式回归关系的假设测验多项式回归(Uk)由X的各次分量项的不同所引起,具有:。离回归(Qk):与X 的不同无,具有。可测验多项式回归关系的真实性。,(1124),相关指数:,k 次多项式的回归平方 和占Y总平方和的比率的平方根值,可用来表示Y与X的多项式的相关密切程度。决定系数:在Y 的总变异中,可由X 的k 次多项式说明的部分所占的比率。,(1125),(二)k 次多项式必要性的假设测验若k次多项式的k次项不显著,可由(k-1)次方程描述Y 与X 的曲线关系。有必要测验多项式增加一次所用去的1个自由度,对于离回归平方和的减少(或回归平方和的增加)是否“合算”。因此由:,(1127)可测验k 次多项式的适合性。(三)各次分量项的假设测验偏回归平方和:,(1128),此 具有,故由:可测验i次分量是否显著。,(1129),