关于优化的数学知识.ppt
1,第 2 讲,关于优化的数学知识,2,优化数学,许多经济理论基于经济参与人寻求某个函数的最优值这个假定消费者寻求最大化效用厂商寻求最大化利润本讲介绍对于这些问题的一些共同的数学知识,3,优化数学,“新古典”模型方法与优化数学偏好目标函数约束选择变量需要满足的条件最优选择一阶条件和二阶条件行为变化包络定理,4,单变量函数的优化,简单例子:管理者希望最大化利润,=f(q),数量,在q*获得最大化利润*,5,单变量函数的优化,管理者尝试改变 q 寻找最大利润的位置q1 到 q2 的上升导致 的上升,=f(q),数量,*,q*,1,q1,6,单变量函数的优化,如果产出增加超过 q*,利润将会下降q*到 q3 的增加导致利润 下降,=f(q),数量,*,q*,7,最大值的一阶条件,对于一个单变量函数,为了获得某个最大值点,这点的导数一定是0,8,二阶条件,一阶条件(d/dq)是最大值的 必要 条件,但不是 充分 条件,数量,如果利润函数是u型的,一阶条件会导致选择 q*,将会最小化,9,二阶条件,这意味着,为了 q*是最优值,并且,因此,在 q*,d/dq 一定是递减的,10,二阶导数,(局部)最大值的二阶条件是,11,利润最大化的例子,假定利润和产量的关系是=1,000q-5q2最大值的一阶条件是d/dq=1,000-10q=0q*=100因为二阶导数总是-10,q=100 是一个 全局最大值点,12,多变量函数,经济参与人的大多数目标依赖于多个变量必须进行权衡一个变量(y)依赖于一系列其他变量(x1,x2,xn)可以记做,13,y 对于 x1 的偏导数记做,偏导数,在计算偏导数的时候,所有其他的 x 保持不变偏导数是其他条件不变 假设的数学表达表明了当其他影响保持不变的时候,一个变量的变化如何影响某个结果,14,偏导数,我们必须关注变量的单位如果q 代表汽油需求数量(单位是十亿加仑),p 代表了每加仑的美元价格,那么 q/p 测量了每加仑汽油价格变化一元,需求数量的改变量(十亿加仑每年),15,弹性,弹性测量了一个变量变化对于其他变量的比率效应无单位y 对于 x 的弹性是,16,弹性和函数形式,假设y=a+bx+其他项在这种情况下,ey,x 不是一个常数必须注意到是在哪点计算的弹性,17,弹性和函数形式,假设y=axb 在这种情况下,18,弹性和函数形式,假设ln y=ln a+b ln x在这种情况下,弹性可以通过对数微分计算,19,二阶偏导数,偏导数的偏导数被称作 二阶偏导数,20,Youngs 定理,在一般条件下,计算二阶偏导数的偏微分顺序不重要,21,利用二阶偏导数,二阶偏导数在许多经济定理中起到了重要作用一个最重要的是一个变量自身的二阶偏导数,fii表明 xi 对于 y 的边际影响(y/xi)如何随着 xi 增加而变化fii 0 表明了边际效应递减,22,全微分,假设 y=f(x1,x2,xn)如果所有的 x 改变很小的单位,对于 y 的总效应将会是,23,最大值(或最小值)的一阶条件,函数f(x1,x2,xn)最大值(或者最小值)的必要条件是对于x微小变化的任意组合都有dy=0这个成立的唯一条件是,满足这个条件的点称为 驻点,24,寻找最大值,假定 y 是x1和 x2的函数y=-(x1-1)2-(x2-2)2+10y=-x12+2x1-x22+4x2+5一阶条件意味着,或者,25,隐函数定理,不是总可以从隐函数形式 g(x,y)=0 解出唯一的显函数形式 y=f(x)数学家推导了必要条件在许多经济应用中,这些条件和最大值(或最小值)的二阶条件相同,26,包络定理,包络定理关注一个函数的参数改变之后,函数的最优值如何改变利用一个例子可以很容易地了解这点,27,包络定理,假定 y 是 x 的函数y=-x2+ax对于a 的不同取值,这个函数代表了一族抛物线如果a 取定一个值,那么 y 变成仅仅是 x 的函数,同时可以计算使得y最大的x的取值,28,包络定理,对于不同的a,x和y的最优值,29,包络定理,随着 a 增加,y(y*)的最大值上升,a 和 y 的关系是二次的,30,包络定理,假定我们感兴 y*如何随着 a 变化我们有两种方法可以做到这点直接计算 y 的斜率保持 x 在最优值不变,直接计算 y/a,31,包络定理,为了计算函数的斜率,我们必须对于任意的a解出 x 的最优值dy/dx=-2x+a=0 x*=a/2替代,得到y*=-(x*)2+a(x*)=-(a/2)2+a(a/2)y*=-a2/4+a2/2=a2/4,32,包络定理,因此,dy*/da=2a/4=a/2=x*但是,我们可以利用包络定理节约时间对于a的微小变化,dy*/da 可以通过保持x 在 x*不变,直接从y 计算y/a,33,包络定理,y/a=x保持 x=x*y/a=x*=a/2这和前面的结果相同,34,包络定理,包络定理 表示了,函数最优值对于参数的变化可以通过保持 x(或者几个x)在最优值不变,偏微分目标函数获得,35,包络定理,包络定理可以扩展到 y 是多变量的函数y=f(x1,xn,a)寻找 y 的最优值包括求解n个一阶条件方程 y/xi=0(i=1,n),36,包络定理,x 的最优值将是 a 的函数x1*=x1*(a)x2*=x2*(a),37,包络定理,替代进原目标函数获得了y(y*)最优值的表达式y*=f x1*(a),x2*(a),xn*(a),a求导,可得,38,包络定理,考虑一阶条件,如果 x 在它们的最优值,那么所有项,除了 f/a,都等于0因此,39,约束最优化,如果不是所有的x 取值都是可行的会怎么样?x 的值可能都需要是正的消费者的选择被购买力所限制求解约束最大化问题的一种方法是 拉各朗日乘子法,40,拉各朗日乘子法,假定我们希望找到 x1,x2,xn 的取值最大化y=f(x1,x2,xn)服从约束,仅仅一些特定的 x 可以使用g(x1,x2,xn)=0,41,拉各朗日乘子法,拉各朗日乘子法开始于建立表达式L=f(x1,x2,xn)+g(x1,x2,xn)其中 是一个附加变量,称作拉各朗日乘子当约束起作用的时候,因为 g(x1,x2,xn)=0,L=f,42,拉各朗日乘子法,一阶条件L/x1=f1+g1=0L/x2=f2+g2=0,L/=g(x1,x2,xn)=0,43,拉各朗日乘子法,可以利用一阶条件解出 x1,x2,xn 和 这些解具有两个性质:x 遵守约束这些x 使得 L(因此 f)的值最大,44,拉各朗日乘子法,拉各朗日乘子()具有重要的经济解释一阶条件意味着f1/-g1=f2/-g2=fn/-gn=分子衡量了xi 增加一单位对于函数 f 的边际益处分母反映了xi 增大对于约束的负担,45,拉各朗日乘子法,在 x 的最优选择,增加 xi 的收益与边际成本的比率应该对于所有的 x 都相同 是所有 x 共同的成本收益比率,46,拉各朗日乘子法,如果稍微放松约束,哪个 x 改变并不重要拉各朗日乘子衡量了约束放松如何影响 y 的值 为约束提供了一个“影子价格”,47,拉各朗日乘子法,一个较高的 值意味着放松约束那么y将会上升较大幅度每个x具有较高的成本收益比率一个较低的 值意味着放松约束不会有很大收益=0 意味着约束没有起作用,48,对偶,任何约束最大值问题都伴随着一个 对偶 问题,此问题是一个带约束的 最小化 问题,目标函数是原问题的约束,49,对偶,参与人在预算约束下最大化效用对偶问题:参与人最小化可以达到给定效用水平的支出厂商为了生产一定的产出最小化要素投入成本对偶问题:给定要素投入成本的条件下,厂商最大化产出,50,约束最大化,假定一个农民有一个长度确定(P)的篱笆,希望圈成一个最大的矩形令 x 表示一个边的长度令 y 表示另一条的长度问题:选择 x 和 y 最大化面积(A=xy)服从约束是周长确定 P=2x+2y,51,约束最大化,建立拉各朗日乘子方程L=xy+(P-2x-2y)最大值的一阶条件是L/x=y-2=0L/y=x-2=0L/=P-2x-2y=0,52,约束最大化,因为 y/2=x/2=,x 一定等于 y这个区域一定是正方形x 和 y 应该这样选择,使得边际收益与边际成本的比率相同因为 x=y 并且 y=2,我们可以利用约束获得x=y=P/4=P/8,53,约束最大化,对于拉各朗日乘子的解释如果农民希望知道增长一码篱笆可以增加多少面积,表明是现在周长(P)的八分之一因此,拉各朗日乘子表示了约束隐含的价值,54,约束最大化,对偶问题:选择 x 和 y 最小化能围起一定区域的篱笆的长度最小化 P=2x+2y 约束 A=xy建立拉各朗日函数:LD=2x+2y+D(A-xy),55,约束最大化,一阶条件:LD/x=2-Dy=0LD/y=2-Dx=0LD/D=A-xy=0求解得到x=y=A1/2拉各朗日乘子(D)=2A-1/2,56,包络定理和约束最大化问题,假设我们希望最大化y=f(x1,xn;a)服从约束g(x1,xn;a)=0 一种求解方式是建立拉各朗日函数,求解一阶条件,57,包络定理和约束最大化问题,另外,可以证明dy*/da=L/a(x1*,xn*;a)为了获得参数 a 的改变导致 y 的最大值的变化可以对于 L 在最优值点偏微分,58,二阶条件 单变量函数,令 y=f(x)最大值点的必要条件dy/dx=f(x)=0为了保证这个点是最大值点,y 必须在离开这个点的时候递减,59,二阶条件 单变量函数,全微分衡量了 y 的变化dy=f(x)dx在最大值点,对于 x 的微小增加dy 一定会减小为了看到 dy 的变化,我们必须利用 y 的二阶导数,60,二阶条件 单变量函数,注意 d 2y 0 意味着 f(x)dx2 0因为 dx2 一定是正的,f(x)0这意味着函数 f 在驻点一定是凹的,61,二阶条件 双变量函数,假定 y=f(x1,x2)最大值点的一阶条件y/x1=f1=0y/x2=f2=0为了保证这个点是最大值点,从任何方向离开驻点 y 必须减小,62,二阶条件 双变量函数,x1 方向的斜率(f1)必须在驻点减小x2 方向的斜率(f2)必须在驻点减小但是,交叉导数(f12=f21)也必须满足约束,以保证dy 对于任何方向离开驻点的运动都会减少,63,二阶条件 双变量函数,y 的全微分dy=f1 dx1+f2 dx2这个函数的微分是 d 2y=(f11dx1+f12dx2)dx1+(f21dx1+f22dx2)dx2d 2y=f11dx12+f12dx2dx1+f21dx1 dx2+f22dx22根据Young定理,f12=f21 并且 d 2y=f11dx12+2f12dx1dx2+f22dx22,64,二阶条件 双变量函数,d 2y=f11dx12+2f12dx1dx2+f22dx22为了使得这个方程对于x的任何方向都是负的,f11 和 f22 必须是负的如果 dx2=0,那么 d 2y=f11 dx12为了 d 2y 0,f11 0如果 dx1=0,那么 d 2y=f22 dx22为了d 2y 0,f22 0,65,二阶条件 双变量函数,d 2y=f11dx12+2f12dx1dx2+f22dx22如果 dx1 和 dx2 都不是,那么 d 2y 是负的仅当 f11 f22-f122 0二阶导数(f11 和 f22)负的足够大使得它们足以超过来自交叉导数(f12=f21)的逆效应,66,约束最大化问题,假定我们希望选择 x1 和 x2 最大化y=f(x1,x2)服从线性约束c-b1x1-b2x2=0我们可以建立拉各朗日函数L=f(x1,x2)+(c-b1x1-b2x2),67,约束最大化问题,一阶条件是f1-b1=0f2-b2=0c-b1x1-b2x2=0为了保证我们有一个最大值,我们必须使用“二阶”全微分d 2y=f11dx12+2f12dx1dx2+f22dx22,68,约束最大化问题,仅当 x1 和 x2 的值满足约束的时候,可以被看成不同于驻点的可行解因此,我们可以计算约束的全微分-b1 dx1-b2 dx2=0dx2=-(b1/b2)dx1x1 和 x2可行的相对变化,69,约束最大化问题,因为一阶条件意味着 f1/f2=b1/b2,我们可以得到dx2=-(f1/f2)dx1因为d 2y=f11dx12+2f12dx1dx2+f22dx22 我们可以替代 dx2 得到d 2y=f11dx12-2f12(f1/f2)dx12+f22(f12/f22)dx12,70,约束最大化问题,合并同类项得到d 2y=f11 f22-2f12f1f2+f22f12 dx12/f22因此,为了使得 d 2y 0,一定满足f11 f22-2f12f1f2+f22f12 0这个方程刻画了一系列函数,称为拟凹函数集合中两点的连线还在集合中,71,凹和拟凹函数,凹函数和拟凹函数的差别可以利用下面这个函数说明 y=f(x1,x2)=(x1x2)k 其中 x 取值为正,k 为正数,72,凹和拟凹函数,无论 k 取什么值,这个函数都是拟凹的这个函数是否是凹函数依赖于 k 的值如果 k 0.5,函数是凸的,73,y=f(x1,x2)=(x1x2)0.3,74,y=f(x1,x2)=(x1x2)0.3,75,y=f(x1,x2)=(x1x2)1.5,76,y=f(x1,x2)=(x1x2)1.5,77,齐次函数,函数 f(x1,x2,xn)是 k阶齐次的 如果f(tx1,tx2,txn)=tk f(x1,x2,xn)当函数是一阶齐次的,所有自变量扩大一倍函数值扩大一倍当函数是零次齐次的,所有自变量扩大一倍函数值不变,78,齐次函数,如果一个函数是 k 次齐次的,函数的偏导数是 k-1次齐次的,79,欧拉定理,如果我们对于比例因子 t 微分,可以得到ktk-1f(x1,xn)=x1f1(tx1,txn)+xnfn(x1,xn)这个关系是 欧拉定理,80,欧拉定理,欧拉定理表明,对于齐次函数,函数值和偏导数之间具有确定性的关系,