计量经济学的基础工具.docx
《计量经济学的基础工具.docx》由会员分享,可在线阅读,更多相关《计量经济学的基础工具.docx(42页珍藏版)》请在三一办公上搜索。
1、第2章 计量经济学的基础工具 61第2章 计量经济学的基础工具在第1章中定义了计量经济学的主要工具是数学,包括优化理论和统计分析。这些工具的基础知识是计量经济学的基础知识。尽管这些知识在所有的专业书籍中都可以找到,但是考虑到知识的连贯性和应用的便利,这里将以一章来介绍这些基本知识,以备那些需要的读者参考。关于矩阵部分,主要参考了Sydsaeter,Strom和Berch(2001)的文献,关于概率统计及其推断部分,主要参考了古亚拉提(2000)的文献,古扎拉蒂(2004),Sydsaeter,Strom和Berch(2001)以及王文中(2003)的文献。2.1 矩阵2.1.1 矩阵的定义称为
2、阶矩阵,其中aij称为位于矩阵的第行和第j列的元素。简记。当时,称矩阵为阶方阵,称为的n阶行列式。如果则称该方阵为n阶单位矩阵,记为。有=1。是对角矩阵的特殊形式。一般的对角矩阵记为并有 矩阵的名称是由其元素的变化决定的。比如,所有元素都为0的矩阵叫零矩阵,所有位于主对角线下面的元素均为0,则称为上三角矩阵,反之则叫下三角矩阵。定义为矩阵的转置,记为。当时,如果,称为对称矩阵;如果,称为反对称矩阵;如果,则是幂等矩阵;如果,则是对合矩阵;若,则是正交阵且;如果或,则称为奇异的或非奇异的。一个高阶矩阵,根据实际需要,可分成若干小块。比如可分成四块:其中为阶矩阵,且如果是满足条件的最大阶方阵,则称
3、的秩为r,记为设,则有、设为n阶方阵,的迹定义为主对角线上所有元素之和,即2.1.2 矩阵的计算及其性质同阶矩阵的加、减等于它们的对应元素相加、减后的矩阵。两个矩阵可乘的条件是第一个矩阵的列数等于第二个矩阵的行数,并且它们的乘积所得的矩阵的阶数由第一个矩阵的行数和第二个矩阵的列数决定,其元素由第一个矩阵相应的行向量和第二个矩阵列向量的对应元素乘积的和组成。分块矩阵的加、减和乘可形式上比照一般矩阵的类似做法,此时记住分块矩阵的每个分块可视做相应矩阵的元素。矩阵的加法满足结合律和交换律。矩阵的乘法满足结合律。矩阵的乘法和加法满足分配律。不过,记住矩阵的乘法一般不满足交换律。这一点从矩阵的乘积定义中
4、很容易理解。性质2.1 方阵可逆的充分必要条件是如果方阵可逆,方阵的逆矩阵的求法如下:其中伴随矩阵定义为是元素的代数余子式,其定义为从矩阵中划去第i行和第j列后剩余的矩阵的行列式再乘上。分块矩阵的逆的求法设方阵分成四块如下:如果存在,则的逆可表示成:其中。如果存在,则的逆可表示成:其中。矩阵的指数形式和导数形式分别表示为:,矩阵的导数等于各个元素分别求导后的矩阵。对于矩阵和列向量,有以下求导公式:性质2.2 设,。则有:2.1.3 复矩阵的定义和性质元素在复数域的矩阵称为复矩阵。下面把复矩阵的某些定义和基本性质叙述 如下。定义2.1 设为一个复矩阵,则有l 称为的共扼矩阵。l 称为的共扼转置。
5、l 称为Hermitian矩阵,如果。l 称为酉矩阵,如果。性质2.3 设为复矩阵。则l 是实的,当且仅当。l 如果是实的,是Hermitian矩阵,当且仅当是对称的。性质2.4 设和为复矩阵,为复数。则有l 。l 。l 。l 。2.1.4 特征值与特征向量定义2.2 设是n阶方阵。称为的特征值, 特征值的一个显然性质就是使得方阵的秩小于n。如果满足以下方程根据代数基本原理,是的n阶代数方程,在复数域里,存在n个根。这些根叫做的特征值。对于每一个特征值,存在一个非零向量使得称为关于的特征向量。特征值很重要,现在把一些相关性质叙述如下。性质2.5 设为多项式。如果为的特征值,则为的特 征值。性质
6、2.6 当且仅当0不是的特征值时,方阵可逆。若可逆且为的一个特征值,则为的一个特征值。性质2.7 当且仅当的极限是零矩阵()时,的所有特征值的模严格小于1。性质2.8 设和为同阶矩阵。则和有相同的特征值。性质2.9 如果是对称矩阵且仅有实元素,则的所有特征值是实的。性质2.10 如果是的特征多项式,则是的所有阶主子式的和(共有个主子式的和)。称为的特征值方程或特征方程。性质2.11 是可对角化的充分必要条件是存在矩阵和对角矩阵使得,与有相同的特征值。性质2.12 如果有n个不同的特征值,则可对角化。谱定理 如果是对称的且有特征值,则存在一个正交阵,使得Jordan分解定理 如果有n个特征值,则
7、存在可逆矩阵,使得其中,且是矩阵,Shur引理 设为一个复矩阵。则存在酉矩阵使得是一个上三角矩阵。Hermitian矩阵的谱定理 设是一个Hermitian矩阵。则存在酉矩阵使得是一个对角矩阵。所有的特征值都是实的。性质2.13 给定,对任意,存在矩阵有n个不同的特征值,使得考虑二次型 ,其中,且性质2.14l 是正定的,当且仅当对所有x成立或或的所有特征值都是正的。l 是半正定的,当且仅当对所有x成立或或的所有特征值都是非负的。l 是负定的,当且仅当对所有x成立或或的所有特征值都是负的。l 是半负定的,当且仅当对所有x成立或或的所有特征值都是非正的。l 是不定的,当且仅当对某些x成立或对某些
8、i成立或的特征值有正有负。本节的所有性质都有很好的含义,考虑到篇幅有限以及解释所依据的相关知识已经超出了本书的设想,我们只好把这些性质罗列出来,仅供参考。2.2 概率与统计初步本节主要回顾一些概率与统计的基本知识。2.2.1 基本概念对世界上各种事物或现象的描述方式有确定性描述和不确定性描述。比如根据经验,地球上的每一天,太阳总是从东边升起,西边落下,以及明天中午12点整,广州将会下雨。前者为确定性描述,后者则是不确定性描述,或者说是一个概率事件。概率统计是研究不确定性现象的理论。这个理论无疑变成了计量经济学的重要工具。“不确定性”,比如抛一枚硬币 这里所提到的“硬币”、“骰子”等都暗含着这样
9、一层意思:它们的质地均匀,没有瑕疵。到桌面上,理论上出现两种等可能结果:正面朝上或反面朝上,这种不确定现象的实验就叫做统计或随机实验。所有可能的随机实验结果的集合就叫做样本空间或总体。样本空间的每一个元素,如抛一次硬币实验中的“正面朝上”或“反面朝上”,称为样本空间的一个样本点。样本空间的每一个子集称为事件,即随机实验的可能结果的集合。最大的事件就是样本空间,即是必然事件,理论上最小的事件是空集,也就是说随机实验没有发生。在实际应用中,人们剔除空集这一事件和必然事件。因此,抛一次硬币实验的事件有两个,即“正面朝上”、“反面朝上”。如果等可能抛硬币次,“正面朝上的次数”是一个随机事件,其可能取值
10、的结果是:。跟所有可能结果联系起来的“正面朝上的次数”就是随机变 量,也就是说以随机实验的结果为取值范围的变量就叫做随机变量。随机变量所取值的集合如果是离散的就称为离散型随机变量;如果是连续的就叫做连续型随机变量。在随机变量的取值范围内,对离散随机变量而言,随机变量取到某个或某些值的可能程度有多大?在探讨这个问题之前,本书将要引入概率的相关知识。掷一颗骰子,向上的数字只有六个等可能结果:1,2,3,4,5,6。如果求事件“数字小于4的面朝上”的可能概率是多少,结果就是1/2。因为掷一次骰子数字向上的可能结果有6个,事件“数字小于4的面朝上”含有三个样本点,后者比前者就得到所要的结果。此时的样本
11、空间或总体是指集合。到此,我们可以给出事件发生的古典概率如下:表示在所有可能的实验结果中,就某一个事件发生的可能程度。例2-1 房地产开发企业的资产负债率如表2-1所示。表2-1 房地产开发企业的资产负债率年 份资产负债率(%)199776.2199876.1199976.1200075.6200175.0200274.9200375.8资料来源:2004年中国统计年鉴按照1%的幅度把资产负债率分成三个区间:74%, 75%),75%, 76%), 76%, 77%),并计算相应的频数和频率如表2-2所示。表2-2 资产负债率的频数和频率区 间频 数频 率74%,75%)175%,76%)37
12、6%,77%)3通常情况下,频率可以当作概率来使用。因此,关于资产负债率的概率柱状分布图,如图2-1所示。在本节中,表示事件,表示事件的概率。概率的基本性质 如下: 任何事件的概率都位于0与1的闭区间内,即0,1。概率等于0的事件是不可能或没有发生的事件,概率等于1的事件是必然发生的事件。比如,每天太阳都从东边升起这一事件是必然事件,其概率为1,“农历初一月圆”这一事件是不可能的事件,其概率为0。用公式表示如下:0P(A)1区间概率图2-1 资产负债率的概率柱状分布 相互独立事件的和或积的概率等于各个事件概率的和或积。比如事件相互独立,则称为联合概率,称为非条件概率或边缘概率。如果事件不相互独
13、立,则有:此时,联合概率就等于边缘概率乘上条件概率,即其中表示在事件B发生的情况下事件A发生的概率。上式给出了条件概率的求法: 如果相互独立事件组成一个完备事件组,则所有事件的和就是必然事件,其概率为1。例2-2 假设盒子里装有两枚骰子,随机抽取一枚骰子并抛到桌面上,计算数字3朝上的概率为多少?如果假设A表示“随机抽取一个骰子”,B表示“数字3朝上”,试求A+B的概率。第一个问题的事件是AB,这样,所要求的结果全部列在表2-3中。表2-3 随机事件的概率事 件概 率BB|AABA+B事件是样本空间的子集,随机变量所取的值是事件可能的数字表征,由事件的概率也就可求得随机变量的概率。接着,概率密度
14、函数也随之给出。2.2.2 概率密度函数概率密度函数的曲线表示随机变量X取所有可能值概率的集合的几何表述。对于随机变量X所取的每一个可能值,通过对应关系“”,存在一个惟一的概率,即,与之对应。事件与随机变量通过概率密度函数和概率联系起来了。当是离散型随机变量时,概率密度函数可表示为:当是连续型的随机变量时,累积分布函数可表示为:如果实验结果由至少两个随机变量来表示,即一个结果是通过两个变量取值后才能确定。这时的相应概率密度函数就是多元的。类似地,多元密度函数也一样表示,比如离散型二元密度函数可表示为:其中表示联合概率。相应的条件密度函数是:如果随机变量是相互独立的,则联合密度函数等于边缘密度函
15、数之积:图2-1给出了概率密度分布。设X表示资产负债率的频数,表示与 之相应的概率密度,则根据例2-1,得到以下概率密度和累积分布函数如表2-4所示。表2-4 概率密度和累积分布函数Xf(X)XF(X)1根据表2-4,可以做出累积分布函数的图形,如图2-2所示。图2-2 资产负债率的概率的累积分布函数密度函数的数字特征有:(1)离散型随机变量X的期望值,即总体趋势的度量,也就是所有离散型随机变量X与其概率密度函数乘积的和,即在这里,应注意的是概率密度函数起到了权重的作用。比如表2-1的房地产企业的资产负债率的期望是:(2)期望的性质:不变性,即常数的期望等于自己;线性性,即随机变量和的期望等于
16、随机变量期望的和;分离性1,即相互独立随机变量积的期望等于随机变量期望的积;分离性2,即数与随机变量乘积的期望等于该数乘上随机变量的期望。(3)离散型随机变量X的方差或,即离散程度的度量,也就是随机变量与期望差的平方的期望,记作:称为标准差。方差描述了随机变量取值的集中程度,也就是说,方差越小,随机变量取值的范围就越小,或数值越集中于均值或期望。表2-1的房地产企业的资产负债率的方差, 注意公式的分母是“7”,这是严格按照定义计算的。实际上,分母应该是“6”。关于这点,将在后面说明。其计算如下:(4)方差的性质:常数的方差等于0;两个独立随机变量相加或相减的方差等于相应随机变量方差的和;数与随
17、机变量乘积的方差等于该数平方再乘上随机变量的方差。期望和方差描述的是单变量的密度函数的数字特征。对于多维的密度函数的数字特征,要用协方差和相关系数来描述。 设为两个离散型随机变量,其协方差定义为:这个表达式可改写成:当时,即方差是协方差的特殊情形。(5)随机变量X,Y的cov(X,Y)的性质如下:l 若相互独立,则。l 对于任意常数,有。(6)协方差和方差的关系如下:协方差描述了的相关关系。对于这种关系,有更好的表示:相关系数。即相关系数描述了的相关关系,即为正数表示是正相关关系,为负数表示是负相关关系,等于0表示没有相关关系。相关系数与协方差的符号一致,同为正或负或零,而且相关系数界于-1和
18、+1之间。例2-3 现在考虑全国别墅、高档公寓与经济适用房的平均售价的相关系数和协方差。有关原始数据如表2-5所示。表2-5 全国别墅、高档公寓和经济适用房屋的平均售价年 份别墅、高档公寓(元/m2)经济适用房屋(元/m2)199753821097199845961035199945031093200042881202200143481240200241541283200341451380资料来源:2004年中国统计年鉴计算结果如下:别墅、高档公寓与经济适用房的相关系数协方差分别为:-0.659734958233和-34494.8337586别墅、高档公寓与经济适用房的平均售价是负相关的,如图
19、2-3所示。别墅、高档公寓平均售价年份平均售价(元/m2)经济适用房屋平均售价图2-3 别墅、高档公寓与经济适用房的平均售价的相关性概率密度函数的数字特征除了以上介绍的外,这里再介绍三个:条件期望值和概率密度函数的偏度及峰度。(7)条件期望值定义为:(8)随机变量X的n阶中心矩定义为:当时,一阶中心矩是0;当n=2时,二阶中心矩就是随机变量的方差。方差衡量了分布的紧疏状况,然而,概率密度函数的对称性和分布的宽窄则分别由概率密度函数的偏度和峰度来刻画。概率密度函数的偏度S定义为:当0时,概率密度函数的几何图形右偏;当3时,概率密度函数的分布是高峰态的;当3时,概率密度函数的分布是低峰态的,如图2
20、-5所示。图2-5 概率密度函数分布的峰度示意图从表2-5的经济适用房的平均售价数据可做出以下频数柱状分布图:图2-6是右偏低峰态的渐进正态分布图,其偏度为:0.232223,峰度为:1.857836。相比之下,别墅、高档公寓的平均售价呈现出较大的右偏高峰态柱状分布,其偏度和峰度分别为:1.439003和3.860236。2.02.50.00.51.0 1.51100 1400 1300 1200 1000 图2-6 经济适用房平均售价频数的柱状分布图2.2.3 样本与样本空间前面求得的期望值、方差、协方差、条件期望值、峰度、偏度等都是在样本空间内求的总体概率密度函数的数字特征。在实际工作中,
21、人们往往难于掌握样本的总体状况,而只是掌握其中某些数据,如何通过这些样本来估算或判断总体样本的情况,则是一个艰巨的任务。比如,要评估全国人口平均的生活水平,人们很难通过全国人口普查来实现,而是通过局部抽样调查来提供判断的依据。为此,掌握样本的数据特征求法是必要的步骤。下面就来实现这样的步骤。1样本均值设()是随机抽取关于随机变量的某个实验的n个样本值,则随机变量的样本均值定义为:这个定义的n表示样本的容量。通常情况下,总体期望往往是不清楚的,需要通过样本的均值来估计。如何去评估样本均值与总体期望之间的偏差,这是 衡量抽样成功与否的关键之所在。这个问题留到以后需要时再讨论。后面所介 绍的样本数字
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 基础 工具
链接地址:https://www.31ppt.com/p-1656625.html