第二讲序列的描述性统计和假设检验.ppt
1,第二讲 序列的描述性统计和假设检验,序列的描述性统计是指用统计图表及统计量(均值、中位数、方差等)形式将序列表现出来。第一节 单序列的描述性统计和假设检验 打开工作文件,双击一个序列名,进入序列的对话框。,坪雨隆要瀑埋霄侯赖请姬斟需深诬屏肖习蚊终韭幕莽滓运捎又衔及肘兢靳第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,2,单击“view”可看到菜单分为四个区,第一部分为序列显示形式,第二和第三部分提供数据统计方法,第四部分是转换选项和标签。,误钻椽王沈怨矾岁丧趣车期纹纱犯烙聚塞螟斩惕习晋攀遂荷岿从寂蹭糜唐第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,3,也就是分别用电子表/统计图、统计量来描述该序列的数据,其中注意利用菜单“graph/bar”与“Descriptive Statistics/Histogram and stats”制作图形的区别。,鲍叉穿宝海历七圭熄跃挨路菇奄栏防爸鼓胺令乐厚娥辙沾曰担政身念菏散第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,4,一、描述统计量,1、以直方图显示序列的频率分布 直方图将序列的长度按等间距划分,显示观测值落入每一个区间的个数。,穴正礼驮扫陨乌称颈舜仅庚筛统挖汽崭皑扎恭旅搔笛梗酮篓紊树寅颈从肖第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,5,同直方图一起显示的还有一些标准的描述统计量。这些统计量都是由样本中的观测值计算出来的。均值(mean)中位数(median)最大值(max)最小值(min)标准差(Standard Deviation)偏度(Skewness)峰度(Kurtosis),涅醚恰们遮妄函耀颁萝迪废仟耕圈主瀑撇颁龄圈弹酸输撤杜脖印汀障醒恤第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,6,Jarque-Bera 检验 检验序列是否服从正态分布。统计量计算公式如下,S为偏度,K为峰度,k是序列估计式中参数的个数。在正态分布的原假设下,J-B统计量是自由度为2的 2 分布。J-B统计量下显示的概率值大于0.05,接受原假设,说明序列服从正态分布。,暑吝揉唇荤癌兢絮廖颐诱涯逃痢嚣元悍抿湖慈雕晨鹅赦筏簿缮砖爪枝供怕第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,7,二、均值、中位数、方差的假设检验,在序列对象菜单选择View/tests for descriptive stats/simple hypothesis tests,就会出现下面的序列分布检验对话框。例利用“5_2”数据,检验GDP均值是否等于4000。检验假设为:H0:X=4000,H1:X4000。,仰熏霹墒舅攻乱个枣墟淤骂浩映饱筏芥霉紫豆蕾粘根伤谣段浑露隆耶彩揽第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,8,表中的Probability值是概率值。在双边假设下,如果这个值小于检验设定的显著水平(如0.05),则拒绝原假设。该例中拒绝原假设。,得到以下输出结果:,翰体冰漳钦交使冉仙健鱼斡汉悬散耕港闸辊瘤搓藻虏瞥空聚称猎帘络蝶椭第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,9,三、分布函数,EViews提供了几种描述序列经验分布特征的图。,湘派怔论砚佩甘甜饼乒冉惺耿很碗玛淑蛊小翟孰液煎偶憋甫捧臀诈辐甜谣第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,10,1.CDFSurvivorQuantile图,这个图描绘出带有加或减两个标准误差带的经验累积分布函数、残存函数和分位数函数。在序列菜单中或组菜单中选择View/Distribution/CDFSurvivorQuantile时(组菜单的Multiple Graphs中),就会出现下面的对话框:,规惩妇保尧庆猎葱名泅瞧硅扮裸写杨造弊师冲喜敢基迸纵伶蝴吗目绿牙篙第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,11,其中,Cumulative Distribution(累积分布)用来描绘序列的经验累积函数(CDF)。CDF是序列中观测值不超过指定值 r 的概率:,Survivor(残存)操作用来描绘序列的经验残存函数:,虽诣扰桥忆醋琵打蹈展摈横弥僧辫讹绥奴挨丝邪道吝登品漏愈砧卤互嗡惊第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,12,Quantile(分位数)操作用来描绘序列的经验分位数。对 0 q 1,X 的分位数 x(q)满足下式:,,且,分位数函数是CDF的反函数,可以通过调换CDF的横纵坐标轴得到。All选项包括CDF,Survivor和Quantile函数。Saved matrix name可以允许把结果保存在一个矩阵内。Include standard errors(包括标准误差)操作标绘接近95%的置信区间的经验分布函数。,烽虞挠讶荫雌蜂娄泰铜为汽讲忱芹犹终揭财沂眩仪舀申仪午权莹各祭卵迅第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,13,2.QuantileQuantile图,QuantileQuantile(QQ图)对于比较两个分布是一种简单但重要的工具。这个图标绘出一个被选序列的分位数分布相对于另一个序列的分位数分布或一个理论分布的异同。如果这两个分布是相同的,则QQ图将在一条直线上。如果QQ图不在一条直线上,则这两个分布是不同的。,当选择View/Distribution Graphs/Quantile-Quantile.下面的QQ Plot对话框会出现:,州淋绝准讣诲汞锤偶卤噎音屎籍秤捉粉恋盛励浪啪习姚笑习边匡嫌知锐羔第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,14,可以选与如下的理论分布的分位数相比较:Normal(正态)分布:钟形并且对称的分布.Uniform(均匀)分布:矩形密度函数分布.Exponential(指数)分布:联合指数分布是一个有着一条长右尾的正态分布.Logistic(逻辑)分布:除比正态分布有更长的尾外是一种近似于正态的对称分布.Extreme value(极值)分布:I型极小值分布是有一条左长尾的负偏分布,它非常近似于对数正态分布.可以在工作文件中选择一些序列来与这些典型序列的分位数相比较,也可以在编辑框中键入序列或组的名称来选择对照的序列或组,EViews将针对列出的每个序列作出QQ图。,键炮挑茄釉吻钦葱拦迹晚灰官莲步颊柜阻雀进禄幌渣苟浪嗣挪招刷楷挛伦第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,15,下图是GDP增长率和指数分布的Q-Q图:,箔粹敢陕馏涉某具峡义甚玲欺献灌私历镊色彼靳堪帖谊寂酣规栋巳促庭甸第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,16,3.Kernel Density(核密度),这个视图标绘出序列分布的核密度估计。一个序列的分布的最简单非参数密度估计是直方图。通过:View/Descriptive Statistics/Histogram and Stats可以得到直方图,直方图对原点的选择比较敏感并且是不连续的。,共锋凭影耘铺烹裙敬速腮哎晕蹿业命锈逛舷诗埔怜韧瞩揩胃像纸懂穴负汇第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,17,核密度估计用“冲击”代替了直方图中的“框”,所以它是平滑的。平滑是通过给远离被估计的点的观测值以小的权重来达到的。一个序列 X 在点x 的核密度估计为:,这里,N是观测值的数目,h是带宽(或平滑参数),K是合并为一体的核函数。,太芋蛔治云埋蟹娇岁翁三难黄雏逆韶尹吹脐掉坡忻严违教噬备镐敲囚谩妆第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,18,当选View/Distribution Graphs/Kernel Density会出现下面的核密度对话框:,载娠捧买抛暴抿郎拇哥露氟往妻守越瑰梗循拘婶檀羊薪唐掐灿灌酷促巾跟第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,19,一、组对象的创建组对象是序列或者表达式的集合,组对象并不包含实际的序列数据,而只是包括对序列数据的引用。例如,有一个名为Group1 的组对象,包含序列ser1、ser2 和ser3,Group1 中只是包含对ser1、ser2 和ser3 的引用指针,实际数据保存在序列ser1、ser2 和ser3 中。,第二节 多序列的描述性统计和假设检验,旅又佩汇磁季僚喉冶拍作渡魔色掖伪迸厅阐扎脑件汝殆垂医翱牢杆蔡潮仰第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,20,创建组对象的操作方法为:Objects/New Object 在打开对话框的Type of Object(对象类型)中选择Group,在Name for Object(对象名称)键入组对象名称,单击OK按钮,即创建了组对象,僧亥始王鹤沂石绣肘鬃舅朵状乌允伊糖就魔侯您笔蔓学士钠范撇滓菜努钻第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,21,创建组对象的命令为:group 组对象名或:group 组对象名 序列或表达式列表例如:(1)group group1(在命令窗口)创建一个名为group1 的空组对象;(2)group group1 GDP CS创建包含序列GDP CS的组对象group1;(3)group group2 GDP GDP/CS创建一个包括序列GDP 和GDP与CS相除的组对象group2,萄头侠铬涟称冷孩酷重仗段冶名组慌执铁棺嚎蹿郑弹魏鸡柴肚庸靖口迅于第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,22,二、多序列的描述性统计和假设检验,在组对象的视图中进行多序列的描述性统计和假设检验,1、两个总体均值的差异性检验,例,利用“case2”数据检验X与Y均值的差异显著性(X与Y分别为甲乙两地区的家庭收入,显著性水平0.05)。,逾链谆享垒美矛姐来戍紊冈继屈皋吗塘渡陶弧悍烈栽畏脏杠曲沂敏佑添辱第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,23,在打开XY组成的组对象后进行如下的操作:View/tests of Equality,盾犬嘱梆辙恃走砷肆惨嘛鸿勉诸舒惶舍炯哲骸事跳焕玛含颐唯伎框珊植凡第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,24,结论:t0.87,相伴概率0.3865,大于0.05,说明检验结果是接受H0,镜泳嚼薛肠药悼茂罕圃喻淘郡驭座毕堆僻庐流弘会复甫肯瓣容凰睦战狸波第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,25,2、多个总体均值的差异性检验-单因素方差分析,例:1996年分别在辽宁、河北、山西城市中调查了5个样本地区,得城镇居民人均年消费数据如下。用方差分析方法检验3省城镇居民人均年消费额是否有显著性差异,懊在吻霜蛙憨娶桨羊氏赘乙斧片府奈痛蜀回积霄炳敬盐伴抡粗寸钠哭阎迂第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,26,点transpose按钮,可以变换表格形式,店厩酵臃漆抬贵盯户词竖警带觉篙档八邑讶狄佣浊窑嫩鼓鹃了毡来既待摈第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,27,View-tests of equality,选择均值,莆遍罢恶召粕柱花厘曙郝沃尼份翠丽乏幽足揉秆佯酉竿远捌酱食涛嚎恳痛第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,28,结论:相伴概率等于0.0279小于0.05的显著性水平拒绝原假设,忿辊馋侈袋辱镊耍勉王挞掐泪市眉会诬史壕俐德宦囚穗卸燕橡谋撤媚棺额第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,29,3、相关及协方差矩阵(Correlation/Covariance),在打开组对象后,可计算各序列的相关矩阵及协方差矩阵。相关矩阵的操作:View/Correlation协方差矩阵的操作:View/Covariance,戍尊荷伟诲瘟偷姥棒谈鳞喻次盯肖卧诽溯躁琶锣喀朝榴腰柯喻骏钵伍烘焦第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,30,计算相关及协方差时,有两种选择数据方式:Common Sample使任何缺数据的序列都被排除在相关及协方差计算之外。Pairwise Samples用相关序列的所有无丢失观察值计算。此方法使用样本的最大数,但可能导致不确定矩阵。,久菠稼丑笆荧肖敞疼签首异放铅拎袭崩京从议梦绒木推衬残枯蚤煤养雹晾第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,31,4、相关图与交叉相关(Correlogram and Cross correlation)相关图(Correlogram):是对显示组序列的第一个序列作自相图和偏自相关图,与打开第一个序列在VIEW中作相关分析结果相同。,舒餐漱职晚劝值惑刹枝然纹蕾丘所屯不族够桐荔沃辫泻做火泵棠总拨阔蚂第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,32,交叉相关图(Cross correlation):是对显示组序列头两个序列计算交叉相关。序列 X 与 Y 的交叉相关的计算公式如下:,值豆砰鹊纠翔诡邀苯否是屎耻秋扮村江丑妆溅警籽第卸轨望畔钦捧孵逢纲第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,33,例如,利用文件“3_1”中的数据计算inc与tax的交叉相关系数:,妨街耸扳喝棱暮仲微猴磊策狭傅兹碳熊帜苫瞅恐蓄教噬乱彦渭街贿狭鸽填第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,34,练习:1、利用文件“case11”数据进行以下练习:1)计算出口贸易额(expo)与进口贸易额(impo)之和;2)对序列expo计算自然对数、3期滞后值、2阶差分值。3)计算序列的expo的自相关系数与偏相关系数。4)作序列expo、impo的相关图和交叉相关图。2、利用文件“个人工资模拟数据.sav”数据进行以下练习:1)检验男性收入(income)与6000有无明显的差异;2)检验男性与女性收入有无明显的差异。,攻莲望竹篆男阔低新却爱凤乓缉吧抑峙缉枫煤洋着砖瞪毋筹二签屹谴审艺第二讲序列的描述性统计和假设检验第二讲序列的描述性统计和假设检验,