中国城镇居民2003可支配收入分析 .doc
中国城镇居民2003年可支配收入分析摘要:本文通过对影响可支配收入因素的分析,并结合各种检验方法,得到计量经济模型,以此了解各个地区的发展程度且做出分析。关键字:可支配收入 个人所得税 社会保障补贴 第一部分建模的目的及其经济意义建立本模型的目的:通过对中国东北三省、长江中下游及沿海地区的城镇居民的人均可支配收入占总收入的比率的估计,可了解这些地区的经济发展状况。其经济意义是:1 通过对各个地区人均可支配收入占总收入比率的分析,可得各个地区的发展程度以及它们之间的差别;为各地区政府来年制定经济规划提供参考,分析各项利弊得失并找出症结所在,保证政策的合理性。2 人均可支配收入占总收入的比率还可作为各地区政府工作绩效考核指标,形成各地区间的良性竞争。3 该模型也可对企业的投资和经营提供参考,使优势资源得到合理配置。第二部分数据的取得模型所用数据均取自2004中国统计年鉴及2004中国人口年鉴。现对所用数据做以下说明:1 依照研究的目的,我们选择了17个省及直辖市作为研究地区来估计模型,它们分布在东北三省、长江中下游及沿海地区,这样减小了由地区性差异带来的误差。2 所选项目包括:城镇居民人均可支配收入、城镇居民人均社会保障补贴、城镇居民人均个人所得税、城市人口等。3 由于所得税的征收时间不长且年鉴中的数据多以年为统计单位,为了保证取得充足的数据,我们选择了截面数据而非时间序列数据进行估计。4 由于统计年鉴上福利补贴项目的数据是按各个城市的补贴总数来统计的,而模型中需要用到的是人平均数。因此,我们用补贴总数除以该地区城镇居民总人数,求得近似值来估计。(注:该福利补贴是指养老保险、住房公积等项目的加总,不考虑农村人口)第三部分模型建立首先,在选择解释变量时,我们最初考虑到了通货膨胀率对可支配收入的影响,因为模型中的城镇居民可支配收入是一个名义收入,而从现实经济生活来看,实际可支配收入才能真正表现出居民的实际购买力,才是一个具有实际经济意义的变量。但是,我们加入这个解释变量时遇到了问题,因为实际可支配收入名义可支配收入*(1通货膨胀率),就目前中国的经济情况来看,居民对通货膨胀的敏感度不高,而且我们用的是截面数据,通货膨胀率对这个模型的影响可以忽略不计,因此在建立模型时我们剔除了这个解释变量。其次,我们还考虑到了就业率对居民可支配收入的影响,一个地区的就业情况越好,那么该地区的居民收入也会越多,而可支配收入也会随之增加。但在收集资料的过程中我们发现就业率统计口径并不一致,而且本文模型所要求的是城镇居民的就业率,而统计数据是以一个地区的所有居民为基础的,因此我们不能采用它作为解释变量。第三,我们主要是想模拟在一年之中中国东北三省、长江中下游及沿海地区的城镇人均可支配收入与其总收入、个人所得税和社会保障补贴之间的关系。我们选择的被解释变量是:城镇人均可支配收入YD我们选择的解释变量是:城镇人均总收入Y 城镇人均个人所得税T 城镇人均社会保障补贴E我们所用的模型为: 经济意义如下:这里的城镇人均总收入是指城镇居民的劳动收入以及其他的非劳动收入,但其中不包括政府的补贴。因此,可支配收入YD与其总收入Y是成正比的关系:即Y增加,YD也应增加,也即是说系数应该为正。这里的T是指城镇居民上缴的个人所得税。因此YD与T成反比的关系:即T增加,YD应减少,即是说系数应该为负。个人所得税和人均总收入之间可能存在多重共线性,这是因为国家在征收个人所得税时是以居民的总收入作为税基的,因此总收入的变化要引起个人所得税的变化,二者存在着密切的关联度。这里的E是指政府补贴给城镇居民的社会保障补贴。因此YD与E成正关系:即E增加,YD也应增加,即是说系数应该为正。政府补贴与人均总收入应该也存在一定程度上的共线性。第四、为了估计,我们选用的数据如表1:省份项目城镇居民人均可支配收入YD(元)城镇居民人均总收入Y(元)城镇居民人均个人所得税T(元)城镇居民人均社会保障支出E(元)北京13882.6214959.35878.612824131.6296753天津10312.9110971.57221.0705467485.0952381河北7239.067608.43140.1560207433.1628949辽宁7240.587832.7112.2632607608.3262641吉林7005.177311.2369.28470004439.858005黑龙江6678.96968.0188.25094446498.5555823上海14867.4916380.24504.3380855232.664513江苏9262.469912.14178.1565287150.6242513浙江13179.5314295.38287.2976534138.2300163安徽6778.037155.9175.76353774451.5564954福建9999.5410816.32206.722427582.38864034江西6901.427153.6583.08175383473.2484586山东8399.919057.58108.5103189144.0304357湖北7321.987745.7769.64209888294.492569湖南7674.28145.07135.1655924531.9226495广东12380.4313451.13440.901647172.1731646海南7259.257605.69143.9720352451.9368203表1 统计资料第四部分模型检验 先对17个数据进行回归分析用OLS方法回归得到表2Dependent Variable: YDMethod: Least SquaresDate: 06/03/05 Time: 16:00Sample: 1 17Included observations: 17VariableCoefficientStd. Errort-StatisticProb. C496.4948132.23053.7547670.0024Y0.8808630.00950292.702860.0000T0.0346010.0168192.0572190.0603E0.0367980.1572640.2339860.8186R-squared0.999303 Mean dependent var9199.028Adjusted R-squared0.999142 S.D. dependent var2763.035S.E. of regression80.91209 Akaike info criterion11.82693Sum squared resid85107.96 Schwarz criterion12.02298Log likelihood-96.52889 F-statistic6215.012Durbin-Watson stat2.477990 Prob(F-statistic)0.000000 表2从表2中可以看到税收的参数的估计值0.034601>0,这与我们开始所估计的有出入。究其原因我们发现,北京的数据与其他地区的数据差距太大,因此我们去掉了这个异常数据北京的数据,而只采用了16个数据。 对这16个数据进行回归分析将数据录入后用OLS法对模型 进行回归,得到表3Dependent Variable: YDMethod: Least SquaresDate: 06/03/05 Time: 16:10Sample: 2 17Included observations: 16VariableCoefficientStd. Errort-StatisticProb. C444.3489211.26522.1032760.0572Y0.8887940.02636633.710240.0000T-0.1364760.527820-0.2585660.8004E0.0573310.1748400.3279030.7486R-squared0.999146 Mean dependent var8906.304Adjusted R-squared0.998933 S.D. dependent var2567.006S.E. of regression83.84934 Akaike info criterion11.90824Sum squared resid84368.55 Schwarz criterion12.10139Log likelihood-91.26591 F-statistic4682.238Durbin-Watson stat1.870753 Prob(F-statistic)0.000000表3 由表3我们看到,和很大,且F值显著大于给定显著性水平(0.05)下的临界值,而变量对应的偏回归系数的t值不显著,因此我们怀疑该模型存在多重共线形。 对该模型进行多重共线性检验:检验方法:相关系数矩阵法,得到表4YTEY 1.000000 0.941332-0.629425T 0.941332 1.000000-0.497713E-0.629425-0.497713 1.000000表4从表4可以看出Y与T具有较强的相关性,两者的相关系数达到了0.941332,且Y与E相关系数为 -0.629425,说明该模型存在多重共线性。因此我们对该模型进行了修正。修正方法:比率法我们对解释变量和被解释变量重新定义令 YD1=Yd/YT1=T/YE1=E/Y 各个变量的经济意义如下:YD1 可支配收入在总收入中占的比重T1 个人所得税在总收入中占的比重E1 社会保障补贴在总收入中占的比重将模型修正为 其中,为T1对YD1的影响程度;为E1对YD1的影响程度。 对修正模型进行OLS回归得到表5:Dependent Variable: YD1Method: Least SquaresDate: 06/03/05 Time: 16:14Sample: 2 17Included observations: 16VariableCoefficientStd. Errort-StatisticProb. C0.9407470.01268674.154770.0000T1-0.9228880.490180-1.8827530.0823E10.3304810.1317822.5077800.0262R-squared0.623324 Mean dependent var0.938916Adjusted R-squared0.565374 S.D. dependent var0.016573S.E. of regression0.010926 Akaike info criterion-6.028021Sum squared resid0.001552 Schwarz criterion-5.883160Log likelihood51.22416 F-statistic10.75620Durbin-Watson stat1.519451 Prob(F-statistic)0.001753 表5 对修正模型拟合优度的检验由表5可得:可决系数为0.623324,0.565374虽然可决系数和修正的可决系数比较低,但是考虑到经济意义,我们仍然接受这样的可决系数程度。 对修正模型回归参数的显著性检验检验方法:t检验法在显著性水平为0.1下,自由度为n-k=16-3=13查t分布表有,(13)=1.782由表5有: -1.882753<-,但t值偏小。这是因为中国个人所得税开征比较晚,个人所得税的征收还不完善、统计也不完善,由此造成一定的制度性误差和统计误差,而这部分误差是不可避免和消除的。 2.507780>,显著不为0的。 对修正模型回归方程的显著性检验检验方法:F检验法在显著性水平为0.05下,自由度为(k-1,n-k)=(2,13)查F分布表,有(2,13)3.81由表5,F=10.75620>(2,13),因此我们认为方程具有整体显著性。 对修正模型的多重共线性进行检验检验方法:相关系数矩阵法,得到表6T1E1T1 1.000000-0.549320E1-0.549320 1.000000 表6由上表我们可以看出T1与E1之间的相关系数为-0.549320,因此我们可以认为此模型已不存在多重共线性。 对修正模型的异方差性进行检验检验方法为:Goldfeld-Quandt检验法截取第一部分样本2-6,进行OLS回归,得到0.000145截取第二部分样本13-17,进行OLS回归,得到 0.000120计算F统计量:F=0.827586查F分布表,给定显著性水平0.05,得到临界值(3,3)=9.28>F,则接受:,表明随机误差项不存在显著异方差性。 对修正模型的自相关性进行检验检验方法:图示法和D-W检验法图示法:绘制和的二维坐标图如下D-W检验法:给定显著性水平0.01,2,n16,查表可得:0.737,1.252,4-2.748由表5可以得到,DW1.519451 ,因此可以得出<DW<4-表明修正模型随即误差项不存在自相关性。 最终回归模型= 0.940747 - 0.922888T1 + 0.330487E1 t= (74.15477) (-1.882753) (2.507780) 0.565374 F=10.75620 带入数据检验上海:T1=0.030789 E1=0.014204YD1=0.907648将T1和E1代入回归方程=0.917026误差为1.059河南:T1=0.0096667E1=0.033261YD1=0.955986 将T1和E1代入回归方程=0.942817 误差为-1.378四川:T1=0.013441E1=0.050172YD1=0.940359 将T1和E1代入回归方程=0.944924 误差为0.485广西:T1=0.015446E1=0.032949YD1=0.938646 将T1和E1代入回归方程=0.937381 误差为-0.135 通过以上检验,我们看到模型的估计值与真实值之间差别不大,说明该模型做出的估计在实际操作中是有效的。我们可以借此估算当地经济情况,为来年规划提供参考。第五部分总结我们最终的回归模型为:= 0.940747 - 0.922888T1 + 0.330487E1 t= (74.15477) (-1.882753) (-1.882753) 0.565374 F=10.75620由以上模型可知,可支配收入在总收入中占的比重(YD1)与个人所得税在总收入中占的比重(T1)成反比的关系:即T1增加,YD1减少,T1的系数为负,与经济意义相符。YD1与社会保障补贴在总收入中占的比重(E1)成正比关系:即E1增加,YD1也增加,E1的系数为正,与经济意义相符。综上,修正的模型比较符合现实经济意义。在资料搜集和模型建立检验的过程中,由于我们知识有限、经验不足,难免会出现一些问题,望老师批评指正。