会计与财务的数量方法.ppt
会计与财务的数量方法-计量模型(1),上海国家会计学院张人骥JUNY 2012(1.2),RENJI CHANG(SNAI),2,CV,教育背景:1960-1965 复旦大学数学系 1979-1981 同济大学管理学院(硕士)1986-1989 联邦德国Giessen大学经济系(博士候选人)工作经历 1981-2001 上海财经大学 2001-上海国家会计学院联系方式:电话:(021)69768000-68232 传真 E-M:地址:上海蟠龙路200 邮编:201702,RENJI CHANG(SNAI),3,前言,学术研究 发现与创造两个条件-掌握已有的发现与创造(这是你前进的台阶)-掌握适当的“工具”核心思想 即对会计领域相关问题的痴迷般的兴趣和深入的把握-直觉与灵感,RENJI CHANG(SNAI),4,前言,在当前规模巨大的信息量如何有效地了解学术发展前沿-文献的阅读与独立的作出评述(分析与综合)-介绍两套重要的文献:“当代会计研究”:共有九个专题综述和对应的九个评论,总结了80年代至上世纪末的研究动态。已由人大出版社在09年翻译出版,RENJI CHANG(SNAI),5,前言,JAE Conference papers(2009):在总结第一个十年后,出版六个专题报告,Understanding Earnings Quality;The Role of Information and Financial Reporting;A Review of Tax Research;The Financial Reporting Environment;Accounting Anomalies and Fundamental Analysis;What should GAAP look like?,RENJI CHANG(SNAI),6,前言,合适的工具:大学里这部分属于会计研究方法论的部分,(陈冬华教授的课程)本课程不涉及这个大的领域,内容聚集在面向应用的统计和回归有关的计量经济学。,RENJI CHANG(SNAI),7,前言,主要参考资料-高铁梅等:计量经济分析方法与建模,清华大学出版社。是国内较好的教材,特别是结合Eviews软件使用。-伍德里奇:计量经济学导论,中国人大出版社,近年来的优秀教材。-坎贝尔:金融市场的计量经济学,上海财大出版社,统治十余年的经典教材,它的许多习题是可以作为论文的重要方法而使用。,RENJI CHANG(SNAI),8,前言,本课件中的例子主要来源于“上海国家会计学院论文集”第一,二,三集;”上海国家会计学院案例集“第一,二,三,四集。其它文献将注明出处。建议的软件工具:state或Eviews 在正式发表论文时,不要把盗版软件名披露出来,RENJI CHANG(SNAI),9,RENJI CHANG(SNAI),9,经济数学模型,理论模型,计量经济模型,财务与会计理论,政策,规则,制度,一般数学,运筹学,统计学,计算数学,RENJI CHANG(SNAI),10,内容(细节见大纲),前言数据:特征与来源描述性统计估计与推断,一元回归多元回归回归模型中的特殊问题面板数据分析,RENJI CHANG(SNAI),11,数据:特征与来源,学术研究的数据来源-公开发表的数据-调查数据-实验数据,RENJI CHANG(SNAI),12,公开的数据,专业数据库-万德,CISMA,路透等等各种网站各种媒体报道怎样由数据库获取公开数据,RENJI CHANG(SNAI),13,调查数据,怎样实施一个调查:这是很有意义但并不简单的任务调查数据收集的步骤-研究目标具体化成假说最后转化为问卷-问卷设计与初步检验-有效问卷与数据整理-信度与效度的检验,RENJI CHANG(SNAI),14,调查数据,-构建数学模型或统计模型,检验符合研究目标的假说参考例子:上海国家会计学院:“成为胜任的CFO”,p118.,RENJI CHANG(SNAI),15,实验数据,参考例子-夏大慰等:“会计准则国际趋同的经济后果与博弈”,第二章第四节,(上海国家会计学院学术丛书,经济科学出版社,2010),RENJI CHANG(SNAI),16,数据类型,定量与定性-严格以数值表示其实质意义的变量数据-变量数据不能表示实质意义的数据,一般表示某个特性,类别或状态,因为会计数据都是以货币计量的,所以会计与财务数据都是定量数据,如利润。现金流,应收账款,负债率,内部收益率等等定性数据(变量)中常见的如公司性质(国有,民营),分类的如盈利(ST与非ST),状态的如控股情况(大于50%,在50%-30%,30%以下),数据类型,连续与离散-连续数据是指在每一个时点上取值的变量数据,例如股价指数,长期考查的公司现金流量,利润等-离散数据是在某些时点上取值的变量数据,(有时离散数据取的是整数)-在会计与财务问题中变量取的是连续数据还是离散数据是与实际研究方法相关的,如年度或季度的利润在一些理论模型中可以作为连续变量,数据类型,定序与定名-定序数据反映了变量的顺序特征,例如世界500强,地区市场化指数-定名数据仅是一个分类数据,它不表示任何次序,间距也没用实际意义,仅表示某种性质和状态 例如国有公司=1,民营公司=0,(或反之)。又如国有股权50%公司=1,国有股权30%而50%的公司=2,国有股权30%的公司=3,-这两种数据在一些特殊情况下也可互换,RENJI CHANG(SNAI),19,数据类型,RENJI CHANG(SNAI),20,数据结构,截面数据时间序列数据混合数据面板数据,截面数据,在给定的时点对企业或其他单位的样本所采集的财务与会计数据集合。例如2011年全部上市公司年报数据集合。时点是2011.12.31.-截面数据的基本前提:随机抽样-因此:允许截面上时点的可以忽略的差异-允许有几个联系或间断的样本,截面数据研究例子,Fama,E.F.,and MacBeth,J.D.,1973,“Risk,Return and Equilibrium:Empirical Tests”,Journal of Political Economy,71,607-636.Data:Monthly returns on all stocks at NYSE during 1926-1968研究股票收益率与系统风险关系,时间序列数据,时间序列数据是由一个或几个变量不同时点上的观测值组成。例如长期(10年或更长)考查某个公司或某些公司的利润,现金流等收集的数据。-问题:连续时点数据的不独立性,如一季度利润与二季度利润之间依赖-问题:观察期较长,如考虑季度利润的特征,约需要40-60个时点,大约10-15年-问题:一些产业或公司会有周期性的变动,这会干预和影响研究的结论-问题:方法的复杂性,混合数据,同时有截面数据特性和时序数据特性的数据集合。-把不同年度的截面数据混合是研究政策影响的重要方法(例如,新旧会计准则的实施影响)-混合截面可以对变量在不同时点的现实差异作出解释,以看出某个重要关系随时间变化的特征-扩大样本,混合数据研究例子,夏大慰,赵春光等:“会计准则国际趋同的经济后果与博弈”,经济科学出版社,2010.第八章。2005-2008年数据,新旧准则实施前后两个时点的截面数据混合,研究盈余管理问题,面板数据,面板数据指的是截面数据集的时间序列,也即同一截面上的一个样本已经有一个时期的时间序列。有利于控制个体的异质性,前两种数据无法控制的,例如,100家上市公司连续观察15年的财务数据,这中间影响财务数据的有两种,即同一截面中产业差异和同一公司不同年度间的变动。,面板数据,选择问题截面相关性,RENJI CHANG(SNAI),28,描述性统计,描述性统计做什么-识别数据(分布)特征-通过对数据特征的分析得出经验的结论,RENJI CHANG(SNAI),29,描述性统计,频数分布,频数,绝对,相对,累积绝对频数,累积相对频数,RENJI CHANG(SNAI),30,描述性统计,位置参数,中间值,位置中间值,计算中间值,众数,分位数,其它分位数,算术平均值,几何平均值,调和平均值,RENJI CHANG(SNAI),31,描述性统计,分散性参数-平均偏差-方差-标准差-方差系数-全距-分位间距-分位离差,RENJI CHANG(SNAI),32,描述性统计,偏度:三阶距峰度:四阶距,RENJI CHANG(SNAI),33,描述性统计,集中度(位置参数另一个表述),集中度度量,集中度比例,洛伦兹曲线,基尼系数,哈芬达尔指数,RENJI CHANG(SNAI),35,描述性统计例子,考察年报披露时滞的信息含量,会计期限,会计期限结束日,预约披露日,年报披露截止日,年报预约披露时滞,预约时间公布日,RENJI CHANG(SNAI),36,2002-2005年上市公司年报预约披露时间统计表(按月统计),RENJI CHANG(SNAI),37,2002-2005年上市公司年报预约披露时滞统计表(按天数统计),RENJI CHANG(SNAI),38,2002-2005上市公司年报预约披露时滞描述统计,RENJI CHANG(SNAI),39,讨论,从2002到2005年,上市公司年报预约披露时滞逐年增加。预约披露时滞的均值从2002年的84.33天逐步增加到2005年的88.90天。这意味着公司对年报披露时间的预计越来越理性,而不再受“好消息早,坏消息晚”的影响为给投资者留下“好消息”的印象而故意将披露日预约到较早的时间。,RENJI CHANG(SNAI),40,讨论,2002-2005年预约披露时滞的最小值逐年增加,说明在同等条件下,公司越来越倾向于较晚披露年报。预约披露时滞的最大值一直都稳定在120天。我国法律规定上市公司的年度财务报告应在每一会计年度结束之日起4个月内披露;预约在第120天披露意味着公司有可能,RENJI CHANG(SNAI),41,估计与推断,估计:从总体中随机抽取一个样本,利用样本统计量推算总体参数的过程两种估计过程:点估计与区间估计点估计:根据样本数据计算的统计量对未知的总体参数进行估计,得出的是一个确切的数值,RENJI CHANG(SNAI),42,估计与推断,点估计方法-最小二乘(一般线性回归模型最常用)-极大似然(logit模型使用)-矩估计(可以不考虑总体分布)点估计评判-无偏-有效-一致-在上述的评判下仍不能了解误差的大小,RENJI CHANG(SNAI),43,估计与推断,区间估计:估计误差通过置信度和置信区间表示出来,从而得出参数估计的一个取值区间。数学表达式 其中 为置信区间,为置信水平或置信度,为显著性水平,,估计与推断,区间估计中的基本判定-置信区间的大小与置信度成正比-增加样本容量可以减小置信区间,提高估计精度-由此,在样本容量不变时,为降低推断错误风险的途径是提高置信水平,但会扩大置信区间而降低精度,估计与推断,假设检验-是统计推断的另一个重要内容-假设检验是先对总体参数提出一个假设,然后用样本信息来判断假设是否成立-在回归分析中检验回归系数的假设研究假设与零假设-研究假设:希望得到支持的假设-零假设:与研究假设对立的假设(希望得到否定的假设),估计与推断,-假设检验是指通过检验与其对立的零假设,来间接获取研究假设正确的可能性。或者零假设正确的可能性很小,从而也间接地肯定了研究假设。两类错误-否定了原先正确的零假设(犯错概率)-没有否定原先错误的零假设(犯错概率)-降低错误:增加样本量;可以事先自行设定条件下检验的成效取决于,估计与推断,步骤-假定零假设正确的情况下,将样本统计量(例如样本均值)转化为某一分布的统计量(例如Z值),然后对点估计量和零假设的总体参数的差异度量。如果零假设成立情况下得到的检验统计值落在置信区间内,则接受零假设,而落在置信区间外则拒绝零假设。,估计与推断,置信区间大小与显著性水平有关,显著性水平代表样本统计值被拒绝的可能性,或者犯第一类错误的概率P-值:假定零假设正确时利用观测数据得到与零假设相一致的概率;P与 关系:是研究者设定的值,p值是样本计算的实际值,估计与推断,检验结果判定:如果p值小于等于显著性水平则拒绝零假设,如果p值大于显著性水平则不拒绝零假设显著与不显著不是绝对的,只是随p值的减少,结论的可靠性越来越强实际研究中一般定在0.01,0.05和0.10,当然0.10已经是非常弱的支持,RENJI CHANG(SNAI),50,一元回归,线性回归模型-无论理论模型,计量经济模型它们的基础都是经济理论,或具体的就是会计与财务的理论,规则,制度,观点,现象-数学模型是描述上述理论,规则,制度,观点,现象的“另一种语言”-线性回归模型就是最简单的模型之一,一元回归,线性回归模型的基本结构-被解释变量=f(解释变量)+残差-被解释变量y,结果变量,反应变量,内生变量(随机变量)-解释变量x,自变量,先决变量,外生变量-残差,随机误差(随机变量),一元回归,线性回归模型的基本假定-线性回归模型描述了x与y的关系(在经济学上是因果关系)-X是非随机的-误差的期望值(均值)为零-误差项方差不变,是同方差-误差项之间无关-误差项与x无关-误差项服从正态分布,一元回归,回归系数的OLS估计 方程中的,两个参数是由最小二乘法估计出的,它的基本思想是:通过各个数据点画出一条直线,而使个点到直线的距离的平方和最小。运用这个求极值的运算解出这两个参数值。最小平方和并非最佳估计的唯一标准。例如也可采用距离绝对值的和最小,求出参数。但OLS求出的系数有更好的统计性质,即残差和总是为零。,一元回归,回归方程是一条直线,那么这条直线与数据的拟合的程度,或者拟合的密切程度是由R2衡量,称为判定系数,它取值在0到1之间,越大越好。在最简单的模型中,它也代表了x,y的相关系数的平方在总体上判定了数据拟合程度后,需要实施检验。,一元回归,回归分析中检验什么-模型整体检验,即检验根据样本数据建立的回归方程在总体中有解释能力-回归系数检验,即检验方程中解释变量x对非解释变量y 的影响在总体中也存在(一元回归中这两个检验是一回事),一元回归,整体检验(F检验)-回归方程的解释力是由R2度量的,整体检验就是对R2的检验,但它不是一个直接刻检验的量,因此需要一个新统计量,这就是F,-计算的F值与一个相应的临界值Fa比较,F Fa,两个变量线性关系显著存在;F Fa表示线性关系不显著,但不是没有关系,一元回归,回归系数检验(t检验)-这里就是检验,所以零假设是=0,-误差项的标准差越大就越难精确预测-x的标准差越大就越精确预测-增加样本量有助于估计的准确-截距与斜率的估计量都服从于n-2的t分布,一元回归,一组简单的“数据”:,一元回归,y的均值为9500,x的均值为104.5,可以对这两个变量作描述性统计分析如果在经济学理论上得出y是受x支配的,这就决定了有如下的函数关系 y=f(x)为了解x与y的关系-直接计算相关系数-将y回归到x上,一元回归,回归方程的建立结果=-13661.3,=221.639 方程是:y=-13661.3+221.639x,一元回归,一元回归,一元回归例子,问题:现金持有量与公司治理的关系理论分析:在股东保护环境好,现金持有量少(?)假说:在不考虑其它因素影响下,现金持有量与股东保护程度成负相关理论模型:现金持有量=f(股东保护程度度量),一元回归例子,困难:怎样度量股东保护程度设计一个可以度量的指标 x X=X1+X2+X3第一大股东持股比例 因素X1 小于等于20%3大于20%且小于等于50%2 大于50%1,一元回归例子,第一大股东持股比例与其他三大股东持股比例之差 因素X2 小于等于零 1 大于零 0,一元回归例子,现金持有量比率=(库存现金、银行存款和短期投资)/(帐面总资产 现金)回归方程 CashholdR=+SharproV+下面两件工作:-数据准备和预处理-估计 和,检验我们的假说,一元回归例子,研究样本包括2000年度公布年报的991家沪、深上市A股公司。本文研究重点是上市公司现金持有量-剔除了金融性公司-2000度新上市且资料不全的公司排除在样本之外-发行N股或H股的公司剔除而保留同时发行A、B股的公司-时点选择在年末12月29日,部分ST、PT股票当日没有交易行情,也作了剔除,一元回归例子,研究样本观测值最终991个描述性统计 股东保护变量值 现金持有量比率 现金持有量比率中 样本数(N)均值 中值(股东保护很差)132.61%18.62%284(股东保护较差)229.80%17.26%425(股东保护一般)327.60%14.45%182(股东保护较好)425.57%14.61%78(股东保护良好)522.40%10.67%22 合计 991,一元回归例子,VaribleRegre.Constant 0.349(11.147)*SharproV-2.430E-02(-1.817)*样本量 调整R2 F值 991 0.002 3.302*,一元回归例子,为对应于假说,统计的检验提出的假设是:-H0=0,H1 0 这样,当拒绝H0 后就接受H1 0。检验结果在10%水平上拒绝原假设,公司治理变量的系数显著为负,我们的假说得到一定支持。,RENJI CHANG(SNAI),71,谢 谢,