统计建模与R软件-第一讲-(2018).ppt
《统计建模与R软件-第一讲-(2018).ppt》由会员分享,可在线阅读,更多相关《统计建模与R软件-第一讲-(2018).ppt(47页珍藏版)》请在三一办公上搜索。
1、,统计建模与R软件 郭广报 统计计算,课程意义,统计学的目的:解释数据!统计计算的关键是,拥有自己的code一些特殊研究机构:阿里研究院 百度研究院 腾讯研究院 光启研究院 滴滴研究院,2,课程教材和参考书目,薛毅,陈立萍.统计建模与R软件.清华大学出版社,2007Kabacoff著,高涛,肖楠等译.R语言实战(R inAction:Data analysis and graphics with R).人民邮电出版社,2013何晓群.多元统计分析(第三版).中国人民大学出版社,2012,课程教材和资料,吴喜之.统计学-从数据到结论(第4版).中国统计出版社,2013吴喜之.复杂数据统计方法基于
2、R的应用.中国人民大学出版社,2012,统计之都http:/cos.name/,5,经管之家,6,课程内容与进度,序号123456789,内容统计建模概论R软件的使用数据描述性分析参数估计假设检验回归分析方差分析应用多元分析计算机模拟7,第一讲 概论,统计建模的概念及特点统计建模的步骤统计建模常用软件,一、统计建模的概念及特点,统计学:收集、分析、展示和解释数据的科学。统计建模:以计算机统计分析软件为工具,利用各种统计分析方法对批量数据建立统计模型和探索处理的过程,用于揭示数据背后的因素,诠释社会经济现象,或对经济和社会发展做出预测或判断。,中国统计教育学会,统计建模的意义,随着计算机和网络技
3、术的发展,我们面对着数据和信息爆炸的挑战,如何迅速有效地将数据提升为信息、知识和智能,是统计工作者面临的重要课 题。,统计建模将统计方法、计算机技术完美结合,,带动以数据分析为导向的统计思维,发现和挖掘数据背后 的规律,为经济社会的发展提供更好更多的统计信息。,统计建模的特点,1.模型只能是对客观世界的一种近似,是现实的简单化或理想化。统计建模的宗旨,就是设法建立“有用的”模型,而不是所谓“绝对正确的”模型。Box(1976)“有用的”模型能抓住并凸显现象中与分析目的最相关之主要特征,因此统计建模的成功与对主题领域的了解密切相关。,统计建模的特点,2.建模者应根据目的来寻找合适的数据和建模方法
4、。数据:数据的来源;数据的真实性;数据所含信息;数据是否适合建模。方法:同一个问题,可采用多种方法,也可能需要多种方法。一个好的建模(统计学实证paper)的三要素:,ideadatamodel,统计建模的特点,3.统计建模是一个学习与实践的过程统计学:统计学基础、多元统计分析、非参数统计、贝叶斯统计计量经济学:时间序列、面板数据、微观计量、非参数时间序列分析:一元、多元、波动建模、非线性专业领域背景知识统计分析软件:Matlab、R、SPSS、SAS,统计建模的注意事项,避免只用一种方法(未比较其他模型和交叉验证),应该避免没有根据或比较地任意假定模型形式。不要过度夸大一个模型的功能,即使是
5、诺贝尔经济奖获得者也无法预测出任何一次经济危机?任何一个现成模型必须得经受最新数据的考验,否则必须被替代或修改:例如,线性非线性;一元多元;水平二阶矩偏度和峰度 经验:模仿权威文献,适当引入自己变量!,统计的本质,观测/实验数据,理论/假说/模型,p2,明确问题,数据收集,数据预处理,撰写论文结果分析模型检验模型估计模型构建,二、统计建模的步骤,1.明确问题,许多数理统计杂志喜欢发表没有任何数据背景的有关数学模型的文章;许多统计毕业生只会推导和证明各种模型,却不擅长处理真实的问题和数据;许多人面对着有限样本,也假装是大样本,并且不经验证,据此得到结论;一些人不从数据出发,在学习或者构建了一个新
6、模型后,就生搬硬套,寻找“适合”的数据来“证明”自己的模型有意义。,供应链问题;小微企业贷款问题;富二代问题;二胎问题;企业税负减免问题;人民币贬值问题;收入差距扩大问题;学排行榜问题,明确问题:以问题和数据为导向,明确问题:以问题和数据为导向,可以搜集哪些变量?哪些是控制变量?,哪些是无法掌控的变量?,哪些是需要重点研究的变量?适合构建什么模型?,模型结果与理论是否吻合?,预测精度怎样?未来的变化趋势怎样?有何政策含义?,统计建模已经帮这个世界解决许多真实且实际的问题(农业、医学、遗传、工业、商业等)。各个领域都靠统计解决许多问题,所以统计是问题导向,人们在“没有标准答案的问题”中寻,求近似
7、可靠稳定的模型提供解决方案!,明确问题:以问题和数据为导向,2.数据收集,一手数据:调查、实验观察二手数据:书籍、网络、年鉴基准数据统计建模时,一定要写清数据来源!,数据收集,1.政府统计数据,统计局网站或年鉴国家各部委,例如人民银行、国税总局、商务部等,2.国际组织,世界银行世界发展指数数据库国际货币基金组织IMFIFS 数据库世界贸易组织WTO贸易统计年鉴国际清算银行、亚洲开发银行、泛美开发银行、联合国世界粮农组织、联合国环境署、联合国教科文组织等,数据收集,3.权威商业机构统计数据库,全球银行、金融机构信息库BvD全球市场信息数据库GMID亚洲经济数据库(CEIC ASIA)英国路透(R
8、euters)数据库中经网统计信息数据库,4.非政府组织的抽样调查数据:大学、科研院所组织的调查统计,美国北卡莱罗纳大学和中国疾病控制与预防中心联合主办的“中国健康与营养调查(CHNS),高校常用数据库,1.国家统计局官网2.中经网统计数据库3.国研网统计数据库4.CCER统计数据库5.Wind数据库6.BvD数据库,如果有些数据库找不到,请与其它高校的同学或者朋友联系,或者国外同学联系,国家统计局,28,国内常用微观数据库,1.CHIP数据,中国社会科学院经济研究所收入分配课题组(李实、赵人伟老师主持,福特基金会赞助)于1988年、1995年和2002年,进行的全国调查中的中国农村和城市居民
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 建模 软件 第一 2018

链接地址:https://www.31ppt.com/p-5299735.html