欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOC文档下载  

    数据分析课程论文.doc

    • 资源ID:4025023       资源大小:419.50KB        全文页数:28页
    • 资源格式: DOC        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数据分析课程论文.doc

    海 南 大 学数据分析课程论文 题 目:我国人均GDP的发展情况及其影响因素分析学 号: 姓 名: 年 级:2010级 学 院:信息科学技术学院 系 别:数 学 系 专 业:数学与应用数学 指导教师: 完成日期:2013年 6 月 25 日 摘 要 人均国内生产总值(Real GDP per capita),也称作“人均GDP",常作为发展经济学中衡量经济发展状况的指标,是重要的宏观经济指标之一,它是人们了解和把握一个国家或地区的宏观经济运行状况的有效工具。将一个国家核算期内(通常是一年)实现的国内生产总值与这个国家的常住人口(目前使用户籍人口)相比进行计算,得到人均国内生产总值。是衡量各国人民生活水平的一个标准,为了更加客观的衡量,经常与购买力平价结合。本文依据19782008年我国人均消费和人均国内生产总值和2003年各地区人均国内生产总值和对外开放水平的相关数据,运用相关知识,对我国人均消费和人均国内生产总值关系、分布地区及对外水平和人均国内生产总值关系进行检验。首先应用从中国统计年鉴收集的19872008年我国人均国内生产总值的数据,利用MATLAB软件求出其数字特征,根据求出的数据特征进行分析;再利用MATLAB软件绘制曲线图,根据图形分析其变化趋势。 其次应用所搜集的2003年各地区的统计数据,应用MATLAB软件进行数据拟合,直观的展现变量之间的关系。关键词:人均国内生产总值 回归分析 居民平均消费水平 MATLABAbstrartThe per capita gross domestic product (Real GDP per capita), also known as the "GDP" per capita, often in development economics as a measure of economic performance index, is one of the important macroeconomic indicators, it is an effective tool to understand and grasp the situation of macro economy of a country or region's people. A national accounting period (usually a year) to achieve the GDP and the country's resident population (currently used household population) compared to calculate, get the per capita gdp. Is a standard to measure the standard of living of the people of various countries, in order to measure more objective, often combined with the purchasing power parity.Based on the relevant data of the per capita GDP in 1978 - 2008 China's per capita consumption and per capita GDP in 2003 and the various regions and the level of opening up, using the related knowledge, to examine China's per capita consumption and distribution of per capita GDP, area and level of foreign trade and GDP per capita relationship.The first application from the "China Statistical Yearbook" collection of 1987 - 2008 China's per capita GDP data, calculate the numerical characteristics by using the MATLAB software, according to the analysis of data characteristics calculated; then we use MATLAB software to draw curves, based on the graphic analysis of its changing trend.The statistical data collected in 2003 followed by application area, application of MATLAB software for data fitting, reveal the relationship between variables.Keywoords: Real GDP per capita;regression analysis ;average consumption level of residents;MATLAB目 录1 绪论-11.1背景-11.2意义-12 问题分析与数据收集-2 2.1问题分析 -2 2.2 数据收集与处理-23 相关知识-2 3.1数据的数字特征 -3 3.2 一元线性回归分析-54 符号说明-85 建立模型-9 5.1模型一的分析与建立-9 5.2 模型二的分析与建立-10 5.3 模型三的分析与建立-136 总结-15参考文献-16附录-171绪论1.1背景1996年以来,中国宏观经济运行呈现出需求不振,物价持续走低,经济增长乏力的发展态势,从原来的持续高速增长状态走向缓慢增长阶段.尽管中国人民银行已经连续8次降息,但处于上扬趋势的居民储蓄存款屡创新高,国内消费需求依然疲软.其结果是,最终消费率从1990年的62%降至1998年的58.7%,1999、2000年略有回升,2001年又降至59.8%,城镇居民的平均消费倾向从1991年的0.855下降至2001年的0.774。由于消费是所有经济行为有效实现的最终环节,唯有消费需求的不断上升才有经济增长的持久拉动力.而居民的消费水平在很大程度上又受整体经济状况的影响.国内生产总值是用于衡量一国总收入的一种整体经济指标,经济扩张时期,居民收入稳定,GDP也高,居民用于消费的支出较多,消费水平较高;反之,经济收缩时,收入下降,GDP也低,用于消费的支出较少,消费水平随之下降.改革开放以来,我国的GDP不断增长的同时,人民的物质生活也在不断提高。2008年,我国居民消费扣除价格变动影响后比1978年扩大了11倍,年平均增长8.8%。我国居民消费增长较快,但与发达国家相比。2003年我国居民消费相当于美国居民消费的 8.8%,2008年提高15.4%,发达国家的差距在缩小。统计数字显示,2000年至2008年,我国投资增长17.9%,净出口增长34.7%,分别比消费增速快7.2个和24个百分点。1.2意义人均GDP是一国经济的最大基本面,它是研究产业结构和产业演变趋势的主要解释变量,也是反映一国经济发展情况的重要指标,因而无论对经济政策的制定,还是投资分析均具有重要意义。但是,究竟哪些因素会影响人均GDP的变化呢?本文希望通过分析各个因素对人均GDP的影响来说明居民的人均消费水平的提高及引进外资情况和产业结构是影响人均GDP的重要因素,进而了解从哪些发面促进我国GDP的增长。 2 问题分析与数据收集2.1 问题分析根据相关资料,我们知道,改革开放以来,我国GDP 保持了高速增长的势头。1999我国GDP平均每年递增9.9,其中有一半年份的年增长速度超过10。而在此期间,西方发达国家的GDP平均每年增长速度都在3左右,亚太地区发展较快的国家或地区(如韩国、新加坡、泰国等)的经济增长速度一般都在58左右。从这一时期与世界各国经济增长速度的比较中,可以清楚地看到:改革开放以来我国经济增长速度在世界各国中名列前茅、独领风骚。然而,我国GDP的高速增长并不是十分稳定的,经历了多次波动,且波幅亦显过大。由于我国的特殊国情,我国GDP 增长的每次波动伴随着国民经济“过热过冷过热”的频繁调整,影响了经济运行的质量。那么,我国的人均GDP的发展情况如何?又是哪些因素带动了改革开放以来我国GDP的快速增长?又是哪些因素造成了我国GDP增长的多次波动?我们可以选择某段时间的我国人均GDP的数据,对所收集的数据的数字特征及其随时间的变化曲线图进行分析其发展情况;我们都知道人均GDP的增长表明国家的经济水平提高,因此本文想验证人均GDP和居民的消费水平是否相关。其次一个地区的经济发展也许跟该地区的对外开放情况及其的产业结构有关。2.2 数据收集与处理根据上述的问题分析,本文从中国统计年鉴收集了19782008年我国人均国内生产总值和居民平均消费水平的数据(见附录里的表一),还收集了003年各地区统计数据(见附录里的表二)。3 相关知识3.1 数据的数字特征 设n个观测值为,其中n称为样本容量。(1)均值 均值即是的平均数:均值表示数据的集中位置。(2)方差、标准差与变异系数 方差是描述数据取值分散性的一个度量,它是数据相对于均值的偏差平方的平均:方差的开方称为标准差。方差的量纲与数据的量纲不一致,它是数据量纲的平方,而标准差的量纲与数据量纲一致。标准差为:刻画数据相对分散性的度量是变异系数:,它是一个无量纲的量,用百分数表示。(3)偏度与峰度偏度和峰度是刻画数据的偏态、尾重程度的度量。偏度的计算公式为: 其中,s是标准差, 为样本k阶中心矩。偏度是刻画数据对称性的指标。关于均值对称的数据其偏度G1=0,右侧更分散的数据(即右尾长)偏度为正(G1>0),左侧更分散的数据(左尾长)偏度为负(G1<0)。峰度的计算公式为: 当数据的总体分布为正态分布时,峰度G2近似为0;当分布较正态分布的尾部更分散时,峰度为正(G2>0).否则峰度为负(G2<0)。当峰度为正时,两侧极端数据较多(粗尾);当峰度为负时,两侧极端数据较少(细尾)。(4)中位数与极差中位数的计算公式:当n为奇数时:当n为偶数时:中位数是描述数据中心位置的数据特征,大体上比中位数大或小的数据个数为整个数据个数的一半,对于对称分布的数据,均值与中位数较接近;对于偏态分布的数据,均值与中位数不同。中位数的又一显著特点是不受异常值(特大或特小)的影响,具有稳健性。极差的计算公式:,它是描述数据分散性的数据特征,数据越分散,极差越大。(5) 分位数对0p<1,样本的p分位数是:np不是整数时:np是整数时:其中np表示np的整数部分。当p=1时,定义。大体上样本的100p%的观测值不超过p分位数。0.5分位数M0.5(第50百分位数)就是中位数。在实际应用中,0.75分位数与0.25分位数比较重要,分别称为上、下四分位,记 ,上、下四分位之差称为四分位极差(或半极差),表示为:它是度量样本分散性的重要数据特征,尤其对于具有异常值的数据,它作为分散性的度量具有稳健性,因此它在稳健型数据分析中具有重要作用。(6) 三均值和下、上截断点当存在异常值时,缺乏稳健性,可用三均值作为数据集中位置的数字特征,其计算公式为:。有一种判断数据为异常值的简便方法。称和为数据的下、上截断点。大于上截断点的数据为特大值,小于下截断点的数据为特小值,两者皆为异常值。3.2 一元线性回归分析(1) 一元线性回归的数学模型一元线性回归就是寻求两个变量间的线性统计回归分析,若其相关关系的统计规律性呈现线性关系则称一元线性回归分析。其回归模型为: 其中y为因变量,X为自变量,a和b为待定参数(a为常数项,b为回归系数)。通常采用最小二乘法来求参数a和b的估计。即使得 达到最小。通过计算求得: 其中 , 。(2)回归方程的显著性检验给定以上模型和实测数据以后,总可以得到待定参数的拟合值,但由此确定的回归方程式不一定有意义。因此,需要对得到的回归系数做显著性检验,即检验回归系数是否为0,如果为0,则说明因变量与自变量无关,回归方程无意义。运用F检验法和相关系数检验法。记 则有 这里 SST与的总离差平方和; SSR回归值与均值的总离差平方和,这是由回归所能解释的部分; SSE观测值与回归值的总离差亦即残差平方和,这里不能由回归加以解释的部分。若方程有意义,即引起y波动的主要是由x变化而引起,其他一切因素是次要的。即要求SSR进可能大,而SSE尽可能小。 1) F检验法方差分析法在:b=0为真时,可证明 当不真时,有变大趋势,因而F也有变大趋势,故应单侧拒绝域。对给定的显著性水平,当时,认为b=0不真,我们称方程是显著的。反之,方程不显著。这种用F检验对回归方程做显著性检验的方法称为方差分析。其检验过程可由一张“方差分析表”来进行。通常,若,则为高度显著;若,则为显著;若,则为不显著。方差分析表方差来源偏差平方和自由度方差F值F显著性回归SSR1剩余SSE=SST-SSRn-2总和SSTn-12) r检验法拟合程度的测定变量y的各个观测值点聚在回归直线周围的紧密程度,称作回归直线对样本数据点的拟合程度,通常用可决定系数(亦称测定系数)r2来表示。显然,变量y的的各个观测值点与回归直线越靠近,SR在ST中所占的比重越大,因而定义 它可以用来预定回归直线对各个观测点的拟合程度。若全部观测值点yi都落在回归直线上,则剩余平方和SSE=0,r2=1;若x的变化无助于解释Y的偏差,则回归方程SSR=0,r2=0。显然,r2越接近于1,用x的变化解释y的偏差的部分就越多,表明回归直线与各观测值点越接近,回归线的拟合程度越高。可决定系数r2在0,1上取值。回归直线对样本数据点拟合程度的另一测度是线性相关系数r。在一元线性回归中,线性相关系数r实际上是可决系数r2的平方根,即,r的正负号与回归系数b的正负号相同,|r|越接近与1,表明回归直线对样本数据点的拟合程度越高。3) 估计标准误差可决系数r2和线性相关系数r描述了回归直线对样本数据点的拟合程度,但没有表示出变量y的诸观测值yi与回归直线的绝对离差数额。定义 为最小二乘法残差ei方差, 为变量y对x的最小二乘回归的估计标准误差,简称估计标准误差。Sy值越小表明误差越小。(3) 利用回归方程进行预测利用变量x与y的n对样本数据建立的回归方程,如果通过了上述的各种检验,即可用来预测。所谓预测问题,就是在确定自变量的某一个x0值时求相应的因变量y的估计值,其中又可以分为点预测和区间预测。点预测:将自变量的预测值x0代入回归模型式所得到的因变量y的值,作为与x0相应的y0的预测值,就是点预测。可以证明是无偏预测。4 符号说明S2:方差S:标准差G1:偏度G2:峰度M:中位数MP:分位数:三均值R1:四分位极差Q3:上四分位Q1:下四分位a:一元回归方程的常数项b:表示回归方程的系数F:表示F函数y:表示我国的人均GDP的值:表示人均GDP的平均数x: 表示居民的平均消费水平SST:表示总的离差平方和SSE:表示残差平方和SSR:表示回归平方和r2:表示可决系数Sy:估计标准误差Y:各地区人均GDPX1:各地区引进外资情况(美元)X2:各地区第一产业所占比例 (%)5 建立模型5.1 模型一的分析与建立(1) 运用数据的数字特征对我国人均GDP的发展情况进行分析 对1978年到2008年的人均国内生产总值的数据,运用MATLAB软件对其平均值、方差、标准差、分位数等数据特征进行计算(运行代码见附录(1)和(2),将运行结果绘制成表格如下:均值方差标准差极差变异系数偏度峰度5703.451638867650.72266234.392623390109.30911.4094.4835中位数下四分位数上四分位数四分位极差三均值下截断点上截断点2998884.2584317546.753827.8125-10435.87519751.125从计算的结果分析,由于偏度G1=1.409,数据分布的图形显著右偏;峰度为G2=4.4835,数据分布的右端有许多极端值。又数据的标准差s=6234.3926,其数据超过均值=5703.4516,且均值5379.6667、中位数M=2998、三均值3827.8125三者的区别较大,说明数据的分散性相当大。由于改革开放以来,特别是近20年来,我国人均生产总值增长很快,因此出现了上述数据分布特点,此批数据是一批有严重偏态且有较多异常值的数据。 从表一的数据看,20169与23708大于上截断点值19751.125,是异常值(特大值)。由于改革开放的形式具体分析,这些特大值的出现是好事。由此可见,实际问题中必须结合问题背景对数据进行具体分析。(2)运用变化曲线图对我国的人均GDP的发展趋势进行分析 运用MATLAB软件对我国从1978年到2008年这些年来我国人均GDP随时间的变化曲线图所画图形如下:从图中可以看出我国国内人均GDP的增长一直处于上升趋势,且从1993年后增长的速度越来越快,这是个很好的趋势,也说明国家的经济越来越发达,人民的生活水平也会随之变好。5.2 模型二的分析与建立(我国的人均GDP与居民的人均消费水平之间的关系)(1)初步估计并建立的模型建模目的:本文主要建立计量模型来说明人均GDP与居民人均消费水平之间的关系。变量设定:以我国居民人均消费额(元)作为被解释变量(y),以我国人均GDP(元)作为解释变量(x),简单地阐述了人均GDP对居民消费的影响。应用MATLAB软件画出散点图,图形如下:初步建模:从上图可以看出X与Y存在明显的线性关系,所以根据建模的目的和要解决的问题,初步估计并建立的模型为:y=ax+b。利用最小二乘法进行数据拟合,求出各个各个参数,并用MATLAB软件进行数据拟合(代码见附录(5),得到如下曲线图:得出参数a= 0.3598 b= 313.3846所以得出回归方程为:y=ax+b=0.3598x+313.3846(2) 一元线性回归的数学模型根据相关数据及相关知识,本文运用MATLAB进行分析得以下方差分析表:方差来源偏差平方和自由度方差F值F显著性回归14.1830 显著剩余297.5977 总和30 从运行结果可以看出,得到的回归方程是y=0.3598x+313.3846;从方差分析表可以看出,回归的效果是不显著的;从可决定系数r2=0.9835,非常接近1,也说明回归的效果好。运行还绘制了回归线图:线性回归的一个重要应用是进行预测,根据输入的原始数据x,y,以及要进行预测的数据xx进行点预测。给了预测的概率(第四个输入参数pp),可以进行区间预测。例如当xx=500,pp=0.95时得yy=493.2787,ylr=(493.2787,493.2787)。1978年到2008年这些年的居民人均消费和人均GDP之间的相关系数为0.9835,说明我国人均GDP与居民人均消费之间存在着高度的相关关系,人均GDP的增长直接关系着我国居民的人均消费水平的发展,我国人均GDP每增长一元,我国居民的人均消费就增加0.305元。综上可得,上面的回归方程可作为最终确定的数学模型:y=0.3598x+313.38465.3 模型三的建立与分析(我国人均GDP的影响因素) 通过查阅2003年的统计年鉴,我们可以得到相关数据(见附录中的表二),其中包括各地区人均GDP、引进外资情况、和第一产业所占比例。Y表示各地区人均GDP(元/人)X1表示各地区对外开放水平引进外资情况(美元/人)X2表示各地区的产业构成情况第一产业所占比例(1)模型分析 先通过散点图来查看Y与X1,X2的关系,可得到下图:运用MATLAB软件进行分析得如下结果:回归方程为:Y=9941.200+84.78308X1-238.0015X2S.E=1603.739 7.833891 80.16680 t=6.198764 10.82260 -2.968829 R2=0.904641 F=132.8130 DW=2.221972(2)模型检验从两个散点图可以看出,我国的人均GDP的发展与对外开放成正比,而与第一产业在三个产业中所占比例成反比,从回归方程可以看出是符合一般的经济原理的,每引进外资1美元/人,可使人均GDP提高84.78308元,第一产业所占比例每增加1%,可导致人均GDP下降238.0015元。(3)t检验和拟合优度检验从回归方程可以看出,t统计量都超过了2,比较大,说明这些变量对经济的影响还是显著的。可决系数为0.904641,比较大,F统计量为132.8130,也比较大,说明从整体上来看回归方程对数据的拟合是比较好的。也可直接通过图观察到实际观测值和拟合值非常接近,但依然存在一些不足。(4) 模型改进对存在异方差进行修正加权最小二乘法分别选用权数W1=1/X12, W2=1/X22,运用MATLAB软件进行分析得:经估计检验发现,用权数W2的效果最好,因此选用W2的估计结果。方程结果为:Y=21101.03+66.59359X1-1339.443X2S.E=1849.173 4.686292 266.9054t=11.41107 14.21029 -5.018421R2=0.999545 F=413.3285 DW=2.473407 可以看出,运用加权最小二乘法消除了异方差后,参数的t检验均显著,可决系数大幅提高,F检验也显著,这个模型比之前的模型更接近真实的情况。 所以最后的方程为:Y=21101.03+66.59359X1-1339.443X2通过模型的分析结果,我们可以看到,在中国,各地区引进外资情况和第一产业所占比例是影响人均GDP水平的主要因素。其中,引进外资情况和人均GDP水平是正相关的关系,而第一产业所占比例与人均GDP则是负相关的关系。从模型分析结果可知,引进外资和产业结构的情况对人均GDP的影响非常显著。同时也可以看出,目前我国传统农业在大多数地区所占比例较大,影响了当地的经济发展水平,产业结构调整已经势在必行。因此,我们要发展一个地方的经济,首先必须进行产业结构调整,适当降低农业的比例,加大第二、三产业的发展;其次就是要进一步加大对外开放的力度,引进外资,加快当地经济的发展,进而推动整个社会经济的发展。6 总结根据本文的分析,我们知道提高我国的人均GDP是我国经济发展的头等大事,从模型中不难看出人均GDP和人均消费的比例关系,说明人均GDP与人均消费有很大的关系,人民的消费水平的提高依赖于人均GDP的增长。从模型三中我们知道人均GDP与产业结构相关,我们国家应该把第三产业的发展和我国GDP的提高兼顾起来,由于第三产业的发展,肯定会在一定程度上阻碍或影响第一、第二产业的发展,从而很有可能成为我国GDP增长的阻力,而GDP是经济发展的命脉,这种阻力也势必影响到第三产业,所以如果把这两个协调不好,我国经济很有可能停滞不前,更不用说居民生活水平的提高了。人均GDP也与对外开放挂钩,我们国家应积极引进外国的先进技术,努力把经济提上去,让人民的生活水平更高。同时提高我国人均GDP促进我国居民人均消费,推动我国经济的进一步发展,相信我国的经济会有很好的发展。通过此次的课程论文我对数据分析和数学建模有了更深一步的理解,对相关软件的运用更加熟练,对数据的收集和处理的方法也有了进一步的了解;这次课程论文中是自己独立完成,个人知识不够,这一个过程遇到了很多问题。比如起初并不知道从何下手,后来经过查阅资料与跟同学讨论了解到这类问题的解决方案,虽然自己所做的论文不完善,但认真积极的去对待了,从中也学到了很多东西。通过这次实验,我们更深刻的了解到了MATLAB软件的强大功能以及数学应用的广泛性,学会了应用回归分析方法对数据进行分析以及最小二乘法来对本次论文课题的数据进行拟合,另外,也感受到数学应用与实际联系紧密,增强了对数据进行分析的能力。参考文献1范金城,梅长林.数据分析(第二版),北京:科学出版社,2010.2王岩,隋思涟.试验设计与MATLAB数据分析,北京:清华大学出版社,2012.3隋思涟,王岩.MATLAB语言与工程数据分析,北京:清华大学出版社,2009.4周品,赵新芬.MATLAB数理统计分析,北京:国防工业出版社,2009.5姜启源,谢金星,叶俊.数学模型(第三版),北京:高等教育出版社,2003.6盛骤,谢式千,潘承毅.概率论与数理统计,北京:高等教育出版社,1979.7茆诗松.回归分析及其试验设计.上海:华东师范大学出版社,1986.8何晓群,刘文卿.应用回归分析,北京:中国人民大学出版社,2002.9鲁道夫J.费洛伊德,威廉姆J.威尔逊,平沙.回归分析因变量统计模型,重庆: 重庆大学出版社,2012.10卓金武,魏永生,李必文.MATLAB在数学建模中的应用,北京:北京航天航空大学出版社,2011.11何正风.MATLAB概率与数理统计.北京:机械工业出版社,2012.附录表一 19782008年我国人均国内生产总值和居民平均消费水平(单位:元)年份人均生产总值居民平均消费水平1978381184197941920819804632381981492264198252828819835833161984695361198585844619869634971987111256519881366714198915197881990164483519911893932199223111116199329981391199440441833199550462255199658462787199764203002199867963159199971593346200078583632200186223869200293984106200310542441120041233649252005141855436200616500613820072016971032008237088183表二 2003年各地区统计数据地区 人均GDP(元/人)引进外资情况(美元/人) 第一产业所占比例 (%)北京28449155.9073天津22380172.67054.1河北911511.8553715.6山西61466.7292389.8内蒙古72417.59850921.6辽宁1298683.1461210.8吉林83349.35285319.9黑龙江101849.70022611.6上海40646325.35411.6江苏14391145.37710.5浙江1683868.855678.9安徽58176.18401421.6福建13497116.895314.2江西582926.2803821.9山东1164553.0622913.2河南64364.28345720.9湖北831924.0076114.2湖南656513.8057419.5广东15030155.2848.8广西50998.95859924.3海南780368.8847537.9重庆63476.37169116四川57666.64983321.1贵州31531.06670923.7云南51792.77947221.1西藏6093 1.0257 14.6陕西552310.2311614.9甘肃44932.44112918.4青海64269.98643413.2宁夏58044.0494116.1新疆83821.07691819.1(1)function yihe(y)a=y(:);nans=isnan(a);ind= nans;a(ind)=;xbar=mean(a);disp('均值',num2str(xbar)s2=var(a);disp('方差',num2str(s2)s=std(a);disp('标准差',num2str(s)R=range(a);disp('极差',num2str(R)CV=100*s./xbar;disp('变异系数',num2str(CV)g1=skewness(a,0);disp('偏度',num2str(g1)g2=kurtosis(a,0);disp('峰度',num2str(g2)>> y=318 419 463 492 528 583 695 858 963 1112 1366 1519 1644 1893 2311 2998 4044 5046 5846 6420 6796 7175 7858 8622 9398 10542 12336 14185 16500 .20169 23708;>> yihe(y)(2)function fws(y)a=y(:);a(isnan(a)=;ss50=prctile(y,50);

    注意事项

    本文(数据分析课程论文.doc)为本站会员(文库蛋蛋多)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开