城市规划系统工程学课件.ppt
城市规划系统工程学,1,PPT课件,一、系统、系统工程学、城市规划系统工程学概论,2,PPT课件,一、系统的基本概念,1、什么是系统?,“由相互依存、相互作用的若干元素构成并完成某一特定功能的统一体”,太阳系,城市,建筑,制度,思想体系,班集体,居住区,3,PPT课件,2、三个基本点:,系统是由若干元素组成的;这些元素相互作用、相互依赖;具有特定的功能。,虽然有关系统的定义有很多种,但大都包含了上述三个基本特征。,4,PPT课件,3、对系统的描述,系统的结构系统的环境系统的行为系统的功能,5,PPT课件,3、对系统的描述,1)系统的结构 指的是组成系统的元素、元素间的相互关系以及系统间的层次关系,是系统元素在时间与空间有机联系与相互作用的方式,是系统内部的描述。,每个系统分解成若干个子系统,子系统可以层层分解,分解为更小的子系统,最后层次是元素。元素是完成系统功能的最小单元。,6,PPT课件,3、对系统的描述,小区规划的规划对象系统,建筑物,活动场所,道路,绿化,其他,下一级子系统,住宅,公建,老年人活动场所,幼儿活动场所,小区级道路,组团级道路,宅间级道路,小区级绿化,组团级绿化,宅间绿化,元素,多层住宅,高层住宅,低层住宅,商业,幼儿园,农贸市场,其他,元素,子系统,1)系统的结构,7,PPT课件,3、对系统的描述,2)系统的环境 系统外界事物及诸要素的集合。 系统与环境是相对而言的 更大系统中的元素,往往是下一级系统中的环境。,8,PPT课件,3、对系统的描述,3)系统的行为 系统的各种活动以及周围的影响,称为系统的行为。它是一系列输入与输出活动的集合。,系统,环境,输入,输出,9,PPT课件,3、对系统的描述,3)系统的行为 系统的各种活动以及周围的影响,称为系统的行为。它是一系列输入与输出活动的集合。,城市系统,区域环境,输入,输出,10,PPT课件,3、对系统的描述,4)系统的功能 系统与外部环境相互作用的能力,功能是系统对外部的影响。是系统对环境的作用和输出。,11,PPT课件,4、系统的分类,1)自然系统、人工系统(按自然属性分) 自然系统:由自然物,自然形成的系统,称之为自然系统。海洋系统、生态系统,一座山、一片森林等等。 人造系统:人工制造的系统称之为人造系统。一般是按照人们特定的希望有目的地、有计划地组织建造而成的系统。比如生产系统,一艘宇宙飞船、一栋建筑。 复合系统:由自然和人工共同建造的复合系统。,12,PPT课件,4、系统的分类,2)实物系统、概念系统(按物质属性分),实物系统:凡是能看得见摸得着的,具体实体元素所构成的系统,都叫实物系统,又叫硬系统。,概念系统:一切概念、原理、方法、制度、程序等概念性的元素所构成的系统称之为概念系统,又称为软系统。,13,PPT课件,4、系统的分类,3)封闭系统、开放系统(按系统与环境的关系分),封闭系统:不与环境发生联系的系统,开放系统:与环境发生联系的系统,封闭与开放是一个相对的概念。,14,PPT课件,4、系统的分类,4)静态系统、动态系统(按运动属性分),动态系统是系统的状态变量是时间函数。 静态系统是表征系统运行规律的数学模型不含有时间因素。,动态与静态也是相对而言的。,15,PPT课件,4、系统的分类,5)简单系统、复杂系统(按复杂程度分) 简单系统:组成系统的子系统数量很少,因此他们的关系很简单;或者子系统数量多,但之间的关系比较简单。 复杂系统:子系统数量很大,种类很多,他们之间的关系错综复杂。,16,PPT课件,4、系统的分类,6)黑色系统、白色系统以及灰色系统(按认知的程度分)。 白色系统:信息完全明确的系统,如学校。 黑色系统:信息完全不明确的系统,如遥远的星球。 灰色系统:信息部分明确,部分不明确的系统,如城市系统。,17,PPT课件,二、系统的思想,系统思想的要点,从整体把握系统,对系统作全面的分析;充分了解各环节的相互关系;体现整体最优的观点,18,PPT课件,三、系统科学的形成,认识处于总体思维阶段强调自然界整体性统一性细节的认识靠臆造和猜测古代朴素的系统观,古 代,近 代,现 代,从总体到局部细节的研究实验、解剖和观察的方法孤立的研究与科学发展相抵触形而上学的思维方式,更深入的了解局部细节,建立了事物整体与构成整体的各部门间的桥梁 辩证唯物主义(科学的系统观),19,PPT课件,四、系统工程学的形成,运筹学为系统优解提供了定量化方法和理论。,计算机技术为定量化的系统分析提供了强有力的运算工具和信息处理手段。,系统工程学第一部著作 System engineering,20,PPT课件,五、系统工程学,系统工程:,系统工程是一门正处于发展阶段的新兴学科,是一门复杂的跨学科的,带有普遍意义的工程技术,并与其他学科相互渗透、相互影响。,自然科学,社会科学,系统科学,(桥梁),研究系统工程的学科叫做系统工程学。,系统工程学:,21,PPT课件,六、系统工程学理论基础和方法,1)思想方法上的整体性(整体最优),1、理论基础: 运筹学、控制论、信息论、管理科学、模糊数学、统计数学、计算机科学技术。 运用各种数学方法、计算机技术、模拟仿真技术和控制理论来实现系统的模型化和最优化。,2、方法论,22,PPT课件,六、系统工程学理论基础和方法,2)方法和步骤的综合性,界定问题,确定目标,系统设计,提出方案,建立模型,系统分析,系统综合评价,优选,满意否,建议方案,决策,实施,是,否,1,2,3,4,5,6,7,使用系统工程学的方法思考和解决问题的步骤,2、方法论,23,PPT课件,六、系统工程学理论基础和方法,(1)摆问题,高层建筑影响因素系统,社会因素,经济因素,儿童智力发育,老年人活动,治安问题,修建费,土地费,管理费,容积率,基础,设备,级差地价,安置,电梯,水泵,租金,24,PPT课件,六、系统工程学理论基础和方法,(2)选择目标,确定目标时应注意以下原则:1)要有长远的观点2)要有总体的观点3)注意明确性4)多目标时应该区分主次、轻重、缓急,25,PPT课件,六、系统工程学理论基础和方法,(3)系统设计,系统的设计就是按照系统的性质、目的、功能、形成一组备选方案,以便进行系统的分析和比较。,26,PPT课件,六、系统工程学理论基础和方法,(4)系统的分析,建立模型,把系统(方案)的评价目标联系起来对系统的品质特征进行试验分析,实现对系统的定量分析。,(5)系统的评价和优选,通过系统的分析,选择较优的系统(方案)。,(6)决策,(7)实施,27,PPT课件,七、建立模型,1、什么是模型,所谓模型是对于系统本质,主要特征的描述、模仿和抽象,用于某种特定的用途(目的),以方便的形式向决策人提供必要的知识。 模型既反映原型,也不等于原型。,28,PPT课件,七、建立模型,2、模型的分类,实物模型:,非实物模型:数学模型 逻辑模型 自然科学中的一切公式、定理都是某种原型的模型。比如:F=ma,29,PPT课件,八、城市规划系统工程学,系统工程是一个总类的名称,还分门别类: 有社会系统工程、经济系统工程、行政系统工程、生态环境系统工程、农业系统工程、交通运输系统工程等等。,城市规划系统工程学:着重研究城市规划和建设中的系统问题。,30,PPT课件,二、空间分布的测度,31,PPT课件,(一)点状分布 要素在空间上分布成离散的点,如城市商业网点的分布、郊区居民点的分布等。,一、城市组成要素的空间分布类型,32,PPT课件,(一)点状分布,33,PPT课件,(二)线状分布 要素在空间上的分布成连续的线,如道路、各种管网等。同样,分析其空间分布时,可忽略其宽度而简化为线对象。,一、城市组成要素的空间分布类型,34,PPT课件,(二)线状分布,35,PPT课件,(三)离散的区域分布 如城市中的工业区、居住区、城市建成区等。,一、城市组成要素的空间分布类型,36,PPT课件,(四)连续的区域分布如地形、人口分布、空间污染分布等。,一、城市组成要素的空间分布类型,37,PPT课件,二、点状分布的测度,(一)找出某些点的中心位置,38,PPT课件,思考:如图所示的点为区域内的居民点,我们要在区域内选择一个地方作为一个商场的选址,要求周围居民点到达商场整体上最方便。(即找到这些居民点的中心),39,PPT课件,1、中项中心 当由两条互相垂直的线,分别将所有平面分布点以左右、上下等数量均分,这两条线交叉点即为中项中心。,二、点状分布的测度,(一)找出某些点的中心位置,40,PPT课件,2、平均中心 又称分布重心,它是以任一坐标系,分别计算各点坐标x及y值的平均值:,通常,中项中心与平均中心的位置不完全一致,但比较接近。中项中心精度较粗,适于轮廓分析。平均中心有利于计算机处理。,二、点状分布的测度,(一)找出某些点的中心位置,41,PPT课件,=(5+8+8+9+6+9+10+12+12+13+14+15)/12=10.08,=(2+3+4+6+6+7+1+3+4+6+7+8)/12=4.75,中项中心,平均中心,注意:中项中心操作简单,但不精确; 平均中心与中项中心的位置比较接近,但不完全一致, 平均中心较精确,但操作起来较麻烦,42,PPT课件,二、点状分布的测度,(二)点状分布的离散程度或集中程度的测度1、点状空间分布有三种模式:均等(离散)随机凝聚(集中),43,PPT课件,随机,凝聚,均等,44,PPT课件,常用方法:利用中项中心来测度离散程度 在中项中心基础上,再分别在左右、上下四个半片作四个1/4中项中心四条线,形成四个小矩形,每个小矩形面积和总面积的比就反映了他们对中项中心的离散程度。,其中,qi为四个小矩形面积Di表达了不同方向的离散程度。Di 1/4为均匀分布; Di 0为最大集中; Di 1为最大离散。,(二)点状分布的离散程度或集中程度的测度,45,PPT课件,q1,q2,q3,q4,Q=q1+q2+q3+q4 ; Di=qi/Q (i=1,2,3,4)Di 1/4为均匀分布; Di 0为最大集中; Di 1为最大离散,本例中,东北方向商业网点最集中,而西南方向最为离散,46,PPT课件,三、线状分布的测度,47,PPT课件,(一)绕曲指数 绕曲指数是指AB两点间实际最短线路长度和AB两点间直线距离的比值,一般以表示。它反映了线路绕曲的程度。,三、线状分布的测度,A,B,3M,9M,4M,48,PPT课件,(一)绕曲指数 绕曲指数是指AB两点间实际最短线路长度和AB两点间直线距离的比值,一般以表示。它反映了线路绕曲的程度。,三、线状分布的测度,A,B,3M,9M,4M,绕曲指数=(3+9+5)*100%/(9+4)=131%,49,PPT课件,区位分析 在某个中心特大城市周边,分布着4个小城市。这4个城市与中心城市之间的交通均为高速公路,其直线距离以及公路里程距离如下所示,试分析这四个城市的区位条件。,A,B,C,D,从直线距离来看:B、D优于C优于A (但A为100、C为90,差别不远)从公路里程来看:D优于B优于A优于C从绕曲指数来看:D优于B、A优于C(A为300、C为100,差别较大),因此,从交通便利的程度上,我们判断这四个城市的区位条件依次为: D优于B优于A优于C,(一)绕曲指数,50,PPT课件,路网通达程度比较分析 比较一下以下两个区域的城市之间的公路网,用绕曲指数来判断哪个区域的公路网路交通更加便利一些。,(二)平均绕曲指数,甲区域,乙区域,30km,30km,40km,40km,B,C,D,A,B,C,D,A,E,40km,51,PPT课件,度量道路网络中各点之间联结的便捷程度的指标,称为联结度指数。联结度指数是道路网实际边数对其最大可能达到的边数的比值。,(三)网络联结指数,联结度指数=道路网实际边数/道路网最大可能达到的边数联结度指数越高,表示网络联结便捷度越好,交通越方便。,乙区域,比较以下区域甲、区域乙中哪个区域的公路网交通更方便。,a,甲区域,b,c,d,a,b,c,d,e,52,PPT课件,四、界限网络的测度,城市中许多要素的分布常具有一定的区域界线,测度其区域面积比较容易,但用定量的方法描述其形状却比较困难。,A城市建成区外接圆的半径为20公里,建成区面积为980平方公里。 B城市建成区外接圆的半径为10公里,建成区面积为156平方公里。问哪个城市的发展更加紧凑一些?,B,R=20公里,A,R=10公里,53,PPT课件,边界网络紧凑度(CI,Compaction Index),当区域为圆形时,CI1,为最紧凑形状;CI越小表示区域形状越不紧凑,越分散,当CI0时,则趋于一条直线,最不紧凑。,四、界限网络的测度,1、1964,Cole提出如下公式:,54,PPT课件,四、界限网络的测度,A CI=980/3.14*20*20 =0.78,B,R=20公里,A,R=10公里,B CI=156/3.14*10*10 =0.50,A城市建成区外接圆的半径为20公里,建成区面积为980平方公里。 B城市建成区外接圆的半径为10公里,建成区面积为156平方公里。问哪个城市的发展更加紧凑一些?,55,PPT课件,城市要素的区域分布状态一般可以调查,统计其区域的有关数据,如各区的人口、职工数、用地面积等。这些可以直接用于比较分析,但还可以进行进一步的加工处理,使其分析更深入。,五、区域分布的测度,罗伦兹曲线(The Lorenz Curve),罗伦兹曲线是研究离散区域分布的重要方法。罗伦兹是一位经济统计学家,20世纪20年代发表关于工业集中化的统计方法,提出频率累积曲线cumulative frequency curve,即罗伦兹曲线Lorenz curve。,它是用来反映某事物在区域内的分布是否均匀的一种重要方法。,比如区域贫富差距问题、收入不平衡问题,56,PPT课件,某城市有11个区,每个区的人口占全市总人口的比例、以及每个区的纺织行业的职工人数占全市纺织行业职工人数的比例如下表所示,请问如何判断这11个区的纺织业发展的均衡的状态。,五、区域分布的测度,举例,57,PPT课件,1、计算R值,58,PPT课件,2、根据R值的大小重新排序(R值越大排在越前面),然后再进行累积频率的计算。得到下表。,59,PPT课件,3、将纺织行业的职工累积比重作为y轴的值,将总人口累积比重作为x轴的值,确定坐标位置,并连成曲线。即洛仑兹曲线。,60,PPT课件,x,61,PPT课件,不均衡程度的比较 : 其他条件如上题,从下表给出的条件判断该城市里面服务行业和纺织行业两个行业哪个的发展更加均衡一些。,62,PPT课件,1、求R值,63,PPT课件,根据R值的大小将各行业分别重新排序(R值越大排在越前面),然后再进行累积频率的计算。得到下表。,64,PPT课件,将纺织行业职工的累积比重作为y轴的值,以相对应的总人口累积比重作为x轴值,确定坐标位置连成曲线。,0,20,40,60,80,100,x,20,40,60,80,100,y,纺织业,均匀分布线,65,PPT课件,0,20,40,60,80,100,x,20,40,60,80,100,y,均匀分布线,服务业,将服务行业职工的累积比重作为y轴的值,以相对应的总人口累积比重作为x轴值,确定坐标位置连成曲线。,66,PPT课件,0,20,40,60,80,100,x,20,40,60,80,100,y,纺织业,均匀分布线,服务业,结论:服务业的发展比纺织业发展要均衡。,67,PPT课件,三、 统计方法在城市规划中的初步应用,68,PPT课件,(一)人类生活的世界充满了随机现象,投硬币、掷骰子和摸扑克婴儿的诞生流星殒落,大自然的千变万化,一、随机现象,不确定性现象(即随机现象),69,PPT课件,当人们在一定条件下对某一现象加以观察时,观察到的结果是多个可能结果中的某一个,且在每次观察前都无法预知观测结果到底是哪一个。即结果的出现呈现出偶然性,或者说:出现哪个结果 “凭机会而定”。,具有不确定性(或随机性、偶然性)的现象称为随机现象。,(三)随机现象的特点是什么?,(二)随机现象概念,70,PPT课件,在一个标准大气压下,水在100时沸腾; B. 掷一颗骰子,观察其向上点数; C. 一般情况下,上抛的物体一定下落; D. 新生婴儿体重。,问:下列现象哪些是随机现象?,71,PPT课件,(四)随机现象是不是没有规律可言?,否!在一定条件下对随机现象进行大量重复观测后就会发现:随机现象的发生有一定的规律性。,72,PPT课件,(五)城市里的随机现象,每天火车站的人流量每年高峰时期火车站的人流量,以上这些现象都是不确定的,但是通过长期、大量的调查,是可以发现其存在着某种规律的,73,PPT课件,统计调查,统计整理,统计分析,二、统计工作的三个中心阶段,1、全面调查(制度化的经常性调查) 统计报表 、普查等2、非全面调查:专门组织调查(如抽样调查),74,PPT课件,三、随机抽样调查,从所研究的对象的全体中随机抽取小部分来进行观察和研究,从而对整体进行推断,这个就叫做随机抽样法。,75,PPT课件,随机事件及其概率,1)事件,随机现象可能发生的每一种表现或结果叫做事件。如天气的随机现象,可能发生雨天、晴天、阴天,那么这三种天气现象就是事件。,某一事件发生的机会或可能性大小的计量我们把它叫做概率。,2)概率,76,PPT课件,包含两个方面的意思 1)当样本无限增大的时候,事件发生的频率将与他的概率趋于一致 。 2)样本增多的时候,我们可以用样本的平均值来估计总体的均值。,大数定理,如何估测出某一水塘中有多少条鱼?,77,PPT课件,样本的规模,总体比例10%的样本将两倍优于一个占总体比例5%的样本吗?在总体小于1000的情况下,如果样本占总体的比例低于30%,那么,我们最终得到的样本误差很大当总体为10000的时候,我们需要有10%的样本比例当总体为150000的时候,1%的样本比例就已经足够了当总体为1000万或者1000万以上的时候,样本比例的增加实际上不产生作用。,当总体的规模增加的时候,样本比例的作用趋向越来越小样本规模绝对数值的重要性大大超过样本占总体比例的重要性,78,PPT课件,(一)抽样调查方法的优点,1、经济,2、及时,79,PPT课件,(二)抽样调查的方法,将编好号的全体对象顺序分为若干大小相同的组,组数与所需样本数一致,在第一个组里面随机抽取一个样本后,按组距为间隔在每组里面抽出一个样本。不太适合有一定周期性趋势的对象。,2、机械随机抽样(等距抽样),1、单纯随机抽样:,在抽样前将被调查的对象编上号,然后进行随机取号抽样(比如抽签等),保证每个对象被抽到的概率一致,3、整群随机抽样,把被调查的总体分为若干个整群,凡是被随机抽样的整群就在其内部进行全面调查。适合整群之间差异不大,但整群内部差异很大的情况。,80,PPT课件,它是先将总体对象按一定标准分成各种类型(或层);然后根据各类型对象数与总体个数的比例,确定从各类型中抽取样本单位的数量;最后,按照随机原则从各类型中抽取样本。,5、分层随机抽样(类型随机抽样),4、多阶段随机抽样:,如果整群抽样得到的整群还是太大,就需要在整群内部再做随机抽样,适用于总体很大,但样本较小的情况。,(三)抽样调查需要掌握的原则,1、样本分布具有一定的代表性2、抽样需要根据研究的目的来进行,81,PPT课件,统计调查,统计整理,统计分析,四、统计整理,82,PPT课件,(一)主要任务,分组、频率分布、统计表、统计图,(二)分组,划分现象类型,例1:调查某城市居住区的绿化水平,对10个样本进行了调查:得到这10个样本的绿化率分别为:10%、10%、15%、25%、 25%、5%、6%、10%、5%、4%。,分组前,分组后,分组:10%以下的(不含10%);10%-15%;15%以上的(不含15%),关键:服从研究任务需要,反映总体本质特征,83,PPT课件,(三)频率分布,是一种重要的分组资料,反映各组在总体中的分布状态。,例:,组团的名称,公共绿地数,频率,城东组团,20,10,20,城西组团,中心组团,10,30,合计,50,100,60,84,PPT课件,例: 调查某一城区居民的居住水平的时候,其中一个指标是每个家庭的人均居住面积(平方米/人)。假设该区有3千户居民,抽查了其中30户,得到了以下30个数据。下面需要对这三十个数据进行整理,第1户:2.5;第2户: 9.4;第3户:3.5;第4户:3.8;第5户:4.0第6户:4.2;第7户: 5.5 ;第8户:4.5;第9户: 6.7 ;第10户:4.9;第11户: 6.3 ;第12户:4.9;第13户: 7.8 ;第14户:5.0;第15户:5.1;第16户: 6.0 ;第17户:5.15;第18户:5.3;第19户:5.4;第20户: 4.4 ;第21户:5.5;第22户:5.7;第23户:5.9;第24户: 5.15 ;第25户:6.1;第26户: 4.9 ;第27户: 4.7 ;第28户:7.0;第29户: 5.0 ;第30户:3.0,单位:平方米,85,PPT课件,第一:将30个数据从小到大整理出来。 2.5,3.0,3.5,3.8,4.0,4.2,4.4,4.5,4.7,4.9,4.9,4.9,5.0,5.0,5.1,5.15,5.15,5.3,5.4,5.5,5.5,5.7,5.9,6.0,6.1,6.3,6.7,7.0,7.8,9.4,第二:分组,86,PPT课件,第三、计算频数分布,87,PPT课件,(四)统计表,(五)统计图,直方图(柱状图),饼式图,频率直方图,饼式图,88,PPT课件,(五)统计图,折线图,89,PPT课件,统计调查,统计整理,统计分析,四、统计分析,90,PPT课件,(一)总量指标,1、概念:是反映社会经济现象总规模、总水平的 总和指标。,2、总量指标的作用: 1)反映城市经济、社会、人口等总的发展状况 2)是计算相对指标和平均指标的基础。,91,PPT课件,(二)相对指标(相对数),1、概念 两个有联系的指标对比的比值,反映事物的数量特征和数量关系。,(1)反映总体内在的结构特征,(3)反映事物发展变化的过程和趋势。,(2)用于不同对象的比较评价;,2、作用,92,PPT课件,不同时期比 较,动 态相对数,强 度相对数,不同现象比较,不同总体比较,比 较相对数,同一总体中,部分与部分比 较,部分与总体比 较,比 例相对数,结 构相对数,同一时期比较,同类现象比较,3、几种常用的相对指标,93,PPT课件,反映同类现象的一般水平,是总体内各单位参差不齐的标志值的代表值,也是对变量分布集中趋势的测定。,数据集中区,变量x,(三)衡量数据分布的集中趋势的指标,一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据一般水平的代表值或中心值,94,PPT课件,1、平均数,常见:人均GDP、人均收入、人均居住面积、人均用地面积,(1)简单平均数,95,PPT课件,(2)加权平均数:加权平均数:反映了每个本质不同的数的的重要度,又称权重。,比如:我们的课程成绩,最后考试的成绩占总成绩的50%,调研成绩占总成绩的30%,平时表现占总成绩的20%。如果一个同学考试成绩70分,调研成绩80分,平时表现90分。最后成绩多少分?,70*50%+80*30%+90*20%=77或者(70*50+80*30+90*20)/(50+30+20)=77,i,每个数据为:X1 ,X2 , ,Xk相应的权重为: F1 , F2, ,Fk,96,PPT课件,甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组: 考试成绩(X ): 0 20 100 人数分布(F ):1 1 8 乙组: 考试成绩(X ): 0 20 100 人数分布(F ):8 1 1,权重对于均值的影响,97,PPT课件,又如:城市内工业用地占15%,居住用地占30%,绿化用地占15%,道路广场用地占10%,其他用地占30%。工业用地对于生态的影响指数是10,居住用地对于生态的影响是5,绿化用地对于生态的影响是3,道路广场对生态的影响是6,其他用地对城市生态的影响是4。整个城市对于生态的影响是多少。,整个城市的生态影响指数= 工业用地影响指数*权重+居住用地影响指数*权重+绿化用地影响指数*权重+道路广场用地影响指数*权重+其他用地影响指数*权重=10*15%+5*30%+3*15%+6*10%+4*30%=5.25,98,PPT课件,平均数与加权平均数的特点,最常用的测度值一组数据的均衡点所在易受极端值的影响,99,PPT课件,2、中位数 样本中的数据从小到大的顺序排列,若样本个数为奇数,居于中间位置那个数即称为中位数,如果样本个数是偶数,取正中间两个数的算术平均值为样本的中位数。 如:1,2,2,3,4,4,4,6 的中位数是3.5,排序后处于中间位置上的值,不受极端值的影响,100,PPT课件,2、中位数,从下表里判断甲城市家庭的中等居住水平是什么?,解:中位数的位置为: 300/2150从累计频数看,中位数在“90-120平米”这一组别中。因此该城市的中等居住水平应该是90-150平米,101,PPT课件,3、众数 在样本中有最大频率(频数)的那个数据称为样本的众数。,同样以 1,2,2,3,4,4,4,6这六个样本为例。其中数值4它的频率最大。我们把4称为众数。,出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数,102,PPT课件,3、众数,无众数原始数据: 10 5 9 12 6 8,一个众数原始数据: 6 5 9 8 5 5,多于一个众数原始数据: 25 28 28 36 42 42,103,PPT课件,例子: 请问从下表中反映出来的,甲城市里家庭对于住房状况的满意程度的大多数情况是什么。,104,PPT课件,众数、中位数、平均数的区别,平均数说明的是整体的平均水平;众数说明的是生活中的多数情况;中位数说明的是生活中的中等水平。,105,PPT课件,数据分布的另一个重要特征反映各变量值远离其中心值的程度,因此也称为离中趋势,(四)离散程度的测量指标,106,PPT课件,1、极差(R)1)概念:样本中最大值减去最小值所的差为极差R较小时说明样本数值分布的较为集中。R较大时说明样本数值分布的区域较宽,2)例子:,(四)离散程度的测量指标,甲,乙,107,PPT课件,2、平均差(平均离差),例子:两个胡同里居民人均居住面积如下表所示,问,哪个胡同里居民的居住条件差异不大?,2)作用:平均差越大说明样本分布越离散,1)概念:某一样本值xi和样本平均值之差称之为xi的偏差(离差),如全班同学平均成绩为80分,某一同学的成绩为85分,即偏差是5分。 所有偏差的绝对值的平均值称为平均差。,108,PPT课件,2、平均差(平均离差),例子:两个胡同里居民人均居住面积如下表所示,问,哪个胡同里居民的居住条件差异不大?,甲,乙,109,PPT课件,2、平均差(平均离差),1)甲胡同与乙胡同的人均居住面积的平均值都是26平方米/人,2)求甲胡同的平均差,甲胡同人均居住面积的平均差=(1+3+0+1+0+0+3+1+1)/9=1.11,3)求乙胡同的平均差,乙胡同人均居住面积的平均差=(9+12+6+4+10+5+8+12+8)/9=8.22,结论:甲胡同里居民的居住条件差异不大,110,PPT课件,1)方差公式,3、样本方差,甲胡同样本的方差=(1+9+0+1+0+0+9+1+1)/9=2.44,乙胡同样本的方差=(81+144+36+16+100+25+64+144+64)/9=74.89,2)例子,111,PPT课件,1)公式,4、标准差(方差根),甲胡同样本的方差根=(1+9+0+1+0+0+9+1+1)/9=1.56,乙胡同样本的方差根=(81+144+36+16+100+25+64+144+64)/9=8.65,2)例子,112,PPT课件,3)标准差、方差、平均差 VS极差 标准差或者方差比极差更能体现出一组数据的离散特征,能避免极差的偶然性。 比如一组数据,大多数数据很均匀,但如果有一个特别的冒尖,那么极差会很大。标准差可以避免这种情况的出现。,4、标准差(方差根),113,PPT课件,四、相关性与一元线形回归在城市规划中的初步应用,114,PPT课件,样本的变量,变量:反映样本的某一属性(特征)的指标。有时,我们只调查样本的一个变量。(如:人均居住面积,x)有时,我们调查样本的多个变量(如:人均居住面积,y,人均收入,x) 。当存在多个变量的时候,我们可以来分析一下这些变量之间的关系。,115,PPT课件,是一一对应的确定关系设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量各观测点落在一条线上(此为线性函数,非线性函数不在本课中介绍),x,y,变量间的函数关系,116,PPT课件,单价一定的情况下,某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = p x (p 为单价)圆的面积(S)与半径之间的关系可表示为S = R2 城市用地规模(y)与城市人口(x1) 、城市人均用地面积(x2) 之间的关系可表示为y = x1 x2,变量间的函数关系,117,PPT课件,以上例子的共同点在于,两个变量中任意一个已知,其余一个就可以完全确定. 也就是说,变量之间存在着确定性的关系,并且可以用数学表达式来表示这种关系.(函数关系),然而,在大量的实际问题中,变量之间虽有某种关系,但这种关系很难找到一种精确的表示方法来描述.,118,PPT课件,例如,人的身高与体重之间有一定的关系,知道一个人的身高可以大致估计出他的体重,但并不能算出体重的精确值.,其原因在于人有较大的个体差异, 因而身高和体重的关系, 是既密切但又不能完全确定的函数关系.,119,PPT课件,变量间的相关关系,变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定两者之间存在着某种切实的联系,但同时也存在着不能解释的随机波动各观测点分布在直线周围(此为线性相关,非线性相关不在本课中介绍),120,PPT课件,相关关系的例子商品销售额(y)与广告费支出(x)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系,类似的变量间的关系在大自然和社会中屡见不鲜.,121,PPT课件,城市规划中相关关系的例子居民的人均居住面积(y)与其收入(x)的关系城市人口发展规模(y)与城市发展时间的关系(x)城市房价(y)和城市地价(x)的关系,122,PPT课件,样本相关系数的计算公式,r 的取值范围是 -1,1|r|=1,为完全相关r =1,为完全正相关r =-1,为完全负正相关 r = 0,不存在线性相关关系相关-1r0,为负相关0r1,为正相关|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切,123,PPT课件,相关系数,r,大于0.8高度相关,0.5到0.8之间中度相关,0.3到0.5之间低度相关,小于0.3可视为不相关,124,PPT课件,t=,除了要算r值以外,我们还需要进行计算t值,检验相关关系的显著性。,公式中,r是相关系数,n是样本数,通过公式,求出t值,接下来,查t分布表判断t值是否通过检验。 t分布表在一些统计学教材里面会找得到。 通常我们查“n-2”那一行与要求的显著水平要求(极端值区间的概率)那一列交叉的数,假设其为a。如果我们算出来的t值=a,则表明通过了t值检验,两变量之间的相关性是显著的。 如果没有通过t值检验,无论r等于多少,两个变量之间的相关性都是不显著的。,125,PPT课件,调查城市居住环境(绿化率)与其中居住的居民年收入的关系通过对7个样本的调查,得到了这样一组变量。通过相关系数来分析两者之间的关系,根据公式,计算R=0.824 t=3.2523R0.8相关性比较强,且t值通过查表也通过显著性检验了因此我们说两个变量间的相关性比较强,0,绿化率,1,2,3,4,5,6,7,8,1,2,3,4,5,6,7,8,年收入,t=,126,PPT课件,相关性研究在城市规划中的应用,相关系数对于规划,建筑方面的研究提供了有效的方法,可以科学的,定量地揭示他们之间关系的密切程度。,美国在住宅建设中关于高层问题的研究时,对纽约市几个行政区15万户的统计数字进行分析,说明层数越高,犯罪率越高,两者之间有相关性。且电梯间犯罪率与层数间的相关系数最高,关系最密切。,127,PPT课件,从数量的角度去研究相关关系,是数理统计的一个任务. 这包括通过观察和试验数据去判断变量之间有无关系,对其关系大小作出数量上的估计,对互有关系的变量通过其一去推断和预测其它,等等.,回归分析就是研究相关关系的一种重要的数理统计方法.,回归分析,128,PPT课件,回归这一术语是1886年英国生物学家高尔顿在研究遗传现象时引进的.他发现: 虽然高个子的先代会有高个子的后代, 但后代的增高并不与先代的增高等量. 他称这一现象为“向平常高度的回归”.,回归分析,129,PPT课件,这意味着, 若父亲身高超过父亲这一辈人平均身高6英寸, 那么其儿子的身高大约只超过儿子这一辈人平均身高不到6英寸, 可见身高有向平均值返回的趋势.,诚然, 如今对回归这一概念的理解并不是高尔顿的原意, 但这一名词却一直沿用下来, 成为统计学中最常用的概念之一.,6英寸,6英寸,130,PPT课件,比如:随着城市人口的增加,城市用地规模也会增加,虽然这种增加并没有一个确定的函数关系,但是总是围绕着某一个规律在发生。数学中的回归分析正是对这个回归规律的科学的概括和抽象, 有相关关系的变量,它总是围绕着一根直线(或曲线)上下波动。回归分析就是要找出这根直线、或曲线。,统计学中回归分析的含义,131,PPT课件,在回归分析中, 当变量只有两个时, 称为一元回归分析; 当变量在两个以上时, 称为多元回归分析. 变量间成线性关系, 称线性回归,变量间不具有线性关系, 称非线性回归.,在这一讲里, 我们主要讨论的是一元线性回归. 它是处理两个变量之间关系的最简单的模型. 它虽然比较简单, 但我们从中可以了解到回归分析的基本思想、方法和应用.,重点讨论,132,PPT课件,一元线性回归,在居住区规划里面,商业网点的配置一般是根据千人指标的计算进行的。但千人指标只提出商业面积规模,并未明确各商业点的数目。一般来说,居民数越多,商业点应该越多,但是他们之间并没有一个很确定的函数的关系,只能说他们有相关性。我们可以通过一元线性回归分析来,找到他们所围绕的那根直线(或者说拟合的函数关系),让我们用一个例子来说明如何建立一元线性回归方程.,133,PPT课件,0,粮店数,1,2,3,4,5,1000户,2000户,3000户,居住区规模,散点图,134,PPT课件,0,粮店数(y),1,2,3,4,5,1000户,2000户,3000户,居住区规模(x),y=ax+b,散点图,从图看到, 数据点大致落在一条直线附近, 这告诉我们变量x和y之间大致可看作有线性相关关系.从图中还看到, 这些点又不完全在一条直线上, 这表明x和y的关系并没有确切到给定x就可以唯一确定y的程度.这是因为,还有许多其它因素对y产生影响,如城市密度,生活习惯等等。,现在,我们只研究粮店数与居住区规模之间的关系,希望找到他们之间的拟合的函数关系。从而可以通过知道居住区规模的大小,来确定居住区内粮店的数目。,135,PPT课件,用Spss 统计分析软件来进行一元线性回归分析,大家初步了解这个软件就可以了,回归的结果在Coefficients表中查找,Constant 常数:b=-0.338人口变量前的系数 a=0.00182870t1.96表示两变量显著相关,最后拟合出的方程粮店数目=0.00182870居民户数-0.338,136,PPT课件,检验与预测,最后拟合出的方程粮店数目=0.0