国赛B题论文.doc
新时代的出行方式打车软件对出租车供需关系影响摘要本文针对“打车难”的问题,寻找影响出租车供求关系的因素,并通过供求关系与这些因素的关系建立模型。为了分析补贴方案,我们建立了一个补贴方案的判断模型,并用该模型来判断补贴方案改善后的可行性。针对问题一,我们先对一个城市进行区域划分,用K-Means算法求出该城市的K个局部中心点,为后两问分析补贴方案做准备。我们还找到除了时空因素,影响出租车供求关系的其它因素,并将这些因素量化为参数,用多项式拟合来建立供求关系与这些因素的关系,从而得到“供求匹配”程度的量化,即供求关系指数。针对问题二,为了分析补贴方案对“打车难”的缓解程度,我们利用“引力模型”建立一套判断模型,对于一个地区的司机,他受到来自两种引力的作用:一种引力来自地区内部,驱使司机停留在该区域接客;另一种引力来自除本地区外的其他所有地区,驱使司机离开该地区,到其他地区拉客。我们引入供求波动指数,这个指数越接近0,即各个区域的供求关系指数趋于一致,那么补贴方案解决打车难问题的能力越强。为了说明补贴方案是否能缓解“打车难”,我们使用补贴前和补贴后的的比值H来说明,即城市出租车供求波动变化比。针对问题三,我们提出了对不同城市不同时间段的动态补贴方式,并以北京、上海、广州、杭州四个代表城市进行举例。综上所述,我们通过建立匹配模型,缓解程度的判断模型,对出租车的资源的供求匹配程度和补贴方案进行了分析。关键词:出租车供求关系、k-means聚类、引力模型、动态补贴1.问题重述出租车行业因为其车辆数量受政府控制、运费由政府定价的特点,长期处于“低费用,大众化”的运作状态。这样强行的介入干扰了价格和供求关系的正常联系,使消费者市场产生了出租车服务供不应求的问题,让人受到了“打车难”的困扰。但是随着互联网技术的普及,利用网络平台优化供求关系的方案应运而生。但如果要解决供求关系的问题,我们就必须清楚地了解到是什么因素影响了不同时空条件下的供求关系,找到这些因素,并将进行数据压缩,量化为一些参数,得出供求关系与这些参数函数关系,再以网络平台补贴司机与乘客的方式改变上述参数,平衡整个城市的供求关系,优化资源分配,从而改善供求关系,使得“打车难”的问题得到缓解。找到影响供求关系的因素并将他们量化和说明补贴对“供求匹配”程度的影响是本问题的核心关键。2.模型假设与变量声明2.1 模型假设(1)因为打车难问题主要出现在大城市中,所以我们认为绝大多数的人的人使用打车软件,且使用人数相对稳定,我们对补贴问题的考虑只在使用打车软件的乘客人群中。(因为只有这个人群才可以通过补贴改善供求关系,同时我们只考虑供小于求的情况,因为在许多城市中,出租车行业基本都是供小于求)(2)只考虑一个城市内的情况,即我们考虑的最大范围是一个城市,在这个城市中,出租车的计价规则各处相同。(3)需求量不会因为补贴方案的存在或改变而发生变化。(4)考虑到补贴乘客并不能对改善供求关系有直接影响,只是为了让更多人使用打车软件,因而不考虑补贴乘客的方案对供求关系产生的影响,只对补贴司机的情况进行考虑,并且默认补贴对司机必然有鼓励作用。2.2 变量声明变量字母变量含义I人均出租车拥有数量某时空条件下的出租车数量某时空条件下的出租车需求量某时空条件下的载客出租车数量Z载客率F平均车费T平均等待时间Y供求关系指数M出租车承担城市居民出行周转量P城市居民总量Q居民出行率R出租车在居民出行方式的分担率D居民采用出租车出行的平均出行距离C出租车起步里程出租车起步费m出租车每公里运营费用M*Q*R*CO出租车每日载客总行驶里程A出租车每次平均乘客数K出租车空载率每辆出租车每日平均运营时间V为出租车平均运营速度城市中车辆运行的平均速度出租车交通拥堵饱和量a 城市出租车供求波动指数H城市出租车供求波动变化比B某小时补贴额度3.1影响出租车供求关系的因素的模型建立(解决问题1)3.1.1 相关因素分析3.1.1.1 时空因素影响出租车供求关系的因素有很多,这些因素的变化都因为乘客与出租车时空坐标的改变而产生,其他因素的定义都建立在空间时间的基础之上。为了实现数据的定量分析,我们将对城市进行分块,我们称之为“地区”。通过分块,我们将城市分成多个热点地区,这些区域可能是商圈、住宅区、火车站等,出租车需求较为集中的地区。在后文中我们将以地区为单位给出一个出租车流动模型,以其为基础分析补贴对出租车运行的影响。我们将介绍分区方式,并以上海市的实际数据给出分区模式的直观表现。我们认为一个城市的乘客需求决定的出租车的热点地区。给出一个城市大量打车需求数据,以经纬度为坐标描述,我们可以绘制出城市热力图,直观表现城市出租车运行状况。图1是上海市2015年11月18日的乘客需求数据。经纬度分别标记为x,y坐标。图1 上海市2015年11月18日的乘客需求数据图我们采用k-Means算法自动找出城市中的各个局部中心。设给出地图上共有n个点,k表示城市的局部中心数目,K-Means算法求出地图上的k个局部中心点。 在图二中,k=4时求出的分区数据如下。区域中心用+号标示。图2 k=4时分区情况图可以看到我们的分类算法能够正确的识别各个局部中心,并将出租车需求数据进行正确的分类。在后文的分析中我们将取较大的k,将城市划分为更细致的区域,并统计每个区域的各个指标,并进行补贴问题的分析。3.1.1.2 以时空维度为坐标的其他因素(1)出租车数量和乘客数量 在由3.1.1.1中方法确定的时空条件下,需要搭乘出租车的乘客人数(和该地区该时间在这个地区所在的出租车数量,显然会影响供求关系。我们定义平均需求满足量率为I。那么我们可以得到计算公式。 (式2) 式中的为该时空条件下的出租车数需求量,为该时空条件下的出租车数量。当然,这两个因素也可独立分析,如3.1.2.2中模型检验中的情况(2)载客率 在出租车车辆数量一定的情况下,出租车的载客率的提高意味着出租车利用效率的提高。一般来说控制出租车的满载率可以实现运力与运量的适当平衡,从而优化供求关系。我们定义Z为该时空条件下的载客率,得到如下计算公式。 (式3) 式中的为该时空条件下的载客出租车数量。 这一个指标反映了车辆的载客效率,若该比例较高,说明车辆行驶中载客比例高,空驶比较低,对于需要搭乘出租车的乘客来说可供使用的车辆不多,说明供求关系紧张,所以这个能比较直观的反应供求匹配程度。(3)平均等待时间 平均等待时间是在确定时段的确定地区中,所有乘客的等待总时间取平均值而得到的,我们将其设为T。(4) 平均车费 平均车费是指在确定时段的确定地区中,所有乘客的车费总和取平均值得到的,我们设之为F。(5) 因素总结 综上所述,我们认为出租车数量、出租车需求量 、载客率Z、里程利用率L、平均等待时间T和平均车费F是影响“供求匹配”程度的几个因素。但“供求匹配”程度需要进一步的量化分析才具有价值,因此我们引入摘要所述的供求关系指数Y来量化“供求匹配”的程度,Y的值是衡量供求匹配程度的指标,供求匹配的程度越高,该指数越高。3.1.2 因素整合和求解3.1.2.1 供求关系指数(Y)函数的理论分析由3.1.1分析我们知道有多重因素共同影响了供求关系指数。供求关系指数是直接反应乘客乘车体验的重要指标,供求关系指数越高,表示供求关系越匹配,乘客满意度越高。在时空离散模型中我们抽象出了一个特定时空下的出租车运行指标,包括出租车数、乘客数、平均车费、乘客平均等待时间等。我们需要找出这些指标与供求关系指数的函数关系。对于一个特定的城市,我们认为存在这样的确定的函数关系,能够描述特定时空下各指标与供求关系指数的关系。这个假设是合理的,因为同一个城市,人们的消费水平、基础设施状况等硬性城市建设因素短期内不会发生突变,选择乘坐出租车的人群、出租车高峰使用时段、出租车使用热点地区相对固定。因此,若我们找到了该函数关系,我们就可以对不同时空下的供求关系指数进行预测。 考虑到社会运行的复杂性,几乎可以断定这个函数必然是非线性的。我们认为,利用逻辑推导的方法,推断出各指标与供求关系指数的关系几乎不可能。然而我们还是由手段尝试对该函数进行近似。线性拟合是其中一个广泛使用且效果较好的方法。为了增强拟合的精确度,我们可以进行高次拟合。普遍采取的方法是二次拟合。设若在一个时空关系下指标用向量表示, 表示指标数目,则我们拟合如下: (式5)其中即供求关系指数,向量X=。我们可以对乘客调查的供求关系满意度来代替,我们是根据乘客的满意度来得出。拟合出各后我们就可以由给出,从而实现对不同指标下供求指数的预测。共有 个,其中左右作为一次项系数。一次项系数刻画了各个指标与之间的线性关系。各个一次项系数的相对大小关系表现了各个指标对供求系数大致的贡献度。这对于给出供求关系指数的直观分析是十分必要的。(求解流程如图3)图3 求解供求关系指数函数的流程图3.1.2.2 供求关系指数函数的验证 我们在网络上获取了北京、上海、广州、杭州市的1118日-21日的相关数据进行检验。在这个例子中我们采用了出租车数、乘客数、平均车费、乘客平均等待时间四个指标拟合,即n=4。我们将一次项系数绘制如图4、表1:图4 函数一次项指数柱状图 出租车数需求量(乘客数)平均车费平均等待时间载客率北京73.3288-34.576217.4854-40.7252-32.5625上海66.0178-23.32779.4631-40.9467-24.4165广州124.1988-44.327712.1775-26.5613-56.2565杭州80.946-37.154316.2032-36.0084-48.4625表1 函数一次项指数数值表从图和表中我们可以看到,出租车数量和平均车费与供求关系指数正相关,并且出租车数量占主导地位。而需求量(乘客数)和平均车费的增加会使得供求关系指数下降,二者的影响能力较为接近。我们从数据拟合中得到的结果与生活常识完全符合,而且能准确的定量分析供求关系,从而说明了模型和函数的合理性。3.1.2.3 得出给定某时段某地点的供求关系指数当我们得到了供求关系指数与影响因素的函数之后,对于给出的一个确定时刻的确定点,我们只需要将这个点的经纬度坐标和时间带入3.1.1.1的分析方式中,找出这个点对应的地区,而在3.1.1.1中我们知道,某个地区的某个时段的的各项影响供求关系指数的参数是给出的,我们就可以用这个数据来代替这个点的参数,把这些参数带入供求关系指数与影响因素的函数中,得出这一点的供求关系指数。(操作流程见图五)图5 求解给定某时段某地点的供求关系指数的流程图3.2补贴方案的分析(解决问题2)3.2.1 现行的补贴方案 如模型假设所考虑的一样,我们在忽略对供求关系没有稳定影响的首单补贴模式之后,现在滴滴、快的和uber采取的补贴方案是一致的都为每单补贴司机与乘客一定金额,或补贴金额随机但不考虑每单交易的具体情况。在不考虑对乘客补贴的情况下,我们可以将他们的补贴方案看作为无差别的每单补贴司机一定金额的方案。为了分析的方便,我们取滴滴在2014到2015年中对司机补贴的两个数额每单5元和每单10元进行考虑。 得知了具体的补贴方案后,我们希望对这些补贴方案是否真的缓解了“打车难”这一问题进行分析,这时候就需要一套模型评判,我们便引入下面的引力模型。3.2.2.1 模型判断标准我们认为补贴方案如果能使确定时刻各个区域的供求关系指数趋于一致,我就认为资源分配到了最合理的情况,那么这个城市的“打车难”问题得到最大程度的缓解。但因为现实生活中各个地区某时刻的供求关系指数不可能全部相同,我们便引入某时刻的城市出租车供求波动指数来表示,城市出租供求指数就是该城市某时刻各个地区的供求关系指数的方差。 (式6)式中k为3.1.1.1中算法中的对城市分区的总数量,是各个供求关系指数的平均值,是第n个分区的供求关系指数。我们认为,当这个指数越接近0,即各个区域的供求关系指数趋于一致,那么补贴方案解决打车难问题的能力越强。但是这个指数的值的大小不能很直观的说明补贴方案是否能缓解“打车难”,因此我们使用补贴前和补贴后的的比值H来说明,我们叫这个比值为城市出租车供求波动变化比,计算公式如下: (式7)根据统计知识,我们初步认为当H小于-0.05时,补贴方案反而会加剧“打车难”问题,H在-0.05到0.05之间,我们认为补贴方案没有作用,当H大于0.05小于0.1时,我们认为补贴方案可以缓解“打车难”问题但作用不明显,当H大于0.1时我们认为该打车方案可以明显缓解“打车难”问题。(如表2所示)表2 由H的值决定的分映射表3.2.2.2 模型建立与求解 根据模型假设,我们研究的是一个城市,并且这个城市里的乘客对出租车的需求量和出租车服务的可以提供的供应量是一定的,但因为我们在3.1中研究中得到一个结论不同地区的供求关系情况不是相同,这就意味着供应的服务并没有满足最充分的需求量。为了解释这个问题,我们收到系统动力学的启发,引入了一套不同地区之间的引力模型。我们仍然利用了3.1中模型所述的分区方式,将城市分区,并利用不同区域之间的动态平衡来求解出补贴后的各个地区的出租车数量,再通过这个值求出此时的,因为补贴前的已知,我们就能得到城市出租车供求波动变化比,得出结论。(1) 模型概述我们考虑确定时间下的某个地区。这个地区内的出租车司机在这个时刻有两种行动选择。一是离开该地区,去到其他地区搭载乘客。二是搭载本地区的乘客。若司机选择离开该地区,将导致该地区的出租车数量减少,而其目的地的出租车数量增加。反应到供需关系上,这种行为将直接导致该地区供求关系指数的变化。为了量化司机离开该区域的意向,我们引入“引力”的概念。对于一个地区的司机,他受到来自两种引力的作用。一种引力来自地区内部,驱使司机停留在该区域接客,我们称其为内引力。另一种引力来自除本地区外的其他所有地区,驱使司机离开该地区,到其他地区拉客,我们称之为外引力。我们给出计算第个区域内的司机受到的引力的计算公式: (式8) (式9) (式10)其中表示两地区之间的距离,上标表示地区编号,上横线表示均值。如表示地区i内司机受到的内引力,表示地区司机搭载i号地区内乘客的平均获利。我们认为,当一个区域时,该地域司机不会离开该地域。若,将有部分司机选择离开该区域,选择去其他区域接客。若对所有地区,司机都不会离开该区域,则整个城市进入平衡状态。平衡状态下,若没有外部条件的改变,因为没有司机的流动,我们认为各个区域的供需关系也不会改变。在实际情景下,城市不可能进入绝对平衡状态。因为司机不可能完全预见整个城市各个地区的供需情况。另外,司机有主观的随意性,即使满足,司机仍有几率离开所在区域。在这种情景下,我们仍认为整个城市处在“动态平衡”的状态。因为及时某地区的司机随机离开该区域,导致本地区出租车供应量下降,其他地区的司机也有可能随进进入该区域,导致本地区出租车供应量上升。长期运行的固定条件的系统将趋于平衡状态。对于一个出租车的运行,在一定的时间跨度下,出租车价格、城市道路状况、城市经济发展状况不会发生突变。因此我们认为在补贴发生之前,城市处在动态平衡状态之下。即存在n个方程: (式11)(2)补贴影响分析补贴的引入将破坏原有系统的平衡状态。具体的说,补贴将直接改变。考虑最广泛使用的单词固定补贴模式: (式12)对一个特定的时间和地区,以上获利与上一节中定义一致,即搭载地区i乘客单次司机所获得的平均利润。以上补贴指的是单次搭载获得的补贴额,与地区时空无关。引入补贴后,原有的地区平衡被破坏。某些地区的司机受到的作用,产生离开该区域的动力。设离开该区域的司机的比例为,我们给出如下计算公式: (式13)易知 (式14)流出地区i的出租车数计算公式如下: (式15)这些出租车将流动到其他地区。从地区i流动到地区j的出租车数目设为,由以下公式给出: (式16)我们由以上给出的公式,可以模拟出租车在地点之间的流动。因为出租车的流动在抵抗引力的不平衡,每次出租车移动后,整个系统应该朝整体平衡的状态上移动。具体来说,引入补贴的瞬间,出租车供求波动指数将骤然增大。出租在引力作用下流动,将导致减小,趋于平衡。迭代过程:先计算加入补贴后各个地区的引力,然后算出一次流动的后的各个中心的出租车数,算出H。再迭代再算H,再迭代,再算H,直到符合平衡为止。迭代次数在100次以上,基本可以反映加入补贴后各中心的出租车数目。当迭代完成后,我们就得到了每个地区的出租车数量,为下面的计算提供了依据。除此之外,我们还需要找到出租车拥有量与平均车费、平均需求满足率、载客率和平均等待时间的关系,以求出上述变量变化之后的值,带入3.1建立的模型之中,求出不同地区的供求关系指数。我们认为在只补贴司机的条件下,不会吸引更多的对出租车的需求量,原本的乘客需求也不会因为补贴政策而改变行车距离而使平均车费发生变化,所以我们认为平均车费和平均需求量不会因为补贴方案的存在和变动而变化。为研究载客率与地区出租车总数的关系,我们需要引入出租车承担的城市居民出行周转量和出租车每日载客总行驶里程两个中间概。出租车承担承担的城市居民出行周转量,指出租车载客数量和对应行驶里程的乘积,其计算公式为: (式18)式中:M为出租车承担的城市居民出行周转量( 万人·Km),P为城市居民总量(万人);Q为居民出行率(次/ 天);R为出租车在居民出行方式中的分担率(% );,D为居民采用出租车出行时的平均出行距离(Km)。因为平均出行距离和平均车费又有一定的关系如下: (式19)式中:C为出租车起步里程,F为居民单次乘坐出租平均车费(上文已经提到),为出租车起步费(元);m为出租车每公里运营费用( 元/Km )。所以式 又可以写成如下式: (式20)因为P、Q、R、C、m与我们的模型无直接关系,在计算过程中也不会变化,我们将M*Q*R*C合并为一个常参数,为一个常参数。所以式20又可以写成: (式21)接下来我们引入出租车每日载客总行驶里程数的概念。出租车在运营过程中,每次载客人数是变化的,故根据出租车每次平均乘客数来计算每日载客总行驶里程,其计算公式: (式22)式中:O为出租车每日载客总行驶里程(Km),A 为出租车每次平均乘客数(万人/ 辆)。那么最后根据出租车载客率的定义计算出租车拥有量,其计算公式为: (式23)式中:K 为出租车空载率(%);T 为每辆出租车每日平均运营时间(h);V 为出租车平均运营速度(Km/h);为某地区出租车拥有量(辆)。在式23中,我们可以看到,T是一个易得的参数,可以通过调查轻松得到,而O我们在之前的计算中可以得到,则是我们的已知量,所以要得到载客率,我们只需要的得到出租车运行速度V与某地区出租车拥有量的关系,恰好的是,有学者研究过这两个量之间的关,他们的计算关系如下: (式24)式中表示城市中车辆运行的平均速度,b为一个影响参数,为出租车交通拥堵饱和量,即一个地区内用于这个数量的出租车时,交通会非常拥堵。因为在我们的模型中,b与不会随着补贴方案的存在而改变,且可以通过调查得知,我们在这里就将其合并为一个常参数a。那么式 可以写为: (式25)在得到V关于的函数后,我们就可以得到最终的载客率的表达式: (式26) 同样,关于乘客平均等待时间,也有学者对这一个问题做出过研,等待时间与需求量的平方成正比,得到了如下的表达式: (式27)式中:为一个常参数。至此,我们就都得到所有的参数关于需求、出租车数量、平均车费F的函数关系式如下表3:平均车费为常数F不变平均需求量为常数不变载客率平均等待时间表3 各个因素表达式一览表得到这些因素的值以后,我们将他们带入3.1中得到的供求关系指数的函数中,求出每一个地区的供求关系指数。(具体流程如图六)图6 利用引力模型判断补贴实际价值的流程图得到不同地区的供求关系指数后,如问题重述所说的,我们是希望补贴后的各地区供求关系的指数趋于一致,但是因为现实情况,该数值不可能相等,所以我们就以3.2.2.1的城市出租车供求波动变化比H作为判据对补贴方案进评价。3.2.2.3 现行补贴方案分析我们将利用前文所述模型对现行补贴标准进行分析。回顾前文,补贴前后出租车供求波动指数将发生变化。我们用波动指数变化比(式7)表征该补贴方案的优劣。现行补贴方案无差别给司机每单补贴一定的补贴额。补贴额出现过5元与10元两种。我们采样的是北京市、上海市、广州市、杭州市2015年11月18日到21日的平均数据,在此基础上引入补贴,重新建立平衡,通过3.2.2.2(2)的计算求出5元与10元的波动指数变化比,如图7、图8。 从图7中,我们首先可以看到,相同的补贴方案对不同的城市的作用不同,北京和上海在不同时刻的H值的波动不大,基本都在0.05以上,而广州和杭州不同时刻H值波动较大,但基本也都在0.05以上。从图8中,可以观察到,其图线趋势除个别点以外基本与图七相同,但对应的H值却全部有所提高,尤其是高峰期(H值本身点)提高更为明显。综合观察图7、图8,我们得出的结论是:(1)目前的两个补贴方案在绝大部分时段对缓解“打车难”问题有一定帮助。(2)同样的补贴方案对不同的城市效果不同。(3)相同的补贴方案对同一个城市不同时刻的效果也不同。 (4)对高峰期的补贴的提高对缓解“打车难”问题更有价值。 由这个结论,我们认为现行的打车补贴方案仍然不是最优的,因为它没有考虑不同城市的不同时段的不尽相同的实际情况,没有做出针对性的对策。这也是我们接下来提出自己的补贴方案的优化思路。3.3 动态补贴方案(解决问题)通过对现有补贴方式的分析,我们发现在不同时间补贴产生的效果有很大的差异。我们采样的四个城市是中国最发达的4个城市,他们的交通共同特点是早高峰较早,6时开始交通抬头。晚高峰较晚,19点左右才进入交通高峰。交通高峰时段反应在我们的数据中,就是该时段的波动指数较高。如图所示 在我们上文的分析中,我们得到一个重要结论,即恰恰在这些交通繁忙的时间进行补贴对降低波动指数有显著作用。在较高的地方补贴,对于相同的补贴投入,能够更好的改善交通。因此,我们提出动态补贴方案,即根据一个城市特定的随时波动规律,为每个时间分配不同的补贴额度。我们的期望目标是“削平”图像中最陡峭的那些点晚高峰、早高峰,抓住主要矛盾。具体来说,我们考虑针对一个城市的补贴方案。假设由于经济等因素我们的单次补贴额度只能在元之间浮动。设补贴前有 (式28) (式29) (式30)其中表示第i个小时的值。则我们的补贴方案中第i小时的补贴额度为: (式31)我们设,可以得到各城市各时间下的补贴额度,同时计算出这种补贴模型的值。(见图10、图11)可以看到,采用动态补贴的方法能够显著的降低一个城市的波动变化。因此我们认为,动态补贴比起静态补贴优势明显,是值得推广的一种模式。4.模型结论与评价4.1 模型结论 针对问题(1),我们认为出租车数量、出租车需求量 、载客率Z、平均等待时间T和平均车费F是影响“供求匹配”程度的几个因素。并可以通过实际数据得出量化“供求匹配”程度的大小的供求关系指数关于上述几个因素的函数。针对问题(2),我们通过求出不同城市各个时段出租车供求波动变化比H,在大量数据下得出了现行的补贴方案在大部分时间对缓解“打车难”问题有一定帮助。针对问题三(3),我们考虑到现行的补贴方案没有考虑到不同城市的不同时段的不尽相同的实际情况,提出了对不同城市不同时间段的动态补贴方式,并以北京、上海、广州、杭州四个代表城市进行举例。4.2 模型评价4.2.1 模型优势 (1)该模型充分考虑城市中各个地区各个时间段“供求匹配”程度不相同的实际情况,更有合理性。 (2)该模型通过引力模型解释了补贴影响“供求匹配”程度的原理而不是仅仅通过数据分析得出结论,从理论出发分析问题,而不是仅仅进行数据分析,更加具备说服力, (3)该模型的所有验证计算过程都采用了上海、北京、杭州、广州四个中国各地的代表城市的数据,能更清晰的展示补贴对供求关系所起的作用。4.2.2 模型改进方向(1)模型未来可以基于更广大的群体,而不是只考虑使用打车软件的人群,从而使模型对于一些小型也有较高适用性。(2)模型二所采用的引力模型,是在假设了引入补贴的情况下,必定会引起供求关系的变动并且一定会致使司机离开原来的区域,这个假设具有一定的缺陷。(3)我们只考虑供求关系相对平衡对解决“打车难”问题的作用,并且只考虑的其中五个因素,在改进模型中应该更多的挖掘更多的供求关系带来的影响。(4)数据来源有限,我们模型的数据来源于滴滴打车和快的打车两个打车软件,数据来源较单一。参考文献. 1滴滴打车,苍穹智能出租车平台,,2015年11月21日2康留旺. 基于FCD 的城市出租车空驶率及拥有量的计算, 数字技术与应用:81-82,2010年。34 黄琪, 城市出租车拥有量的确定 ,硕士毕业论文:17-18,2005年。5柴根象,钱伟民,统计学教程,上海:同济大学出版社,2004第一问K-means聚类分析:clear allclcFH FW=textread('C:UsersASUSDesktopFEMALE.xls','%f %f');MH MW=textread('C:UsersASUSDesktopMALE.xls','%f %f');Data(1:50,1)=FH;Data(51:100,1)=MH;Data(1:50,2)=FW;Data(51:100,2)=MW;C=input('ÊäÈëC£º')U,P,Dist,Cluster_Res,Obj_Fcn,iter=fuzzycm(Data,C)plot(Data(:,1), Data(:,2),'o'); hold on; maxU = max(U); index1 = find(U(1,:) = maxU); index2 = find(U(2,:) = maxU); line(Data(index1,1),Data(index1,2),'marker','*','color','g'); line(Data(index2,1),Data(index2,2),'marker','*','color','r'); plot(P(1 2,1),P(1 2,2),'*','color','k') hold off; function U,P,Dist,Cluster_Res,Obj_Fcn,iter=fuzzycm(Data,C,plotflag,M,epsm)if nargin<5 epsm=1.0e-6; endif nargin<4 M=2;endif nargin<3 plotflag=0;endN,S=size(Data);m=2/(M-1);iter=0;Dist(C,N)=0; U(C,N)=0; P(C,S)=0;U0 = rand(C,N); U0=U0./(ones(C,1)*sum(U0);¨while true iter=iter+1; Um=U0.M; P=Um*Data./(ones(S,1)*sum(Um')' for i=1:C for j=1:N Dist(i,j)=fuzzydist(P(i,:),Data(j,:); end end U=1./(Dist.m.*(ones(C,1)*sum(Dist.(-m); if nargout>4 | plotflag Obj_Fcn(iter)=sum(sum(Um.*Dist.2); end if norm(U-U0,Inf)<epsm break end U0=U; endif nargout > 3 res = maxrowf(U); for c = 1:C v = find(res=c); Cluster_Res(c,1:length(v)=v; endendif plotflag fcmplot(Data,U,P,Obj_Fcn);endfunction U,P,Dist,Cluster_Res,Obj_Fcn,iter=fuzzycm2(Data,P0,plotflag,M,epsm)if nargin<5 epsm=1.0e-6; endif nargin<4 M=2;endif nargin<3 plotflag=0;endN,S = size(Data); m = 2/(M-1); iter = 0;C=size(P0,1);Dist(C,N)=0;U(C,N)=0;P(C,S)=0;while true iter=iter+1; for i=1:C for j=1:N Dist(i,j)=fuzzydist(P0(i,:),Data(j,:); end end U=1./(Dist.m.*(ones(C,1)*sum(Dist.(-m); Um=U.M; P=Um*Data./(ones(S,1)*sum(Um')' if nargout>4 | plotflag Obj_Fcn(iter)=sum(sum(Um.*Dist.2); end if norm(P-P0,Inf)<epsm break end P0=P;endif nargout > 3 res = maxrowf(U); for c = 1:C v = find(res=c); Cluster_Res(c,1:length(v)=v; endendif plotflag fcmplot(Data,U,P,Obj_Fcn);endfunction f = addr(a,strsort)if nargin=1 strsort='ascend'endsa=sort(a); ca=a;la=length(a);f(la)=0;for i=1:la f(i)=find(ca=sa(i),1); ca(f(i)=NaN;endif strcmp(strsort,'descend') f=fliplr(f);end function ellipse(a,b,center,style,c_3d)if nargin<4 style='b'endif nargin<3 | isempty(center) center=0,0;endt=1:360;x=a/2*cosd(t)+center(1);y=b/2*sind(t)+center(2);if nargin>4 plot3(x,y,ones(1,360)*c_3d,style)else plot(x,y,style)endfunction fcmplot(Data,U,P,Obj_Fcn) C,S = size(P); res = maxrowf(U);str = 'po*x+dv><.h' figure(1),plot(Obj_Fcn)title('Ä¿±êº¯ÊýÖµ±ä»¯ÇúÏß','fontsize',8)if S=2 figure(2),plot(P(:,1),P(:,2),'rs'),hold on for i=1:C v=Data(find(res=i),:); plot(v(:,1),v(:,2),str(rem(i,12)+1) ellipse(max(v(:,1)-min(v(:,1), . max(v(:,2)-min(v(:,2), . max(v(:,1)+min(v(:,1), . max(v(:,2)+min(v(:,2)/2,'r:') end grid on,title('2D ¾ÛÀà½á¹ûͼ','fontsize',8),hold offendif S>2 figure(2),plot3(P(:,1),P(:,2),P(:,3),'rs'),hold on for i=1:C v=Data(find(res=i),:); plot3(v(:,1),v(:,2),v(:,3),str(rem(i,12)+1) ellipse(max(v(:,1)-min(v(:,1