科普丨地铁客流量是怎样计算的?

您所在的位置:网站首页 地铁客流量查询 科普丨地铁客流量是怎样计算的?

科普丨地铁客流量是怎样计算的?

#科普丨地铁客流量是怎样计算的?| 来源: 网络整理| 查看: 265

写在前面:阅读本文须具有高中程度的数学知识,如有大学数学课程《概率论与数理统计》的基础更佳。

“昨天地铁客流又破500万了!”“地铁客流这么低,这个地方肯定发展不起来”“今天xx市的地铁客流又超yy市了,哈哈哈”……这样的话语,你是否曾经在网络上见到过,又是否在日常生活中听到过?这些人每天都会关注的地铁客流数据,到底是怎样得来的呢?

准确地说,在我国内地,人们津津乐道的地铁客流量实际上指的是地铁的客运量。首先,我们需要了解进站量的概念。什么是进站量呢?顾名思义,它是整个地铁线网中进站乘坐地铁的人次数量。由于进站的每一位乘客不会凭空消失,所以整个线网的出站量和进站量显然是相同的。当然,对于每一个具体的车站而言,进站量和出站量可能会有一些差异,比如某位通勤的乘客上班时乘坐地铁,而下班时选择了其他交通工具,这就会导致他工作单位附近的那个站点的出站量比进站量多出1个人次。但是对于所有的地铁乘客来说,一旦进站,就会在某个站点出站,因此整个地铁线网的出站量和进站量相同。因此,我们通常只考虑进站量。

进站量一般采用综合进站闸机和边门等统计数据的方法进行统计。进站闸机想必大家非常熟悉,无论是持单程票、刷卡还是扫码,都需要刷一下才能进入车站付费区乘坐地铁。边门则是对于一些持有闸机不能识别的免费乘车证件的乘客,在工作人员核验证件的真实性之后,通过闸机旁边的小门进站。由于打开边门需要工作人员刷卡,因此这部分客流也会计入到进站量里。当然,也有乘客在刷卡后突然又不想乘坐地铁,到车站客服中心进行了票卡的更新,消掉了进站记录,这类乘客不能计入到进站量当中。

与进站量不同的是,人们津津乐道的客运量其实是推算出来的结果,它往往并不是一个精确的数字。为什么会产生这样的结果呢?这就要从地铁的发展历程开始讲起。

01 C市风云

相传有一座叫Capital的城市,简称C市。一开始,C市地铁只有一条1号线,很显然,由于没有其他线路的存在,地铁的客运量就是进站量本身。每位乘客从进站到出站的过程中只有1号线可以乘坐,每进站1个人次,1号线就有了1个人次的客运量。

图1  C市地铁1号线线路图

而当大家热烈庆祝C市地铁2号线(坪石至上水段)开通初期运营的时候,对于C市地铁的工作人员而言,情况就开始发生变化了。

图2  C市地铁1、2号线线路图

这时候,C市地铁的乘客就分为三种。第一种是仍然只乘坐1号线的乘客,如从西门口到珀斯;第二种是只乘坐新开通的2号线的乘客,如从坪石到上水;第三种乘客则是我们需要关注的重点,如一位从西门口到坪石的乘客,他需要乘坐1号线至北部湾站下车,之后再换乘2号线,前往坪石。这位乘客虽然只贡献了1个人次的进站量,但却产生了2个人次的客运量——这是因为他将1号线和2号线各坐了一次。

此时的C市地铁客运量为1号线的客运量与2号线的客运量之和,可是该怎样把那些既坐了1号线,也坐了2号线的乘客计算到客运量里面呢?

第二条地铁线路的通车和第一个换乘站的产生引入了新的概念——换乘量。显然,换乘量就是地铁线网中换乘的人次数量。从进站到出站的出行过程中,每位乘客每换乘1次,就会产生1个人次的换乘量。如果有100位西门口到坪石的乘客,北部湾站就会有100个人次的换乘量。由于北部湾站是C市地铁线网中唯一的换乘站,因此,C市地铁的换乘总量就是100人次。

对于每条线路而言,我们还可以分为换入量和换出量。还是以这100位西门口到坪石的乘客为例,对于1号线而言,这些乘客从1号线的车站进站,去往其他的线路,我们称为1号线换出了100人次;对于2号线而言,这些乘客从其他的线路来,到2号线的车站出站,可以说2号线换入了100人次。结合进站量的概念,我们可以得到这样一个式子:

线路客运量=线路进站量+线路换入量

怎样理解这个式子呢?进站量和换入量,都是”来到”某条线路上的客流量,一部分是直接从这条线路上的各个车站进站,而另一部分是从其他线路换乘过来。这两个来源的乘客都乘坐了这条线路,因此它们相加就是线路的客运量。

当然,线网的客运量就是各条线路客运量的和了。所以,有的城市会在第二条线路开通后客运量突然上升了一个台阶,这不仅仅是因为多出了一条线路,而且还因为线路之间能够相互换乘,一部分乘客能够”一个顶俩”,推动了客运量的快速增长。

细心的同学可能会发现,虽然这时候的C市地铁客运量的计算比过去复杂了一些,但也并没有太复杂。每位乘客在地铁中的出行情况其实是非常明确的,要么乘坐1号线,要么乘坐2号线,要么1、2号线各坐一遍,没有其他的可能性。

由于产业转型发展导致财政收入暂时不足,C市地铁只有两条线的情况持续了很长一段时间。几年后,C市的地铁4号线由于建设进度稍快,先于3号线通车了。而在4号线通车后,C市地铁的线路图就变成了这个样子:

图3 C市地铁1、2、4号线线路图

此时,线网中的换乘站增加到三座,除已有的北部湾站之外,还新增了田心站和五象广场站。新的地铁线路带给了C市居民更多的便利,也增加了更多的出行选择——等等,问题好像突然复杂了起来。如果有100位乘客从西门口到上水站,他们既可以乘坐1号线至北部湾站换乘2号线,也可以在田心站换乘4号线并到五象广场站换乘2号线前往目的地。由于北部湾站地处历史悠久的老城区中心,为了保护一棵千年古树,换乘通道相对较长;而田心站与五象广场站由于前期建设时有所预留,换乘通道很短。因此,这两种选择是都有可能的。那么,到底有多少乘客会选择只换乘1次但走得远,有多少乘客会选择换乘2次但或许更省时间呢?

答案是:不知道。

惊不惊喜,意不意外?而如果无法回答这个问题,就意味着C市地铁的客运量,就根本算不出来。如果那100位乘客都选择乘坐1号线并换乘2号线,那么就产生了200人次的客运量;而如果他们都选择乘坐1号线、4号线和2号线,客运量就会增加300人次。那么,这些乘客带来的客运量到底是200人次,还是300人次,还是某一个其他的值呢?

02 客流清分

铺垫了这么多,我们终于进入到这篇文章的正题了——客流清分。

实际上,客流清分是交通运输领域一个经久不衰的研究热点问题,众多专家学者都潜心于这一问题的研究之中,而这一问题不仅关系到客运量的多少,更关系到不同公司的各条线路之间应该怎样分摊收益。关系到钱的事,那可都不是小事。当然了,C市不差钱,他们怎样做是他们的事,我们还是关心一下现实吧。

清分是指按照一定的规则将乘客的出行划分到不同的线路上,便于后续分账。在早期,对于规则没有定论,加上计算机系统并不发达,所以基本依靠人工估算。而因为人工计算能力有限,就只能采取一些非常简单的规则。比如,默认乘客都会选择距离最短的路线,或者用时最短的路线,又或者换乘次数最少的路线。显然,这样的估算和实际情况是有一定偏差的。

随着地铁新线路的开通,客流量越来越大,人工估算带来的误差也越来越难以接受。在计算机的帮助下,各地纷纷选择了其他的方法。目前来看,一个得到普遍实践应用的方法是多路径选择概率分配法,这种方法由同济大学的徐瑞华教授提出,并发表在2009年4月出版的《铁道学报》上。下面为大家简要介绍这种方法。

绝大部分人乘坐地铁,都是为了尽快到达目的地。(当然,《在成都,地铁可以坐多远?》这种为了乘地铁而乘地铁的客流也是存在的,但占比很小可忽略不计)因此,以用时最短的原则去寻找乘客的出行路线的思想是可行的。不过,乘客在换乘时由于需要下车,步行到另一条线路的站台再上车,在心理上的感受和在地铁列车上是不一样的。在车上站十分钟一般不会觉得很累,但下车走十分钟换乘恐怕大部分人都要吐槽不已。这就需要引入换乘放大系数,将换乘时所用的时间乘以一个系数进行放大,变成等效乘车时间。这样,乘客出行的实际时间就转化为了广义出行时间,具体如下式所示:

在式子中,α被称为换乘放大系数。由此可见,广义出行时间就是乘客在列车上的乘车时间与放大后的换乘时间之和。

在对广义出行时间做出定义之后,乘客沿着某一条路径的广义出行时间也就可以计算出来了。对于已经步入网络化运营的地铁来说,相同的出发地与目的地之间可能有非常多的路径,但不是每一条路径都会有人去选择,这里我们就需要对所有可能存在的路径做出一些规定,判断它是否是一条有效路径。

首先,一条有效路径是不存在回头路和环路的。当然,这也很好理解。一般的地铁出行是不会走回头路的,如果出现这种情况,要么是自己不小心坐过站了,要么是为了去起点站抢位置。而环路则是指出行过程中在某站兜了个圈子又回到这一站点,显然这种情况应该是非常少见的。

其次,即便是不存在回头路和环路,也有些路径由于时间过长,我们认为不会有人选择。比如,那些换乘次数多而在时间上没有明显优势的路径,就需要被剔除掉。但该怎么去做出一个限定呢?根据乘客的出行心理,我们可以做出一个合理的推断,可用公式表示为:

在短途出行时,乘客对于具体多几分钟少几分钟并不是非常关心,因此只要不超过最小广义出行时间的(1+θ)倍就可以;而在中长途出行时,乘客对于出行时间的变化就比较敏感,不能在最小广义出行时间的基础上超出一个固定的值M。根据这两条原则,我们就可以根据每条路径的广义出行时间,得到地铁线网中任意两个站之间存在的有效路径。

找出了有效路径,我们终于来到了最后一个步骤,就是把所有乘客分配到有效路径上。如果两座车站之间只有一条有效路径,那自然是皆大欢喜的;而如果存在不止一条有效路径,那就需要对客流按一定的比例进行分配了。在进行客流分配时,有这样几条规则:

第一,全部有效路径的分担比例加起来必须是100%,以确保每位乘客都分配到一条路径上;

第二,如果两条路径的广义出行时间是一致的,那么乘客选择这两条路径的可能性也是一致的;

第三,广义出行时间越短的路径,分担比例越高;

第四,如果某条路径的广义出行时间与最小广义出行时间非常接近,那么乘客往往也会比较倾向于选择它。随着广义出行时间的增加,乘客选择这条路径的意愿将迅速降低。

那么,有没有一种方法能够表示出这种规则呢?答案就是——正态分布。

正态分布是一种日常生活中非常常见的分布,比如人们的身高、体重,学生的学习成绩等等。它呈现出“中间高,两头低”的特点,大部分的数据都集中在数据的平均值左右,与平均值偏离较大的数据很少,这和实际生活中的经验是相吻合的。

图4 正态分布的概率密度图像

正态分布的概率密度函数为

式中,μ为均值,σ为标准差。越大,说明数据越分散,函数图像看起来也就越平滑。

怎样利用正态分布来计算各条路径的分担比例呢?首先,由于不可能存在比最小广义出行时间用时更短的径路,我们只取函数图像的右半部分,也就是x≥μ的部分。在这里,我们将变量的取值进行一定的处理:将要计算的第条路径的广义出行时间减去最小广义出行时间之后,除以广义出行时间的最大允许值与最小值之差,使得变量的取值在0到1之间。这种处理也称为归一化处理,用公式可表示为

这一步处理的目的是为了避免广义出行时间的具体差值对计算结果造成影响。在进行归一化处理后,μ值变为0,也方便了后续的计算。

下一步,根据正态分布的概率密度函数,计算每一条有效路径的概率密度值。此时,概率密度函数就变为了

式中,xi为归一化处理后的第i条路径的广义出行时间。

最后一步,将计算出的概率密度值除以所有有效路径的概率密度值之和,就得到了乘客选择每一条有效路径的比例,称为有效路径的分担比例。也就是

式中,P(i)是第条有效路径的分担比例。

很显然,如果只有一条有效路径,那它的分担比例肯定是100%,而如果有多条有效路径,则需要分别进行计算,得到每条路径的分担比例。由指数函数的性质可以知道,如果广义出行时间越短,xi的取值越接近0,f(xi)的取值越大,其所占的分担比例也就越高。因此,借助正态分布描述乘客出行路径的选择是合理的。

03 实例分析

成都轨道交通集团的易燕妮工程师以成都地铁7号线开通后的地铁线网和客流数据为例,利用这一模型进行了客流清分,其结果刊登在2018年1月出版的《智能城市》上。

参照其他城市,结合成都地铁运营的实际情况,相关的系数取值分别为换乘放大系数α=1.2,相对比例系数θ=0.6,允许值上限M=10,正态分布标准差σ=0.25.

结合前面的介绍,我们可以举一些简单的例子来分析。比如,从甲站到乙站的最短广义出行时间为10分钟,那么乘客所能接受的最长广义出行时间为10×(1+0.6)和10+10当中更小的那一个,得到结果为16分钟。这也就是说,甲站到乙站之间的广义出行时间在10-16分钟之间的路径,都可以称为有效路径。再比如说,如果甲站到丙站的最短广义出行时间为40分钟,那么乘客所能接受的最长的广义出行时间就是40×(1+0.6)和40+10中更小的那一个,结果为50分钟。

还是以甲站到丙站为例,如果甲站和丙站之间有三条可能的乘车路径:路径A,乘车46分钟直达;路径B,乘车20分钟,换乘5分钟,再乘车14分钟;路径C,乘车10分钟,换乘8分钟,乘车18分钟,再换乘5分钟,再乘车10分钟。那么每条路径承担的客流比例又是多少呢?

首先,我们计算出每条路径的广义出行时间。得到路径A的广义出行时间为46分钟,路径B的广义出行时间为20+(5×1.2)+14=40分钟,路径C的广义出行时间为10+(8×1.2)+18+(5×1.2)+10=53.6分钟。根据前面的计算结果,我们可以看出,路径C的广义出行时间已经超过了乘客能接受的最大值。因此,路径C不是一条有效路径,我们只需要对路径A和路径B进行计算。

对路径A和路径B的广义出行时间进行归一化处理,得到变量的取值分别为

将标准差代入,得到概率密度函数

在计算分担比例时,我们发现前面的项可以被约分掉,因此直接计算后面的指数项,得到:

也就是说,往来于甲站与丙站之间,大约有5%的乘客会选择无须换乘的路径A,而近95%的乘客都能够接受换乘一次的路径B,以节省几分钟的出行时间。

用这样的方法去寻找地铁线网中各个车站之间的有效路径,并计算它们的分担率,就可以对整个地铁线网的客流进行清分,得到客运量的计算结果。

部分站点之间各路径分担比例情况如下表所示:

图5 部分站点在成都地铁线网(2018年)中的位置

有些读者会留意到,除去进站和从其他线路换入之外,对于7号线这样的线路而言,还存在一些过路的乘客。他们既不从7号线的车站进站,也不从7号线的车站出站,但又确实是乘坐了7号线。因此,每条线路的客运量实际上是进站、换入与途径三种情况下的乘客人次数量之和。

以202万人次的进站量为例,经过计算得到的成都地铁各线路的客运量数据如下表所示。

表中右下角的换乘系数是全线网客运量与进站量的比值,它表示乘客平均每次出行所产生的客运量。从上面的介绍中我们可以分析出,换乘系数并不是一个人为预先设定的数字,而是根据乘客的进、出站情况,经过清分规则与数学模型计算得出客运量之后的一个统计指标。显然,换乘系数的值并不是固定的,甚至每天都会略有不同。对于不同城市、不同阶段的地铁网络而言,它们的换乘系数也是不一样的。但无论如何,这一数字确实是经过周密的计算后得出的,并不存在”刷客流”的说法。

由于每位乘客至少都会乘坐1次车,因此,换乘系数减去1就是平均换乘次数,也就是说,在当时的成都地铁线网中,每次出行平均换乘0.5744次,这与大部分乘客出行无须换乘或只需换乘1次,一部分乘客需要换乘2次的实际情况是相符的。

写到这里,这篇文章就要进入到尾声了。如今,除了考虑换乘时间之外,还有更多的因素纳入到了清分的过程当中。比如,乘客对列车的拥挤程度比较敏感,如果某条线路非常拥挤,乘客就可能倾向于选择其他的线路。又比如,使用单程票的乘客通常对地铁不太熟悉,往往会选择尽量少换乘的路线,以防止自己坐错车;而使用交通卡的乘客一般有自己的出行习惯,知道怎样最省时间。这样,就可以对这两种乘客分别进行清分,以提高精确度。大数据时代的来临,也让手机信令、人脸识别等新技术手段应用到这一问题当中。在高科技的加持下,相信我们对地铁客流的把握一定会更加准确,未来的地铁出行将更加美好!

附:C市地铁站名介绍

西门口:广州地铁1号线车站。

北部湾:海湾,位于我国南海海域西北部。

珀斯:澳大利亚西部城市。

坪石:京广铁路车站,位于广东省韶关市。

上水:一种铁路技术作业,亦是港铁东铁线车站。

六角亭:一种传统园林建筑,亦是湖北省武汉市地名。

田心:京广、沪昆铁路车站,位于湖南省株洲市。

五象广场:现已更名为金湖广场,位于广西壮族自治区南宁市。

狼窝铺:京哈、津山铁路车站,位于河北省唐山市。

参考文献

[1]徐瑞华,罗钦,高鹏.基于多路径的城市轨道交通网络客流分布模型及算法研究[J].铁道学报,31(2):110-114.

[2]毛保华,四兵锋,刘志丽.城市轨道交通网络管理及收入分配理论与方法[M].北京:科学出版社,2007.

[3]易燕妮.城市轨道交通骨干线路开通对票务清分影响研究[J].智能城市,4(1):114-115.

作者:交通运输科技协会 张勤宇

编辑:宣传部 丁则正

头图设计:宣传部 杨淙翰

审核:丁则正

优质原创

在成都,地铁可以坐多远?

扫描二维码 或 点击上方关注

关注我们

先行科协ATransT

科创|科普|文化|兴趣



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3