漫漫通勤路之上海地铁拥挤程度调查

2015.08.09/2015.08.10发布于研究暂无评论/目录

话说几年前临近毕业的时候,早上乘五号线和一号线找工作来着,早高峰地铁上你拥我挤的情景差点给咱留下不可磨灭的身心伤害。

最近打算租个地铁房,便抽空调查了下上海地铁的拥挤情况,以好避开这些坑爹线路和站点,顺便跟每日都要历经此难的地铁通勤族们分享一下。

骨感的现实

上海地铁自1993年开通一号线,至今(2015年8月)已有14条线路在运营,据上海地铁微博的消息,最近日均客流量大多在900万人次以上,15年4月30日,客流量更是超过了1000万人次。

报道称,2014年上海的常住人口就超过了2425万,再加上大量的外来人员,只能说,这里真的很挤,到处都挤。

然而,咱的目标是

做自己喜欢之事,并且得以体面生存。

为此,需要在骨感的现实生活中稍微钻点空子。

为了丰满的理想

数据来源

上海地铁官方除了每日发一条微博,告知一下昨日的客流总量外,完全不会对外发布任何的客流数据。因此为了咱们丰满的理想,必须走曲线救国的途径。

好在上海地铁网站上提供一个客流实时信息的网络服务(TOS系统),通过这个服务,我们大概知道当前有哪些站点发生了拥挤。

数据说明

TOS系统对外提供的数据比较简单,不算线路名称和站点ID这些基础数据,真正有用的就只有站点(或区间)的拥挤时间这一项。也就是说,从返回数据来看,你只知道某段时间某个站点发生了拥挤,至于拥挤的严重程度或是站点的客流量,全都无从得知。

通过阅读某内部有为青年的论文,大致能了解TOS系统及其提供的数据的含义。下面依照咱的理解简要介绍一些比较关键的概念和名词,方便大家理解下文的统计结果。

  • 拥挤事件:从某个时间开始,某个站点(或区间)发生了拥挤,一直到该站点(或区间)不再拥挤为止,算作一次拥挤事件。实际统计时以第一次和最后一次拥挤的时间界定拥挤时长。
  • 拥挤类型
    • 候车(站点)拥挤:比如发生了候车区客流密度过大(>2人/平米),出入口限流等任一情况。
    • 乘车(区间)拥挤:列车延迟小于10分钟且乘客数量超过满载人数的90%。

所谓的统计结果

从8月3号(周一)开始至8月7号(周五)结束,以每分钟一次的频率,收集到本周的五个工作日内发生的426次独立拥挤事件。这期间天气晴朗,也没有发生地铁事故、节假日或机动车限流等可能会干扰统计结果的事件。

以下分别以地铁整体、线路和站点为研究对象,一一展示统计结果。

地铁整体分析

本周的五个工作日(8.3 ~ 8.7)之内共发生了426次拥挤事件,总拥挤时间约为305小时,最短拥挤时间为0.25分钟,最长拥挤时间为149分钟(2个多小时 !-_-),平均拥挤时间约为43分钟,中位数是39分钟。

在所有的拥挤事件中,候车拥挤有126次,乘车拥挤有300次;然而,候车拥挤时间约为163小时,乘车拥挤约为141小时。

全部拥挤事件

所有拥挤事件的时间见图一,为方便识别,站点名前一律加线路号码,下同。

拥挤时长

按照拥挤时间所占比例来分析,见图二。

拥挤开始时间

按照拥挤开始的时间来分析,大多数拥挤事件分布在7:30~9:00和18:00~19:30这两个时间段内,见图三。

地铁线路分析

在统计时间内,除了10, 11, 12和13号线外,其他的线路均发生了一次以上的拥挤事件。不论是按拥挤次数还是按拥挤时间,6号线和3号线均位列前两名。

线路拥挤次数

对地铁线路的拥挤次数分别进行统计,见图四。

线路拥挤总时间

对各地铁线路的总拥挤时间分别进行统计,见图五。

地铁站点分析

站点拥挤次数

在统计时间内,共有90个地铁站点发生了一次以上的拥挤事件,其中拥挤次数不小于5次(每天至少一次)的车站见图六。

站点平均拥挤时间

按平均每次拥挤的时间来看,超过30分钟的地铁站点排名见图七。

16号线龙阳路的数据比较恐怖(虽然一周只拥挤了3次)。

好像然并卵

以上只是对地铁的拥挤程度进行了简单的统计,除了最后的车站拥挤统计外,大多数结论对普通的通勤族并没有什么用处 !-_-。例如,一个每天只乘坐3号线上下班的人,根本没必要在乎其他线路的死活。就算是乘坐同一条线路,不同类型的乘客的需求也不相同,例如有座位的乘客,可能根本不在乎沿途线路的任何拥挤情况(包括候车拥挤和乘车拥挤)。

比较靠谱的做法是综合乘客的实际通勤旅程和通勤时间等因素,建立一个合适的模型,在以上数据的基础上计算出一个痛苦指数。然而博猪智商有限,目前还不知道怎么做。

参考资料

#上海#地铁#数据分析

评论