澎湃Logo
下载客户端

登录

  • +1

人流量千变万化难以预测,但微软通过大数据和人工智能做到了

澎湃新闻记者 王心馨
2017-02-13 17:30
来源:澎湃新闻
能见度 >
字号

还记得去年任天堂推出的,火遍全球的游戏Pokemon go(编注:中文译作精灵宝可梦)吗?

2016年7中旬,为了抓住一只珍惜的数码宝贝,大量游戏玩家不约而同地涌向了美国纽约的中央公园。这种无法提前预知的人流涌入,给纽约中央公园的交通造成了极大的压力。同时,人流拥堵也极有可能发生踩踏事件。

对于城市管理者来说,如果能提前预知城市的人流动向,并及时做出疏导,会大大减少发生交通拥堵、踩踏等公众事件的可能性。现在基于云计算、大数据和人工智能的应用,科学家建立了预测人流的智能模型。

微软亚洲研究院主管研究员郑宇和他的同事将上述研究写成了论文。这篇名为《Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction》的论文,在今年2月份举行的世界人工智能顶级大会 AAAI上发表。

“利用大数据和人工智能来做人流量预测,这个想法我在2015年的时候提到过,当时还发了条微博,觉得可以做。现在这个研究也算是兑现了自己当年的承诺”郑宇在采访中告诉澎湃新闻(www.thepaper.cn)。

人流量预测系统已在贵阳落地试验

尽管论文今年才正式对外发表,但微软亚洲研究院推行的人流量预测系统去年已经在贵州省贵阳市落地实验。

据郑宇介绍,微软亚洲研究院以贵阳出租车的实时数据作为样本,基于云计算、大数据和人工智能做了实时的人流量预测系统。系统把城市划成一公里乘一公里的格子,预测每个格子里面未来会有多少出租车的进和出。

每个格子颜色不同,代表了不同的信息。每点一个格子会跳出一个图表,能清楚知道整个城市某区域人群流动接下来十几个小时会呈现什么状态。黑色曲线表示的是已经发生过的出租车进出情况,绿色代表未来的人流情况,蓝色表示昨天同一时间的情况。

贵阳市实时人流量预测系统。

除了出租车的数据外,手机信号、地铁刷卡记录等,未来都可以通过该系统模型进行运算,得到某地将有多少人进和出的结果,并预测到未来十几个小时的城市人流情况。

“现在贵阳市的数据是实时输入的,这个系统是真实在运转的。我们希望能够预测整个城市,每一个区域里面在未来这个时刻会有多少人进,以及多少人出。所以我们并不是预测每个人的线路,而我们关心的是最后每个区域里面会有多少人。现在,这个模型预测未来十几个小时的人流情况不是问题。更关键的是未来3-5个小时的人流情况,这段时间对于城市管理者的决策影响关键。但要准确预测也面临许多的困难。”郑宇说。

据澎湃新闻了解,2016年,贵阳大数据成为中国的大数据示范基地。微软亚洲研究院与贵阳市成立了联合实验室——“块数据实验室”,上述的实时监测系统就是这个实验室的一个成果部署。

北京的出租车和纽约的自行车

除了用贵阳出租车的实时数据进行验证外,郑宇在其论文中还用了北京的出租车数据和纽约的自行车租赁数据进行了验证。

其中,分别用了4年的北京市出租车GPS轨迹数据和1年的纽约自行车租赁数据,对自己提出的模型进行了验证,证实了时空深度残差网络预测人流的准确性。

未来,城市管理者可以根据这个模型预测人流动向,提早做好管控。例如,政府部门若能提前知道未来的某个时刻,天安门附近会有大量人流涌入,就可以提前从人流源头给予出行提示。

更重要的一点是,这个模型能精准预测某一个区域内,一个具体时间点的人流量。举例来说,政府部门知道某一庆典的举办时间,也已经预估到届时会有大量人流涌入举办区域,但如果没有精准的时间和人流数量,仍无法合理地安排保障人员和相应的疏导措施。

“对于出行的人来说,如果他们已经到达目的地,再对他们提出警告、进行限制是相对困难的;但如果你能在他们出行前就告知目的地的拥挤情况,例如在地铁站和附近的广告牌上给出提醒,那么他们另选出行目的的概率才会增加。”郑宇说。

值得一提的是,据郑宇透露,人流量预测仅是该模型的应用案例之一。这个预测模型未来还可以用在物流和车辆调度等系统上。例如,可以帮助解决恶劣环境下,出租车打车困难的问题。

建立人流量预测模型的挑战

那么这个人流量预测模型是如何利用大数据、云计算和人工智能做到的?

据郑宇介绍,按照此前的方式,预测人流通常采取预测个人行为的方法,即只要统计某个区域里的每个人从哪来去哪里,就能测算出该区域有多少人进、多少人出。但这样的统计本身有很大的障碍,准确性很难保证,并且涉及隐私。

除此之外,相比其他数据,对人流数据的模拟和验证更加困难,因为会受到以下三个因素的影响。

首先,一旦某个城市有大事件发生,很多人会从很远的地方通过各种交通方式前往(比如地铁、高速公路),而并不一定经过事件发生地的周边区域进入。因此人流的计算不仅取决于周边还取决更远的区域有多少人进出。简单说就是,人流会受区域之间的相互关系影响。

第二,人流的进出是时空数据,即要考虑到人的空间属性,还要考虑到时间属性。举例来说,当你准备去天安门参观时,既要考虑你的位置变化,还要考虑到你的出行时间。

第三,人流量预测还会受到一些外部因素的影响,比如天气、重大事件、节假日等。

这样一来,传统方法,例如一些基于物理学模型、交通动力学模型或是土木工程的经典模型,都无法应对大规模的人流量预测。

应对上诉的困难,郑宇使用的解决方法并不是传统的深度学习方法,而是时空深度残差网络。

“把收到的人流数据,不论是手机信号还是出租车轨迹,投射到划好的城市网格上。这一步还是容易做到的。最重要的是有了数据后,并不能用现有的深度学习来做。因为我们需要输入最近几小时、最近这几帧的数据,通过深度残差网络来模拟相邻时刻人流的变化”郑宇说。

举例来说,某个地铁站的人流量预测。通过时空深度残差网络,输入相邻时刻的人流数据,可以模拟人流变化的平滑过程;输入每天同一时刻的人流数据,可以模拟人流变化的周期性;输入各个月的人流数据,可以模拟人流变化的趋势。

此外,郑宇的研究还将各个区域的相关性利用卷积神经网络并入融合,最后再加入外部因素,做第二次融合,从而得到结果。

之所以不用传统的深度学习进行融合是因为,如果希望数据里面包含周期性和趋势性,那就意味着输入的数据必须很长。如果只用最近两个小时的数据作为输入,则不可能里面体现周期性,也不可能体现趋势性。这样一来,用传统深度学习方法,这个模型会做得非常大、非常复杂,最后变得很难训练,效果也不好。

相对地,郑宇的模型只抽取一些关键帧,这样的话,只要用几十帧的关键帧作为输入,就可以体现出几个月里面所包含的周期性和趋势性,使得网络结构大大简化,但是训练的质量和效果也提高了。

“以前做很多研究,都是深度学习在计算机视觉、图像和自然语言处理等方面的应用,很少看到有在时空数据上的应用。这篇论文可以认为是(在国际知名学术会议上)真正把深度学习有效用在时空数据上的第一个研究成果,有重大的历史意义。”郑宇告诉澎湃新闻(www.thepaper.cn)。

    校对:栾梦
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈