新聞中心
奇妙的交通大數據:一位美國教授與840個公交扒手奇遇記
作者:睿至大數據
一個美國州立大學的終身教授,與北京公共交通系統上的840個扒手之間,存在著什么樣的關系?難道說,這位倒霉的大學教授,在他短短幾次光臨北京的時候,不幸遭遇了這些扒手的集體“臨幸”?又或者,他是這840名扒手背后的“神秘男子”?也許,還有什么不可告人的秘密?

很顯然,我們今天討論的既不是倒霉蛋的故事,也不是不著邊際的陰謀論,這個故事的主角,是美國羅格斯-新澤西州立大學羅格斯商學院管理科學與信息系統系副系主任,他同時也是該大學信息安全中心的主任,他的名字叫熊輝。


2016年在舊金山舉行的KDD2016學術會議上,熊輝向大家報告了他們的研究論文《Catch Me If You Can: Detecting Pickpocket Suspects from Large-Scale Transit Records》。這篇論文以2014年前9個月在北京公共交通系統上抓到的840名扒手(地鐵350名,公交車490名)的數據以及北京市2014年4-6月三個月間600萬乘客的約16億智能公交一卡通數據記錄為大數據集,統計出了正常出行者、旅游者、購物者和扒手四種“出行”模式。


熊輝的研究發現:扒手采用一種流浪的模式,沒有清晰的目的地,他們頻繁地換乘,隨機的停留,經常進行短途的出行;他們還(一段時間內)頻繁的訪問多種功能區:交通樞紐(例如西直門)、購物區(例如王府井)、景點(例如鼓樓)——這一論文結論的得出,對北京公共交通系統的治安管理、安全運營提供了極具參考性的意見,顯示出了在大數據的支撐下進行的數據分析所能產生的意想不到出眾能力。


當然,治理公交車和地鐵車廂里的扒手,還需要治安管理部門和交通運營管理部門的通力合作,大數據所起到的作用在當前來看還略微顯得弱小了一些,畢竟在熙熙攘攘的人群中找到那個“并不賊眉鼠眼”的扒手,需要的更多還是有經驗的反扒人員和更多數字化的監控手段。


不過,在公共交通系統的運營、規劃、管理和乘坐體驗等方面,大數據是可以發揮越來越重要的作用的。特別是近年來,各城市的公共交通運營管理機構(包括公交公司、地鐵運營公司等運營管理機構,以下同)正在努力以城市全局公交交通統籌規劃、優化線網建設、提升管控力、提升服務滿意度為發展的核心目標,致力于更好地發展與管理城市公交,實現其社會效益最優化,并最大限度地提高公交企業管理水平、提高公共交通運行效率的大背景下,大數據能做的事情,或許會讓你大吃一驚。


大數據:在公共交通系統大有可用之地

公共交通系統的大數據應當來自于政府管理部門、公交運營企業和公眾出行參與者三方面多渠道多角度的信息,這其中包括了城市路網規劃(比如路網條件、交通信號燈坐標等)、城市擁堵/交通情況、公交運營數據(包括公交車、地鐵車輛運營信息)、公眾出行參與者們的參與信息(上下車輛、進出站、客流遷徙等),是一個非常復雜的大數據系統。但需要注意的是,只有涵蓋了“路、車、人”三者全部信息及其相互關系的大數據,才能夠幫助公共交通系統的管理者們探索公共交通系統運營管理的切實舉措和發展方向。


同樣是在北京,我們看到為了更好地服務于乘客,拉近集中居住區和核心商務區之間的關系,北京公交集團開行了數十條商務班車,不僅提高了北京公交集團的收入,也為每天往返于居住地和工作地的公交族們提供了全新體驗的“巴士專車”服務,不僅如此,北京公交集團還開行了快速直達專線、節假日撰寫、休閑旅游專線和高鐵快巴——這些創新的公共交通服務,依靠大數據將能夠得到進一步的優化升級。

那么,具體到公共交通運營管理,大數據能夠起到哪些重要的作用呢?

在過去幾年,睿至大數據一直利用自身創新的大數據解決方案幫助全國各地的公共交通系統運營管理部門和城市管理部門優化城市公共交通系統,并就此得到了來自一線的經驗如下:

線路、站點優化:隨著社會經濟的發展、城市化進程的加快,城市建設擴張、功能區重新規劃、城市新興聚集區等因素深刻影響著城市的公共交通系統,通過大數據可以統籌解析城市環境內公交線站網的規劃,了解交通擁堵與公交站點、換乘站點等之間的關系,結合乘客流動,城市擁堵、線路覆蓋度等綜合因素,探索優化公交線路,包括線路和站點的調整、新開、取消;

調度優化:公交車輛和地鐵列車的調度一直是公共交通運營管理機構最艱巨、最頭疼的工作,道路擁堵、社會(突發)事件、車輛損壞(包括交通事故)等等因素,都會對車輛調度產生影響,并最終影響乘車人的體驗(比如導致長時間的等待),大數據可以幫助公共交通運營管理機構更準確、更精細化的管理車輛調度,加大-縮短發車間隔、及時調度更換受損車輛、惡劣天氣下的車輛調度、及時有效應對節假日或局部臨時性活動的影響;

業務創新:大數據可以幫助公共交通運營管理機構在提升乘客體驗、改變傳統業務模式上提供新的可參考依據和新的想法,比如說設置智能公交站牌、智能公共交通APP等服務,讓乘客第一時間了解“車在哪兒?下一趟車幾點到?自己大約幾點能到目的地?”等關鍵信息;

對睿至大數據來說,公共交通行業的業務創新是持續的,是以豐富的行業實踐經驗為基礎的,這其中包含了三個重要的組成部分:業務執行、(大數據)分析、(決策)計算。以此為基礎,在全國各地公共交通系統優化升級的背景下,睿至大數據正在塑造公共交通系統運營的新常態。

睿至大數據:塑造公共交通系統運營新常態

長期以來,睿至大數據在公共交通領域從探尋城市環境下公共交通運行全局活動出發,基于海量公共交通行業基礎數據,從目前公共交通行業最為關心的問題入手,著力解決為公共交通系統線路優化、提升公共交通系統單車承載量、提高公共交通系統運行效率、為公共交通系統提升交通管理水平提供技術和決策支持,從而幫助公共交通運營管理機構構建運營新常態。

面對日益增長的交通大數據,睿至大數據交通大數據領域的行業業務創新基于實時計算池、大數據計算池、超級計算池三個組成部分,他們分別代表了公共交通系統運營管理時所面對的三類需求:業務執行、(大數據)分析、(決策)計算——在共用軟件支撐平臺的基礎上,這三者滿足了公共交通運營管理機構的三大需求:

業務執行:可以被稱為運營決策系統,包括運營調度系統、多媒體實時監測系統、數據轉發系統、企業實施通訊系統(IM)、辦公自動化系統(OA)、企業資源管理(ERP)、車站管理、票務/公交卡系統、搶修救援調度系統、車載定位系統、地理信息系統、應急指揮系統、大屏幕/網絡通信系統等多個系統,是公共交通運營管理機構的一線業務系統,只要是進行第一線的業務(決策/命令)執行的傳遞、第一線信息的及時投影以及相關運營管理資源的管理;

(大數據)分析:以大數據計算池為基礎構建,提供了包括交通需求分析、配置策略分析、交通線網分析、票卡價格分析和企業能力分析等多方面的功能,主要幫助公共交通運營管理機構對大數據進行篩選、清理、集合、分析和關聯性分析,從大數據中發現一些潛在的、不易察覺的數據特征;

(決策)計算:依托超級計算池,睿至大數據為公共交通構建了為公共交通運營管理機構提供實時優化、實際決策依據的“超級計算平臺”,它支持了配置策略優化、車輛優化、交通線網優化、實時預案編制、實時預案優化、運能系統仿真等需要耗費大量計算資源,卻能夠在第一時間為運營管理者提供基于大數據和強大計算力的決策建議。

比如說,就北京公交集團的2萬余輛公交車輛來說,就包括車輛進站中、出站中、運行中、??空?、故障信號五種類別,并且應當通過采集公交車輛的GPS數據(以近乎實時的方式采集并回傳),了解到車輛的實時位置信息。

詳盡采集公共交通系統大數據并對其進行針對性的分析是有著非常重要的意義的: 通過刻畫全局公交交通流特性,不僅能夠從一定層面映射公交交通需求特性,從宏觀層面展現公交交通線網時空熱度,全局展現交通熱區、熱點(比如核心區域內交通活躍度、核心區線路覆蓋重合度等),還能給出公交交通流與城市生產生活功能區域主干路網OD特性,展現公交運力熱段、熱點(比如客流遷徙的趨勢等)。

依托超級計算池和大數據計算池的(決策)計算和(大數據)分析,是睿至大數據在公共交通運營管理平臺及其業務優化上極為重要的創新,它改變了原有行業應用平臺只能提供基本信息化功能(如IM、OA、ERP)或是實時數據顯示的現狀,能夠為管理者呈現(經過分析的)數據內在的具有價值的信息以及不同數據之間的潛在關系。不僅如此,它還能夠為管理者提供“行動指南”,即實時優化的建議和實際決策的參考——真正的將“看似毫無意義的數據”,變成具有實際意義的行動決策。

在某公交集團的大數據監測指揮平臺項目上,睿至大數據幫助該公交集團構建了使用GIS形式展現的實時監控2萬余輛公交車輛的平臺,不僅實時計算該公交集團所屬全市范圍內路段的擁堵情況,(通過特征箱梁設計、模式識別)計算全市紅綠燈地理坐標,而且通過客戶OD大數據,定期監控了全市乘客OD遷移特征規律。

值得一提的是,在模型計算方面, 睿至大數據充分利用了大量高難度的算法,包括K-means聚類算法、平滑濾波算法、貝葉斯算法、概率密度算法等算法,保證了數據呈現的效果、數據分析結果以及優化決策建議的優化高效、切實可信。

在該公交集團的大數據監測指揮平臺,不僅能夠通過GIS可視化展現車輛運行情況,了解交通擁堵、熱門站點、乘客OD遷移特征,并且進行定制化的分析模型構建與展示,更重要的,是能夠直觀的提供線路標準化運營狀態分析、定位數據和調度車次的公里模型以及定位數據的線路及站點位置分析,為公共交通運營管理機構的信息獲取、全景展現、實時優化和實際決策提供了有力的、創新的支撐。


睿至大數據:開展“院企合作” 實踐“產學共贏”


除了自身在公共交通大數據領域的技術研發與創新,睿至大數據同時積極開展“院企合作”實踐“產學共贏”,布局交通大數據的實踐應用:2017年4月,睿至大數據與北京交通大學交通運輸學院,正式簽署戰略合作協議,雙方將通過睿至大數據在算法和工程上的經驗結合專家們的行業經驗,更進一步提升睿至大數據交通大數據平臺的支持、服務和創新能力。

對于睿至大數據未來在交通大數據,特別是公共交通大數據領域的發展,睿至大數據CTO蘭健認為:長期深耕行業、依托行業讓睿至大數據在行業數據源和跨行業數據源整合方面具有先天優勢,這在睿至大數據與北京公交、沈陽公交的合作上已經得到了體現。(在許多實際項目中)睿至大數據通過技術手段,對數據做對接和交互產生了非常好的效果。

未來,睿至大數據將進一步面向公共交通,特別是軌道交通行業(包括(高速)鐵路、城市軌道交通(地鐵、城鐵)),開展結合行業需求、應用特點的面向社會服務的大數據應用研究和實踐,幫助中國城市交通建立完善的大數據平臺。



宅男