當智能交通遇到大數據,如同二氧化錳在制取氧氣的實驗中作為催化劑一樣,一場劇烈的化學反應加劇了兩方的共同發展。
隨著城市的迅速發展,交通擁堵、交通污染日益嚴重,交通事故頻繁發生,這些都是各大城市亟待解決的問題。智能交通成為改善城市交通的關鍵所在。為此,及時、準確獲取交通數據并構建交通數據處理模型是建設智能交通的前提,而這一難題可以通過大數據技術得到解決。
智能交通需求與大數據契合
智能交通整體框架主要包括物理感知層、軟件應用平臺及分析預測及優化管理的應用。其中物理感知層主要是對交通狀況和交通數據的感知采集;軟件應用平臺是將各感知終端的信息進行整合、轉換處理,以支撐分析預警與優化管理的應用系統建設;分析預測及優化管理應用主要包括交通規劃、交通監控、智能誘導、智能停車等應用系統。
系統利用先進的視頻監控、智能識別和信息技術手段,增加可管理空間、時間和范圍,不斷提升管理廣度、深度和精細度。整個系統由信息綜合應用平臺、信號控制系統、視頻監控系統、智能卡口系統、非現場執法系統、信息采集系統、信息發布系統等組成。以達到如下四方面的目標:
提高通行能力
減少交通事故
打擊違章事件
出行信息服務
如下是智能交通整體應用架構圖:

整個系統建設的核心是數據的沉淀、存儲與計算,而其中最重要的核心思想就是“數據是價值”。問題就是如何把數據轉換成價值。這就成為一個技術問題。
從統計學的角度,任何領域任何動態發展的事物,只要有足夠多的樣本數據,就一定能從樣本數據中找到動態發展的規律。數據越多,準確率越高。這個“規律”就是數據的價值所在。對于商業機構,可以分析用戶行為規律從而提高銷售量;分析目標市場規律,定點投放廣告從而降低成本等等;還可以分析交通行為規律,提前做交通疏導,提高交通通暢率,這就能真正挖掘數據的潛在價值,提高其社會價值。
從20世紀初的網絡發展以來,進入一個高度聯網的階段。聯網的同時,數據高度集中,數據量急劇增加。據IDC報告現在互聯網的數據,每兩年就翻一番。這個增長率在智能交通行業同樣有效,隨著卡口、電警、攝像機數量的增加,高清化、智能化的發展,如果再算上物聯網的各種傳感器,未來幾年的數據量增加可能大大高于這個增長率。這就為智能交通行業實現大數據提供了數據基礎。
從各種各樣類型的數據中,快速獲得有價值信息的能力,就是大數據技術。由此我們再看IBM歸納的4個V( 量Volume,多樣Variety,價值Value,速Velocity):
1)Volume數據體量巨大。從TB級別,躍升到PB級別;
2)Variety數據類型繁多。包括視頻、圖片、地理位置信息、傳感器數據等等。
3)Value價值密度低,應用價值高。以視頻為例,連續不間斷監控過程中,可能有用的數據僅僅有一兩秒。
4) Velocity處理速度快。1秒定律。最后這一點也是和傳統的數據挖掘技術有著本質的不同。在交通領域,海量的數據主要包括4個類型的數據:傳感器數據(位置、溫度、壓力、圖像、速度、RFID等信息);系統數據(日志、設備記錄、MIBs等);服務數據(收費信息、上網服務及其他信息);應用數據(生成廠家、能源、交通、性能、兼容性等信息)。交通數據的類型繁多,而且體積巨大量Volume 和多樣 Variety是因,數據類型的復雜和數據量的急劇增加,決定了原有簡單因果關系的應用模式對數據使用率極低,完全無法發揮數據的作用;速Velocity是過程,巨大的運算量決定了速度必須快;價值 Value是最終的果。
大數據沉淀
在各城市建設智慧交通的過程中,將產生越來越多的視頻監控、卡口電警、路況信息、管控信息、營運信息、GPS定位信息、RFID識別信息等數據,每天產生的數據量可以達到PB級別,并且呈現指數級增長。以丹東市的卡口電警產生的數據為例:
車道數 | 1300 |
---|---|
每車道平均每天過車數據 | 4000 |
每車道每天過車數據,峰值 | 12000 |
圖片存儲周期(天) | 180 |
過車信息存儲周期(天) | 180 |
平均每張圖片大小(KBytes) | 250 |
系統要求: | |
圖片存儲容量 | 數百TB |
數據庫存儲容量 | 數TB |
IPSAN吞吐率(MBytes/s),均值 | 15 |
IPSAN吞吐率(MBytes/s),峰值 | 45 |
數據庫容量(億條) | 百億級 |
并發能力(條/S),均值 | 60 |
并發能力(條/S),峰值 | 200 |
大數據增值應用
深入挖掘數據價值,在智能交通等行業上推出車輛軌跡、道路流量、案件聚類等大數據模型。基于大數據模型,推出智能套牌、智能跟車分析、軌跡碰撞、智能比對、輿情分析等數據增值應用,逐步解決行業的深層次問題
海量數據計算
通過云計算集群,實現對海量數據的分布式高速計算,支撐對海量數據的高效分析挖掘。
云計算集群是一種M/S架構的分布式計算系統,Master作為調度管理服務器,負責計算任務分解與調度、計算資源統一管理。Slave則由大量的計算服務器組成,負責完成Master下發的計算任務。
海量數據檢索
基于行業數據查詢特點,對搜索引擎進行優化定制,支持百億記錄的秒級高速查詢。通過集群機制,實現搜索服務的高可靠性、高容錯性、高擴展性。
海量數據存儲
對于海量數據存儲,采用HBase分布式存儲系統。 相比傳統關系型數據庫,有如下特點:
數據格式靈活
高可用
橫向擴展能力強
訪問高效
同時能夠做到無縫集成,快速從關系型數據庫導入已經存在的歷史數據。 提供高可靠性、高容錯性、高性能的海量數據存儲解決方案,支持無縫容量擴展。
大數據在智能交通中的發展
宇視智能交通產品總監孫加君分析,智能交通產品的技術定位近年來有兩大顯著變化:
第一是智能前置,前端的抓拍單元發生了非常大的變化,實現了“一體化”,即所有的交通行為、智能分析行為都由相機來完成。而在2010年前后,抓拍單元還是純粹的抓拍機,其他智能分析算法由路口工控機或后端設備完成;
第二是建設規模,現在一個中小城市建設卡口和電警設備的規模就能達到上千路,抓拍圖片的數量規模非常龐大,有的甚至上億條,如果存儲時間較長則達到10億條,對平臺管理、檢索這些過車記錄,提出了非常大的挑戰。
宇視副總裁閆夏卿從三個角度闡述智能交通與大數據的關系:
首先,從應用成熟度看,在今天無論卡口、非現場執法設備,視頻監控是對圖像和視頻數據進行語意化和結構化處理最成熟、最完整、應用深度最深的領域。智能交通可能是現在新興技術和應用領域里,率先突破數據應用瓶頸的一個技術領域;
其次,從技術角度看,包括大數據、云計算的技術架構,最先在智能交通里落地,智能交通也必將引領整個智慧城市各個子模塊的技術潮流和走勢;
最后,從使用者與應用者關聯的角度看,交通的智能化,最終會影響到每一個人騎車、駕車、公交出行的感受。每位市民都能夠有非常好的交通秩序體驗,這一點就需要智能交通的技術方案去支撐實現。