Skip to main content

深度學習如何讓城市更安全

監視錄影系統已成為整個城市安全保障的基石,但是這些系統所產生的錄影影像,數量已超過城市所能負荷。要物色相關人員去監視錄影影像並搜尋歸檔影片一直是個挑戰。而且,當部署的攝影機越來越多,問題也越來越嚴重。

藉助人工智慧 (AI) 可以讓搜尋和分析錄影影像變得更輕鬆,進而減少人工作業的需求。但是傳統 AI 部署難度頗高,通常成本很高而且相當費時。

GeoVision Inc. 的產品經理 Sean Lin 表示:「針對新的應用或位置自訂 AI 演算法可能要花研發團隊四到六個月的時間」,「而且結果可能平凡無奇,因為有太多的誤判警報和其他錯誤」。他繼續指出:「各個城市需要一種更簡單的方法,讓操作人員可以在重要的錄影影像中準確找到他們要尋找的目標,而不是大海撈針。」

深度學習解決方案之出現會大幅改善電腦視覺與影像分析。這些系統效能更強大、更容易部署,而且馬上可在市面上取得。

透過深度學習,可以根據設置攝影機的環境特色去訓練不同的模型。演算法基本上是針對每種情況而自訂,不需要重寫。

數量龐大的視訊資料是助力而不是阻力。深度學習可以持續汲取資料,以便適應新條件和要求。

深度學習正在改變遊戲規則

藉由深度學習,諸如臉部辨識或運動偵測等電腦視覺技巧均變得更加精密,監視錄影與其他視訊應用也隨著轉型。

在控制型環境中,傳統演算法能發揮良好作用,但是它們通常是針對特定使用案例所編寫。例如,偵測跨越預先決定的虛擬線條的一個物件或人員,基本上就是簡單的是與否演算法。當這類演算法在比較複雜的情境中執行時就會出現難題。

Lin 提出更清楚的例子:「當您將傳統的演算法套用到不同的攝影機位置,有些攝影機設在公園裡,有些可能在街道上,這些實際的環境在錄影影像中呈現不同的影像。傳統演算法無法處理這些細節。」

「在忙碌的街道上,因為不斷有人來來往往,所以運動偵測或入侵者警報經常會有誤警。這是傳統演算法的限制。」他說。

另一個常見的情境是警察利用臉部辨識來指認通緝對象。「透過深度學習,基本上我們只要把一張相片或一段影片存入資料庫,即可登錄這個人的臉孔。然後,我們的軟體可以自動搜尋一個月前、兩個月前的所有監視錄影片段,並自動找到當局要找的那個人。」Lin 說道。

他預測,不久後很可能只需要一張素描而不是相片就足夠。雖然辨識準確度會降低,但這是傳統演算法完全無法做到的。

這就是 GeoVision Inc. Smart Video Management Solution(GV-VMS) 的出場時機,進一步推動 AI 模型的發展,並能進行更加複雜和密集的分析。GeoVision 深度學習演算法可以針對多種條件進行訓練,包括:

  • 計算朝兩個方向移動的人員或物件
  • 偵測和辨識多種應用中的臉孔
  • 在影片中偵測到臉孔時,將臉孔遮罩以保護隱私
  • 把在模糊條件下拍攝的影片「除霧」,以便清晰呈現影像
  • 把多台攝影機的影片接合成單一全景視圖
  • 在震動環境中進行防震錄影
  • 在佔用率代碼有所限制的地方計算人群數量
  • 移除由廣角鏡頭造成的變形
  • 智慧搜尋某個區域有運動的事件

端到端的解決方案

GeoVision 獨特的深度學習功能之基礎,是由攝影機、錄影伺服器和視訊控制中心組成的綜合系統。它透過標準通訊協定連接 GeoVision 和第三方 IP 攝影機,如圖 1 所示。之所以能夠達成這樣的規模,是因為採用可提高視訊處理效率和深度學習能力的 Intel® 處理器。

圖 1:GeoVision Smart Video Management System

GV-VMS 以 Intel® x86 架構為基礎,可充分發揮 Intel® Core 處理器效能。當搭配部署 Intel® OpenVINO 工具組,可將深度學習導向的視訊分析效能提升八至十倍。因此,在不增加額外需求負擔的情況下,便能提高同步視訊處理的能力。

GeoVision 攝影機能夠在網路邊緣進行深度學習。攝影機可以在偵測到某種狀況時傳送警告,而不是把所有影片傳送到中央位置進行分析,這樣可以減少延遲,盡快採取行動。

大多數城市均有舊式的監視錄影系統,包含攝影機、閘道和軟體。GeoVision 應用程式設計介面 (API) 和軟體開發套件 (SDK) 能與舊有的硬體和軟體連線。GeoVision Control Center 有統一的雲端管理軟體,把所有 IP 攝影機整合成為一個整體的安全與管理系統。

有一個例子是,梵帝岡市使用監視錄影系統已有數十年之久。經過多年,形成了採用多家廠商的不同攝影機、閘道和軟體工具的情況。梵帝岡與 GeoVision 合作,有策略地把舊攝影機和軟體整合成一個中央監視錄影解決方案。在重要的政府機關大樓、教堂、禮拜堂和路口的攝影機均由中央控管。GeoVision 解決方案打造一個統合型系統,監視整個羅馬 140 個據點的錄影影像。

聰明靈活,自由擴充

該解決方案可以有效擴充供任何等級的視訊用途。單一實作可以管理多達 57,600 個視訊串流。系統把視訊資料傳送到統一的雲端管理系統,這個雲端管理系統可以監視和控制超過 1,000 個 GV-VMS 系統。在後端,巨量資料可以藉由搭載 Intel 處理器的伺服器儲存在客戶的資料中心或雲端中。

Smart Video Management Solution 也與其他系統整合,如火警偵測或出入控管,讓它的整體功能更全面。以連接出入控管為例,解決方案可以藉由臉部辨識允許人員進入任何類型的禁制區,無論是限制進出的建築或是停車場。它可以在中央視窗中顯示其他系統的資料。

把深度學習以及與其他軟硬體整合的能力結合起來,各大城市可以使用像是 GeoVision 提供的解決方案來改善監視錄影的效用。深度學習改善了自動化回應,整合會提高營運效率,而擴充性則代表監視錄影系統的功能不會因為城市擴張而失去效用。

「若論城市的某種使用情境,傳統的監視錄影解決方案可以滿足所有基本需求。但是一旦某個專案發展至城市的規模,只需一天,您就會收到數千小時的錄影影像。您要花費太多時間和過多的人力才能真正查明您想要找的內容。操作人員利用 GeoVision 解決方案可以更輕鬆地挑出他們正在尋找的人物或東西。」Lin 說道。

作者簡介

Erik Sherman is a journalist, analyst, and consultant with a background in engineering, technology, and business management. He's written about such topics as semiconductors, enterprise software, logistics, software development, advertising technology, scientific instruments, biotechnology, economics, finance, marketing, and public policy.

Profile Photo of Erik Sherman