Skip to main content

在現實世界中建構人工智慧視覺系統

AI 技術, 機器視覺, 邊緣運算

一份 2019 年的 IDC 問卷顯示 25% 已部署人工智慧科技的組織,有一半會失敗。雖然有好幾項因素,但最常見的成因是沒有能力收集、整合和管理用來訓練人工智慧模型的資料。

更具體地説,是沒有能力以準確反映現實世界情況的資料為基礎,來開發並維護模型。

「在實驗室中所使用的資料集都是固定的,但這無法反映現實部署的複雜情況,」Deepomatic 共同創辦人和技術長 Vincent Delaitre 解釋道。「實驗室資料集與現實世界的變化相比,可謂微不足道。」

Delaitre 以與 Compass Group 的夥伴關係為例,該集團為世界數一數二的餐飲公司,服務客戶不乏許多大型企業。為了加快午餐付款流程(過去的手動銷售點系統需耗費超過五分鐘),Compass Group 找到一種利用人工智慧物件辨識的自動化結帳系統,在毫秒之間辨認並向顧客收款。

當然了,系統內執行的神經網路必須能夠識別 15,000 多件商品,而這些商品的包裝方式不同、擺放的餐具也各異,且掃描時的燈光也不同。更麻煩的是,商品經常會因季節供應、菜單變動以及其他原因而替換。

遺憾的是,用於開發並測試實驗室人工智慧系統的固定資料集,無法掌握大部分的變因。事實上,其中大部分情況可能都不適合在實驗室中測試,亦或開發者在現實世界部署時,可能經歷無數案例,根本就無暇顧及單一特例。

倘若無法持續適應不同的資料,如 Compass Group 所期盼的自動化結帳系統只會製造高錯誤率,甚至不見得比傳統方式更有效率。

「A」指的是人工智慧 (AI)。也代表著靈敏 (Agile)。

阻礙人工智慧系統適應陌生狀況的大一主因是傳統程式開發。人工智慧系統需要具有高度彈性和靈敏性的方法,讓工程師得以快速辨識意外情況並適當調整訓練資料集。

矛盾的是,遇到這麼多的例外意味着必須實地部署系統,以記錄意料之外的資料,在未來用於更全面、聰明的型號。

為了讓 Compass Group 開啟這項以資料為中心的意見回饋循環,Deepomatic 以 Deepomatic Studio 和 Deepomatic Run 解決方案為基礎,協助部署了一項邊緣人工智慧系統。

Deepomatic Studio 是一個混合式人工智慧部署和資料管理平台,允許非技術人員在自動化可擴充的基礎架構上,訓練、測試並視覺化專有演算法效能(圖 1)。這些演算法通常都會使用 Deepomatic Run 在現實世界生產環境中部署。Deepomatic Run 是一個以 Docker 為基礎的邊緣環境,使用區域 API 在邊緣裝置以程式設計執行推理演算法。

圖 1.Deepomatic Studio 是一個人工智慧開發環境,允許非技術人員建構複雜的人工智慧推理演算法。(來源:Deepomatic)
圖 1. Deepomatic Studio 是一個人工智慧開發環境,允許非技術人員建構複雜的人工智慧推理演算法。(來源:Deepomatic

以 Compass Group 的自動化結帳系統為例,Deepomatic 工具生態系統內開發的演算法部署到 UP Xtreme 板(AAEON Technology, Inc. 出產)。UP Xtreme 是符合成本效益的單板電腦,搭載了第 8 Intel® Core 以及 Intel® Celeron® 處理器,最多支援六個有 Intel® Movidius 視覺處理器的模組,以處理複雜的邊緣推理任務,如以電腦視覺為基礎的物件辨識、偵測等等(圖 2)。

圖 2.AAEON UP Xtreme 搭載 Intel® Core™ 或 Intel® Celeron® 處理器,且支援最多六個 Intel® Movidius™ 視覺處理器。(資料來源:研揚科技)
圖 2. AAEON UP Xtreme 搭載 Intel® Core 或 Intel® Celeron® 處理器,且支援最多六個 Intel® Movidius 視覺處理器。(來源:AAEON

然而,在 Deepomatic 環境中開發的演算法,本身並沒有為 UP Xtreme 目標進行最佳化,因此可能導致執行時間過長、精確度降低、電源消耗增加,以及其他對如 Compass Group 等終端使用者的負面影響。為了避免掉入泥沼,Deepomatic 平台利用 Intel® OpenVINO 工具組,該跨平台命令列工具能導入各種開發架構的模型,並能在 Intel® 硬體上發揮最佳效能(圖 3)。

圖 3.Intel® OpenVINO 工具組是一個最佳化平台,能夠將各種平台內開發的模型備妥,在邊緣應用程式中執行。( 來源:Intel® )
圖 3. Intel® OpenVINO 工具組是一個最佳化平台,能夠將各種平台內開發的模型備妥,在邊緣應用程式中執行。(來源:Intel®

OpenVINO 工具組為 Deepomatic 軟體開發套件 (SDK) 的一部份。結合後,此解決方案堆疊能改善雙向資料流,並滿足持續改進邊緣人工智慧系統的需求。

「SDK 將自動連線、把應用程式下載到您的邊緣裝置,並進行推理和處理所有資訊,」Delaitre 說道。「它會將資料回傳至 Deepomatic Studio 平台,您因此可以迭代並訓練新的系統版本,並循環持續改進。」

持續改善電腦視覺系統

採用此方法及基礎架構,Compass Group 因此能夠訓練超過一百萬個圖片的資料集,以辨識超過一萬種個別商品。這些演算法已部署至數個 Compass Group 分部的自動化結帳系統,每名顧客的等待時間不用超過 10 秒,而滿意率則高達百分之 92。

雖然有此成就,Delaitre 仍提醒能達到如此的精確度和表現,都須歸功於多年的部署成果。他指出專案一開始在新地點部署智慧結帳系統時,錯誤率比預期高出四倍。而且花了兩年來最佳化整個系統,因此證明了收集資料意見回饋的長期重要性。

幸運的是,AAEON 致力於支援顧客度過這種新形式的即時開發流程,以及整個長期部署生命週期。加上與 Intel® 合作,該公司的新倡議將支援特定人工智慧硬體以及軟體解決方案疊 15 年之久。

更具智慧的系統就需要更有智慧的開發基礎架構,並保證只要系統必須持續適應環境,便會持續提供服務。

如今,在兩者兼具的情況下,您只需要持續匯入資料,便能讓系統持續學習。

作者簡介

Brandon is responsible for Embedded Computing Design’s IoT Design, Automotive Embedded Systems, Security by Design, and Industrial Embedded Systems brands, where he drives content strategy, positioning, and community engagement. He is also Embedded Computing Design’s IoT Insider columnist, and enjoys covering topics that range from development kits and tools to cyber security and technology business models. Brandon received a BA in English Literature from Arizona State University, where he graduated cum laude.

Profile Photo of Brandon Lewis