專為電腦視覺應用程式的最新產品，打造快速自訂人工智慧

July 17, 2020

Brandon Lewis

AI 技術, 電腦視覺

這位是 Walker，它是一台智慧人形服務機器人。Walker 可以包辦各種任務，從與他人互動到倒飲料、搬運物品、擦拭物體表面以及記錄注意事項。甚至連上下樓梯也難不倒它（影片 1）。

影片 1。Walker 由 UBTECH Robotics 公司開發，是一款運用先進電腦視覺技術的智慧服務機器人。

雖然在 Walker 的研發過程中需要用到許多工程專業技術，但真正讓它獨一無二的莫過於電腦視覺。物件偵測、臉部識別、目標追蹤、人體姿態估計以及同步定位與環境地圖建立 (SLAM) 演算法，均對 Walker 的能力有至關重要的影響。

自訂電腦視覺仍然面臨挑戰

雖然大眾已能透過如 OpenFace 和 OpenCV 等開源專案，使用先進的電腦視覺技術，但這並不代表這門技術能直接投入實用。事實上，將電腦視覺軟體從一個環境直接轉移到另一個環境，同時又要維持相當的效能，這項嘗試幾乎可說沒成功過。

以人體姿態估計為例，可以將健康照護人員以及客戶服務人員兩相比較。在健康照護的使用案例上，可能會將演算法最佳化以偵測跌倒或失能患者。而在客服的使用案例上，則很有可能會著重在推斷他人情緒。

雖然兩種情況甚至能使用類型相似的神經網路，但個別的實際應用仍使最終的人工智慧架構有著巨大的差異。

而上述例子甚至還沒將各種眼花撩亂、適合特定使用案例的硬體組合納入考量。各種組合可能包括不同的連線介面和協定、相機鏡頭和延遲、處理器類型和記憶體組態等。更別提沒考慮到持續的硬體商品化，實際上會讓開發獨特、專門的電腦視覺變成一項增值差異化因素。

總而言之，創新的電腦視覺需要自訂人工智慧模型。但可惜的是，這需要時間。而且通常耗時很長。

「現在有不同的軟體框架可供使用、各種可以用來開發的神經網路模型，以及大量的硬體元件以及周邊產品可以使用，」Avnet, Inc. 嵌入式解決方案資深經理 Christian Lang 說道：「設計師們光是評估適合一個應用程式的硬體和軟體就需要耗費數個月。」

加速應用程式開發

儘管如此，所有先進電腦視覺的促成技術早已問世。所以將時間耗費在評估相機和運算硬體、選擇軟體開發框架，以及引進開源儲存庫的模型，其實是拖緩自訂人工智慧模型進行快速原型設計的技術整合挑戰。

「將電腦視覺應用程式開發流程加快的最佳方法，就是在邊緣提供現成、智慧、即時的分析資料（在數小時內即可投入使用），免除耗時的評估流程，」Lang 說道。

而 Avnet 已經成功了，方法就是將一項以邊緣為基礎的電腦視覺系統需要的所有元件，整合至邊緣視覺分析平台（其具備快速設計先進電腦視覺模型必要的硬體和軟體元件）。

該公司建立了一個概念驗證，來展示靈活的軟硬體解決方案疊可以如何適應各種產業的需求（從零售商和教育機構，到工業自動化和公共安全）。該驗證包括一套完整的視覺相機組、Avnet 子公司 Softweb Solutions Inc. 開發的應用程式軟體，以及數個堅固的邊緣人工智慧處理器平台。此外，它還利用了 Intel^® 類神經電腦棒技術（以八個 Intel^® Movidius^™ Myriad^™ X 視覺處理器為基礎）。

但其他絕大部分的魔法都得歸功於 Intel^® OpenVINO^® Toolkit^™，這是一個人工智慧模型最佳化環境，透過一個單一且易用的 API 整合數十種電腦視覺軟體元件。它提供了類神經電腦棒並支援 Open Neural Network Exchange (ONNX)，藉此讓開發人員能使用所有最常用的電腦視覺開發框架（如 TensorFlow 和 Caffe）。

一旦將這些軟體元件整合進 OpenVINO 環境，工具組會將它們傳過一個模型最佳化工具和推理機，以減少整體足跡並提升電腦視覺工作負載的效能。而或許同樣重要的是，該開源開發工具不僅會為 VPU 自動化流程，也會為 CPU、GPU 以及 FPGA 進行自動化。

而結果是，電腦視覺工程師幾乎能立即開始自製人工智慧模型，而無需擔心上市硬體組態是否會與原型平台有所出入。

迄今為止，該平台已經用來快速設計自訂匿名行為和規律分析模型原型，以及即時姿態偵測演算法（圖 1）。