AI • 物聯網 • 網路邊緣

工業物聯網的邊緣化機器學習

August 3, 2018

Ronald van Loon

物聯網正在改變工業產業，希望能大幅提升效率和生產力。但要掌握這些優勢，還需要透過您的機器即時分析各種大量串流資料並加以解讀，以便獲得可據以採取行動的洞見。漸漸地，這代表要部署機器學習，不過問題在於要怎麼做。

雖說雲端具備作為資料模型化和機器學習入口的優勢，可是也無法不斷地為製造、石油與天然氣、營建、交通運輸和智慧建築等產業的應用提供所需的即時回應能力。因此，趨勢朝向藉由在邊緣實施機器學習來擴增雲端方面的發展。

我近日曾與 Foghorn 的科技長 Sastry Malladi 談論過這樣的趨勢。該公司正是「邊緣化」機器學習模型的先驅，他也提出了一些見解，分享此方法是如何為工業組織的即時分析和改良的預測洞察帶來革命性的改變。

邊緣機器學習 = 商業價值

Foghorn 的其中一個客戶迅達集團 (Schindler Elevator) 想要終結一些例行性的問題，例如電梯門摩擦。為此，Schindler 與 Foghorn 攜手合作打造出預測性的維護解決方案。透過從來源分析感測器資料，Schindler 現在可以事先成功判斷維護需求，不再有成本、安全性，以及其他與傳輸大量建物外部資料相關的問題。因此，他們可以在異常現象影響效能之前，以效率極高的方式排定服務。

許多其他客戶也看見了這種商業價值。另一個例子是，廠區遠離市中心的石油與天然氣公司可以運用邊緣機器學習分析資料，包括視訊和音訊。除此之外，該資料可用於預測幫浦的壓力，並就異常的操作參數警示操作人員，且在現場處理大多數本機資料時再次執行。

不過，在進一步談論邊緣化機器學習的優勢前，我們先來看一看企業面臨的一些挑戰。

感測器產生龐大資料

資料轉型促使企業在營運中安裝數位、音訊、視訊和 3D 感測器，然而此舉卻導致一個問題。隨著如海嘯般席捲的爆增資料量，如今企業難以即時且有效地從該資料中獲得可據以採取行動的洞見。

將處理程序移至邊緣顯然是個好辦法。根據 Gartner 指出，未來四年內有 75% 企業所產生的資料會在邊緣處理（對比雲端），自現今的 <10% 開始向上攀升。不只大幅增加的資料，對於更加精確的分析、更低延遲的要求、安全相關議題，以及龐大成本優勢的需求也會促使處理程序移向邊緣。

需要即時分析

儘管雲端是儲存資料和訓練機器學習模型的好地方，但通常不適合用於即時資料收集或分析。頻寬也是項特殊挑戰，因為一般而言工業環境缺乏將所有感測器資料傳輸到雲端的網路能力。因此，雲端型分析會受限於批次或微批次分析，容易錯過數字的上下浮動。

相反的，邊緣技術能分析所有的原始資料。該技術提供最精確的分析，並提升偵測異常的可能性，因此能立即做出反應，進而減少停機時間和降低維護成本。

此外，雖說雲端逐漸變得更加安全，可是在雲端上傳輸和儲存資料仍存在許多風險。這些安全性的議題常常會妨礙企業組識進行雲端作業。透過邊緣運算，企業更能掌握其安全性，這又多了一個讓企業接受此方法的理由。

瞭解邊緣化程序

然而，將分析移至邊緣並不僅僅是變更處理的位置。目前一般使用的機器學習模型是藉由假設開發出來的，僅可在雲端環境中發揮作用。特別是：

它們是針對批次或微批次資料而開發，不太適用於產生速度極快/數量龐大的感測器串流資料等。
它們是以無限制運算的假設開發而成，因此並未限制模型大小和重量，亦適用許多受到運算限制的邊緣裝置。
其中包括預處理（對齊、適應、篩選等）和包含在模型中的後處理（集合、警示產生等）邏輯，它們會引起主程式碼膨脹，對受限的邊緣裝置不是個好兆頭。
執行環境和實作語言在雲端中也不是問題，但在邊緣就是。

由於這些假設在邊緣並不成立，機器學習模型需要適應新環境。換言之，需要將它們邊緣化：

它們需要連線至串流資料。
它們需要資料經過預處理/擴充（淨化、篩選、標準化和情境化），最好透過複合事件處理器 (CEP) 來完成。
需要從模型中擷取預處理和後處理邏輯，並在 CEP 引擎中執行，使運算負載較小。
接著便可微調模型，包括重量，在某些案例中，排除預處理元素更可減少 80% 以上的所需大小和運算記憶體。
最後需要將模型轉換成專為邊緣設計的運算式語言。如此就能快速且有效地在資源有限的環境中執行工作。

雲端在機器學習模型的建立和訓練方面扮演關鍵的角色，尤其是深度學習模型，因為需要龐大的運算資源。在模型完成訓練後，便可透過邊緣化「轉型」並推送至邊緣。

最終，邊緣推斷會經常送至雲端以進一步微調模型，而更新的模型會以高反覆性、閉合迴路的方式推回到邊緣。所以，工業物聯網 (IIoT) 中的「AI」可總結為雲端機器學習和模型邊緣化的這種閉路邊緣。

當然，僅依賴邊緣運算仍嫌不足。若要分散和分析企業規模的資料，機器學習系統必須從邊緣橫跨到雲端。Foghorn 採用了三層式資料處理：

擴充：擴充層可透過解碼、篩選、插補等方法，為日後處理準備好資料。簡言之，這一層可提升資料品質以確保其他層達到良好結果。
複合事件處理 (CEP)：許多已知悉所面臨之問題與模式的企業會使用這一層。這些企業可在 CEP 引擎中陳述其模式與問題以產生資料分析的工具。
機器學習引擎：機器學習引擎預先包裝了協助偵測異常狀況的模型，例如決策樹、迴歸及 SNDF 叢集。這一層為邊緣與雲端重疊之處。

Sastry Malladi 說明了機器學習引擎如何利用監督式與非監督式學習的結合。如果企業已擁有充足的歷史資料，便可在雲端中進行監督式學習。如果沒有，則可於開始接收資料時在邊緣開發模型。

不過您有時候也要實作非監督式學習技術，以利為了累加式更新修改模型。透過非監督式學習，此模型可在一段時間後學會如何實作累加式更新。

邊緣化的優勢

邊緣化有望提供許多優勢，包括：

大幅減少資料。當分析移至邊緣時，可大幅減少網路間推送的資料量。這能降低資料儲存和資料處理的成本。
更好的即時洞察。經由讓運算保持在接近資料來源的地方，邊緣化的機器學習可偵測新興模式，並能夠立即回應。
全面預測性維護。由於邊緣型系統可處理所有傳入的機器資料，也就能在作業中預測所有設備的維護需求。
改善產率。製造商可透過迅速偵測及解決次佳效能來提高生產力並減少停機時間。

挾上述優勢，邊緣化可說是引領物聯網市場的未來潮流。透過改變物聯網市場，邊緣將使即時分析變得更加容易，因此能在降低處理和儲存資料所產生的成本之餘，同時提高作業效率。