Skip to main content

軟體工具

啟發開發者社群創新 AI 技術的動能

三位開發人員在業界活動中聆聽示範。

舉凡製造、醫藥或教育,企業莫不使用 AI 轉型產業;就連一般人也看得出這個趨勢。轉型的幕後功臣則是打造解決方案與推動創新的開發者。這項演變的速度,快到連專業人士與專家也望塵莫及。值得慶幸的是,沒有人必須獨自摸索 AI 開發的領域,現成的社群與合作關係生態系統就是您最好的幫手。

參與這場討論的嘉賓是 AI 與開發者社群中兩家公司代表:Intel 的 AI 倡導者 Paula Ramos,以及 Voxel51共同創辦人 Jason Corso。Jason 同時任教於 University of Michigan 的 Robotics and EECS 系。他們的話題涵蓋 AI 未來趨勢、開發者如何為推動進展貢獻一己之力,以及參與開發社群的重要性,不僅造福企業與產業,同時也嘉惠開發者本人(影片 1)。

影片 1。Intel 與 Voxel51 的業界思想領袖,探討鼓勵參與開發者社群的重要性。(資料來源:insight.tech

AI 領域如何演進,哪些趨勢是形塑這項演進的推手?

Jason Corso:過去幾年,有幾項重大發展主導了 AI 思維。第一項發展是大型語言模型問世,這類模型既可擷取大量標記長度,還能嵌入自然人類語言。這項發展也讓我們獲得了能夠真正自然互動的資源。

此外,我們認為結合視覺的語言是一大未來趨勢。這種語言將隨附新的運算功能、可公開取得的資料,以及利用這些基礎模型確實解決 Voxel 所謂「視覺 AI」領域新問題的能力。

附帶一提,我認為我們應該重視資料在各種 AI/ML 模型開發過程所扮演的角色。我們所打造的這種文化,對模型的重視程度勝過其他一切元素。在學校修機器學習課程時,最初是先用下載或教授給的資料集訓練模型,多半側重於演算法。然而,LLM 領域各行各業的領導者已經開始討論,在打造我們所使用的 AI 系統時,優質資料在結合模型、程式碼與資料的過程,扮演了舉足輕重的角色。

以 Voxel 為例,我們極為側重資料所扮演的角色,並且著重於為開發者提供模型以及處理資料的工具,而不是單純期望開發者生成指令碼,將這些資料視覺化。二十年前,我的資料集是數十個範本或成千上百個範本,對吧?如今,我們的資料集則是動輒成千上百萬個範本。因此,實際管理及理解失敗模式和分佈等實在一大難事,在我看來,需要新思維才能達成。

開發者在 AI 發展過程扮演什麼樣的角色?

Paula Ramos:由於情況瞬息萬變,因此開發者每天都在尋找出路。他們必須在人工智慧這個龐大的領域推動創新,因此必須發揮創意才能解決問題。或許我們遇到的問題與 20 年前無異,但現在的工具更完善,有更好的方法可以解決問題。我們還必須進一步思考應用的最終使用者。

目前存在一些挑戰,在我看來,模型開發、資料管理,以及如何以簡單方式部署部署這些模型,仍有成長空間。您是雲端系統還是邊緣解決方案的使用者?解決方案一向是越簡單越好,這也是開發者目前面臨的主要挑戰。

此外,開源社群在這個領域極為重要;這正在改變 AI 發展的節奏。若向所有人開放這些模型,他們就可以存取資料集,逐回改善這些模型。

開發者與 Intel 這類公司合作的最佳方式是什麼?

Paula Ramos:我們現在有很多個管道,也有各種解決方案。舉例而言,我們有硬體加速器可用來重新訓練或微調模型。我們也有可以在邊緣運作的解決方案。

還有開發者可以取用的邊緣參考套件。這是簡單解決複雜問題的一種方式。我們正設法透過教學課程、程式碼和影片,向他們示範如何在製造業、零售業、醫療保健業等不同領域推展業務。這個方法也適用於 LLM 以及如何操作多種模型。

或者開發者也可以使用 OpenVINO 將模型最佳化及量化。也就是說,他們可以使用現有的同一套基礎架構,還可將 LLM 最佳化及量化,而且我們也不會強迫開發者為了執行這些 LLM 購買特定硬體。OpenVINO 還讓開發者輕輕鬆鬆即可證明及測試這些 LLM。他們可以先建立試驗專案並提供範例,然後再轉移至實際或最終的生產系統。

我們卓越的儲存庫與開源社群,可以供開發者測試最新 AI 趨勢。如果今天有新東西問世,那麼該特定模型在兩天之內就會出現在 OpenVINO Notebook 儲存庫。舉例而言,您可以在那裡測試 Llama 3.1、YOLOv10 以及最新的 AI 趨勢。這是絕佳的工具。

開發者也可以取用 Intel Developer Cloud,在購買各式各樣的硬體之前先行測試。這實在是太酷了。他們可以取用加速器,以及最新的 AI 趨勢,例如 AI PC。 

Voxel51 如何與開發者互動?

Jason Corso:我們的軟體稱為 FiftyOne。它基本上是一種視覺元件,同時也是軟體 SDK,可處理本文討論的工作,例如資料與模型改良。但最近我們推出了這個稱為 Panels 的全新功能。透過 Panels,不懂如何編寫 React 或 Java 或是有 UX 的任何內容,也可以為前端構建功能。您可直接在 Python 編寫,而且依舊能增強 GUI 功能。

我們是開放原始碼驅動的公司,但我們其實有數十位客戶使用我們的商業企業版 FiftyOne 軟體 FiftyOne Teams,而且它能讓您以團隊、雲端或內部部署的方式共同開發相同的功能。我們在製造、安全與汽車領域的客戶群廣泛。

我們今年稍早順利完成了 B 輪融資,而且其實我們正為核心工程工作和開發者關係工作,招募機器學習工程職位。我們對開發者深具信心,因此僱用了受過完整訓練、有能力撰寫論文和程式碼的對象,但他們的角色其實是與社群互動與聯繫。

產業活動如何協助開發者與更廣泛的社群互動?

Jason Corso:Voxel 在 CVPR 之前舉行了首次實體駭客松活動。我們在這類互動中觀察到,開發人員對於接觸新技術躍躍欲試,並且努力設法在新團隊合作解決新問題。

活動固然有趣,但我認為開發者活動的關鍵切入點顯然是教育。參加 CVPR 這類開發者活動或會議,才能真正掌握最新的脈動。去年我教授了電腦視覺入門這個課程:就某種意義而言,我每週花了三小時的時間舉辦這項開發者活動,引領 300 名學生認識電腦視覺。

然而,AI 領域發展神速,似乎每個人無時無刻都在吸收資訊,即使是長年投身這個領域的教職員也是如此。無論是尖端的研究論文,還是必須學習的新 API 與程式庫,要隨時掌握最新資訊都是不可能的任務。

因此,Voxel 設法每週舉辦一次技術活動,讓社群持續參與。以我個人為例,我在東部時間每週一中午都有開放諮詢時間,任何人從 Zoom 登入即可。幾個星期前,我們回顧了某人的論文,並瀏覽了幻燈片和實際的技術模型。但最後的成果卻是:「這是我第一次考慮踏入電腦視覺這個領域。我該注意什麼呢?」

有的是單純與基礎能力有關的原始教育,有的則是真正有助於參與並掌握最新脈動的開發者活動。

還有任何其他開發者應該善加利用的資源嗎?

Jason Corso:正如 Paula 先前說過,開放原始碼是孕育創新的途徑。我們的軟體 FiftyOne 放在 GitHub,歡迎大家建立分支,也可以送交 PR。我們每個月或每兩個月都會發布一次,而且每次發布都有一些屬於我們社群的內容。自發布以來,過去這四年,我們持續透過社群貢獻廣泛瞭解社群的需求。我衷心想對我們建立的開發者社群表示謝意。這個環境充滿活力又豐富,沒有這個社群,我們就不會有今天的成就。

雖然有實際活動,但光是加入開放原始碼專案,也是另一個真正參與 AI 開發者生態系統的好方法。

Intel 如何促進開發者在社群互動?

Paula Ramos:Intel 為了促進互動不遺餘力,而且我們為了與開發者共同推動創新,打造了多種管道。我們有龐大的生態體系統,涉及的範圍不限於推論,還包括訓練,例如異常偵測。

我們有一項名為 Innovator Program 的計畫,在計畫中,來自世界各地的多位開發者共同測試技術。開發者可以自行製作應用程式,然後與我們分享。基本上,他們建立自己的儲存庫,然後建立分支儲存庫,並且建立新的應用程式。日後我會在 LinkedIn 和我的網路重點介紹其中幾位創新者,敬請期待。

此外,我們還參與了 Google Summer of Code,在三個月的時間內與好幾位開發者及 OpenVINO 團隊的不同導師合作。去年,有位參與 Google Summer of Code 的學員,與導師撰寫了一篇關於 Anomalib 的論文。這篇論文送交 CVPR 的 Visual Anomaly Inspection Workshop 之後被接受了。

我們與大學的關係當然也是發展神速,協助大學展開研究,以及撰寫 Intel 能夠支援的研究計畫書。此外,我們透過會議消弭產業與學術圈之間的差距。

我們致力於參與開放原始碼社群,因為開發者是這個社群最重要的一環。我們始終認為,必須讓開發者在我們能提供的軟體使用這個硬體,他們加速之後才能改善管道與工作負載。這才是主要目的。

相關內容

若要進一步瞭解 AI 開發,請收聽 AI 夥伴關係帶動開發者創新。若要掌握 Voxel 的最新創新,請在 X/Twitter 的 @voxel51LinkedInGitHub 關注他們。若要掌握 Intel 的最新創新,請在 X/Twitter 的 @intelLinkedInGitHub 關注他們。

 

本文由 Erin Noble 編審

作者簡介

Christina Cardoza is an Editorial Director for insight.tech. Previously, she was the News Editor of the software development magazine SD Times and IT operations online publication ITOps Times. She received her bachelor’s degree in journalism from Stony Brook University, and has been writing about software development and technology throughout her entire career.

Profile Photo of Christina Cardoza