如何打造最小可行AI產品?這裡有份避坑工程指南

編者按:本文來自微信公眾號「機器之能」(ID:almosthuman2017),36氪經授權發佈。

面向MVP的思維對於任何類型的系統都非常重要,AI也不例外,無論該技術看起來多麼令人興奮。用戶可以採用一種MVP的AI產品,而無需花費大量時間或金錢,並且可以通過早期客戶的反饋加以改進。就AI產品來說,其MVP產品也有一些特殊要求和特點。

文章作者Thomas H. Davenport是巴布森學院(Babson College)總統的信息技術與管理學傑出教授,牛津大學賽德商學院的客座教授,麻省理工學院數字經濟倡議的研究員,德勤(Deloitte)人工智能分析實踐方面的高級顧問,還是Glasswing Ventures的顧問。Rudina Seseri是Glasswing Ventures的創始人和管理合夥人,領導該公司從事AI企業軟件即服務,雲,IT軟件和垂直市場的投資。

什麼是最小可行性產品(MVP,Minimum Viable Product)?

MVP最初由技術專家Frank Robinson定義,也是 Eric Ries 在《精益創業》的核心思想,意思是用最快、最簡明的方式建立一個可用的產品原型,通過這個最簡單的原型來測試產品是否符合市場預期,並通過不斷的快速迭代來修正產品,最終適應市場需求。

簡單說,做新產品不要一開始就追求「盡善盡美」,先花最小代價做出「可用」的產品原型,驗證其是否有價值、是否可行,再通過迭代完善細節。

那麼,MVP的概念對AI意味著什麼?這個問題不僅與初創企業有關,而且與大型企業有關。許多公司正在其業務的不同領域開發AI試點項目,他們希望這些試點項目展示AI的潛在價值並最終走向規模化部署。大型組織的MVP概念與試驗或概念證明,有很多相似之處。

對於任何追求人工智能的組織來說,瞭解成功的MVP是由什麼組成是很重要的。對於一家主要投資人工智能公司的風投來說(比如Glasswing Ventures,我們都參與了這家公司 ),理解什麼是AI產品的 MVP以及如何改善他們同樣重要。我們認為,儘管一些IT產品的某些屬性是必須的,特別是在其早期階段更是如此,但是,它們可以經濟而且快速地迭代和演化。而就AI產品來說,其早期MVP產品也有一些特殊的要求和特點。

數據和MVP

機器學習是一種常見的AI基礎技術,通過大量數據得以改進。到目前為止,監督學習是業務中最常見的類型,需要標記數據。因此,數據可能是AI產品最重要的單一資源,即使在MVP階段,數據也是必要的。沒有數據,就沒有訓練有素的機器學習算法。

任何嘗試創建AI MVP的人都應該能夠回答下述問題(投資者或企業發起人應該向他們提問):

  • 訓練主要模型需要哪些數據資產?

  • 是否已經有足夠數據來訓練某種有效的模型?

  • 訓練模型的數據專有性( proprietary)如何?

  • 能用於訓練模型之前,還需要對這些數據進行多少數據集成,清理和其他活動?

  • 某些時候,是否可以使用其他數據來改進模型?

機器學習算法或模型本身已變得商品化。自動化機器學習軟件的提供者之一DataRobot宣傳說,它已經創建了十億多個模型(當然,並不是所有模型都在使用中)。但是,數據仍然是更具挑戰性的資源,可能需要大量的精力來清理,集成並將其轉換為可用的格式。如果AI的MVP所使用的數據源廣泛可用(例如ImageNet數據庫),則不可能提供很大的競爭優勢。

Glasswing投資的一家初創公司Armored Things擁有的數據就具有專屬性,非常有價值。Armored Things的客戶主要包括活動場所和校園,幫助提高這些場所的人身安全以及設施和運營管理。該公司將來自現有視頻、Wi-Fi、智能門鎖和其他傳感器的數據組合到「空間情報層」中,構建實時人群情報AI平台。對於提高人們如何使用和移動物理空間的可見性來說,這套獨特、專有的數據集至關重要,也有助於將這家年輕公司的產品推向MVP階段。

洛杉磯足球俱樂部(Los Angeles Football Club)的職業足球隊正在使用這家初創公司的產品實時瞭解球迷流量,並對該俱樂部22,000個座位的場館的人群密度、衛生和安全做出更明智的決定。該場館是職業體育運動中最高科技的設施之一。在COVID-19造成中斷後,球迷開始重返體育賽事之際,此類技術至關重要, 快速的數據分析和行動對於建立信任和優化安全體驗是不可或缺的。

數據和算法之外,MVP還需要什麼?

即便有干淨的專有數據,僅憑機器學習(尤其是深度學習)通常也不足以創建有效的AI。對於涉及到感知(語音、視覺),控制(機器人)和預測(客戶需求計畫)的問題,機器學習解決方案的可處理性和複雜性差異很大。

要實現MVP,早期的AI產品需要關注如下四個問題:

1. 複雜的混合模型

在處理模擬人類對話等複雜問題時,由於可用信息數量有限會產生數據稀疏的問題,不可能用大量的數據去處理。

在這種情況下,在構建MVP時,將深度學習與先驗知識建模和基於一定規則的邏輯推理結合起來,可能會更加實際。

這些人工智能解決方案不像深度學習那麼複雜,需要的數據也更少,透明度更大。不過,這樣的混合算法很少是現成的,研究人員必須要自己去探索。

比如情緒檢測公司Cogito使用AI檢測呼叫中心約200種言語和非言語特徵,以改善服務質量,包括人聲的音量、強度、一致性、音調、語氣、張力等。

這種軟件會實時向工作人員報告檢測結果,引導他們進行更加自信和富有同情心的對話,以更高水平的完成工作。

正如Cogito首席執行官Joshua Feast所說,該軟件「幫助人們在交談中變得更有魅力」,這意味著更高的淨推薦人分數(據一項研究,高出28%),更短的平均通話時間,以及更少的客戶升級致電經理的情況。

機器學習結合自然語言處理和社會信號探測,可以比單獨使用這兩種技術提供更好的推薦。

2.要對業務進行整合

大多數企業不想使用單獨的AI應用程序,所以很多解決方案都是提供接口,讓AI程序可以插入現有數據記錄中,並與系統結合,使用更方便。

Glasswing投資的另一家公司Zylotech將這一原理應用於其可自主學習的B2B客戶數據平台。該公司整合了跨現有平台的客戶數據,包括客戶在其他地方瀏覽和購買記錄。為市場、銷售等團隊制定政策提出針對性意見。它是專門為直接補充客戶現有的軟件套件而設計的,最大限度地減少採用摩擦。

另一個案例是庫存管理企業Verusen,考慮到市場上存在著大型的企業資源規劃參與者,平台必須與這樣的系統集成。它收集現有的庫存數據,並在用戶行為沒有顯著改變的情況下,用AI對如何連接數據和如何預測庫存提出建議。

3. 必須有領域知識

AI解決方案和行業知識結合是絕對關鍵的。比如,在很多情況下,一些不錯的醫療AI應用(如診斷助手)最終都被束之高閣,因為它們無法與醫生的日常工作配合。

MVP需要解決特定的業務或消費者問題,因此擁有相關領域知識非常重要。氣象情報中心ClimaCell是一個典型案例。

ClimaCell的團隊已經從衛星、無線信號、飛機、街頭攝像頭、聯網汽車、無人機和其他電子資源中獲取信息,可以提前6個小時逐街逐分鐘地提供天氣預報(或者提前6天提供時間上不太明確的天氣預報)。

它的按需「微型天氣預報」已經為Uber,Ford,National Grid和New England Patriots足球隊等各種客戶提供了服務。

4.從「第0天」開始交付價值

AI應用程序通常需要不斷更新數據以迭代自身。然而,在開發AI MVP時,重要的是要考慮第一個客戶以及如何從一開始(第0天)起就交付價值。

這可能需要一開始就專注於清理客戶數據,以構建可提供給AI產品的數據集,並在早期使用公共數據集來訓練模型,採用人為套環的方法來以較低的置信度來驗證早期響應,或者採用基於規則的技術。MVP開發人員需要確保最初的客戶將成為公司的最大擁護者。

MVP的目標:最低可行性

同樣重要的是要考慮到另一個MVP——最小可行性。給定目標任務,產品必須執行得多好才能算有用?

答案取決於相關業務標準和所需性能水平。在某些應用中,如果在第一天就取得80%的成功,就意味著能大幅提高成本,但在一些其他應用中可能完全不夠,比如語音識別系統。

MVP的目標是超越最低的標準,而不是打敗全世界。衡量AI的作用只需要一個簡單的問題,「一個最小可行的AI產品是否能改進現狀?」

即使是大型軟件公司也需要問這個問題。Salesforce的AI產品開發的首批工具之一是預測客戶的銷售傾向模型。這種工具很簡單,因為所有數據都在Salesforce雲裡,銷售人員對預測性機器學習模型也比較熟悉。即便預測結果不太完美,可能也比銷售人員憑直覺做事更好。

對於AI MVP來說,從最容易實現的目標(low-hanging fruit)開始做起或許是不錯的選擇。在Verusen的案例中,AI主要用於零部件庫存管理。通過構建和改進這一流程,Verusen能夠為每個早期客戶節省數百萬美元。

以MVP為導向的思維對任何類型的系統都很重要,AI也不例外——不管這項技術本身看起來多麼令人興奮。用戶無需花費大量時間或金錢就可以使用最低限度可行的AI產品,並通過早期客戶的反饋進行改進。

有了這種思想,產品和內部應用程序可以順利地從有用的基礎性功能進行轉型。

參考鏈接:

https://sloanreview.mit.edu/article/what-is-a-minimum-viable-ai-product/?use_credit=8e9ad9bcfb35ee3c8f13e524dc7d8e98

本文經授權發布,不代表36氪立場。
如若轉載請註明出處。來源出處:36氪