4 個(gè)關(guān)鍵的 AI 趨勢 | 吳恩達(dá)在 Snowflake Build 2024 上的演講大綱
AI 就像電力一樣?!边@是因?yàn)?,作為一種通用技術(shù)(類似于電力),AI 有著無數(shù)的應(yīng)用場景。如果有人問你:“電力能用來做什么?” 這個(gè)問題很難回答,因?yàn)殡娏缀鯚o處不在。同樣,新興的AI技術(shù)正在為我們創(chuàng)造一個(gè)龐大的機(jī)會(huì)空間,能夠開發(fā)以前無法實(shí)現(xiàn)的應(yīng)用。
經(jīng)常有人問我:“AI最大的機(jī)會(huì)在哪里?” 我對(duì)AI技術(shù)棧的理解是這樣的:在最底層,是半導(dǎo)體技術(shù)。在其上是云基礎(chǔ)設(shè)施。當(dāng)然,再往上是各種基礎(chǔ)模型訓(xùn)練工具和模型本身。大眾和媒體的注意力通常集中在技術(shù)棧的這些層級(jí),尤其是生成式AI等新技術(shù)層面。這本身沒有問題,但我認(rèn)為還有一個(gè)層級(jí)值得更多關(guān)注,那就是應(yīng)用層。
應(yīng)用層是我們創(chuàng)造價(jià)值和收入的地方,它最終支持整個(gè)技術(shù)棧的發(fā)展。因此,我花了很多時(shí)間思考AI的應(yīng)用,因?yàn)槲蚁嘈拍抢锸菢?gòu)建新事物的最佳機(jī)會(huì)所在。
過去幾年中,尤其是在生成式AI的推動(dòng)下,機(jī)器學(xué)習(xí)模型開發(fā)的速度顯著加快。例如,構(gòu)建一個(gè)情感分類器(用于分析文本情感正面或負(fù)面的工具)以進(jìn)行聲譽(yù)監(jiān)控。使用傳統(tǒng)的監(jiān)督學(xué)習(xí)方法,通常需要一個(gè)月時(shí)間收集標(biāo)注數(shù)據(jù),再用幾個(gè)月訓(xùn)練模型,之后還需額外時(shí)間部署平臺(tái)。總體來看,即使是最頂尖的團(tuán)隊(duì),構(gòu)建有價(jià)值的AI系統(tǒng)通常需要6到12個(gè)月。
生成式AI讓某些類別的應(yīng)用開發(fā)可以在數(shù)日內(nèi)完成。例如,編寫一個(gè)提示(prompt)只需幾天時(shí)間,快速部署后,能夠?qū)⒁郧靶枰獢?shù)月完成的應(yīng)用縮短到10天以內(nèi)。這為快速實(shí)驗(yàn)、原型設(shè)計(jì)和快速推出AI產(chǎn)品打開了激動(dòng)人心的可能性。
快速實(shí)驗(yàn)已成為創(chuàng)新的更佳路徑。過去,當(dāng)開發(fā)一項(xiàng)產(chǎn)品需要6個(gè)月時(shí),團(tuán)隊(duì)必須進(jìn)行廣泛的市場研究、驗(yàn)證用戶需求并仔細(xì)規(guī)劃。但現(xiàn)在,快速行動(dòng)的AI團(tuán)隊(duì)可以在一個(gè)周末開發(fā)20個(gè)原型,然后評(píng)估哪些有效。如果有18個(gè)失敗也沒關(guān)系,只需堅(jiān)持那2個(gè)成功的即可。這種快速迭代的方式正在解鎖新的用戶體驗(yàn)創(chuàng)造機(jī)會(huì)。
然而,這一趨勢也帶來了新的挑戰(zhàn)。例如,評(píng)估(或稱“evals”)成為了一個(gè)瓶頸。在監(jiān)督學(xué)習(xí)中,收集10,000個(gè)訓(xùn)練數(shù)據(jù)的同時(shí),也可以順便收集1,000個(gè)測試數(shù)據(jù),幾乎沒有額外成本。但對(duì)于基于大語言模型的應(yīng)用,往往沒有現(xiàn)成的訓(xùn)練數(shù)據(jù)。如果測試需要?jiǎng)?chuàng)建1,000個(gè)示例,便成為一個(gè)顯著的瓶頸。因此,開發(fā)流程從過去的順序構(gòu)建與數(shù)據(jù)收集,轉(zhuǎn)變?yōu)椴⑿羞M(jìn)行。
雖然機(jī)器學(xué)習(xí)原型開發(fā)的速度比以往任何時(shí)候都快,但軟件開發(fā)生命周期的其他部分(包括設(shè)計(jì)、軟件集成、部署和運(yùn)營)并沒有以相同的速度加速。這使得組織面臨壓力,要求加快這些流程以匹配機(jī)器學(xué)習(xí)開發(fā)的速度。
“快速行動(dòng)、打破常規(guī)”這一口號(hào)因?yàn)閹砹素?fù)面后果而名聲不佳。但這并不意味著我們不應(yīng)該快速行動(dòng)。更好的方式是“快速行動(dòng),同時(shí)負(fù)責(zé)”。許多團(tuán)隊(duì)現(xiàn)在能夠快速開發(fā)原型、穩(wěn)健評(píng)估并負(fù)責(zé)任地迭代,以更快的速度構(gòu)建系統(tǒng),同時(shí)不犧牲安全性或質(zhì)量。
在技術(shù)趨勢方面,我最興奮的是智能體AI工作流。如果你問我當(dāng)前最重要的AI技術(shù)是什么,我會(huì)說是智能體AI。當(dāng)我今年初提出這一點(diǎn)時(shí),這一想法還有些爭議,但現(xiàn)在“AI智能體”一詞已經(jīng)被廣泛接受。
從技術(shù)角度看,智能體工作流的核心在于迭代式流程:AI先生成一個(gè)草稿,再進(jìn)行網(wǎng)絡(luò)研究,撰寫初稿,批判修改,然后重復(fù)這一過程。與一次性輸出相比,這種方法雖然更耗時(shí),但效果顯著提升。
例如,在我合作的一些團(tuán)隊(duì)中,智能體工作流被應(yīng)用于處理法律文件、輔助醫(yī)療診斷或管理合規(guī)性文檔。相比傳統(tǒng)方法,這種迭代流程能夠顯著提高結(jié)果的質(zhì)量。
在某些基準(zhǔn)測試中,智能體工作流的優(yōu)越性得到了驗(yàn)證。例如,在OpenAI的人類評(píng)估基準(zhǔn)中解決編程難題時(shí),GPT-3.5的準(zhǔn)確率為48%,GPT-4提高到67%,而GPT-3.5結(jié)合智能體工作流后躍升至95%。這是一個(gè)顯著的提升。
智能體工作流有四種主要設(shè)計(jì)模式:
- 反思(Reflection):模型迭代地批判和改進(jìn)自己的輸出。例如,生成代碼、審視代碼、然后根據(jù)反饋改進(jìn),這一過程通??梢蕴嵘阅堋?/li>
- 工具使用(Tool Use):大語言模型生成并執(zhí)行API調(diào)用、進(jìn)行網(wǎng)絡(luò)搜索或其他自動(dòng)化操作,從而擴(kuò)展了它們可以執(zhí)行的任務(wù)范圍。
- 規(guī)劃(Planning):AI將復(fù)雜任務(wù)分解為一系列子任務(wù)并按順序執(zhí)行。這種方法對(duì)復(fù)雜工作流尤為有用。
- 多智能體協(xié)作(Multi-Agent Collaboration):模型扮演多個(gè)角色(如編碼員、批評(píng)者)或模擬多個(gè)“智能體”之間的協(xié)作,以實(shí)現(xiàn)更優(yōu)的結(jié)果。
智能體工作流在多模態(tài)AI領(lǐng)域的應(yīng)用尤其令人興奮,在這里,模型不僅能處理文本,還能分析圖像、視頻等多種數(shù)據(jù)類型。例如,模型可以逐步分析圖像,檢測人臉、識(shí)別物體,并迭代地生成詳細(xì)輸出。
總結(jié)來說,AI技術(shù)棧正在演進(jìn),出現(xiàn)了一個(gè)新的智能體編排層,使得開發(fā)者能夠更輕松地構(gòu)建強(qiáng)大的應(yīng)用。特別是視覺AI的崛起,為企業(yè)從以前未開發(fā)的圖像和視頻數(shù)據(jù)中提取價(jià)值提供了新的機(jī)會(huì)。
最后,我認(rèn)為以下四個(gè)AI趨勢最值得關(guān)注:
- 由半導(dǎo)體和軟件進(jìn)步推動(dòng)的更快的token生成。
- 大語言模型不僅優(yōu)化了回答問題,還優(yōu)化了工具使用和迭代工作流。
- 數(shù)據(jù)工程在管理無結(jié)構(gòu)數(shù)據(jù)(如文本、圖像、視頻)中的重要性日益增長。
- 視覺AI革命的到來,將為從視覺數(shù)據(jù)中提取價(jià)值打開巨大的潛力。
這是一個(gè)激動(dòng)人心的時(shí)代,生成式AI促進(jìn)了更快的實(shí)驗(yàn),而智能體AI則擴(kuò)展了我們的可能性。許多以前不可能的應(yīng)用,無論是視覺AI還是其他領(lǐng)域,現(xiàn)在都可以實(shí)現(xiàn)。
本文轉(zhuǎn)載自??AI取經(jīng)路??,作者:AI取經(jīng)路
