從AIGC到AGI,為什么我們需要更多的“技術(shù)信仰派”? 原創(chuàng)
整理 | 伊風(fēng)
采訪 | 張曉楠
嘉賓 | 巴川、朱雷、肖然
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
作為AIGC應(yīng)用落地元年,2024開年就拋給我們一些不太好回答的問題:
- 在以探索AGI為長期目標(biāo)時,我們該堅守技術(shù)信仰嗎?
- 除了復(fù)制國外GPT-4、Sora這樣的成功案例,我們該如何尋求更大發(fā)展和突破?
- 即便算力問題得以解決,算法的難題如何跨越?
- 國內(nèi)企業(yè)為什么大都部署多個大模型?為什么并非所有企業(yè)都該擁抱AIGC?
前不久51CTO全新直播欄目《AIGC實戰(zhàn)派》有幸邀請到競技世界首席數(shù)據(jù)科學(xué)家巴川,元語智能聯(lián)合創(chuàng)始人兼COO、SuperCLUE社區(qū)發(fā)起人朱雷以及Thoughtworks中國區(qū)總經(jīng)理、中關(guān)村智聯(lián)創(chuàng)新聯(lián)盟秘書長肖然,在對談中回答以上疑問。
1.“技術(shù)信仰派”還是“市場信仰派”,只是一時之爭
51CTO: 在大模型“技術(shù)信仰派”與“市場信仰派”之爭中,你們站哪一派?這背后又折射了怎樣的一種現(xiàn)實?
巴川:我思考過這個問題,但是沒能給出一個非黑即白的答案。就長期而言我傾向于技術(shù)信仰派,因為技術(shù)進(jìn)步是推動生產(chǎn)力發(fā)展的關(guān)鍵因素,雖然現(xiàn)在AIGC被炒得非常熱,但其長期影響力仍然是被低估的。
但在短期內(nèi),大模型技術(shù)所能產(chǎn)生的影響又被高估了,這種誤判算是技術(shù)落地和廣泛應(yīng)用的一個必經(jīng)階段。短期內(nèi),AIGC將不斷向各行各業(yè)泛化,從這點來看,市場信仰派的觀點也很有價值。
朱雷:我是堅定的技術(shù)信仰派,就目前看,我認(rèn)為技術(shù)派的勝算更大,因為推動大規(guī)模數(shù)據(jù)訓(xùn)練和參數(shù)量的躍升已經(jīng)是全球性的技術(shù)共識,大家都在“卷”技術(shù)、搶人才。
對于市場派的觀點,我認(rèn)為技術(shù)需要服務(wù)于用戶和客戶,解決具體的業(yè)務(wù)問題,這個站位和邏輯也沒有問題。然而,在以探索AGI為長期目標(biāo)時,國內(nèi)需要一些堅持技術(shù)信仰的團(tuán)隊,他們以長期研究和技術(shù)突破為目標(biāo),將商業(yè)化應(yīng)用作為支持研發(fā)和基礎(chǔ)架構(gòu)試錯的一種手段。
國內(nèi)有幾家大模型公司我是很看好的,因為他們在技術(shù)層面有獨到的見解,比如做RAG搜索增強、長文本等等。但他們也沒有只做技術(shù),也在各自的技術(shù)路線上嘗試了多種應(yīng)用,如角色扮演、游戲、效率工具等。我覺得正因為他們有技術(shù)信仰,所以會在自己的應(yīng)用上思考的更長遠(yuǎn)一點。
相反,如果僅從商業(yè)化的角度出發(fā),忽視技術(shù)的成熟度,這種做法從長期看是特別危險的。我們可以看到,隨著AI技術(shù)的不斷進(jìn)步,一些早期的AI應(yīng)用已經(jīng)失去了競爭力。OpenAI的Sora一旦對外開放,就將“殺死”很多小的AI視頻剪輯、自動化生成工具。因此,在AGI的早期階段,一定要保持技術(shù)前瞻性,去做長期的投入和研究。
肖然:在AI技術(shù)浪潮中,真正盈利的往往是提供工具的一方,而非單純追求市場應(yīng)用的一方。這些工具,如RAG、Raptor等,本質(zhì)上是技術(shù)產(chǎn)品,它們的市場價值在于支持和促進(jìn)技術(shù)創(chuàng)新。
所以,技術(shù)的快速發(fā)展已經(jīng)使得所謂的市場化變得不那么重要,因為需求實現(xiàn)的過程已經(jīng)被極大程度地壓縮了。年輕一代,即使沒有深厚的計算機背景,也能在短時間內(nèi)學(xué)會構(gòu)建智能應(yīng)用。這表明,我們正在進(jìn)入一個新時代,其中技術(shù)和市場之間的界限變得模糊。
從當(dāng)前的角度來看,技術(shù)的重要性更為突出。如果你想創(chuàng)造出能夠完成更多任務(wù)的智能化產(chǎn)品,這非常依賴于底層基礎(chǔ)模型的發(fā)展。只有基礎(chǔ)模型得到提升,我們才能完成更多、更復(fù)雜的任務(wù)。
2.如果都是“市場派”邏輯,追上國外會變得更難
51CTO : 對比國外,國內(nèi)大模型會面臨哪些不同?你們對國內(nèi)大模型市場抱有哪些期待?
巴川:從算力角度來看,我們雖然在迎頭追趕,但仍然存在差距。芯片核心技術(shù)在國外手里,這直接影響了我們獲取最先進(jìn)硬件的能力;另外,顯卡的采購困難和禁售帶來的價格飛漲也對我們產(chǎn)生了直接影響。
在算法方面,雖然很多人認(rèn)為國內(nèi)外的算法水平?jīng)]有太大差異,但我們使用的基礎(chǔ)框架,如Transformer等,大多還是來自國外。盡管國內(nèi)的一些公司也在嘗試開發(fā)自己的框架,但離落地應(yīng)用、甚至成為主流框架還差很多。
在數(shù)據(jù)方面,我認(rèn)為國內(nèi)是有獨特優(yōu)勢的?;ヂ?lián)網(wǎng)快速發(fā)展的一二十年里,我們積累了大量數(shù)據(jù),特別是在垂直領(lǐng)域,一旦某個應(yīng)用推廣開來,就能夠迅速覆蓋數(shù)億用戶,這是歐美尤其是歐洲難以做到的。這樣的用戶基數(shù)使得我們能夠快速積累用戶數(shù)據(jù),并在特定垂直領(lǐng)域快速實現(xiàn)應(yīng)用的落地和迭代。
朱雷:在我看來,國內(nèi)外在大模型市場上的主要差異體現(xiàn)在發(fā)展節(jié)奏和目標(biāo)上。比如OpenAI和谷歌下面的DeepMind,他們的目標(biāo)更多地集中在實現(xiàn)AGI上。雖然他們也在推進(jìn)商業(yè)化,但視野更為長遠(yuǎn),并在安全和基礎(chǔ)架構(gòu)上進(jìn)行了深入研究和探索。
相比之下,目前國內(nèi)更多地在復(fù)制國外的成功案例,如GPT-4和Sora等。不過盡管如此,國內(nèi)公司融資充足,人才儲備也具備一定水平,且具有全球化視野,這有助于我們在數(shù)據(jù)規(guī)模和質(zhì)量上進(jìn)行補充。
我認(rèn)為,國內(nèi)的期待在于未來五年內(nèi)能否在基礎(chǔ)架構(gòu)上取得突破,而不是僅僅跟隨國外的技術(shù)發(fā)展。目前,國內(nèi)正在努力追趕GPT-4的水平,同時也有探索非Transformer架構(gòu)的嘗試。因為Transformer架構(gòu)本身存在局限性,預(yù)測下一個token,并不是真實世界的邏輯,因此這個架構(gòu)并不能做出世界模型。
肖然:即便算力問題得到緩解,我們?nèi)匀幻媾R著代際算法差異的挑戰(zhàn)。目前,國內(nèi)的大模型技術(shù)多在復(fù)制和追趕國外的成就,并嘗試做成功產(chǎn)品的理解和復(fù)現(xiàn)。但真的去做一些研究,比如Transform架構(gòu)的根本突破在哪里,國內(nèi)相關(guān)的討論又太少,我們需要更多的聲音和研究來探討和實現(xiàn)下一代的算法革新。
在應(yīng)用層面,國內(nèi)的大模型應(yīng)用多集中在企業(yè)內(nèi)部,而國外的模型精度更高,To C產(chǎn)品更為豐富。這背后的核心原因在于底層模型的成熟度差異。國內(nèi)企業(yè)被迫去做模型微調(diào)和基礎(chǔ)算力設(shè)施,通過這些應(yīng)用手段,提升模型在特定領(lǐng)域的精度。
我樂觀估計,國內(nèi)的算力問題正在得到國家層面的有效解決。但同時,我擔(dān)心的是,當(dāng)我們解決了算力和模型精度問題后,國際上可能出現(xiàn)新的算法突破,而科技巨頭會效仿OpenAI選擇閉源,屆時我們就會被拉大算法的代際差距。
3.AI太重要了,企業(yè)多模型部署“留后路”
51CTO: 具體到國內(nèi)企業(yè)部署和采用大模型,你們發(fā)現(xiàn)有哪些值得關(guān)注的特點,或者一些有趣的現(xiàn)象?這背后的深層原因是什么?
朱雷:我觀察到國內(nèi)企業(yè)往往會同時部署多個大模型。在與各行各業(yè)的企業(yè)接觸中,包括央企和上市公司,我發(fā)現(xiàn)他們會同時采購兩三家公司提供的大模型,并結(jié)合一些開源模型進(jìn)行微調(diào)。這些企業(yè)會利用向量數(shù)據(jù)庫和增強工具,使得基于大模型構(gòu)建的應(yīng)用背后有多個模型支撐。
這種現(xiàn)象背后的原因可能有幾個方面。首先,AI大模型目前被認(rèn)為非常重要,因此企業(yè)愿意投入較多預(yù)算。隨著開源能力的提升,大模型的部署成本已經(jīng)降低,盡管后續(xù)的數(shù)據(jù)清洗和模型推理可能成本較高,但采購模型本身已經(jīng)變得相對便宜。
其次,當(dāng)前大模型的能力還比較有限,特別是在特定行業(yè)的應(yīng)用上。這就導(dǎo)致企業(yè)在應(yīng)用大模型時會部署多個模型,以期望不同模型在不同方面的能力可以互補。
最后,AI的重要性不言而喻,但企業(yè)對于國內(nèi)大模型的發(fā)展前景還不太確定,因此他們傾向于嘗試多個模型,以觀望哪個模型能夠更好地發(fā)展,以免選錯后對企業(yè)造成較大損失。
肖然:從成本來看,盡管模型本身的成本已經(jīng)降低,但與之配套的運維成本卻相對較高。企業(yè)在微調(diào)大模型時需要投入額外的資源來管理知識庫和優(yōu)化整個數(shù)據(jù)處理流程,這導(dǎo)致了需要額外雇傭?qū)I(yè)人員來維護(hù)和優(yōu)化這些模型。而部署的多模型,每個基礎(chǔ)模型相對小一些,微調(diào)后能達(dá)到專事專用的效果。
此外,大型組織更有可能部署自有模型,而小型組織則不太可能考慮這一選項。在大型企業(yè)中,各個部門可能會根據(jù)自己的需求獨立部署和使用不同的模型。這種分散的部署方式雖然短期內(nèi)看似效率不高,但實際上有助于保護(hù)組織結(jié)構(gòu)擁有一定的自由空間,允許各部門根據(jù)自己的業(yè)務(wù)需求靈活調(diào)整。
最后,企業(yè)特別希望大模型的能力能夠與現(xiàn)有的工具鏈相結(jié)合,而不是完全替換現(xiàn)有的工作流程。例如,企業(yè)可能更愿意在現(xiàn)有的辦公平臺上集成模型來輔助工作,比如釘釘AI這樣的設(shè)計,而不是遷移到一個全新的系統(tǒng)中去。
51CTO:企業(yè)的模型部署、AIGC應(yīng)用等等由哪個部門負(fù)責(zé)?
肖然:數(shù)字化能力強的公司可能會成立專門的人工智能中心,來負(fù)責(zé)模型和算力的相關(guān)工作,而應(yīng)用則由具體實踐這些工具的相關(guān)部門負(fù)責(zé)。
在為企業(yè)部署AI能力時,負(fù)責(zé)牽頭的角色往往是CIO或CTO。然而,隨著人工智能戰(zhàn)略的重要性日益增加,一些企業(yè)包括我們自己公司開始設(shè)立CAO(Chief AI Officer)來專門負(fù)責(zé)人工智能戰(zhàn)略的制定和執(zhí)行。從長遠(yuǎn)來看,或許越來越多的企業(yè)會設(shè)置類似CAO的崗位。
巴川:我們公司算是一個典型的中型互聯(lián)網(wǎng)游戲公司,我們有一個技術(shù)中臺,其中包括大數(shù)據(jù)、機器學(xué)習(xí)和深度學(xué)習(xí)等方向。技術(shù)中臺自然成為了大模型應(yīng)用的主要推動者。同時,我們的業(yè)務(wù)部門,比如說美術(shù)部門、銷售部門,也在自下而上的擁抱技術(shù)變革。
我們也在嘗試多個模型,因為目前還不清楚哪個模型更合適。在這個過程中,我們會直接調(diào)用接口,也會對大模型進(jìn)行微調(diào)。這其中涉及到成本和產(chǎn)出比的問題,業(yè)務(wù)部門會根據(jù)業(yè)務(wù)場景直接評估性價比,決定是否值得投入。
然而,技術(shù)部門在推動大模型應(yīng)用時,可能會發(fā)現(xiàn)性價比并不高,這時我們的步伐就會受到限制。一些大模型,比如馬斯克最近發(fā)布的Grok開源大模型,雖然下載不難,但能運行起來的機器需要200萬成本,這就需要我們仔細(xì)考慮場景的適用性和成本效益,雖然我們自己也很好奇效果,但如何能說服管理者批預(yù)算是個難題。
對于中小公司來說,通用大模型的成本可能是難以承受的,可能需要大廠或國家意志整合資源才能實現(xiàn)。此外,我們也在思考,專注于特定業(yè)務(wù)場景的大模型是否會讓我們離AGI越來越遠(yuǎn)。
4.“新質(zhì)生產(chǎn)力”AI+,已經(jīng)敲開了技術(shù)變革的門
51CTO:隨著大模型采購成本下降以及垂類模型的成熟,所有企業(yè)都應(yīng)該擁抱大模型嗎?AIGC能在未來成為所有企業(yè)的剛需嗎?
巴川:隨著成本不斷下降,我認(rèn)為中小企業(yè)完全有可能開始使用大模型。在形式上,他們可能會更多地選擇直接調(diào)用現(xiàn)有的大模型接口,利用其能力來降本增效,并在特定的市場業(yè)務(wù)場景中創(chuàng)造價值。而大型企業(yè),如百度、阿里,可能會開發(fā)自己的模型,以保持技術(shù)壁壘和市場競爭力。
從國家層面來看,整合資源開發(fā)具有自主知識產(chǎn)權(quán)的大模型也是非常重要的,這不僅是技術(shù)追求,也是社會責(zé)任的體現(xiàn)。必須有人去開發(fā)大模型這樣的基礎(chǔ)設(shè)施。
肖然:AIGC就屬于國家提出的“新質(zhì)生產(chǎn)力”這個概念,隨著技術(shù)的進(jìn)步,未來的情況將與現(xiàn)在大不相同,盡管可能不會有像iPhone那樣的顛覆性時刻,但人工智能的應(yīng)用仍會讓人眼前一亮。
從這個角度來看,并不是所有企業(yè)都需要自己部署模型。隨著問題逐漸被解決,特別是走向AGI時,企業(yè)可能不再需要自己擁有模型。正如黃仁勛所說,“打敗你的不是AI,而是使用AI的人”。
朱雷:雖然大模型和AI技術(shù)的成本正在下降,但目前大多數(shù)企業(yè)的核心業(yè)務(wù)流程還不能依賴于大模型。目前,大模型的應(yīng)用主要集中在相對邊緣的業(yè)務(wù)上,成本的降低并不直接等同于可以落地實施。真正要影響企業(yè)核心業(yè)務(wù)的落地,除了成本,還需要模型在準(zhǔn)確性和推理速度上達(dá)到可用的水平,而目前這個階段還有相當(dāng)大的差距。
5.“賣鏟子”是門好生意,引領(lǐng)應(yīng)用新趨勢是“天花板”
51CTO:如何判斷一款A(yù)IGC應(yīng)用是否優(yōu)秀呢?有什么標(biāo)準(zhǔn)嗎?
巴川:我會首先考慮合規(guī)性,這對于公司的業(yè)務(wù)至關(guān)重要;其次,AIGC生成的內(nèi)容是否有C端用戶愿意買單,這是一個直接且重要的評判標(biāo)準(zhǔn);此外,我希望能夠看到應(yīng)用中有些特色,能夠把相關(guān)的數(shù)據(jù)積累用起來,形成一定的壁壘。
肖然:我認(rèn)為這個時代值得做的生意就是“賣鏟子”。使用AIGC技術(shù)提供工程化支持的工具和服務(wù)——是一個有前景的事情。直接做大模型的門檻太高了,不適合一般的玩家入場。無論AIGC應(yīng)用是面向C端還是B端,都需要將這些技術(shù)工程化、規(guī)?;尳M織能在內(nèi)部享受到AI技術(shù)帶來的便利。
如果涉及到直接面向消費者的應(yīng)用,我會在合規(guī)的基礎(chǔ)上增加對高頻場景替代的考量。我喜歡那些能夠改變用戶習(xí)慣、增加用戶粘性的應(yīng)用。
朱雷:從長遠(yuǎn)來看,我認(rèn)為AIGC應(yīng)用在交互方面還有很大的創(chuàng)新空間。盡管目前市面上已有一些成熟的交互模式,如智能音箱和流程機器人,但未來可能會有新的交互模式出現(xiàn),特別是適合AGI的新型交互模式,我期待在國內(nèi)看到這樣的創(chuàng)新。
本文轉(zhuǎn)載自 ??51CTO技術(shù)棧??,作者:伊風(fēng)
