10月17日上午,百度世界2023大會,百度創(chuàng)始人李彥宏身著白色襯衫,從容登場。可以說,這次大會,是自文心一言發(fā)布7個月以來,百度對生成式AI重構(gòu)行業(yè)格局決心,最精彩也是最深刻的對外展示。
一、最強(qiáng)文心大模型發(fā)布李彥宏:毫不遜色于GPT4
回想3月16日文心一言發(fā)布現(xiàn)場,Robin非常謙虛地自評道:文心一言并不完美,并表示,想要對標(biāo)早兩天發(fā)布的GPT4而言,壓力還是不小的。
但此次,文心一言4.0版本給足了百度在AIGC時代的信心。長時間以來的投入與探索,讓百度建立起一條扎實(shí)、獨(dú)特的大模型能力提升與應(yīng)用落地的道路。
文心一言App更新,李彥宏宣布開啟邀測
單憑全屏海報,就能嗅到新版文心一言濃濃的“多模態(tài)”的味道。
他難掩激動:這是迄今為止最強(qiáng)大的文心大模型,實(shí)現(xiàn)了基礎(chǔ)模型的全面升級,在理解、生成、邏輯和記憶能力上都有著明顯提升,綜合水平“與GPT-4相比毫不遜色”。
李彥宏說道,“AI原生應(yīng)用,就是基于大模型的理解、生成、邏輯和記憶能力開發(fā)出來的應(yīng)用。這些能力是過去的時代所不具備的,因而能夠打開無限的創(chuàng)新空間?!?/p>
二、四大硬核能力,李彥宏親自Prompt
李彥宏開場沒有太長的預(yù)熱,直奔硬核主題:親身Prompt,測試文心一言4.0。提問的方式也大多本著“窮追不舍、追根問底”的方式“為難”大模型。
“接觸大模型之后,感覺最神奇的地方,就是讓原來的“人工智障”不再智障了”,李彥宏如是說。
1.李彥宏出了一道彎彎繞的難題
首先,李彥宏給出了一道“彎彎繞”、看似簡單卻前后亂序的“公積金買房”的難題:我想回承德買房,否可以申請公積金貸款嗎?我在北京工作。
在前后亂序、模糊語義的情況下,文心一言很好的理解了實(shí)際問題,并給出了很好的回答。
2.啟發(fā)創(chuàng)意的神器:“長安啟源”數(shù)字人口播創(chuàng)意視頻
緊接著,李彥宏現(xiàn)場測試了文心大模型4.0的生成能力,李彥宏給出了一張?jiān)嫉钠噲D片,在不到3分鐘之內(nèi),文心一言迅速生成了一組廣告海報、五條廣告文案以及一條“長安啟源”汽車的數(shù)字人口播的視頻廣告。
輸出的文案中,“科技之美”、“時代風(fēng)潮”等字眼,專業(yè)且流暢,已經(jīng)達(dá)到了品牌營銷實(shí)用的標(biāo)準(zhǔn)。而數(shù)字人口播視頻也非常新潮、有特色、聲音洪亮、品牌感十足。
文心大模型生成能力由于多模態(tài)能力的釋放而得到了重大的升級,李彥宏稱之為“啟發(fā)創(chuàng)意的神器”。
圖片
李彥宏介紹,基于這一能力,百度已經(jīng)推出了AIGC營銷創(chuàng)意平臺擎舵,讓“一個人就成為一支AI營銷隊(duì)伍”。
3.李彥宏如何演示解決輔導(dǎo)孩子作業(yè)的難題
邏輯能力升級方面,李彥宏選擇用輔導(dǎo)孩子做數(shù)學(xué)作業(yè)的場景,對文心發(fā)起了“沙錐鋪路”的數(shù)學(xué)題目,并問上述題目解答用到了哪些知識點(diǎn),考核大模型舉一反三的能力。
“不寫作業(yè),母慈子孝;一寫作業(yè),雞飛狗跳”,今天的發(fā)布,采用了大模型的方法,讓輔導(dǎo)學(xué)生做作業(yè)有了新的體驗(yàn)和方法。
李彥宏還補(bǔ)充道,在智能交通中,包括智能地圖、紅綠等控制等復(fù)雜任務(wù)中,也是大模型的超強(qiáng)邏輯能力的用武之地。
4.記憶能力:李彥宏現(xiàn)場創(chuàng)作一篇多角色的武俠小說
李彥宏在Prompt之中,不斷穿插了一些干擾問題,比如“角色太少,再添加四個角色”、“增加戲劇反轉(zhuǎn)與沖突”,“把角色代入到原來章節(jié)中”等等,可以記住故事的主線。
小說創(chuàng)作是非常典型的AIGC應(yīng)用,文心模型記住了所有的需求,人物和關(guān)系在反復(fù)修改的過程種并沒有出現(xiàn)錯亂,與人類創(chuàng)作的邏輯十分吻合。
文心大模型作為此次百度世界大會的主角,李彥宏全程用語音與之進(jìn)行互動交流,大模型也非常絲滑的在prompt之下展現(xiàn)了自己堪比GPT4的超強(qiáng)能力。
三、大革新:AI原生思維下的百度產(chǎn)品
“之前吹過的?!?,Robin李彥宏實(shí)現(xiàn)了。5月份,李彥宏放出狠話:百度要做第一個把所有現(xiàn)有產(chǎn)品都進(jìn)行重構(gòu)、重做的公司。如今,百度做到了。李彥宏毫不吝嗇筆墨來一一展示搜索、如流、地圖、網(wǎng)盤、文庫等App的驚艷重構(gòu)內(nèi)幕。
百度成立已將近23年,在成長為一家互聯(lián)網(wǎng)巨頭的過程中,沉淀非常多的產(chǎn)品。這里我們選取了幾個典型的應(yīng)用,來解讀李彥宏眼中的“AI原生應(yīng)用”。
首先,是百度新搜索。李彥宏認(rèn)為,原有的搜索響應(yīng)已經(jīng)過時,“搜索框輸入問題,返回給你一堆鏈接”的時代,已經(jīng)“Not any more”。
會上,李彥宏講述了百度新搜索的3個跟過去搜索結(jié)果完全不同的特點(diǎn):極致滿足、推薦激發(fā)、多輪交互。極致滿足是指,通過大模型去理解和推理,推薦給你更容易理解的、圖表展現(xiàn)的答案。一步給你極致的答案;而推薦激發(fā),即給出讓你滿足答案的同時,推薦給你一些極有可能會繼續(xù)想了解的內(nèi)容;多輪交互則是指,對于沒有標(biāo)準(zhǔn)答案的問題,多輪交互的搜索體驗(yàn)才是更好的解決體驗(yàn)。
李彥宏向來認(rèn)為“搜索與AI是天作之合”,因?yàn)锳I可以極大地擴(kuò)大搜索的邊界。
對于企業(yè)應(yīng)用方面,百度還從0開發(fā)了一款A(yù)I原生產(chǎn)品“”百度GBI(Generative Business Intelligence)。顧名思義,AI加持之下的“BI”,這個屬于全球首發(fā)的AI產(chǎn)品。據(jù)介紹,該產(chǎn)品可以做到海量數(shù)據(jù)秒?yún)R總、“執(zhí)行計劃立刻有”、商業(yè)分析師十幾天才能完成的數(shù)據(jù)分析報告縮短到分鐘級,幫助領(lǐng)導(dǎo)者以最快的速度做出行業(yè)決策。
李彥宏自豪地說道:“天下武功,唯快不破,今天我們用擁有了企業(yè)級的、真正的決策利器?!?/p>
其次是,百度內(nèi)部團(tuán)隊(duì)溝通辦公產(chǎn)品“如流”,用AI超級助理既可以1秒總結(jié)群聊,劃出重點(diǎn),幾秒就能達(dá)成上萬條消息的智能分類和智能總結(jié),又可以“一鍵差旅”,幫助工作人員搞定出行問題。當(dāng)然這背后是百度AI和CRM系統(tǒng)打通后呈現(xiàn)的極致效果。
AI原生思維打造的辦公工具,體現(xiàn)出來一種新的理念:用智能工作代替勤奮工作。
四、那些革了自己命的百度老產(chǎn)品
1.百度新文庫:向生產(chǎn)力工具進(jìn)軍
如果你現(xiàn)在登錄百度文庫,就能看到右側(cè)的文檔智能助手,通過這個助手,就可以一句話的方式而不是通過搜索來達(dá)成你的真實(shí)文檔需求。
圖片
李彥宏介紹,在大模型加持下的文庫,可以幫你識別出來哪些是大眾資料,那些是嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)的演講稿。
除此之外,百度新文庫也從一個內(nèi)容工具,變成了一個生產(chǎn)力工具,通過評測后,遠(yuǎn)超同類產(chǎn)品。李彥宏還用一個“生成PPT”的例子,展示了新文庫的不俗之處。許多之前AI工具做不到的細(xì)節(jié),比如識別知識點(diǎn)之間并列還是從屬關(guān)系、圖表的美觀優(yōu)化等,甚至PPT對應(yīng)的演講稿、現(xiàn)場觀眾可能會提出哪些問題都能推演出來。
百度文庫,革了自己的命!背靠10億優(yōu)秀的文檔,加上文心大模型的理解、生成的能力,還有多模態(tài)能力的玩法,它完成了“過去用戶來門戶找現(xiàn)成的內(nèi)容,現(xiàn)在用戶來門戶來生產(chǎn)內(nèi)容”的進(jìn)化。
2.百度新網(wǎng)盤:視頻理解能力增強(qiáng)
百度網(wǎng)盤發(fā)布于2012年,也是移動互聯(lián)網(wǎng)時代早期的云存儲服務(wù)之一。11年過去,百度網(wǎng)盤需要用AI來重新定義。百度也給出了自己的答案?;诰W(wǎng)盤4萬億文件,用AI重構(gòu)做智能服務(wù),成為了一個不錯的選擇。
李彥宏介紹到,百度網(wǎng)盤“云一朵”,它是業(yè)界乃至全球首個個人云智能助理。這就是AI重構(gòu)后的新網(wǎng)盤。
新在何處?李彥宏給“云一朵”出了一個“理解采訪視頻,并提煉內(nèi)容、截取金句”的難題,原來的老網(wǎng)盤蛻變成了可以理解視頻內(nèi)容、識別不同角色、形成上下文記憶的超人助理。幾句話,就可以讓長達(dá)43分鐘的采訪視頻完摘要提煉和金句截取的處理。
一旦老網(wǎng)盤擁有了學(xué)習(xí)統(tǒng)計規(guī)律的能力,就可以定義未來十年的新網(wǎng)盤。它將在工作、生活、學(xué)習(xí)三大典型場景提升用戶體驗(yàn),實(shí)現(xiàn)了從圖形界面交互到自然語言交互的轉(zhuǎn)變,增強(qiáng)了多模態(tài)信息理解。
這就不止是看內(nèi)容,更多的是在一句話就可以在原有內(nèi)容里去“找最精華的部分”。截止到昨天,云一朵的用戶已經(jīng)達(dá)到2000萬。
3.百度新地圖:不止是導(dǎo)航,更是向?qū)?/h3>
擁有18年歷史的百度地圖,當(dāng)然也急需“AI原生思維”進(jìn)行重構(gòu)。
現(xiàn)代化的應(yīng)用似乎已經(jīng)厭倦了多個步驟的機(jī)械式的“搜索目的地-搜索周邊-搜索路線-搜索交通方式-導(dǎo)航-打車/訂機(jī)票”的出行前的繁瑣的互聯(lián)網(wǎng)行為。
百度地圖在想能不能將這些步驟合而為一,一步直達(dá),快速響應(yīng)。李彥宏指出,使用新地圖,用戶只要說出心中的需求,幾千個API、多級菜單都可以一步直達(dá)。并給出了一個非常讓人叫好的例子。
圖片
例子中,對于泛需求的理解,中間聚會地點(diǎn)的選取,多地點(diǎn)信息的對比,未來出行的預(yù)約等方案,新地圖都給出了實(shí)時調(diào)用和合理推薦。這背后是文心一言的能力和地圖特有的億級的PUI、萬億級的交通感知的數(shù)據(jù)進(jìn)行了融合的結(jié)果。
百度新地圖,將成為越來越懂你的、無所不在的AI出行向?qū)?,將深刻影響著人們線下的生活和工作。
除了這些新產(chǎn)品之外,百度CTO王海峰還透露了,百度內(nèi)部研發(fā)代碼生成工具“comate”,百度內(nèi)部有20%的代碼都是comate生成的,代碼的采納率高達(dá)60%。
五、文心大模型為什么這么強(qiáng)?
百度CTO王海峰在隨后的演講中,也解釋了這7個月以來,文心大模型的不懈探索:萬卡算力上運(yùn)行的飛槳平臺、基于搭建的多維數(shù)據(jù)體系,做了多階段對齊(有監(jiān)督精調(diào)、偏好學(xué)習(xí)、強(qiáng)化學(xué)習(xí))和可再生訓(xùn)練、增量式的參數(shù)調(diào)優(yōu),才有了今天文心大模型訓(xùn)練效果、推理效果的大幅度提升。
圖片
現(xiàn)在的文心大模型,訓(xùn)練算法已經(jīng)累計提效3.6倍,訓(xùn)練穩(wěn)定性的周均訓(xùn)練有效率超過了98%。
此外,還有知識增強(qiáng)的重視。通過搜索引擎知識圖譜,將不僅輸入端進(jìn)行了增強(qiáng),輸出端也進(jìn)行了反思。同時引入了知識體,讓機(jī)器想人一樣自主的進(jìn)行思考和進(jìn)化。
另外,百度還提出了“星河共創(chuàng)計劃”,堅(jiān)持與開發(fā)者共創(chuàng)和共建的方式,讓文心一言在豐富的實(shí)際場景和環(huán)境中持續(xù)成長。
圖片
六、寫在最后
我們已經(jīng)進(jìn)入了一個人機(jī)通過Prompt交互的時代,產(chǎn)品和應(yīng)用也將進(jìn)入到“AI原生”的時代。
AI原生應(yīng)用應(yīng)該什么樣子?用大模型重構(gòu)之后的產(chǎn)品到底長什么樣子呢?我們在“ 聊一聊OpenAI、谷歌點(diǎn)燃的多模態(tài)之戰(zhàn)”的T前線直播中也探討了這個問題,融入還是重寫,都有 不少細(xì)節(jié)上“雷”與“坑”。所以此次百度的全新亮相,可謂給業(yè)界做一個很好的示范。
李彥宏最后分享了《時代周刊》封面上的一段話,“AI獨(dú)特性...它不僅能模仿人類的某些技能,還能執(zhí)行我們難以完成的任務(wù)。然而,推動機(jī)器學(xué)習(xí)和大語言模型每一次進(jìn)步的背后,其實(shí)都是人類。”
AI原生時代,并不是AI取代人,而是AI模仿了人類的部分技能幫我們完成難以完成的任務(wù)。
具體來說,海量數(shù)據(jù)的快速匯總、秒級的內(nèi)容生成工具、一句話搞定一場出行等等都是上面這句話最好的詮釋。
當(dāng)然,“AI原生時代”的探索,百度所有這些探索,也會成為新的起點(diǎn)。