微軟亞洲研究院2025六大預(yù)測(cè):AI Agents 將顛覆傳統(tǒng)工作模式
2025年伊始,AI 驅(qū)動(dòng)的代理(agent)將擁有更高的自主性來(lái)執(zhí)行更多任務(wù),從而提升人們的生活質(zhì)量。
AI在記憶與推理能力上的創(chuàng)新,也將助力人類社會(huì)尋找應(yīng)對(duì)氣候變化、醫(yī)療健康等重大挑戰(zhàn)的新方法。
在過(guò)去的2024年,各界商業(yè)領(lǐng)袖和 AI 決策者對(duì)GenAI 的使用率就從55%激增至75%。
新的AI工具預(yù)示著巨大的潛力。那么2025年及其后三年還將發(fā)生什么?值得商酌。
以下是2025年值得我們關(guān)注的六大 AI 趨勢(shì),以及微軟將在每個(gè)趨勢(shì)上進(jìn)行的創(chuàng)新方向。
AI模型將變得更加強(qiáng)大和有用
AI Agent將徹底改變工作方式
AI助手將支持日常生活
AI資源的利用將更加高效
開(kāi)發(fā)AI的關(guān)鍵是測(cè)試與定制
AI將加速科學(xué)研究的突破
從2024年到現(xiàn)在,大模型變得更快、更高效。如今,最新的大語(yǔ)言模型已經(jīng)可以完成從基礎(chǔ)寫作到編程開(kāi)發(fā)的廣泛任務(wù),高度專業(yè)化的行業(yè)模型還可以為特定任務(wù)或行業(yè)進(jìn)行量身定制。
今年,大模型將做得更多、更好。像 OpenAI o1 這樣具備高級(jí)推理能力的模型已經(jīng)能夠解決一些復(fù)雜問(wèn)題,其邏輯步驟類似于人類在回答難題前的分析過(guò)程。
這種優(yōu)秀的推理能力將在基礎(chǔ)科學(xué)、編程、數(shù)學(xué)、法律和醫(yī)學(xué)等科學(xué)專業(yè)領(lǐng)域繼續(xù)發(fā)揮作用,使模型能夠比較合同、生成代碼以及執(zhí)行多步驟工作流程。
相比于這種模型的推理能力,模型的數(shù)據(jù)管理、后訓(xùn)練(post-training)的進(jìn)步同樣重要。
例如,微軟的小語(yǔ)言模型 Phi 系列表明,管理高質(zhì)量的數(shù)據(jù)可以提升模型性能與推理能力。微軟的 Orca 和 Orca 2 展示了合成數(shù)據(jù)在后訓(xùn)練小語(yǔ)言模型中的力量,讓模型可以達(dá)到以前只有更大規(guī)模的語(yǔ)言模型才能實(shí)現(xiàn)的水平,而且在專業(yè)任務(wù)上表現(xiàn)得更好。
今年,將有更快、更好、更專業(yè)化的模型將創(chuàng)造新的、更有用的AI體驗(yàn)(包括代理agent)。
“我們訓(xùn)練模型的方式和這些模型驅(qū)動(dòng)代理之間可能產(chǎn)生協(xié)同作用,現(xiàn)在人們將有更多機(jī)會(huì)選擇或構(gòu)建滿足他們需求的模型?!?nbsp; 微軟 AI Frontiers 負(fù)責(zé)人 Ece Kamar 表示。
隨著模型的記憶能力、推理能力和多模態(tài)能力的進(jìn)步,代理agent將會(huì)運(yùn)用新技能和新交互形式處理更復(fù)雜的任務(wù)。
workflow驅(qū)動(dòng):企業(yè)可以重新構(gòu)建報(bào)告生成和人力資源任務(wù)等流程,例如幫助解決新?lián)Q筆記本電腦的問(wèn)題或回答福利問(wèn)題,讓員工能夠?qū)W⒂诟邇r(jià)值的工作。
多agent驅(qū)動(dòng):企業(yè)可以設(shè)置多個(gè)代理agent來(lái)提醒供應(yīng)鏈經(jīng)理關(guān)于庫(kù)存中斷的問(wèn)題,推薦新的供應(yīng)商并執(zhí)行銷售訂單,以應(yīng)對(duì)日常挑戰(zhàn),從而保持銷售。
無(wú)論你的技術(shù)水平如何,都將可以構(gòu)建和使用代理。
用你的工作方式構(gòu)建agent
任何人都能在 Copilot Studio 中無(wú)需編碼構(gòu)建代理,而開(kāi)發(fā)人員則能夠在 Azure AI Foundry 中創(chuàng)建更復(fù)雜的代理來(lái)協(xié)調(diào)更復(fù)雜的任務(wù)。
開(kāi)發(fā)者專用agent開(kāi)發(fā)平臺(tái)
企業(yè)將擁有一系列代理agent,從簡(jiǎn)單的提示對(duì)話和響應(yīng)到完全自主規(guī)劃、執(zhí)行的任務(wù),這些代理將代表個(gè)人或團(tuán)隊(duì)獨(dú)立以及協(xié)同工作來(lái)執(zhí)行和協(xié)調(diào)相應(yīng)流程。
最后重要的是,不斷進(jìn)化的 AI 驅(qū)動(dòng)代理agent,離不開(kāi)人的監(jiān)督體系,形成閉環(huán)。人類監(jiān)督關(guān)注更多的是哪些任務(wù)可以被代理允許執(zhí)行,以及這種界定邊界在哪的問(wèn)題。
Microsoft Copilot 作為 智能辦公的AI 助理,將全天候24小時(shí)為用戶提供支持,幫助用戶簡(jiǎn)化和處理日常收到的大量信息等任務(wù),為用戶釋放更多時(shí)間。
Copilot 的功能在接下來(lái)將得到進(jìn)一步增強(qiáng),與用戶建立更緊密的聯(lián)系。
Copilot Daily 會(huì)在新一天的開(kāi)始,以用戶熟悉的聲音來(lái)朗讀新聞?wù)吞鞖馇闆r。
Copilot Vision 能夠識(shí)別網(wǎng)頁(yè)內(nèi)容并參與討論,這依賴于它的多模態(tài)大模型的能力,能夠識(shí)別和理解網(wǎng)頁(yè)端的內(nèi)容,并且根據(jù)內(nèi)容提供下一步?jīng)Q策。
Copilot 將在一定程度上協(xié)助用戶決策,如幫助用戶尋找匹配新家的家具,然后提供最佳的布置方案。
未來(lái)隨著AI的普及,算力變得越來(lái)越稀缺,必將耗費(fèi)大量的能源電力,如何使用AI的時(shí)候變得更加高效節(jié)能,成為擺在大家面前的問(wèn)題。
未來(lái)幾年,支持AI的新型數(shù)據(jù)中心將實(shí)現(xiàn)零冷卻用水,微軟也將擴(kuò)大使用冷板等超高效液冷系統(tǒng)。微軟計(jì)劃在2025年使 AI 基礎(chǔ)設(shè)施更加高效、可持續(xù)。
微軟將繼續(xù)投資、使用更多低碳建筑材料,如近零碳鋼、混凝土替代品和交叉層壓木材,以及風(fēng)能、地?zé)崮芎吞?yáng)能等無(wú)碳能源。微軟還致力于在運(yùn)營(yíng)的電網(wǎng)中引入更多無(wú)碳電力,并倡導(dǎo)在全球范圍內(nèi)推廣清潔能源解決方案。
今年預(yù)測(cè)最大的進(jìn)展概括:測(cè)試(testing)與定制化(customization)。
評(píng)測(cè)是如何定義和有效評(píng)估AI風(fēng)險(xiǎn)的關(guān)鍵,對(duì)于負(fù)責(zé)任地構(gòu)建人工智能至關(guān)重要。例如,檢測(cè)和解決 AI “幻覺(jué)”。如果可以評(píng)測(cè)風(fēng)險(xiǎn)與威脅,那么就可以幫助解決或減輕這些問(wèn)題。
微軟正在通過(guò)開(kāi)發(fā)嚴(yán)格而全面的測(cè)試來(lái)打造安全的 AI 應(yīng)用。除了評(píng)估幻覺(jué)等內(nèi)部威脅外,測(cè)試還將更好地識(shí)別外部日益復(fù)雜的攻擊?!咀陨砘糜X(jué)+外部攻擊】
人們還將對(duì)組織機(jī)構(gòu)內(nèi) AI 應(yīng)用的運(yùn)作方式擁有更大的控制權(quán)。他們將能夠定制過(guò)濾內(nèi)容的應(yīng)用,并建立適合其工作的防護(hù)措施。
人工智能推動(dòng)了從超級(jí)計(jì)算到天氣預(yù)報(bào)等各領(lǐng)域的進(jìn)展,有望在自然科學(xué)、可持續(xù)材料、藥物發(fā)現(xiàn)和人類健康方面展現(xiàn)出新的能力。
2024年微軟研究院的一項(xiàng)突破讓科研人員能夠以前所未有的速度和精度探索生物分子科學(xué)的問(wèn)題,包括發(fā)現(xiàn)新藥。
AI2BMD 技術(shù)流程圖
利用 AI 驅(qū)動(dòng)的蛋白質(zhì)模擬系統(tǒng),研究員們提出了一種模擬生物分子動(dòng)力學(xué)的新方法 AI2BMD,以幫助科學(xué)家解決此前難以解決的問(wèn)題,并推動(dòng)蛋白質(zhì)設(shè)計(jì)、酶工程和藥物發(fā)現(xiàn)方面的生物醫(yī)學(xué)研究。
請(qǐng)看VCR:
微軟研究院副總裁 Ashley Llorens 表示,今年最值得關(guān)注的事情之一將是如何在科學(xué)研究中使用人工智能來(lái)推進(jìn)解決世界上一些最緊迫的問(wèn)題。
本文轉(zhuǎn)載自 絳燁 ??AIGC新知??,作者: 絳燁 ??AIGC新知??
