行業(yè)大模型快速落地的一年,如何做?
生成式AI正成為時下科技企業(yè)“講故事”的關鍵詞之一。但從發(fā)展上看,無論是“文生文”的大語言模型,還是“文生圖”的多模態(tài)模型,更多的是輔助人們進行一些簡單的辦公,或者提供一些娛樂,其面對的群體主要是終端的用戶。
消費側的應用僅是AI大模型的冰山一角,大模型真正的價值則是在行業(yè)側、企業(yè)側的應用,據(jù)市場研究機構預測,到2025年,全球生成式AI市場規(guī)模將達到100億美元以上。其中,企業(yè)級生成式AI市場將占據(jù)相當大的份額,成為最大的應用領域之一。
從行業(yè)大佬們的發(fā)言中也能看出一些相似的觀點。浪潮集團執(zhí)行總裁、總工程師、浪潮云董事長肖雪曾表示,以大模型“新技術”釋放數(shù)據(jù)“新要素”價值,推動數(shù)實融合,賦能千行百業(yè),打破傳統(tǒng)生產(chǎn)要素“質態(tài)”,提升經(jīng)濟社會發(fā)展“質效”,促進社會“生產(chǎn)力”實現(xiàn)新的躍升;IBM 大中華區(qū)董事長、總經(jīng)理陳旭東曾公開表示,企業(yè)級AI應用相較于消費側,有著更廣泛的需求和潛力.....
數(shù)據(jù)質量已成大模型落地關鍵
隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等技術的發(fā)展,數(shù)據(jù)資源呈現(xiàn)爆炸式增長。而2023年底多部委聯(lián)合印發(fā)的《“數(shù)據(jù)要素×”三年行動計劃(2024—2026年)》(簡稱《行動計劃》)更是凸顯了國家層面對于數(shù)據(jù)的重視程度。
《行動計劃》以推動數(shù)據(jù)要素高水平應用為主線,以推進數(shù)據(jù)要素協(xié)同優(yōu)化、復用增效、融合創(chuàng)新作用發(fā)揮為重點,強化場景需求牽引,帶動數(shù)據(jù)要素高質量供給、合規(guī)高效流通,培育新產(chǎn)業(yè)、新模式、新動能,充分實現(xiàn)數(shù)據(jù)要素價值,為推動高質量發(fā)展、推進中國式現(xiàn)代化提供有力支撐。
大模型作為新產(chǎn)業(yè)、新動能的一部分,數(shù)據(jù)也是大模型訓練的關鍵,企業(yè)通過收集、整理和分析數(shù)據(jù),為大模型提供了豐富的“燃料”。對此,浪潮云總經(jīng)理顏亮對鈦媒體表示,過去,在應用層面,數(shù)據(jù)很難發(fā)揮出共享、流通以外的更大價值,“通過大模型的加持,尤其是行業(yè)大模型的不斷涌現(xiàn),整個數(shù)據(jù)產(chǎn)業(yè)將發(fā)生質的改變?!鳖伭林赋?。
顯然,從現(xiàn)階段企業(yè)數(shù)據(jù)質量角度來看,企業(yè)進行數(shù)據(jù)治理的水平參差不齊,絕大多數(shù)企業(yè)數(shù)據(jù)質量較低。現(xiàn)階段,對于絕大部分企業(yè)而言,企業(yè)內(nèi)部有60%~70%的內(nèi)部數(shù)據(jù)未被使用,企業(yè)若能將這部分數(shù)據(jù)加以利用,這些數(shù)據(jù)將進一步驅動企業(yè)業(yè)務發(fā)展,對此,阿里巴巴集團副總裁、瓴羊CEO朋新宇曾在由鈦媒體集團與ITValue聯(lián)合主辦的“2023 ITValue Summit 數(shù)字價值年會”上表示,現(xiàn)階段大多數(shù)企業(yè)不具備數(shù)據(jù)驅動的能力,造成了企業(yè)數(shù)據(jù)應用不足的現(xiàn)狀,“不過與數(shù)據(jù)應用相比,缺乏數(shù)據(jù)治理能力的企業(yè)更多?!迸笮掠钪赋?。
隨著越來越多行業(yè)大模型應用的落地,數(shù)據(jù)的質量和多樣性也得到了提升,使得大模型能夠更好地適應不同的應用場景。在顏亮看來,大模型在“數(shù)據(jù)要素×”的戰(zhàn)略推進過程中,將起到催化劑的作用,“通過行業(yè)大模型的應用,能讓更多的企業(yè)更快地感受到數(shù)據(jù)帶來的價值,”顏亮如是說,“當更多企業(yè)切實感受到數(shù)據(jù)的價值后,就對企業(yè)自身的數(shù)據(jù)愈發(fā)重視,從而進一步推動了企業(yè)的數(shù)據(jù)治理,提升了企業(yè)數(shù)據(jù)質量?!?/p>
可信賴、易落地、可持續(xù),行業(yè)大模型的三大核心要求
雖然數(shù)據(jù)是大模型的“燃料”,沒有高質量的數(shù)據(jù)就訓練不出優(yōu)秀的大模型,但是數(shù)據(jù)質量只是大模型落地的第一步,如何打造一個能用、好用,能一直好用的大模型,是當下企業(yè)與大模型服務提供商關注的焦點。
可信賴層面,因為大模型的訓練會涉及海量的數(shù)據(jù),尤其是行業(yè)大模型,需要針對不同企業(yè),不同業(yè)務場景,使用企業(yè)獨有的數(shù)據(jù)進行大模型的訓練。在這個過程中,如何確保企業(yè)的數(shù)據(jù)不出域,確保企業(yè)數(shù)據(jù)安全,成為當下亟待解決的問題之一。對此,顏亮表示,在應用大模型產(chǎn)品的過程中,企業(yè)更傾向于本地部署,同時要具備可靠的安全能力,對企業(yè)的數(shù)據(jù)形成有效的保護,“數(shù)據(jù)安全問題是企業(yè)選擇大模型產(chǎn)品過程中,首要考慮的問題?!鳖伭翉娬{。
無獨有偶,IEEE標準協(xié)會理事兼IEEE數(shù)字金融與經(jīng)濟標準委員會主席林道莊也有著相似的看法,林道莊曾對鈦媒體表示,在AI時代,企業(yè)面臨著更大的網(wǎng)絡安全和數(shù)據(jù)安全的挑戰(zhàn),尤其集中在數(shù)據(jù)泄露、數(shù)據(jù)篡改/偽造等數(shù)據(jù)安全方面的挑戰(zhàn)。
針對此,未來,大模型的發(fā)展將更加注重數(shù)據(jù)隱私和安全,企業(yè)需要采取一系列的安全措施和技術手段,如加強數(shù)據(jù)加密和訪問控制、建立安全審計和監(jiān)控機制、采用對抗性防御技術提升模型的穩(wěn)健性、完善隱私保護政策和機制等。而在這個過程中,諸如加密學習、聯(lián)邦學習、隱私計算等技術將會成為企業(yè)應用行業(yè)大模型過程中的得力助手。
易落地層面,在這個唯快不破的時代,簡單易用、快速落地的數(shù)字技術將受到更多企業(yè)的青睞,在顏亮看來,易落地是解決大模型快速在行業(yè)側體現(xiàn)應用價值的關鍵能力。從現(xiàn)階段企業(yè)應用大模型能力的方式來看,主要有三種,即:嵌入軟件、API調用和自建企業(yè)級AI平臺。
雖然嵌入軟件是部署最快的一個,但是差異化能力極低,沒法更好地適配企業(yè)業(yè)務場景,所以從企業(yè)角度出發(fā),企業(yè)應用API調用+自建平臺的形式無論從短期出發(fā),還是從長遠角度出發(fā),都是企業(yè)應用大模型能力的最佳選擇。
從大模型服務供應商角度出發(fā),服務商需要具備一定的基礎模型能力,其次要具備充實的算力資源能力,最后還要具備大模型引擎的能力。針對此,浪潮云首席技術官孫思清對鈦媒體表示,基于分布式云架構開發(fā)的大模型產(chǎn)品將成為行業(yè)大模型落地的重要渠道。
孫思清指出,采用分布式的架構可以在模型的預訓練環(huán)節(jié)采用集中式的方式,在交付的時候,通過本地化的能力,結合本地數(shù)據(jù),更好地保護企業(yè)隱私,即滿足了企業(yè)對于安全合規(guī)的需求,又將模型的能力最大化地激發(fā)出來。
可持續(xù)層面,絕大多數(shù)行業(yè)的企業(yè)對于業(yè)務的持續(xù)性有著較高要求,而持續(xù)性的要求也映射到這些企業(yè)選擇數(shù)字技術服務業(yè)務的過程中,這就對行業(yè)大模型提出了穩(wěn)定性、連續(xù)性的要求。對此,顏亮表示:“在大模型訓練和使用過程中,不能出現(xiàn)中斷的情況。原來我們是為云和數(shù)據(jù)平臺做保障,現(xiàn)在要為大模型平臺做保障,要讓用戶有非常好的大模型體驗感,如果推理過程出現(xiàn)持續(xù)性的間斷,推理速度慢,得不到快速響應等問題,對于企業(yè)用戶而言,賦能的體驗是體現(xiàn)不出來的,而我們依托在全國布局的三個運行指揮中心,可以支撐對用戶的持續(xù)運營。”
除此之外,可持續(xù)性還應該體現(xiàn)在模型的迭代和更新上,服務商所提供的模型不能是“與世隔絕”的,要與時俱進,這一點,采用分布式的架構,采用本地與云端“兩條腿走路”的優(yōu)勢也就顯現(xiàn)出來了,企業(yè)可以根據(jù)需求的變化,以及數(shù)據(jù)的更新,快速的對大模型產(chǎn)品進行更新,從而更好地賦能業(yè)務發(fā)展。
快速發(fā)展的一年
大模型作為驅動新質生產(chǎn)力的重要底座,必將與行業(yè)深度融合。而2024年在多方面的共同努力下,對于行業(yè)大模型而言將是快速發(fā)展的一年,林道莊曾對鈦媒體表示,目前,大模型的應用主要集中在“三產(chǎn)”(服務業(yè))居多,主要是輔助人工作,而行業(yè)級的大模型有望在服務業(yè)相關領域率先落地成熟度較高的應用。從現(xiàn)有的應用情況來看,醫(yī)療、交通、政府等多個行業(yè)有望率先實現(xiàn)較成熟的應用落地。
以醫(yī)療行業(yè)為例,通過行業(yè)大模型對大量醫(yī)療數(shù)據(jù)的學習和分析,可以自動識別病變特征,輔助醫(yī)生進行疾病診斷,提高診斷準確率與診斷效率。對此,顏亮對鈦媒體表示,浪潮云推出的海若大模型產(chǎn)品就在醫(yī)療行業(yè)深耕布局,通過診療記錄、入院記錄等信息,直接生成病歷,省去了醫(yī)生填寫記錄的時間,“最多可為醫(yī)生省去20%的時間?!鳖伭寥缡钦f。
無獨有偶,林道莊也曾表示,現(xiàn)階段,中國醫(yī)療資源比較緊缺,許多人排了很久的隊才能看上病,而醫(yī)生也很忙,通過大模型的輔助,能幫助醫(yī)生快速的識別諸如X光片、CT等病歷,從而大幅提升醫(yī)生工作效率,也能降低患者等待的時間。
除“增效”以外,大模型在醫(yī)療行業(yè)的落地還可以幫助患者和醫(yī)院實現(xiàn)“降本”,通過自動化和智能化的醫(yī)療輔助系統(tǒng),可以降低醫(yī)療成本,提高醫(yī)療服務的效率和質量。
另一方面,行業(yè)大模型在醫(yī)療行業(yè)還可以幫助醫(yī)生優(yōu)化治療方案。通過大模型對對患者病情、病史、藥物過敏等情況進行綜合分析,為醫(yī)生提供更加全面和個性化的治療方案,提高治療效果。
在政務方面,隨著數(shù)據(jù)要素市場化進程的推進,大模型的應用讓越來越多的企業(yè)迫切的需要更多同行業(yè)的優(yōu)質數(shù)據(jù),也間接推動了數(shù)據(jù)要素市場化的進程。
浪潮云積極探索政務大模型在公文寫作、基層減負等場景的落地,實現(xiàn)基層材料整理效率提升100倍,回復準確率提升至75%;除此之外,在金融方面,大模型也有著很多用武之地,金融行業(yè)不同于其他行業(yè),其監(jiān)管要求極高,從技術上看,像貸款審核等業(yè)務其實已具備初步落地的技術能力,但因為安全合規(guī)的要求,大模型只能在其中起到解放生產(chǎn)力的輔助作用。
現(xiàn)階段,大模型在金融行業(yè)的應用主要還是集中在風險評估和管理,以及知識圖譜平臺搭建方面。在風險評估方面,大模型可以通過分析大量的歷史數(shù)據(jù)和實時信息,預測市場風險、評估信用風險等,為金融機構提供更加準確和及時的風險管理決策支持。
另一方面,將大模型與知識圖譜平臺結合,用大模型代替NLP技術,金融機構可以在提升效率的同時,提升風控水平。
從現(xiàn)有的應用來看,醫(yī)療、政府和金融是眾多大模型服務商重點布局的領域,而其他包括制造、交通、農(nóng)業(yè)、應急等在內(nèi)的多個行業(yè)也有望在今年實現(xiàn)大模型應用成熟落地。
大模型落地方興未艾??梢灶A見,2024年,行業(yè)大模型必然是各行各業(yè)關注的焦點,未來也會有越來越多的應用落地。在新技術的熱潮中,企業(yè)不會缺席大模型落地應用的探索,但成效不是一蹴而就,夯實根基、理性決策才能穿越技術成熟的周期。
本文轉載自??鈦媒體??,作者:張申宇
