關(guān)于企業(yè)級人工智能應(yīng)用常用架構(gòu),如果老板讓你負(fù)責(zé)牽頭引入人工智能技術(shù),你知道該怎么做嗎? 原創(chuàng)
“ 大模型+本地知識庫,是主流的技術(shù)架構(gòu)方向”
在當(dāng)前人工智能爆火的時代,人工智能走進(jìn)了越來越多的企業(yè),很多企業(yè)都在業(yè)務(wù)中引入人工智能技術(shù)。
但在一些沒接觸或剛接觸人工智能的技術(shù)人員來說,領(lǐng)導(dǎo)突然要引入人工智能技術(shù)時,并且讓拿出一個技術(shù)方案來,這時很多人都會不知所措,無從下手。
今天就來討論一下企業(yè)級人工智能解決方案應(yīng)該是什么樣的。
01、人工智能常見的應(yīng)用技術(shù)
人工智能領(lǐng)域是一個繁雜的技術(shù)領(lǐng)域,因為它涉及到多種不同的學(xué)科和技術(shù),但作為應(yīng)用者來說,我們不需要關(guān)心人工智能是怎么發(fā)展的,以及怎么做出來的。
我們需要關(guān)心的是,怎么在人工智能之上構(gòu)建應(yīng)用,解決實際的業(yè)務(wù)問題。而這才是我們更多需要了解的技術(shù)。
大模型技術(shù)
人工智能目前最重要的技術(shù)之一,就是基于機器學(xué)習(xí)模型,使用龐大數(shù)據(jù)訓(xùn)練出來的具有大量參數(shù)的大模型技術(shù),大模型技術(shù)可以說是當(dāng)代人工智能技術(shù)的核心。
而根據(jù)不同的任務(wù),大模型技術(shù)又有多種分類,比如自然語言處理(NLP),計算機視覺(CV),分類任務(wù),文生圖,聲音,圖像,視頻處理任務(wù)等。
而不管什么模型,實現(xiàn)原理雖然不盡相同,但我們在使用的過程中,只需要按照自己的需求,選擇合適的模型即可。
本地知識庫技術(shù)
其次就是本地知識庫,本地知識庫的作用一是為了填補大模型天生的缺陷,那就是數(shù)據(jù)更新不及時;其次就是,節(jié)省成本。
因為不論大模型的訓(xùn)練和微調(diào),哪怕是使用第三方的開源模型,同樣需要很高的成本,包括數(shù)據(jù)收集成本,訓(xùn)練成本,以及技術(shù)人力成本等。
而本地知識庫因為使用簡單,成本低,技術(shù)要求不高,就成為了大模型最好的補充技術(shù)之一。
本地知識庫的文章,??爆火的本地知識庫項目是什么???
AI Agent技術(shù)
還有就是AI Agent技術(shù),如果把大模型比作人的大腦,那么AI Agent技術(shù)就是大模型的手和腳。
有了agent技術(shù),大模型就可以通過function calling的方式調(diào)用外部工具,這大大擴展了大模型的能力邊界。
因為數(shù)據(jù)安全的原因,有些企業(yè)只能在企業(yè)內(nèi)部使用大模型,而不能使用一些第三方的大模型;因此,對有資金和技術(shù)的企業(yè),就可以從頭設(shè)計或使用一些開源的模型進(jìn)行訓(xùn)練,并部署一個大模型。
關(guān)于AI Agent可以看一下之前的文章,??大模型的手和腳??。
本地大模型部署工具
但對一些小企業(yè)無法做到模型的設(shè)計與訓(xùn)練,那么它們就可以使用一些開源大模型,然后在使用一些本地部署模型的框架,來解決數(shù)據(jù)安全的問題。
比如,ollama,lmstudio,gpt4all等開源框架,在本地部署大模型,這些開源框架,不但提供了客戶端的用戶接口,而且還提供了編程接口。
再有就是,類似于Langchain和AnythingLLM的開發(fā)框架,這兩種框架的作用是,讓你能夠更加方便的使用大模型。其功能類似于java web開發(fā)中的,ssm框架,有了它們就可以更加方便的開發(fā)應(yīng)用。
當(dāng)然,如果你不想使用它們也可以,可以直接使用大模型原生的SDK工具包,或者自己開發(fā)工具包。
關(guān)于本地部署大模型可以看一下之前的文章,??你想在本地部署大模型嗎???
02、企業(yè)人工智能應(yīng)用架構(gòu)
在企業(yè)應(yīng)用中,根據(jù)不同的企業(yè),不同的業(yè)務(wù),以及公司的技術(shù)能力和資金能力,可以選擇不同的系統(tǒng)架構(gòu)。
首先,對一些小微企業(yè)來說,就是那種技術(shù)能力和資金都不充足的企業(yè),最好的選擇方式就是:
第三方大模型+本地知識庫的方式
之所以選擇這種方式,是因為自己訓(xùn)練和維護(hù)一個模型的成本比較高,很多企業(yè)可能都沒有這個能力。
而且,因為第三方大模型基本上都屬于通用模型,也就是什么都懂,但什么都不精。因此通用模型的最明顯的一個缺點就是在垂直領(lǐng)域表現(xiàn)泛泛,因此可以使用本地知識庫的方式來補充這一點。
其次,對一些有能力部署本地模型,但又是很有能力的企業(yè),那么就可以選擇使用的方式是:
本地大模型+第三方大模型+本地知識庫
之所以選擇這種方式是因為,因為很多企業(yè)的業(yè)務(wù)并不是一個模型就可以解決的,很多時候都需要多種模型的搭配使用,比如需要一個自然語言模型處理客戶問題,一個音頻模型來給客戶打電話等。
而且也因為部分?jǐn)?shù)據(jù)安全問題,比如涉及到一些企業(yè)內(nèi)部數(shù)據(jù),不適合在第三方模型上使用。
因此使用這種方式,一是可以把自己的核心業(yè)務(wù)和核心數(shù)據(jù)放到自己本地模型上進(jìn)行處理;其次可以把一些邊緣業(yè)務(wù)使用第三方大模型來完成。
這樣既節(jié)約了成本,也降低了企業(yè)維護(hù)本地模型的成本;而本地知識庫的作用和第一種相同。
最后就是那種對數(shù)據(jù)安全要求比較高的企業(yè),并且它們有足夠的技術(shù)和資金支持,那么它們就可以選擇自己設(shè)計和訓(xùn)練模型,讓自己的核心業(yè)務(wù)完全運行在本地大模型中。
本地大模型+本地知識庫
這種方式,只適合那種對業(yè)務(wù)安全性要求較高,并且財大氣粗,具有一定技術(shù)實力的企業(yè),比如國家電網(wǎng)。
至于AI Agent技術(shù),根據(jù)不同的業(yè)務(wù)方向,可以根據(jù)需求選擇是否使用。
從這也可以看出,不論采用何種方式,本地知識庫都是必不可少的一環(huán)。原因就是因為大模型的天生缺陷,以及成本問題。
除非大模型能夠真正學(xué)會自我學(xué)習(xí),并且能夠降大模型的成本,本地知識庫才有可能退出市場。
這也是為什么最近本地知識庫爆火的原因。
本文轉(zhuǎn)載自公眾號AI探索時代 作者:DFires
