人工智能應(yīng)用就是大模型能力+場景,基于大模型構(gòu)建應(yīng)用,首先要了解大模型的能力圈 原創(chuàng)
“ 大模型的應(yīng)用是玩出來的而不是看出來的,多體驗和嘗試不同的模型之間的功能和區(qū)別才能讓你真正了解大模型的能力?!?/strong>
在關(guān)于大模型應(yīng)用方面,雖然也了解和應(yīng)用過其中的一些技術(shù);但經(jīng)過這段時間的實踐和思考發(fā)現(xiàn),對大模型應(yīng)用的認(rèn)識還很淺顯,因此在此記錄一下自己的思考。
大模型應(yīng)用的思考
大模型作為人工智能應(yīng)用的底座技術(shù),所有應(yīng)用場景和技術(shù)都是構(gòu)建在大模型之上;但很多時候我們都搞錯了一件事,那就是我們沒有搞清楚大模型能力和其它技術(shù)的關(guān)聯(lián)和區(qū)別。
因此,在這里我們要搞清楚一個概念,那就是大模型能力;所謂大模型的能力,就是模型開發(fā)人員怎么把模型做的更好更強(qiáng),其中設(shè)計到模型的設(shè)計,訓(xùn)練等;具體有神經(jīng)網(wǎng)絡(luò)架構(gòu),模型蒸餾等等。
當(dāng)然,我們不需要關(guān)心大模型是怎么做出來的,以及大模型為什么能做那么好或者那么差;我們僅需要知道大模型有哪些能力和功能即可。
比如爆火的deekseep的V3模型和R1模型,其中V3更多的偏向生成模型,而R1更擅長的是推理。
前面說了這么多,可能很多人還沒理解其中的含義;之所以說大模型的能力,那就是說我們要明白大模型就是大模型,其它任何附屬于大模型的技術(shù)都不屬于大模型的范疇。
比如說,RAG技術(shù),function call技術(shù),MCP技術(shù),其實他們并不屬于大模型本身的功能;特別是RAG,從技術(shù)上來看完全可以說RAG和大模型沒什么關(guān)系。
而function call和MCP技術(shù)只是大模型使用外界功能,也就是調(diào)用外部接口的能力;而思維鏈才屬于大模型本身的技術(shù),讓模型具備分析和推理的能力。
但至于怎么讓大模型使用外部工具,這個就是function call和MCP需要考慮的事情。
所以說,模型就是模型,功能就是功能,工具就是工具;但往往我們很多時候都會把這些混為一談;導(dǎo)致的直接結(jié)果就是,在構(gòu)建應(yīng)用的時候分不清什么技術(shù)解決了什么問題,也不知道自己能做什么應(yīng)用。
這也是為什么很多基于大模型開發(fā)的功能平臺,它的核心能力其實是平臺的設(shè)計和功能;和具體的大模型沒直接關(guān)系,市面上有了更好的模型出現(xiàn),那么直接把現(xiàn)有的模型換掉就行了,并不會影響到這些平臺本身的業(yè)務(wù)和功能。
其實從這個角度來思考,事實上這就是一種方法論,很多人不知道怎么使用人工智能解決自己工作和生活中的問題,原因就在于不懂這種方法論;導(dǎo)致自己的認(rèn)知和方向有偏差,感覺自己明明學(xué)了好多東西,但卻不知道能干啥。
大模型是核心,function call和MCP既是一種技術(shù),也是一種工具;大模型可以選擇集成function call和MCP的能力,也可以選擇不使用這些功能。
function call和MCP屬于大模型能力的一種擴(kuò)展,就類似于一種可插拔組件,其是實現(xiàn)智能體(Agent)的技術(shù)手段。而思維鏈才是屬于大模型本身的能力,大模型先具備獨立思考的能力,學(xué)會分析和拆解任務(wù),其次再使用外部工具來完成任務(wù)。
當(dāng)然,大模型實現(xiàn)function call并不需要具備網(wǎng)絡(luò)接口調(diào)用的能力,大模型只需要按照需求生成調(diào)用接口所需要的參數(shù),然后把參數(shù)傳遞給開發(fā)者寫好的代碼中即可。
本文轉(zhuǎn)載自公眾號AI探索時代 作者:DFires
原文鏈接:??https://mp.weixin.qq.com/s/uQp1ctFoaPN5hCy7vZC76Q??
