自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

什么是端到端(end to end)大模型,它和傳統(tǒng)的大模型有什么區(qū)別?其優(yōu)勢(shì)與劣勢(shì)是什么? 原創(chuàng)

發(fā)布于 2024-9-24 06:51
瀏覽
0收藏

“ 端到端模型,是一個(gè)直接由輸入獲取輸出的過(guò)程 ”

最近有一個(gè)很火的關(guān)于人工智能模型的詞——端到端模型。

那么什么是端到端模型?為什么會(huì)提出端到端模型,以及它解決了哪些問(wèn)題?

今天我們就來(lái)一起了解一下這個(gè)端到端模型。

端到端模型

還記得計(jì)算機(jī)組成原理里面,關(guān)于馮諾伊曼計(jì)算機(jī)結(jié)構(gòu)中,組成計(jì)算機(jī)的幾個(gè)模塊嗎?

運(yùn)算器 控制器 存儲(chǔ)器 輸入設(shè)備和輸出設(shè)備,由這五大模塊組成了現(xiàn)有的計(jì)算機(jī)系統(tǒng)。

而對(duì)我們使用者來(lái)說(shuō),這五大模塊中我們接觸最多的就是輸入設(shè)備與輸出設(shè)備,也就是鼠標(biāo)鍵盤(pán)顯示器。

而運(yùn)算器,控制器和存儲(chǔ)器是由計(jì)算機(jī)系統(tǒng)自己處理的,我們不需要知道它們的內(nèi)部運(yùn)行原理,也不需要知道它們是怎么協(xié)調(diào)的。

同樣端到端也是如此,從表象來(lái)看我們只需要關(guān)心其輸入與輸出,不需要知道它的內(nèi)部結(jié)構(gòu),也就是說(shuō),端到端模型的表象是一個(gè)黑盒。


我們知道,大模型的表現(xiàn)是無(wú)法解釋的,它更多的是一種現(xiàn)象,叫做智能涌現(xiàn),現(xiàn)在很多研究機(jī)構(gòu)都在解決大模型的可解釋性,也就是大模型為什么能做到這樣的效果,中間經(jīng)歷了哪些處理。


但如果要實(shí)現(xiàn)一個(gè)端到端的大模型,應(yīng)該怎么實(shí)現(xiàn)呢?任何新技術(shù)的出現(xiàn)都是為了解決存在的問(wèn)題,那端到端模型解決了什么問(wèn)題? 

其實(shí)用一句話概括端到端,就是讓大模型直接理解問(wèn)題,然后給出答案或決策。

比如拿語(yǔ)音模型舉例,很多人以為的語(yǔ)音模型就是直接理解語(yǔ)音,但事實(shí)上語(yǔ)音模型并不是直接理解語(yǔ)音;而是由多個(gè)模塊組成的一個(gè)語(yǔ)音模型。

語(yǔ)音在語(yǔ)音模型中的處理過(guò)程,需要經(jīng)過(guò)語(yǔ)音轉(zhuǎn)文字,然后把文字輸入給大模型,大模型處理完畢返回文字,再有轉(zhuǎn)化系統(tǒng)把文字轉(zhuǎn)換為語(yǔ)音返回給用戶。

什么是端到端(end to end)大模型,它和傳統(tǒng)的大模型有什么區(qū)別?其優(yōu)勢(shì)與劣勢(shì)是什么?-AI.x社區(qū)

這就是現(xiàn)在大模型所存在的問(wèn)題,中間需要經(jīng)過(guò)多個(gè)模塊的協(xié)同處理才能得到想要的結(jié)果??赡苡腥藭?huì)問(wèn)為什么不讓大模型直接理解語(yǔ)音,還要經(jīng)過(guò)中間的轉(zhuǎn)化?

原因就是這樣的實(shí)現(xiàn)方式技術(shù)難度低,容易實(shí)現(xiàn)。

而端到端模型的目的就是省略中間語(yǔ)音轉(zhuǎn)文字,文字轉(zhuǎn)語(yǔ)音的過(guò)程;為什么要這么做?

這么做的目的并不是為了炫耀技術(shù),而是有些場(chǎng)景需要強(qiáng)大的實(shí)時(shí)性,無(wú)法接受如此長(zhǎng)鏈條的處理響應(yīng)時(shí)間。

比如說(shuō)自動(dòng)駕駛,現(xiàn)今的自動(dòng)駕駛采用的就是多模塊協(xié)作的方式,如路況采集,自動(dòng)化分析,做出決策,執(zhí)行決策等。這樣的自動(dòng)駕駛系統(tǒng)就需要大量的時(shí)間做出響應(yīng)。

而如果采用端到端系統(tǒng),那么端到端系統(tǒng)就可以直接采集路況數(shù)據(jù),然后做出決策,省略中間各種亂七八糟的處理流程,大大提升了系統(tǒng)靈敏度。

從技術(shù)到角度來(lái)說(shuō),端到端模型實(shí)現(xiàn)難度更大,系統(tǒng)更復(fù)雜,而且可解釋性更差,而且更像一個(gè)黑盒。

可能說(shuō)到這里,有些人任務(wù)端到端模型能做到的事,普通大模型也可以做到,而且技術(shù)難度更低,成本也更低。

但端到端模型出現(xiàn)的原因并不是為了解決普通的問(wèn)題,比如回答系統(tǒng);哪怕你普通大模型性能低一點(diǎn),回答慢一點(diǎn)也可以接受。

但在一些領(lǐng)域,如智能駕駛,高端制造,軍事競(jìng)爭(zhēng)等方面,延遲要在毫秒,甚至是微秒的程度;這時(shí)普通大模型就無(wú)法完成任務(wù)了。

端到端模型的主要目的就是為了讓大模型直接接受輸入,減少中間環(huán)節(jié)的處理成本,提升效率。

什么是端到端(end to end)大模型,它和傳統(tǒng)的大模型有什么區(qū)別?其優(yōu)勢(shì)與劣勢(shì)是什么?-AI.x社區(qū)

程序員應(yīng)該比較容易理解端到端,普通大模型就類似于現(xiàn)在的高級(jí)語(yǔ)音,如java,python等;它們的功能強(qiáng)大,但執(zhí)行效率低,原因就是中間有一個(gè)解釋器。

而端到端模型就類似于C語(yǔ)言,直接轉(zhuǎn)換為計(jì)算機(jī)能夠處理的格式,省略了中間解釋的環(huán)節(jié)。

雖然高級(jí)編程語(yǔ)言的作用越發(fā)強(qiáng)大,但永遠(yuǎn)也沒(méi)有那個(gè)語(yǔ)言能完全取代C語(yǔ)言和匯編語(yǔ)言。

當(dāng)然,C語(yǔ)言和匯編語(yǔ)言雖然效率高,但遷移性比較低,不同的平臺(tái)需要不同的指令集和開(kāi)發(fā)庫(kù)。端到端模型也是如此,對(duì)訓(xùn)練數(shù)據(jù)質(zhì)量的要求更高,適應(yīng)性也更差。

因此,網(wǎng)上也有人說(shuō),所謂的端到端就是直接由輸入得到輸出,大模型可以直接理解輸入數(shù)據(jù),而不需要這樣那樣的轉(zhuǎn)化過(guò)程。


本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires

原文鏈接:??https://mp.weixin.qq.com/s/r81EJECLsPvJNznXKWoPlA??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
已于2024-9-24 07:50:23修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦