自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

大模型蒸餾技術(shù)的演進(jìn)歷史與實(shí)現(xiàn)原理原創(chuàng)

AI探索時(shí)代

發(fā)布于 2025-5-9 06:31

瀏覽

0收藏

“ 知識(shí)蒸餾技術(shù)是模型輕量化小型化的一種方式，其效果也遠(yuǎn)超我們的想象 ”

在深度學(xué)習(xí)領(lǐng)域模型的壓縮與部署是一項(xiàng)非常重要的研究課題，原因就在于模型巨大的成本和算力需求；因此，怎么把模型小型化就成為一個(gè)亟待解決的問(wèn)題。

因此，一項(xiàng)技術(shù)就被應(yīng)用于模型小型化的過(guò)程，這個(gè)技術(shù)就叫做知識(shí)蒸餾，而我們平常說(shuō)的比較多的是大模型蒸餾技術(shù)。

當(dāng)然，知識(shí)蒸餾技術(shù)并不是一項(xiàng)新技術(shù)，其在2015年就已經(jīng)被諾貝爾獎(jiǎng)獲得者——Hinton等人提出；之后在chatGPT帶火大模型技術(shù)之后，知識(shí)蒸餾就又再次進(jìn)入大眾的視野。

但如果說(shuō)知識(shí)蒸餾最爆火的原因就在于DeepSeek的發(fā)布，我們都知道DeepSeek是我國(guó)的模型之光；而其解決的最主要的問(wèn)題就模型的訓(xùn)練成本問(wèn)題；但可能很少有人知道，其實(shí)DeepSeek是使用知識(shí)蒸餾技術(shù)，從阿里的千問(wèn)系列蒸餾得到的DeepSeek模型。

大模型蒸餾技術(shù)的演進(jìn)歷史與實(shí)現(xiàn)原理-AI.x社區(qū)

所以，什么是蒸餾技術(shù)，以及蒸餾技術(shù)的發(fā)展歷史與實(shí)現(xiàn)原理是什么？

蒸餾技術(shù)

蒸餾技術(shù)是由諾獎(jiǎng)得主——Hinton在2015年提出的，但嚴(yán)格來(lái)說(shuō)Hinton只是在前人的基礎(chǔ)之上優(yōu)化了蒸餾技術(shù)。

蒸餾技術(shù)——現(xiàn)在對(duì)蒸餾技術(shù)的定義是教師模型（大模型）通過(guò)訓(xùn)練數(shù)據(jù)學(xué)到的“知識(shí)”（如類別間關(guān)系、特征分布）被提煉到學(xué)生模型（小模型）中。

簡(jiǎn)單理解蒸餾技術(shù)就是老師教學(xué)生，在蒸餾技術(shù)之前，訓(xùn)練模型需要從0開(kāi)始；也就是需要隨機(jī)初始化模型參數(shù)；這就類似于你從小開(kāi)始學(xué)習(xí)全部靠自學(xué)，沒(méi)有任何人教你。

大模型蒸餾技術(shù)的演進(jìn)歷史與實(shí)現(xiàn)原理-AI.x社區(qū)

很明顯，這種方式學(xué)習(xí)效率低下；因此，就產(chǎn)生了一個(gè)新的職業(yè)——教師；它們的作用就是在他們自己學(xué)習(xí)的基礎(chǔ)之上，把知識(shí)和經(jīng)驗(yàn)教給你，這樣不論是學(xué)習(xí)的速度還是效率，還是準(zhǔn)確率都會(huì)大大提高。

而模型蒸餾就是基于這個(gè)理論，用訓(xùn)練好的大模型去“教”簡(jiǎn)單的小模型；由于是站在巨人的肩膀上，因此蒸餾出來(lái)的小模型不論是表現(xiàn)還是響應(yīng)速度都比大模型要好。

當(dāng)然，蒸餾技術(shù)作為目前一項(xiàng)熱門技術(shù)，其實(shí)現(xiàn)原理并沒(méi)有大家想象中的那么簡(jiǎn)單；首先，在2015 Hinton提出知識(shí)蒸餾之前，模型蒸餾已經(jīng)有人在使用了；只不過(guò)那時(shí)候的蒸餾技術(shù)還比較簡(jiǎn)單，只是在輸出層對(duì)模型的預(yù)測(cè)結(jié)果進(jìn)行學(xué)習(xí)；這種方式被稱為硬目標(biāo)。

這就像上學(xué)時(shí)有時(shí)老師說(shuō)的那樣，你實(shí)在不會(huì)記住就行了，不需要知道為什么；但這就會(huì)產(chǎn)生一個(gè)問(wèn)題，那就是你只能學(xué)會(huì)同一個(gè)題目或者是很類似的題目，但換個(gè)新題目你可能就不會(huì)了。

所以，老師常說(shuō)我們不但要學(xué)會(huì)知識(shí)，更重要的是要學(xué)會(huì)學(xué)習(xí)的方法——因此Hinton提出的知識(shí)蒸餾就類似于學(xué)習(xí)方法，它學(xué)習(xí)的是大模型預(yù)測(cè)數(shù)據(jù)的概率分布或思考過(guò)程，而不僅僅只是記住答案；而這種方式就被叫做軟目標(biāo)。

以目前的蒸餾技術(shù)來(lái)看，蒸餾也分為多種不同的情況；比如輸出層蒸餾，中間層蒸餾和自蒸餾等多種不同的形式；但不論什么形式的蒸餾，其目的只有一個(gè)，那就是讓student模型去學(xué)習(xí)Teacher老師模型的“知識(shí)”。

大模型蒸餾技術(shù)的演進(jìn)歷史與實(shí)現(xiàn)原理-AI.x社區(qū)

實(shí)現(xiàn)原理

知識(shí)蒸餾的實(shí)現(xiàn)原理主要包括兩個(gè)方面，知識(shí)遷移和軟標(biāo)簽：

知識(shí)遷移：教師模型（大模型）通過(guò)訓(xùn)練數(shù)據(jù)學(xué)到的“知識(shí)”（如類別間關(guān)系、特征分布）被提煉到學(xué)生模型（小模型）中。

軟標(biāo)簽（Soft Labels）：教師模型輸出的概率分布（非硬標(biāo)簽）包含更多信息，例如“貓和狗有相似特征”，學(xué)生模型通過(guò)模仿這些軟標(biāo)簽學(xué)習(xí)泛化能力。

模型蒸餾使用溫度T來(lái)控制軟標(biāo)簽的相關(guān)性，溫度越高，軟標(biāo)簽的相關(guān)度越高，溫度越低軟標(biāo)簽相關(guān)度越低。

本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/IsKykTm39Oq5J_aaaoYvhw??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

知識(shí)蒸餾技術(shù)

蒸餾技術(shù)

已于2025-5-9 06:31:40修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

深入理解Sora技術(shù)原理

卓勝微wjp ? 3520瀏覽 ? 0回復(fù)
多模態(tài)視覺(jué)-語(yǔ)言大模型的架構(gòu)演進(jìn)

angel ? 4466瀏覽 ? 0回復(fù)
GPT4技術(shù)原理：大模型的幻覺(jué)，解鈴還須系鈴人

ceesoft ? 2753瀏覽 ? 0回復(fù)
AI大模型技術(shù)的四大核心架構(gòu)演進(jìn)之路

AIGC觀察者 ? 3437瀏覽 ? 0回復(fù)
多模態(tài)大模型的實(shí)現(xiàn)原理，以及技術(shù)難點(diǎn)

AI探索時(shí)代 ? 4872瀏覽 ? 0回復(fù)
大型語(yǔ)言模型（LLM）的歷史與未來(lái)

51CTO內(nèi)容精選 ? 3306瀏覽 ? 0回復(fù)
LLM蒸餾到GNN，性能提升6.2%！Emory提出大模型蒸餾到文本圖｜CIKM 2024

duhorse ? 2026瀏覽 ? 0回復(fù)
視頻生成類大模型實(shí)現(xiàn)原理以及應(yīng)用和難點(diǎn)

AI探索時(shí)代 ? 3734瀏覽 ? 0回復(fù)
四年匠心磨礪，快手系統(tǒng)軟件技術(shù)創(chuàng)新與領(lǐng)域演進(jìn)之路

快手技術(shù) ? 1920瀏覽 ? 0回復(fù)
深入探討語(yǔ)音轉(zhuǎn)文本技術(shù)的演進(jìn)

芝士AI吃魚 ? 2180瀏覽 ? 0回復(fù)
微軟開(kāi)源小模型Phi系列：技術(shù)演進(jìn)、能力突破與未來(lái)展望

上堵吟1 ? 2923瀏覽 ? 0回復(fù)
大規(guī)模相似性搜索：原理、技術(shù)與 Faiss 實(shí)踐

柏企閱文 ? 2322瀏覽 ? 0回復(fù)
蘋果也在蒸餾大模型，給出了蒸餾Scaling Laws

輕薄滴假象 ? 1802瀏覽 ? 0回復(fù)
DeepSeek-R1技術(shù)大揭秘：論文核心原理拆解與模型性能突破關(guān)鍵

arnoldzhw ? 2960瀏覽 ? 0回復(fù)
LLMs的知識(shí)蒸餾：技術(shù)和應(yīng)用

柏企閱文 ? 2554瀏覽 ? 0回復(fù)
一文搞懂 DeepSeek 的蒸餾技術(shù)和案例實(shí)踐

玄姐聊AGI ? 6153瀏覽 ? 0回復(fù)
深入解析變分自編碼器（VAE）：理論、數(shù)學(xué)原理、實(shí)現(xiàn)與應(yīng)用

唐克 ? 3602瀏覽 ? 0回復(fù)
Qwen-VL系列多模態(tài)大模型技術(shù)演進(jìn)-模型架構(gòu)、訓(xùn)練方法、數(shù)據(jù)細(xì)節(jié)

大模型自然語(yǔ)言處理 ? 3450瀏覽 ? 0回復(fù)
TinyR1-32B-Preview: 通過(guò)全新分支合并蒸餾技術(shù)讓大模型瘦身不掉智商

sbf_2000 ? 1244瀏覽 ? 0回復(fù)

AI探索時(shí)代

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實(shí)戰(zhàn)教程 0回復(fù)

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復(fù)

2025年最值得關(guān)注的十大多模態(tài)大語(yǔ)言模型！ 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲神器 0回復(fù)

從零到一構(gòu)建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解 0回復(fù)

上一篇：影響大模型能力表現(xiàn)的因素，以及提示詞在其中扮演的角色和工程化的作用和方法

下一篇：關(guān)于大模型應(yīng)用過(guò)程中的記憶功能管理問(wèn)題，以及解決方案

社區(qū)精華內(nèi)容

目錄

^{<big id="shq8d"><code id="shq8d"></code></big>}<cite id="shq8d"><rp id="shq8d"></rp></cite>

<legend id="shq8d"><abbr id="shq8d"></abbr></legend>

<cite id="shq8d"><track id="shq8d"></track></cite>