自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<center id="dydjy"><optgroup id="dydjy"></optgroup></center>

<pre id="dydjy"></pre>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

大模型微調(diào)哪家好？小孩子才做選擇，成年人當(dāng)然是全都要

發(fā)布于 2024-9-26 15:25

瀏覽

0收藏

一、概述

title：UNIPELT: A Unified Framework for Parameter-Efficient Language Model Tuning

論文地址：https://arxiv.org/abs/2110.07577

代碼：https://github.com/morningmoni/UniPELT

1.1 Motivation

大模型不同的微調(diào)方法（PELT）例如LoRA，prefix-tuning，Adapter方法效果不同，在不同的任務(wù)上效果也有差異，到底選哪個(gè)方法好呢？
parameter-efficient language model tuning (PELT) 方法能在參數(shù)量比f(wàn)ine-tuning小很多的情況下，perform追上fine-tuning的水平，但是不同的PELT方法在同一個(gè)任務(wù)上表現(xiàn)差異可能都非常大，這讓針對(duì)特定任務(wù)選擇合適的方法非常繁瑣。

1.2 Methods

提出了PELT方法，將不同的PELT方法作為子模塊，并學(xué)習(xí)通過(guò)門控機(jī)械激活最適合當(dāng)前數(shù)據(jù)或任務(wù)的方法。

大模型微調(diào)哪家好？小孩子才做選擇，成年人當(dāng)然是全都要-AI.x社區(qū)

說(shuō)明：

例如通過(guò)Gp參數(shù)控制Prefix-tuning方法的開(kāi)關(guān)，GL控制LoRA方法的開(kāi)關(guān)，GA控制Adapter方法的開(kāi)關(guān)。
圖中藍(lán)顏色的參數(shù)為可學(xué)習(xí)的參數(shù)。

1.3 Conclusion

本文方法始終優(yōu)于傳統(tǒng)的fine-tuning方法以及它在不同子模塊下的表現(xiàn)，并且通常超過(guò)了在每個(gè)任務(wù)上單獨(dú)使用的每個(gè)子模塊的最佳性能的上限。
融合多種PELT方法可能會(huì)有利于預(yù)訓(xùn)練語(yǔ)言模型PLM的有效性和魯棒性

二、詳細(xì)內(nèi)容

1 GLUE實(shí)驗(yàn)結(jié)果

大模型微調(diào)哪家好？小孩子才做選擇，成年人當(dāng)然是全都要-AI.x社區(qū)

UniPELT（AP）和UniPELT（APL）區(qū)別

A: Adapter

P: P-tuning

L: LoRA

結(jié)論

在樣本K=100，500，1000的實(shí)驗(yàn)上，UniPELT集成了多個(gè)微調(diào)方法的效果更好

2 Adapter方法分析：bottleneck大小對(duì)該方法效果的影響

大模型微調(diào)哪家好？小孩子才做選擇，成年人當(dāng)然是全都要-AI.x社區(qū)

bootleneck size越大，可訓(xùn)練的參數(shù)越多，效果也就更好，size=48的時(shí)候，可能學(xué)的還不太充分

3 LoRA方法對(duì)參數(shù)的敏感性

大模型微調(diào)哪家好？小孩子才做選擇，成年人當(dāng)然是全都要-AI.x社區(qū)

針對(duì)兩個(gè)任務(wù)SST和MRPC，和不同的參數(shù)a來(lái)做實(shí)驗(yàn)，結(jié)果如下：

沒(méi)有一個(gè)有效的a在任何task上都是效果比較好的，說(shuō)明了本文方法讓他自己來(lái)學(xué)習(xí)這些參數(shù)的重要性

4 其他方法分析：

Prefix-tuning

增加訓(xùn)練參數(shù)效果不一定好

BitFit和LoRA

LoRA訓(xùn)練參數(shù)比較小的情況下，效果好像也還可以

5 UniPELT和原始微調(diào)方法的上限對(duì)比

大模型微調(diào)哪家好？小孩子才做選擇，成年人當(dāng)然是全都要-AI.x社區(qū)

6個(gè)實(shí)驗(yàn)有5個(gè)都超過(guò)了單獨(dú)方法的上限

6 全量數(shù)據(jù)的訓(xùn)練效果

大模型微調(diào)哪家好？小孩子才做選擇，成年人當(dāng)然是全都要-AI.x社區(qū)

使用全量的數(shù)據(jù)PELT還是取得了最好的結(jié)果
不使用門，簡(jiǎn)單的融合，效果也沒(méi)有本文PELT效果好，說(shuō)明了本文方法的有用性

7 訓(xùn)練時(shí)間和推理時(shí)間分析

大模型微調(diào)哪家好？小孩子才做選擇，成年人當(dāng)然是全都要-AI.x社區(qū)

訓(xùn)練速度UniPELT比之前微調(diào)的方法多一些，但是也還好，推理時(shí)間BitFit增加的最少，本文方法時(shí)間增加27%
訓(xùn)練參數(shù)量LoRA，BitFit，Prefix-tuning都比較小，UniPELT多了一些

三、Adaptor、Prefix-tuning、LoRA背景知識(shí)

參考原文：從統(tǒng)一視角看各類高效finetune方法：??https://mp.weixin.qq.com/s/j17G5RTWQJjYUhNOQBzzJA??

1 Adaptor方法介紹

Adaptor核心是在原Bert中增加參數(shù)量更小的子網(wǎng)絡(luò)，finetune時(shí)固定其他參數(shù)不變，只更新這個(gè)子網(wǎng)絡(luò)的參數(shù)。Adaptor是最早的一類高效finetune方法的代表，在Parameter-Efficient Transfer Learning for NLP（ICML 2019）這篇文章中被提出。在原來(lái)的Bert模型的每層中間加入兩個(gè)adapter。Adapter通過(guò)全連接對(duì)原輸入進(jìn)行降維進(jìn)一步縮小參數(shù)量，經(jīng)過(guò)內(nèi)部的NN后再將維度還原，形成一種bottleneck的結(jié)構(gòu)。在finetune過(guò)程中，原預(yù)訓(xùn)練Bert模型的參數(shù)freeze住不更新，只更新adapter的參數(shù)，大大減少了finetune階段需要更新和保存的參數(shù)量。

大模型微調(diào)哪家好？小孩子才做選擇，成年人當(dāng)然是全都要-AI.x社區(qū)

2 Prefix-tuning方法介紹

Prefix-tuning的核心是為每個(gè)下游任務(wù)增加一個(gè)prefix embedding，只finetune這些embedding，其他參數(shù)freeze。Prefix-tuning對(duì)應(yīng)的論文是Prefix-Tuning: Optimizing Continuous Prompts for Generation（2021），這類方法的思想來(lái)源于prefix prompt，prefix embedding相當(dāng)于一個(gè)上下文信息，對(duì)模型最終產(chǎn)出的結(jié)果造成影響，進(jìn)而只finetune這個(gè)embedding實(shí)現(xiàn)下游任務(wù)的遷移。

大模型微調(diào)哪家好？小孩子才做選擇，成年人當(dāng)然是全都要-AI.x社區(qū)

3 LoRA方法介紹

LoRA的核心是通過(guò)引入?yún)?shù)量遠(yuǎn)小于原模型的可分解的兩小矩陣建立一個(gè)旁路，通過(guò)finetune這個(gè)旁路來(lái)影響預(yù)訓(xùn)練模型。LoRA于LoRA: Low-rank adaptation of large language models（2021）論文中被提出，利用低秩矩陣替代原來(lái)全量參數(shù)的訓(xùn)練，提升finetune效率。

大模型微調(diào)哪家好？小孩子才做選擇，成年人當(dāng)然是全都要-AI.x社區(qū)

本文轉(zhuǎn)載自 ??NLP PaperWeekly??，作者：胡翔

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

大模型提示學(xué)習(xí)樣本量有玄機(jī)，自適應(yīng)調(diào)節(jié)方法好

pangguiyu ? 3293瀏覽 ? 0回復(fù)
當(dāng)下最容易上手的大模型微調(diào)工具是誰(shuí)？LLamaFactory或是其中之一

Syrupup ? 1.3w瀏覽 ? 0回復(fù)
訓(xùn)練大模型自動(dòng)在RAG和記憶間選擇

51CTO內(nèi)容精選 ? 2892瀏覽 ? 0回復(fù)
大模型應(yīng)用落地：如何選擇合適的 Embedding 模型？

玄姐聊AGI ? 4579瀏覽 ? 0回復(fù)
你知道什么是微調(diào)嗎？大模型為什么要微調(diào)？以及大模型微調(diào)的原理是什么？

AI探索時(shí)代 ? 6322瀏覽 ? 0回復(fù)
如果老板讓你基于大模型搭建一個(gè)系統(tǒng)，怎么選擇一個(gè)適合自己任務(wù)的大模型？選擇大模型需要考慮哪些問(wèn)題？

AI探索時(shí)代 ? 2394瀏覽 ? 0回復(fù)
大模型到底需要消耗多少GPU顯存？公式和工具全都有

Syrupup ? 1.1w瀏覽 ? 1回復(fù)
Google:我全都要！

探索AGI ? 2212瀏覽 ? 0回復(fù)
大模型微調(diào)終極指南

NLP工作站 ? 3595瀏覽 ? 0回復(fù)
數(shù)據(jù)高效和計(jì)算高效全都要！中科大&微信等提出多模態(tài)大語(yǔ)言模型EE-MLLM

angel ? 2303瀏覽 ? 0回復(fù)
如何選擇適合企業(yè)需求的大語(yǔ)言模型

51CTO內(nèi)容精選 ? 2481瀏覽 ? 0回復(fù)
【好禮贏不停】1024程序員嘉年華！在這里集結(jié)

AI.x社區(qū)官方賬號(hào) ? 1.2w瀏覽 ? 15回復(fù)
深入理解預(yù)訓(xùn)練與微調(diào)，為什么需要預(yù)訓(xùn)練，什么是微調(diào)？

AI探索時(shí)代 ? 3881瀏覽 ? 0回復(fù)
什么是好的GenAI 產(chǎn)品？哪些以LLM技術(shù)為支持的產(chǎn)品值得開(kāi)發(fā)？

AI博物院 ? 2078瀏覽 ? 0回復(fù)
中科大揭秘微調(diào)大模型的秘訣：如何精準(zhǔn)選擇數(shù)據(jù)提升AI性能

AI論文解讀 ? 2808瀏覽 ? 0回復(fù)
?對(duì)標(biāo)DeepSeek，Gemini 2.0輕量模型開(kāi)卷“極致性價(jià)比”！谷歌守住多模態(tài)陣地應(yīng)用們都要開(kāi)始做推理了！

51CTO技術(shù)棧 ? 1614瀏覽 ? 0回復(fù)
DeepSeek大模型一體機(jī)哪家強(qiáng)？

數(shù)字化助推器 ? 3685瀏覽 ? 0回復(fù)
Agent模型能力哪家最強(qiáng)？一文選出最合適Agent大模型

石映飛云 ? 1479瀏覽 ? 0回復(fù)
實(shí)測(cè)AI大模型：騰訊混元T1 vs DeepSeek 哪家強(qiáng)？

云中江樹(shù) ? 1222瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

人工標(biāo)注太貴，合成數(shù)據(jù)不夠好？看OS-Genesis如何破解數(shù)據(jù)困局 1天前發(fā)布
震驚！強(qiáng)化學(xué)習(xí)訓(xùn)練后，大模型推理“天花板”反而降低了？清華研究揭示RLVR局限性 2025-05-06 07:12:18發(fā)布

熱門推薦

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實(shí)戰(zhàn)教程 0回復(fù)

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復(fù)

2025年最值得關(guān)注的十大多模態(tài)大語(yǔ)言模型！ 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲(chóng)神器 0回復(fù)

從零到一構(gòu)建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解 0回復(fù)

上一篇： TOT(Tree of Thought) | 讓GPT-4像人類一樣思考

下一篇： Microsoft ｜利用LLM本身訓(xùn)練SoTA embedding模型

社區(qū)精華內(nèi)容

目錄