自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="tq3se"></cite>

<style id="tq3se"></style>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

從零實現(xiàn)大模型-GPT2任務(wù)微調(diào) 原創(chuàng)

發(fā)布于 2024-7-2 11:26

瀏覽

0收藏

??從零實現(xiàn)大模型-BERT預(yù)訓(xùn)練??

??從零實現(xiàn)大模型-BERT微調(diào)??

我們在BERT微調(diào)那篇文章中提到，許多NLP任務(wù)（如情感分析和問答）都依賴于上下文理解能力。而像BERT這種雙向模型具有較強(qiáng)的上下文理解能力，因此非常適合用于任務(wù)微調(diào)，即針對某個具體任務(wù)進(jìn)行微調(diào)。

??從零實現(xiàn)大模型-GPT2預(yù)訓(xùn)練??

??從零實現(xiàn)大模型-GPT2指令微調(diào)??

??從零實現(xiàn)大模型-GPT2 RLHF??

而像GPT這種自回歸模型，在預(yù)訓(xùn)練完成后會進(jìn)行一個指令微調(diào)過程，用于跟隨人類指令，然后通過指令去完成不同的任務(wù)（翻譯，總結(jié)）。

那GPT能否像BERT那樣，直接微調(diào)用于完成某個具體任務(wù)呢？雖然BERT更適合，但GPT確實也可以。

今天我們就基于之前的GPT2預(yù)訓(xùn)練模型，使用一個垃圾郵件數(shù)據(jù)集，來微調(diào)一個郵件分類模型。

1.垃圾郵件識別

傳統(tǒng)ML方法

當(dāng)然，也可以通過傳統(tǒng)的機(jī)器學(xué)習(xí)方法實現(xiàn)垃圾郵件分類，例如，貝葉斯分類，或者基于統(tǒng)計學(xué)，事先設(shè)定一些敏感詞匯，如果郵件中出現(xiàn)了這些敏感詞匯，就認(rèn)為是垃圾郵件。

Embedding

但傳統(tǒng)機(jī)器學(xué)習(xí)方法依賴人類經(jīng)驗，既然我們正在寫大模型的文章，就得入鄉(xiāng)隨俗。

我們通過Embedding實現(xiàn)文本分類，具體來說就是計算郵件內(nèi)容的Embedding，然后計算“spam”和“none spam”的Embedding，最后通過計算余弦相似度來判斷郵件類型。

從零實現(xiàn)大模型-GPT2任務(wù)微調(diào)-AI.x社區(qū)

指令微調(diào)模型

其實，還有比計算Embedding更簡單的方法，如果大模型已經(jīng)經(jīng)過預(yù)訓(xùn)練、指令微調(diào)以及RLHF過程，那么就可以直接利用這種指令跟隨能力來實現(xiàn)垃圾郵件分類。

例如，我們構(gòu)造下面的prompt輸入給chatGPT。

"Is the following text 'spam'? Answer with 'yes' or 'no':"
    " 'You are a winner you have been specially"
    " selected to receive $1000 cash or a $2000 award.'"

以下是GPT4-o給出的答案，不僅準(zhǔn)確識別出了垃圾郵件，還遵循了人類指令輸出了“yes”。

從零實現(xiàn)大模型-GPT2任務(wù)微調(diào)-AI.x社區(qū)

如果只使用預(yù)訓(xùn)練模型，沒有經(jīng)過指令微調(diào)，前面我們也測試過，模型雖然有輸出，但輸出只是簡單的拷貝輸入。

輸入：
Is the following text 'spam'? Answer with 'yes' or 'no': 'You are a winner you have been specially selected to receive $1000 cash or a $2000 award.'
輸出：
The following text 'spam'? Answer with 'yes' or 'no': 'You are a winner

2.任務(wù)微調(diào)

本文完整代碼如下，建議結(jié)合代碼閱讀文本。

https://github.com/AIDajiangtang/LLM-from-scratch/blob/main/GPT2_fine-tune_spam_classifier_from_scratch.ipynb

在通過Embedding實現(xiàn)文本分類時，Embedding是通過調(diào)用openAI的API得到的，其實，這個Embedding也可以看作是GPT模型輸出隱狀態(tài)的一部分。

除了用Embedding計算余弦相似度來實現(xiàn)文分類外，還可以基于隱狀態(tài)實現(xiàn)一個分類模型，也就是在模型的輸出端加一個分類頭。

從零實現(xiàn)大模型-GPT2任務(wù)微調(diào)-AI.x社區(qū)

準(zhǔn)備數(shù)據(jù)

訓(xùn)練數(shù)據(jù)來自公開的垃圾郵件數(shù)據(jù)集，包括文本和標(biāo)簽兩列，標(biāo)簽列中spam代表是垃圾郵件。

從零實現(xiàn)大模型-GPT2任務(wù)微調(diào)-AI.x社區(qū)

因為數(shù)據(jù)集中垃圾郵件數(shù)量少于正常郵件，所以要平衡正負(fù)樣本數(shù)量。

# Examine class distributions
print(df["Label"].value_counts())

Label
ham     4825
spam     747
Name: count, dtype: int64

def create_balanced_dataset(df):
    num_spam = df[df["Label"] == "spam"].shape[0]
    ham_subset = df[df["Label"] == "ham"].sample(num_spam, random_state=123)
    balanced_df = pd.concat([ham_subset, df[df["Label"] == "spam"]])
    return balanced_df


balanced_df = create_balanced_dataset(df)
print(balanced_df["Label"].value_counts())

Label
ham     747
spam    747
Name: count, dtype: int64

接下來劃分訓(xùn)練集，驗證機(jī)和測試集。

接下來是tokenization，padding或者截斷到最大長度。

最后構(gòu)造Dataloader。

加載預(yù)訓(xùn)練模型

加載gpt2預(yù)訓(xùn)練模型。

CHOOSE_MODEL = "gpt2-small (124M)"
INPUT_PROMPT = "Every effort moves"
BASE_CONFIG = {
    "vocab_size": 50257,     # Vocabulary size
    "context_length": 1024,  # Context length
    "drop_rate": 0.0,        # Dropout rate
    "qkv_bias": True         # Query-key-value bias
}
model_configs = {
    "gpt2-small (124M)": {"emb_dim": 768, "n_layers": 12, "n_heads": 12},
    "gpt2-medium (355M)": {"emb_dim": 1024, "n_layers": 24, "n_heads": 16},
    "gpt2-large (774M)": {"emb_dim": 1280, "n_layers": 36, "n_heads": 20},
    "gpt2-xl (1558M)": {"emb_dim": 1600, "n_layers": 48, "n_heads": 25},
}
BASE_CONFIG.update(model_configs[CHOOSE_MODEL])


assert train_dataset.max_length <= BASE_CONFIG["context_length"], (
    f"Dataset length {train_dataset.max_length} exceeds model's context "
    f"length {BASE_CONFIG['context_length']}. Reinitialize data sets with "
    f"`max_length={BASE_CONFIG['context_length']}`"
)

from gpt_download import download_and_load_gpt2


model_size = CHOOSE_MODEL.split(" ")[-1].lstrip("(").rstrip(")")
settings, params = download_and_load_gpt2(model_size=model_size, models_dir="gpt2")


model = GPTModel(BASE_CONFIG)
load_weights_into_gpt(model, params)
model.eval()

再微調(diào)過程中，可以凍結(jié)大部分預(yù)訓(xùn)練模型參數(shù)。

# Freeze all model layers first
for param in model.parameters():
  param.requires_grad = False

添加分類頭

在預(yù)訓(xùn)練模型的輸出端加一個二分類分類頭。

# Add a classification head
torch.manual_seed(123)
num_classes = 2
model.out_head = torch.nn.Linear(
    in_features=BASE_CONFIG["emb_dim"], # 768
    out_features=num_classes,           # 2 (spam or not spam)
)

構(gòu)造損失函數(shù)

因為是二分類，所以構(gòu)造一個交叉熵?fù)p失函數(shù)。

def calculate_loss_batch(input_batch, target_batch, model, device):
  input_batch, target_batch = input_batch.to(device), target_batch.to(device)
  logits = model(input_batch)[:, -1, :] # Grab logits of last output token only!
  loss = torch.nn.functional.cross_entropy(logits, target_batch)
  return loss

然后開始訓(xùn)練，訓(xùn)練過程與指令微調(diào)過程基本一致。

import time


start_time = time.time()
torch.manual_seed(123)


# Create optimizer
optimizer = torch.optim.AdamW(model.parameters(), lr=5e-5, weight_decay=0.1)


# Set training epochs
num_epochs = 5


# Train the model
train_losses, val_losses, train_accs, val_accs, examples_seen = train_classifier(
    model=model,
    train_loader=train_loader,
    val_loader=val_loader,
    optimizer=optimizer,
    device=device,
    num_epochs=num_epochs,
    eval_freq=50,
    eval_iter=5,
    tokenizer=tokenizer,
)


end_time = time.time()
execution_time_minutes = (end_time - start_time) / 60
print(f"Training completed in {execution_time_minutes:.2f} minutes.")

本文轉(zhuǎn)載自公眾號人工智能大講堂

原文鏈接：??https://mp.weixin.qq.com/s/n1h9JeCxV3Kq_yj0-_RS5A??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

今日arXiv最熱NLP大模型論文：Github萬星！北航發(fā)布零代碼大模型微調(diào)平臺LlamaFactory

pangguiyu ? 4305瀏覽 ? 0回復(fù)
奧特曼承認(rèn)了神秘gpt2！哈佛MIT巡演繼續(xù)，斯坦福演講完整版公開

Crystalcxt ? 2322瀏覽 ? 0回復(fù)
OpenAI神秘gpt2正在A/B測試，奧特曼搶先劇透，網(wǎng)友已玩嗨

Crystalcxt ? 2134瀏覽 ? 0回復(fù)
OpenAI模型終于更新！強(qiáng)大視聽能力的GPT-4o將面向所有用戶，其前身正是神秘的gpt2！

51CTO技術(shù)棧 ? 3246瀏覽 ? 0回復(fù)
LoRA數(shù)學(xué)編程任務(wù)不敵全量微調(diào) | 哥大&Databricks新研究

Crystalcxt ? 2560瀏覽 ? 0回復(fù)
The Annotated GPT2注釋加量版，讀懂代碼才算讀懂了GPT

魚蟲子 ? 3295瀏覽 ? 0回復(fù)
從零實現(xiàn)大模型-GPT2指令微調(diào)

魚蟲子 ? 3736瀏覽 ? 0回復(fù)
從零實現(xiàn)大模型-BERT微調(diào)

魚蟲子 ? 2913瀏覽 ? 0回復(fù)
從零實現(xiàn)大模型-RLHF：Reinforcement Learning from Human Feedback

魚蟲子 ? 4177瀏覽 ? 0回復(fù)
ICML 2024高分論文 | 零階優(yōu)化器微調(diào)大模型，大幅降低內(nèi)存

輕薄滴假象 ? 2684瀏覽 ? 0回復(fù)
從零實現(xiàn)大模型-GraphRAG，構(gòu)建LLM中的關(guān)系數(shù)據(jù)庫

魚蟲子 ? 2899瀏覽 ? 0回復(fù)
基于PyTorch從零實現(xiàn)視覺轉(zhuǎn)換器（ViT）?

51CTO內(nèi)容精選 ? 3537瀏覽 ? 0回復(fù)
LLM 合并新思路：進(jìn)化算法+零訓(xùn)練->新任務(wù)

amei2000go ? 2828瀏覽 ? 0回復(fù)
修改一行代碼就能實現(xiàn)高效微調(diào)！上海交大&騰訊開源SaRA：兼顧原始生成和下游任務(wù)

angel ? 2319瀏覽 ? 0回復(fù)
DB-GPT-Hub:text2sql的微調(diào)框架及基準(zhǔn)測試套件

大模型自然語言處理 ? 2504瀏覽 ? 0回復(fù)
使用 LlamaFactory 結(jié)合開源大語言模型實現(xiàn)文本分類：從數(shù)據(jù)集構(gòu)建到 LoRA 微調(diào)與推理評估

AI悠閑區(qū) ? 5690瀏覽 ? 0回復(fù)
基于 LlamaFactory 微調(diào)大模型的實體識別的評估實現(xiàn)

AI悠閑區(qū) ? 2123瀏覽 ? 0回復(fù)
從零開始微調(diào)Embedding模型：基于BERT的實戰(zhàn)教程

AI悠閑區(qū) ? 1004瀏覽 ? 0回復(fù)
從零到一構(gòu)建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解

PyTorch研習(xí)社 ? 1897瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

訓(xùn)練大模型時，顯存都哪去了？ 2024-11-19 12:41:34發(fā)布
生產(chǎn)環(huán)境測試模型的四種方法 2024-11-15 11:22:05發(fā)布

熱門推薦

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實戰(zhàn)教程 0回復(fù)

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復(fù)

2025年最值得關(guān)注的十大多模態(tài)大語言模型！ 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

從零到一構(gòu)建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解 0回復(fù)

上一篇：從零實現(xiàn)大模型-RLHF：Reinforcement Learning from Human Feedback

下一篇：從零實現(xiàn)大模型-GraphRAG，構(gòu)建LLM中的關(guān)系數(shù)據(jù)庫

社區(qū)精華內(nèi)容

目錄

<sub id="dzkwc"><p id="dzkwc"></p></sub>

<sub id="dzkwc"></sub>

<thead id="dzkwc"></thead>

<sub id="dzkwc"><rt id="dzkwc"></rt></sub>