自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="gyrzs"><s id="gyrzs"><li id="gyrzs"></li></s></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

Llama3.1系列模型正式開源，最大405B，閉源模型的統(tǒng)治時(shí)代將迎來結(jié)束？

發(fā)布于 2024-7-30 00:37

瀏覽

0收藏

Meta開源了Llama3.1系列模型，最大參數(shù)規(guī)模為405B，開源也是好起來了，榜單指標(biāo)直逼GPT4-o。

Llama3.1系列模型正式開源，最大405B，閉源模型的統(tǒng)治時(shí)代將迎來結(jié)束？-AI.x社區(qū)

開源追上閉源模型不再是夢(mèng)！Llama系列模型確實(shí)是開源界的頭部，真金白銀砸出來的就是不一樣。

不過現(xiàn)在大家也都知道，榜單效果和真實(shí)使用效果也不是完全正比的，后面看看對(duì)lmsys戰(zhàn)榜單，還有大家的實(shí)測(cè)效果吧！

HF: https://huggingface.co/collections/meta-llama/llama-31-669fc079a0c406a149a5738f

Llama3.1系列模型正式開源，最大405B，閉源模型的統(tǒng)治時(shí)代將迎來結(jié)束？-AI.x社區(qū)

Llama3.1系列模型細(xì)節(jié)

15T Tokens預(yù)訓(xùn)練；占比知識(shí)50、數(shù)學(xué)25、代碼17、語言8
8B、70B、405B的模型均采用GQA；
405B模型，有126層，詞表大小128256，隱藏層維度16384；8B和70B模型與llama3一樣就不介紹了；

Llama3.1系列模型正式開源，最大405B，閉源模型的統(tǒng)治時(shí)代將迎來結(jié)束？-AI.x社區(qū)

支持上下文長(zhǎng)度128k；
支持多語言，包括英語、法語、德語、印地語、意大利語、葡萄牙語、西班牙語和泰語；當(dāng)然其他語言也可以使用，只是沒有針對(duì)性進(jìn)行安全測(cè)試。
instruct模型微調(diào)使用了公開可用的指令數(shù)據(jù)集，以及超過2500萬的合成數(shù)據(jù)

Llama3.1系列模型正式開源，最大405B，閉源模型的統(tǒng)治時(shí)代將迎來結(jié)束？-AI.x社區(qū)

8B模型預(yù)訓(xùn)練用了146萬 GPU小時(shí)，70B模型預(yù)訓(xùn)練用了700萬 GPU小時(shí)，405B模型預(yù)訓(xùn)練用了3084萬 GPU小時(shí)；

Llama3.1系列模型正式開源，最大405B，閉源模型的統(tǒng)治時(shí)代將迎來結(jié)束？-AI.x社區(qū)

Llama3.1系列模型效果

Llama3.1系列的8B和70B模型的效果，普遍好于Llama3系列模型。尤其是Instruct模型提升較高，特別是通用、代碼、數(shù)學(xué)和工具使用四個(gè)方面，大幅提高；額外添加的合成數(shù)據(jù)，應(yīng)該是關(guān)鍵。

Llama3.1系列模型正式開源，最大405B，閉源模型的統(tǒng)治時(shí)代將迎來結(jié)束？-AI.x社區(qū)

Llama3.1系列模型正式開源，最大405B，閉源模型的統(tǒng)治時(shí)代將迎來結(jié)束？-AI.x社區(qū)

模型使用

Llama3-405B模型整體結(jié)構(gòu)沒有變化，所有直接transformers走起。

import transformers
import torch

model_id = "meta-llama/Meta-Llama-3.1-8B-Instruct"

pipeline = transformers.pipeline(
    "text-generation",
    model=model_id,
    model_kwargs={"torch_dtype": torch.bfloat16},
    device_map="auto",
)

messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]

outputs = pipeline(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])

當(dāng)然為了加速或者節(jié)省顯存，也可以vllm、ollama、llamacpp等框架來加載量化模型，這里就不詳細(xì)介紹了。

寫在最后

不過405B模型太大了，部署成本太高了，即使效果很棒，但有多少企業(yè)有資格玩一把呢？

個(gè)人玩家就更不用說了，光模型大小就820G，別說有沒有顯卡，也許都沒有820G磁盤空間下載都沒資格，太難了！

不過后面各大平臺(tái)（阿里、百度、SiliconFlow）應(yīng)該會(huì)有調(diào)用API，到時(shí)候體驗(yàn)效果也不費(fèi)事兒。

又有新工作可做了，應(yīng)該很快會(huì)有Chinese-Llama-3.1工作出來，沒資源的小伙伴，等就完事兒了。

最后，Qwen系列是不是也要加把勁了，都給我卷起來！?

本文轉(zhuǎn)載自 ??NLP工作站??，作者：劉聰NLP

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

拳打開源SOTA腳踢商業(yè)閉源的LI-DiT是怎樣煉成的？

angel ? 3155瀏覽 ? 0回復(fù)
最強(qiáng)模型Llama 3.1 405B正式發(fā)布，扎克伯格：開源引領(lǐng)新時(shí)代

輕薄滴假象 ? 2268瀏覽 ? 0回復(fù)
Meta 開源最強(qiáng)大模型Llama 3.1，參數(shù)多達(dá) 405B，超16000塊H100訓(xùn)練，燃燒數(shù)億經(jīng)費(fèi)！小扎：堅(jiān)定開源不動(dòng)搖！

51CTO技術(shù)棧 ? 3871瀏覽 ? 0回復(fù)
量化成為時(shí)代標(biāo)準(zhǔn)！AI大神賈揚(yáng)清銳評(píng)Llama3.1：很難盈利、成本巨高、速度卻馬馬虎虎

51CTO技術(shù)棧 ? 2503瀏覽 ? 0回復(fù)
最強(qiáng)大模型 Llama 3.1-405B 架構(gòu)設(shè)計(jì)剖析

玄姐聊AGI ? 2952瀏覽 ? 0回復(fù)
Meta正式發(fā)布Llama-3.1，超大杯405B！千呼萬喚始出來！

PaperAgent ? 3017瀏覽 ? 0回復(fù)
ViT篇外：NVIDIA Llama-3.1-Minitron 4B

魯班模錘1 ? 2369瀏覽 ? 0回復(fù)
阿里史上最大規(guī)模開源發(fā)布，超GPT-4o 、Llama-3.1！

Aceryt ? 2172瀏覽 ? 0回復(fù)
Qwen2.5：13個(gè)新模型來襲！開源通用、編碼、數(shù)學(xué)模型全解讀，72B超越Llama 405B - 本地安裝測(cè)試

老蛀蟲 ? 5083瀏覽 ? 0回復(fù)
Llama 3.1 405B，教你白嫖使用最強(qiáng)開源大模型

小虎哦哦 ? 2547瀏覽 ? 0回復(fù)
開源閉源爭(zhēng)論不休，淺談大模型開源和閉源

NLP工作站 ? 2121瀏覽 ? 0回復(fù)
AMD 開源 AMD OLMo：完全開源的 1B 語言模型系列

Halo咯咯 ? 2255瀏覽 ? 0回復(fù)
Qwen2.5：13個(gè)新模型來襲！開源通用、編碼、數(shù)學(xué)模型全解讀，72B超越Llama 405B - 本地安裝測(cè)試

老蛀蟲 ? 4202瀏覽 ? 0回復(fù)
從 Llama 1 到 3.1：Llama 模型架構(gòu)演進(jìn)詳解

Baihai_IDP ? 4134瀏覽 ? 0回復(fù)
開源最大AI視頻模型，130億參數(shù)，性能媲美閉源，擊敗Runway Gen-3、Luma 1.6

51CTO技術(shù)棧 ? 2338瀏覽 ? 0回復(fù)
Good Fire AI 針對(duì) Llama 3.1 8B 和 Llama 3.3 70B 的開源稀疏自動(dòng)編碼器 (SAE)

Halo咯咯 ? 1733瀏覽 ? 0回復(fù)
1B模型如何通過測(cè)試時(shí)優(yōu)化逆襲405B LLM？

arnoldzhw ? 1802瀏覽 ? 0回復(fù)
Open Deep Search：開源推理智能體實(shí)現(xiàn)深度搜索，打破閉源壟斷

十一月雨_55 ? 1504瀏覽 ? 0回復(fù)
NVIDIA開源Llama-3.1-Nemotron-Ultra-253B-v1，性能直逼DeepSeek

Halo咯咯 ? 1106瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Qwen3 一手肝帝實(shí)測(cè)！附示例，涉及推理、創(chuàng)作、數(shù)學(xué)和代碼！ 2025-05-07 06:53:37發(fā)布
LLM實(shí)戰(zhàn)系列 | 大模型的多Lora部署，將顯存節(jié)省到極致 2025-04-22 07:18:29發(fā)布

熱門推薦

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實(shí)戰(zhàn)教程 0回復(fù)

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復(fù)

2025年最值得關(guān)注的十大多模態(tài)大語言模型！ 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

從零到一構(gòu)建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解 0回復(fù)

上一篇：大模型微調(diào)技巧 | 高質(zhì)量指令數(shù)據(jù)篩選方法-MoDS

下一篇：一大堆Llama3.1-Chinese正在襲來

社區(qū)精華內(nèi)容

目錄

<strike id="2l0xi"></strike>