自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大模型再現(xiàn)黑馬!英偉達(dá)開源Llama-Nemotron系列模型,效果優(yōu)于DeepSeek-R1

人工智能 新聞
NVIDIA NeMo 框架是一個(gè)可擴(kuò)展的云原生生成式 AI 框架,專為從事大型語言模型 (LLM)、多模態(tài)模型 (MM)、自動(dòng)語音識(shí)別 (ASR)、文本轉(zhuǎn)語音 (TTS ) 和計(jì)算機(jī)視覺 (CV) 領(lǐng)域的研究人員和 PyTorch 開發(fā)者打造。

近日,英偉達(dá)推出了 Llama-Nemotron 系列模型(基于 Meta AI 的 Llama 模型構(gòu)建)—— 一個(gè)面向高效推理的大模型開放家族,具備卓越的推理能力、推理效率,并采用對(duì)企業(yè)友好的開放許可方式。

圖片

該系列包括三個(gè)模型規(guī)模:Nano(8B)、Super(49B)與 Ultra(253B),另有獨(dú)立變體 UltraLong(8B,支持超長(zhǎng)上下文)。這些模型不僅具備超強(qiáng)的推理能力,還為企業(yè)使用提供開放許可。模型權(quán)重和部分訓(xùn)練數(shù)據(jù)在 Hugging Face 上公開,遵循 NVIDIA Open Model License 和 Llama 社區(qū)許可,可商業(yè)使用。

圖片截至 2025 年 4 月,根據(jù)人工智能分析,我們的旗艦型號(hào) LN-Ultra 是最“智能”的開放式型號(hào)。

相關(guān)鏈接

  • 論文:https://arxiv.org/pdf/2505.00949
  • 代碼:https://github.com/NVIDIA/NeMo
  • 數(shù)據(jù)集:https://huggingface.co/datasets/nvidia/Llama-Nemotron-Post-Training-Dataset
  • 模型:https://huggingface.co/models?library=nemo&sort=downloads&search=nvidia

NeMo介紹

NVIDIA NeMo 框架是一個(gè)可擴(kuò)展的云原生生成式 AI 框架,專為從事大型語言模型 (LLM)、多模態(tài)模型 (MM)、自動(dòng)語音識(shí)別 (ASR)、文本轉(zhuǎn)語音 (TTS) 和計(jì)算機(jī)視覺 (CV) 領(lǐng)域的研究人員和 PyTorch 開發(fā)者打造。它旨在幫助您利用現(xiàn)有代碼和預(yù)訓(xùn)練的模型檢查點(diǎn),高效地創(chuàng)建、定制和部署新的生成式 AI 模型。

NeMo 2.0 的新功能

  • NVIDIA NeMo 2.0 與其前身 NeMo 1.0 相比引入了幾項(xiàng)重大改進(jìn),增強(qiáng)了靈活性、性能和可擴(kuò)展性。
  • 基于 Python 的配置- NeMo 2.0 從 YAML 文件轉(zhuǎn)換為基于 Python 的配置,從而提供更高的靈活性和控制力。這種轉(zhuǎn)變使得以編程方式擴(kuò)展和自定義配置變得更加容易。
  • 模塊化抽象——通過采用 PyTorch Lightning 的模塊化抽象,NeMo 2.0 簡(jiǎn)化了適配和實(shí)驗(yàn)。這種模塊化方法使開發(fā)人員能夠更輕松地修改和實(shí)驗(yàn)其模型的不同組件。
  • 可擴(kuò)展性——NeMo 2.0 使用NeMo-Run在數(shù)千個(gè) GPU 上無縫擴(kuò)展大規(guī)模實(shí)驗(yàn),NeMo-Run 是一種強(qiáng)大的工具,旨在簡(jiǎn)化跨計(jì)算環(huán)境的機(jī)器學(xué)習(xí)實(shí)驗(yàn)的配置、執(zhí)行和管理。

總的來說,這些增強(qiáng)功能使 NeMo 2.0 成為一個(gè)強(qiáng)大、可擴(kuò)展且用戶友好的 AI 模型開發(fā)框架。NeMo 2.0 目前由 LLM(大型語言模型)和 VLM(視覺語言模型)集合支持。

定性評(píng)估

LN-Ultra 在廣泛的推理和非推理基準(zhǔn)測(cè)試中,在開放模型中表現(xiàn)出色。LN-Ultra 在廣泛的推理和非推理基準(zhǔn)測(cè)試中,在開放模型中表現(xiàn)出色。圖片

責(zé)任編輯:張燕妮 來源: AIGC Studio
相關(guān)推薦

2025-05-07 10:12:52

英偉達(dá)模型AI

2024-06-17 08:55:00

2025-02-03 14:17:27

2025-03-19 10:10:43

2025-03-05 03:00:00

DeepSeek大模型調(diào)優(yōu)

2025-04-16 08:50:00

模型AI數(shù)據(jù)

2025-03-13 08:13:47

DeepSeekMLLMVision-R1

2025-02-13 08:51:23

DeepSeek大模型

2025-02-06 10:18:45

2024-10-17 14:05:34

2025-02-12 12:45:59

2024-06-19 13:02:01

2025-02-19 08:00:00

2025-04-09 10:40:32

2025-02-13 01:00:00

2025-03-27 10:28:32

2025-04-07 09:45:00

2025-02-17 10:40:00

DeepSeek模型AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)