自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<p id="hdut4"></p>

<p id="hdut4"><track id="hdut4"></track></p>

<sub id="hdut4"><p id="hdut4"></p></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

Model2Vec：RAG 加速新引擎，模型瘦身15倍，速度提升500倍，最新emb benchmark

鴻煊的學(xué)習(xí)筆記

發(fā)布于 2025-2-4 18:12

瀏覽

0收藏

嵌入（Embedding）技術(shù)作為基石，廣泛應(yīng)用于自然語言處理（NLP）、搜索引擎、推薦系統(tǒng)等多個(gè)關(guān)鍵領(lǐng)域，發(fā)揮著不可或缺的作用。盡管嵌入技術(shù)歷經(jīng)持續(xù)發(fā)展并取得諸多顯著成果，但傳統(tǒng)嵌入方法始終受困于模型規(guī)模龐大、計(jì)算資源消耗嚴(yán)重、推理速度遲緩等難題，這些問題猶如枷鎖，限制了其進(jìn)一步的拓展與應(yīng)用。

在此背景下，Model2Vec 的全新嵌入技術(shù)為行業(yè)帶來了突破性的解決方案。它憑借創(chuàng)新性的設(shè)計(jì)，成功實(shí)現(xiàn)了嵌入模型規(guī)模縮小 15 倍、速度提升 500 倍（在CPU上）的驚人跨越，同時(shí)還能維持出色的性能表現(xiàn)，堪稱嵌入技術(shù)領(lǐng)域的一次重大飛躍。

Model2Vec：RAG 加速新引擎，模型瘦身15倍，速度提升500倍，最新emb benchmark-AI.x社區(qū)

1. Model2Vec：靜態(tài)嵌入的革新者

Model2Vec 是一種致力于提供高效、輕便且快速的靜態(tài)嵌入解決方案的創(chuàng)新模型，它與傳統(tǒng)的動(dòng)態(tài)嵌入模型（如 Sentence Transformers）存在本質(zhì)區(qū)別。傳統(tǒng)動(dòng)態(tài)嵌入模型在處理每一個(gè)句子時(shí)，都需要實(shí)時(shí)計(jì)算新的嵌入向量，這使得其在運(yùn)行過程中對計(jì)算資源有著極高的需求。而 Model2Vec 另辟蹊徑，采用靜態(tài)嵌入方式，提前對單詞或短語的嵌入向量進(jìn)行計(jì)算并存儲(chǔ)。這種預(yù)計(jì)算的方式避免了重復(fù)計(jì)算帶來的資源浪費(fèi)，大大提高了系統(tǒng)的整體運(yùn)行效率。

Model2Vec 的優(yōu)勢十分顯著。

從模型體積來看，在同等計(jì)算能力的前提下，它的嵌入模型相較于傳統(tǒng)模型縮小了 15 倍，這意味著可以節(jié)省大量的存儲(chǔ)空間，在資源有限的環(huán)境中也能輕松部署；
在速度方面，受益于預(yù)計(jì)算的靜態(tài)嵌入技術(shù)，其推理速度比傳統(tǒng)動(dòng)態(tài)嵌入模型快 500 倍，幾乎能夠?qū)崿F(xiàn)即時(shí)響應(yīng)，為用戶帶來更為流暢的體驗(yàn)；
此外，Model2Vec 無需進(jìn)行復(fù)雜的預(yù)索引操作，支持直接對文檔進(jìn)行向量搜索，這一特性極大地簡化了使用流程，降低了技術(shù)門檻。

2. 強(qiáng)大功能：重塑嵌入技術(shù)新格局

2.1 即時(shí)向量搜索

在處理大規(guī)模數(shù)據(jù)時(shí)，向量搜索的效率至關(guān)重要。Model2Vec 具備卓越的即時(shí)向量搜索能力，無論是面對數(shù)百萬文檔的海量數(shù)據(jù)集，還是復(fù)雜的搜索需求，它都能在秒級時(shí)間內(nèi)給出響應(yīng)，精準(zhǔn)地完成向量搜索任務(wù)，這一特性為許多依賴大規(guī)模數(shù)據(jù)檢索的應(yīng)用提供了強(qiáng)大支持。

2.2 模型壓縮與加速

Model2Vec 在模型壓縮和加速方面成績斐然。它成功將模型體積壓縮至原來的 1/15，同時(shí)實(shí)現(xiàn)了 500 倍的速度提升，且在這一過程中，性能幾乎沒有損失，依然保持著高精度和高效能，在保證結(jié)果準(zhǔn)確性的同時(shí)，顯著提高了運(yùn)行效率。

2.3 簡便易用的蒸餾

模型蒸餾是 Model2Vec 的又一亮點(diǎn)功能。通過簡單的操作，只需短短幾秒鐘，就能將復(fù)雜的 Sentence Transformers 模型轉(zhuǎn)化為靜態(tài)嵌入模型。這一過程無需大量的訓(xùn)練數(shù)據(jù)，也不需要繁瑣的配置，極大地簡化了開發(fā)者的工作流程，讓更多開發(fā)者能夠輕松利用這一技術(shù)。

2.4 豐富的預(yù)訓(xùn)練模型

為了進(jìn)一步降低開發(fā)成本，Model2Vec 在 HuggingFace 平臺(tái)上提供了一系列預(yù)訓(xùn)練的最先進(jìn)的靜態(tài)嵌入模型。開發(fā)者無需從頭開始進(jìn)行復(fù)雜的訓(xùn)練過程，可直接調(diào)用這些預(yù)訓(xùn)練模型，快速將其應(yīng)用于自己的項(xiàng)目中，有效節(jié)省了時(shí)間和資源。

3. Model2Vec 與 RAG：珠聯(lián)璧合的高效組合

在 RAG（Retrieval-Augmented Generation，檢索增強(qiáng)生成）模型中，檢索模塊是影響生成質(zhì)量和效率的核心環(huán)節(jié)。Model2Vec 通過優(yōu)化靜態(tài)嵌入技術(shù)，完美契合了 RAG 模型的需求，為其帶來了顯著的性能提升。

3.1 超高效的向量檢索

Model2Vec 強(qiáng)大的即時(shí)向量檢索能力，使其能夠?qū)?shù)百萬篇文檔進(jìn)行快速檢索，而且無需復(fù)雜的預(yù)索引過程。這種高效的檢索速度直接加快了 RAG 模型中檢索模塊的響應(yīng)速度，讓模型能夠更快地獲取相關(guān)信息，為后續(xù)的生成任務(wù)提供有力支持。

3.2 大幅度壓縮與加速

如前文所述，Model2Vec 將嵌入模型體積縮小 15 倍、速度提升 500 倍的特性，使得 RAG 模型在執(zhí)行過程中的計(jì)算開銷大幅降低。這一優(yōu)勢讓 RAG 模型在需要快速響應(yīng)的大規(guī)模應(yīng)用場景中表現(xiàn)更為出色，能夠更好地滿足用戶的需求。

3.3 與現(xiàn)有 RAG 架構(gòu)無縫集成

Model2Vec 具備良好的兼容性，可以輕松與像 LangChain 等常見的 RAG 工具集成。通過這種集成，開發(fā)者能夠優(yōu)化現(xiàn)有的 RAG 工作流，進(jìn)一步提升數(shù)據(jù)檢索和生成的速度，實(shí)現(xiàn)更高效的應(yīng)用開發(fā)。

4. 快速上手 Model2Vec

4.1 快速入門

對于想要嘗試 Model2Vec 的開發(fā)者來說，從 HuggingFace 中心加載其旗艦?zāi)Ｐ褪亲詈唵蔚娜腴T方式。這些模型已經(jīng)過預(yù)先訓(xùn)練，可直接投入使用。

安裝

pip install model2vec


# 安裝蒸餾附加功能
pip install model2vec[distill]

以下是加載模型并進(jìn)行嵌入操作的示例代碼：

from model2vec import StaticModel
# 從HuggingFace中心加載模型（這里以potion-base-8M模型為例）
model = StaticModel.from_pretrained("minishlab/potion-base-8M")
# 進(jìn)行嵌入操作
embeddings = model.encode(["It's dangerous to go alone!", "It's a secret to everybody."])
# 生成詞元嵌入序列
token_embeddings = model.encode_as_sequence(["It's dangerous to go alone!", "It's a secret to everybody."])

如果不想用官方提供的模型，可以采用下面的方法蒸餾自己的 Model2Vec 模型。蒸餾速度非?？欤?CPU 上只需要 30 秒。最重要的是，蒸餾不需要訓(xùn)練數(shù)據(jù)。

from model2vec.distill import distill


# Distill a Sentence Transformer model, in this case the BAAI/bge-base-en-v1.5 model
m2v_model = distill(model_name="BAAI/bge-base-en-v1.5", pca_dims=256)


# Save the model
m2v_model.save_pretrained("m2v_model")

4.2 推理

4.2.1 用預(yù)訓(xùn)練模型推理

from model2vec import StaticModel


# Load a model from the Hub. You can optionally pass a token when loading a private model
model = StaticModel.from_pretrained(model_name="minishlab/potion-base-8M", token=None)


# Make embeddings
embeddings = model.encode(["It's dangerous to go alone!", "It's a secret to everybody."])


# Make sequences of token embeddings
token_embeddings = model.encode_as_sequence(["It's dangerous to go alone!", "It's a secret to everybody."])

4.2.2 用Sentence Transformers庫推理

from sentence_transformers import SentenceTransformer
from sentence_transformers.models import StaticEmbedding


# Initialize a StaticEmbedding module
static_embedding = StaticEmbedding.from_model2vec("minishlab/potion-base-8M")
model = SentenceTransformer(modules=[static_embedding])
embeddings = model.encode(["It's dangerous to go alone!", "It's a secret to everybody."])

4.3 蒸餾

4.3.1 從Sentence Transformer模型蒸餾

from model2vec.distill import distill


# Distill a Sentence Transformer model
m2v_model = distill(model_name="BAAI/bge-base-en-v1.5", pca_dims=256)


# Save the model
m2v_model.save_pretrained("m2v_model")

4.3.2 從加載的模型蒸餾

from transformers import AutoModel, AutoTokenizer


from model2vec.distill import distill_from_model


# Assuming a loaded model and tokenizer
model_name = "baai/bge-base-en-v1.5"
model = AutoModel.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)


m2v_model = distill_from_model(model=model, tokenizer=tokenizer, pca_dims=256)


m2v_model.save_pretrained("m2v_model")

4.3.3 從Sentence Transformers庫蒸餾

from sentence_transformers import SentenceTransformer
from sentence_transformers.models import StaticEmbedding


static_embedding = StaticEmbedding.from_distillation("BAAI/bge-base-en-v1.5", device="cpu", pca_dims=256)
model = SentenceTransformer(modules=[static_embedding])
embeddings = model.encode(["It's dangerous to go alone!", "It's a secret to everybody."])

4.3.4 帶自定義詞典蒸餾

from model2vec.distill import distill


# Load a vocabulary as a list of strings
vocabulary = ["word1", "word2", "word3"]


# Distill a Sentence Transformer model with the custom vocabulary
m2v_model = distill(model_name="BAAI/bge-base-en-v1.5", vocabulary=vocabulary)


# Save the model
m2v_model.save_pretrained("m2v_model")


# Or push it to the hub
m2v_model.push_to_hub("my_organization/my_model", token="<it's a secret to everybody>")

默認(rèn)情況下，這將使用子詞分詞器來蒸餾模型，把模型（子詞）的詞匯表和新詞匯表合并起來。如果你希望得到一個(gè)詞級分詞器（僅包含傳入的詞匯表），可以將use_subword參數(shù)設(shè)置為False，例如：

m2v_model = distill(model_name=model_name, vocabulary=vocabulary, use_subword=False)

4.4 評估

安裝

pip install git+https://github.com/MinishLab/evaluation.git@main

下面的代碼片段展示了如何評估一個(gè) Model2Vec 模型：

from model2vec import StaticModel


from evaluation import CustomMTEB, get_tasks, parse_mteb_results, make_leaderboard, summarize_results
from mteb import ModelMeta


# Get all available tasks
tasks = get_tasks()
# Define the CustomMTEB object with the specified tasks
evaluation = CustomMTEB(tasks=tasks)


# Load the model
model_name = "m2v_model"
model = StaticModel.from_pretrained(model_name)


# Optionally, add model metadata in MTEB format
model.mteb_model_meta = ModelMeta(
            name=model_name, revision="no_revision_available", release_date=None, languages=None
        )


# Run the evaluation
results = evaluation.run(model, eval_splits=["test"], output_folder=f"results")


# Parse the results and summarize them
parsed_results = parse_mteb_results(mteb_results=results, model_name=model_name)
task_scores = summarize_results(parsed_results)


# Print the results in a leaderboard format
print(make_leaderboard(task_scores))

4.5 集成

4.5.1 與Sentence Transformers集成

Model2Vec 可以通過StaticEmbedding模塊直接在 Sentence Transformers 中使用。

以下代碼片段展示了如何將 Model2Vec 模型加載到 Sentence Transformer 模型中：

from sentence_transformers import SentenceTransformer
from sentence_transformers.models import StaticEmbedding


# Initialize a StaticEmbedding module
static_embedding = StaticEmbedding.from_model2vec("minishlab/potion-base-8M")
model = SentenceTransformer(modules=[static_embedding])
embeddings = model.encode(["It's dangerous to go alone!", "It's a secret to everybody."])

以下代碼片段展示了如何將模型直接蒸餾為 Sentence Transformer 模型：

from sentence_transformers import SentenceTransformer
from sentence_transformers.models import StaticEmbedding


static_embedding = StaticEmbedding.from_distillation("BAAI/bge-base-en-v1.5", device="cpu", pca_dims=256)
model = SentenceTransformer(modules=[static_embedding])
embeddings = model.encode(["It's dangerous to go alone!", "It's a secret to everybody."])

4.5.2 與LangChain集成

Model2Vec 可以通過langchain-community包在 LangChain 中使用。在使用pip install langchain-community安裝langchain-community包后，以下代碼片段展示了如何在 LangChain 中使用 Model2Vec：

from langchain_community.embeddings import Model2vecEmbeddings
from langchain_community.vectorstores import FAISS
from langchain.schema import Document


# Initialize a Model2Vec embedder
embedder = Model2vecEmbeddings("minishlab/potion-base-8M")


# Create some example texts
texts = [
    "Enduring Stew",
    "Hearty Elixir",
    "Mighty Mushroom Risotto",
    "Spicy Meat Skewer",
    "Fruit Salad",
]


# Embed the texts
embeddings = embedder.embed_documents(texts)


# Or, create a vector store and query it
documents = [Document(page_content=text) for text in texts]
vector_store = FAISS.from_documents(documents, embedder)
query = "Risotto"
query_vector = embedder.embed_query(query)
retrieved_docs = vector_store.similarity_search_by_vector(query_vector, k=1)

4.5.3 與Txtai集成

Model2Vec 可在 txtai 中用于文本嵌入、最近鄰搜索，以及 txtai 提供的任何其他功能。在使用pip install txtai[vectors]安裝 txtai 包（包括向量相關(guān)依賴項(xiàng)）后，以下代碼片段展示了如何在 txtai 中使用 Model2Vec：

from txtai import Embeddings


# Load a model2vec model
embeddings = Embeddings(path="minishlab/potion-base-8M", method="model2vec", backend="numpy")


# Create some example texts
texts = ["Enduring Stew", "Hearty Elixir", "Mighty Mushroom Risotto", "Spicy Meat Skewer", "Chilly Fruit Salad"]


# Create embeddings for downstream tasks
vectors = embeddings.batchtransform(texts)


# Or create a nearest-neighbors index and search it
embeddings.index(texts)
result = embeddings.search("Risotto", 1)

4.5.4 與 Transformers.js 集成

要在 transformers.js 中使用 Model2Vec 模型，可將以下代碼片段作為起點(diǎn)：

import { AutoModel, AutoTokenizer, Tensor } from '@huggingface/transformers';


const modelName = 'minishlab/potion-base-8M';


const modelConfig = {
    config: { model_type: 'model2vec' },
    dtype: 'fp32',
    revision: 'refs/pr/1'
};
const tokenizerConfig = {
    revision: 'refs/pr/2'
};


const model = await AutoModel.from_pretrained(modelName, modelConfig);
const tokenizer = await AutoTokenizer.from_pretrained(modelName, tokenizerConfig);


const texts = ['hello', 'hello world'];
const { input_ids } = await tokenizer(texts, { add_special_tokens: false, return_tensor: false });


const cumsum = arr => arr.reduce((acc, num, i) => [...acc, num + (acc[i - 1] || 0)], []);
const offsets = [0, ...cumsum(input_ids.slice(0, -1).map(x => x.length))];


const flattened_input_ids = input_ids.flat();
const modelInputs = {
    input_ids: new Tensor('int64', flattened_input_ids, [flattened_input_ids.length]),
    offsets: new Tensor('int64', offsets, [offsets.length])
};


const { embeddings } = await model(modelInputs);
console.log(embeddings.tolist()); // output matches python version

本文轉(zhuǎn)載自??鴻煊的學(xué)習(xí)筆記??，作者：乘風(fēng)破浪jxj ?

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

一次預(yù)測多個(gè)token，Meta新模型推理加速3倍，編程任務(wù)提高17%

Crystalcxt ? 2457瀏覽 ? 0回復(fù)
TFB：2024最新時(shí)間序列預(yù)測Benchmark

海因斯DK ? 6430瀏覽 ? 0回復(fù)
3倍生成速度還降內(nèi)存成本，超越Medusa2的高效解碼框架終于來了

輕薄滴假象 ? 2125瀏覽 ? 0回復(fù)
10倍速度突破質(zhì)量瓶頸，效果超越Gen-2和Pika！T2V-Turbo：新一代視頻生成模型

angel ? 3272瀏覽 ? 0回復(fù)
史上首個(gè)實(shí)時(shí)AI視頻生成技術(shù)：DiT通用，速度提升10.6倍

輕薄滴假象 ? 3085瀏覽 ? 0回復(fù)
Excp & FastPersist：數(shù)十倍 LLM Checkpoint 保存加速和壓縮

amei2000go ? 5452瀏覽 ? 0回復(fù)
長視頻生成速度提升100倍！新加坡國立提出Video-Infinity：分布式長視頻生成

angel ? 2915瀏覽 ? 0回復(fù)
提升5.69倍，高效RAG上下文壓縮方法COCOM

Aceryt ? 2237瀏覽 ? 0回復(fù)
谷歌發(fā)布大模型數(shù)據(jù)篩選方法：效率提升13倍，算力降低10倍

Aceryt ? 2379瀏覽 ? 0回復(fù)
英偉達(dá)開源新大模型：訓(xùn)練數(shù)據(jù)減少40倍，算力節(jié)省1.8倍

Aceryt ? 2875瀏覽 ? 0回復(fù)
OpenAI上新sCM！生成速度提升50倍，Scaling Law 再創(chuàng)奇跡：兩步采樣就出圖，實(shí)時(shí)視頻時(shí)代或?qū)㈤_啟！

51CTO技術(shù)棧 ? 1912瀏覽 ? 0回復(fù)
Meta AI發(fā)布全新量化版本Llama 3.2（1B & 3B）：推理速度提升2-4倍，模型大小減少56%

Halo咯咯 ? 2370瀏覽 ? 0回復(fù)
清華大學(xué)提出1-Bit FQT：將全量化訓(xùn)練極限推到極致,訓(xùn)練速度提升5倍！

AI論文解讀 ? 2414瀏覽 ? 0回復(fù)
Unsloth揭秘：如何將模型微調(diào)效率提升2-5倍

穿越時(shí)空111 ? 8096瀏覽 ? 0回復(fù)
15種典型RAG框架：卡內(nèi)基梅隆大學(xué)最新RAG綜述

大語言模型論文跟蹤 ? 5692瀏覽 ? 0回復(fù)
谷歌AI發(fā)布Gemini 2.0 Flash：比Gemini 1.5 Pro快2倍的新AI模型

Halo咯咯 ? 5805瀏覽 ? 0回復(fù)
1.8秒完成90幀視頻重建，相比加速1000 倍!顏水成團(tuán)隊(duì)提出NutWorld:渲染速度可達(dá)450FPS

angel ? 2130瀏覽 ? 0回復(fù)
使用Unsloth微調(diào)與運(yùn)行Gemma 3，速度提升1.6倍，VRAM使用減少60%

sbf_2000 ? 2538瀏覽 ? 0回復(fù)
45倍加速+最新SOTA！VAE與擴(kuò)散模型迎來端到端聯(lián)合訓(xùn)練：REPA-E讓VAE自我進(jìn)化！

angel ? 975瀏覽 ? 0回復(fù)

鴻煊的學(xué)習(xí)筆記

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

LLM - Reasoner：讓 LLM 像 DeepSeek R1 一樣思考更深入 7天前發(fā)布
一文讀遍 LoRA 家族：大語言模型高效訓(xùn)練的"秘密武器" 2025-04-27 00:35:57發(fā)布

熱門推薦

一文讀遍 LoRA 家族：大語言模型高效訓(xùn)練的"秘密武器" 0回復(fù)

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實(shí)戰(zhàn)教程 0回復(fù)

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復(fù)

2025年最值得關(guān)注的十大多模態(tài)大語言模型！ 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：清華&人大：search-o1 讓推理模型具有主動(dòng)能力

下一篇： 7G顯存，訓(xùn)練自己的 DeepSeek-R1：GRPO 資源下降80%

社區(qū)精華內(nèi)容

目錄