自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="ural6"><s id="ural6"><li id="ural6"></li></s></sub>

^{<blockquote id="ural6"></blockquote>}

<legend id="ural6"></legend>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專(zhuān)業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

Voyage AI 推出 voyage-code-3：專(zhuān)為代碼檢索而優(yōu)化的全新下一代嵌入模型原創(chuàng) 精華

發(fā)布于 2024-12-25 13:36

瀏覽

0收藏

01、概述

在AI技術(shù)不斷發(fā)展的今天，代碼檢索這一領(lǐng)域迎來(lái)了新的突破。由Voyage AI團(tuán)隊(duì)推出的Voyage-code-3，作為一款專(zhuān)為代碼檢索任務(wù)設(shè)計(jì)的嵌入模型，不僅表現(xiàn)卓越，還大幅超越了當(dāng)前的行業(yè)標(biāo)桿，如OpenAI-v3-large和CodeSage-large。這一進(jìn)展不僅重新定義了代碼檢索技術(shù)的潛力，也為廣大開(kāi)發(fā)者帶來(lái)了全新的解決方案。

Voyage-code-3的亮眼表現(xiàn)

在代碼檢索任務(wù)中，Voyage-code-3無(wú)疑是一個(gè)耀眼的明星。研究顯示，這款模型在238個(gè)代碼檢索數(shù)據(jù)集上的測(cè)試中，平均性能相比OpenAI-v3-large和CodeSage-large分別提高了13.80%和16.81%，在多個(gè)維度上實(shí)現(xiàn)了技術(shù)飛躍。

不僅如此，它在多種存儲(chǔ)成本場(chǎng)景中也展示了卓越的表現(xiàn)。例如，在僅使用原始存儲(chǔ)成本三分之一的情況下，Voyage-code-3的性能仍比對(duì)手高出13.80%，凸顯其在高效性和性能之間的完美平衡。

Voyage AI 推出 voyage-code-3：專(zhuān)為代碼檢索而優(yōu)化的全新下一代嵌入模型-AI.x社區(qū)

02、技術(shù)創(chuàng)新：從模型架構(gòu)到存儲(chǔ)優(yōu)化

Voyage-code-3的強(qiáng)大之處不僅體現(xiàn)在檢索性能上，還融入了多項(xiàng)技術(shù)創(chuàng)新，特別是在向量搜索的計(jì)算挑戰(zhàn)和大規(guī)模代碼庫(kù)管理方面。

1） Matryoshka嵌入技術(shù)

Matryoshka嵌入是一種獨(dú)特的分層嵌入技術(shù)，可以動(dòng)態(tài)調(diào)整嵌入維度，從而更高效地適配不同的檢索需求。這不僅降低了存儲(chǔ)和搜索成本，也使模型在應(yīng)對(duì)大型代碼庫(kù)時(shí)更加靈活。

2）先進(jìn)的量化技術(shù)

為了應(yīng)對(duì)存儲(chǔ)成本的挑戰(zhàn)，Voyage-code-3引入了二值化和int8量化技術(shù)。這些技術(shù)顯著減少了嵌入的存儲(chǔ)占用，同時(shí)保持了高質(zhì)量的檢索能力。例如，在256維度二值化嵌入下，模型依舊能夠比3072維浮點(diǎn)嵌入的性能高出4.81%。

3）二值重評(píng)分技術(shù)

在標(biāo)準(zhǔn)二值檢索的基礎(chǔ)上，Voyage-code-3通過(guò)二值重評(píng)分技術(shù)進(jìn)一步提升檢索精度。這一改進(jìn)使得在處理復(fù)雜代碼查詢(xún)時(shí)，模型的表現(xiàn)更加穩(wěn)定和可靠。

03、為什么代碼檢索如此復(fù)雜？

代碼檢索不僅僅是“搜索”，它遠(yuǎn)比傳統(tǒng)的文本檢索復(fù)雜。編程語(yǔ)言具有獨(dú)特的語(yǔ)法結(jié)構(gòu)和邏輯關(guān)系，這使得簡(jiǎn)單的關(guān)鍵詞匹配難以勝任實(shí)際需求。代碼檢索通常包含以下幾種類(lèi)型的任務(wù)：

文本到代碼檢索：從自然語(yǔ)言描述中找到相應(yīng)的代碼。
代碼到代碼檢索：尋找相似的代碼段。
文檔字符串到代碼檢索：通過(guò)代碼的文檔描述定位具體實(shí)現(xiàn)。

每種任務(wù)都需要對(duì)代碼的語(yǔ)義、上下文以及邏輯結(jié)構(gòu)進(jìn)行深入理解，而Voyage-code-3正是為了解決這些復(fù)雜挑戰(zhàn)而設(shè)計(jì)的。

04、嚴(yán)謹(jǐn)?shù)男阅茉u(píng)估：重新定義基準(zhǔn)測(cè)試

Voyage-code-3的研發(fā)團(tuán)隊(duì)不僅著眼于技術(shù)本身，還對(duì)模型的評(píng)估方法進(jìn)行了全新設(shè)計(jì)。他們開(kāi)發(fā)了一套更全面的評(píng)估框架，克服了傳統(tǒng)方法的局限性，包括：

數(shù)據(jù)清洗：消除數(shù)據(jù)集中常見(jiàn)的噪聲和標(biāo)簽錯(cuò)誤，確保評(píng)估結(jié)果的準(zhǔn)確性。
多樣化任務(wù)覆蓋：從文本到代碼、代碼到代碼等多個(gè)任務(wù)維度對(duì)模型性能進(jìn)行綜合評(píng)估。
數(shù)據(jù)集優(yōu)化：通過(guò)重新利用問(wèn)答數(shù)據(jù)集，拓展了評(píng)估的廣度和深度，更全面地展現(xiàn)了模型的能力。

通過(guò)這些改進(jìn)，Voyage-code-3的評(píng)估結(jié)果不僅更具說(shuō)服力，也為整個(gè)行業(yè)的代碼檢索基準(zhǔn)設(shè)立了新標(biāo)準(zhǔn)。

Voyage AI 推出 voyage-code-3：專(zhuān)為代碼檢索而優(yōu)化的全新下一代嵌入模型-AI.x社區(qū)

Voyage AI 推出 voyage-code-3：專(zhuān)為代碼檢索而優(yōu)化的全新下一代嵌入模型-AI.x社區(qū)

Voyage AI 推出 voyage-code-3：專(zhuān)為代碼檢索而優(yōu)化的全新下一代嵌入模型-AI.x社區(qū)

05、Voyage-code-3的實(shí)際應(yīng)用場(chǎng)景

1. 開(kāi)發(fā)者工具優(yōu)化

對(duì)于開(kāi)發(fā)者來(lái)說(shuō)，快速找到相關(guān)代碼片段可以大幅提高工作效率。Voyage-code-3的高效檢索功能讓復(fù)雜代碼庫(kù)中的查詢(xún)變得更加便捷，尤其適用于IDE集成和智能助手等場(chǎng)景。

2. 企業(yè)代碼管理

對(duì)于企業(yè)而言，管理海量代碼庫(kù)是一項(xiàng)艱巨的任務(wù)。Voyage-code-3能夠支持大規(guī)模的代碼檢索需求，幫助團(tuán)隊(duì)快速定位、復(fù)用和優(yōu)化代碼資源。

3. 教育與研究

在編程教育領(lǐng)域，Voyage-code-3可以幫助學(xué)生快速理解代碼邏輯，從海量資源中提取學(xué)習(xí)材料；在研究領(lǐng)域，它還能為學(xué)術(shù)探索提供高效的代碼檢索工具。

06、Voyage-code-3的意義與未來(lái)展望

Voyage-code-3的問(wèn)世，不僅是一項(xiàng)技術(shù)突破，更代表了代碼檢索領(lǐng)域的未來(lái)趨勢(shì)。這款模型通過(guò)靈活的設(shè)計(jì)、卓越的性能和高效的存儲(chǔ)優(yōu)化，為開(kāi)發(fā)者和企業(yè)提供了強(qiáng)有力的支持。

然而，隨著AI技術(shù)的不斷普及，我們也需要對(duì)其潛在影響保持警惕。例如，如何確保代碼檢索結(jié)果的可靠性和安全性？如何防止技術(shù)被濫用？這些問(wèn)題需要行業(yè)共同探討和解決。

Voyage AI團(tuán)隊(duì)的努力無(wú)疑為代碼檢索領(lǐng)域樹(shù)立了新的標(biāo)桿，而Voyage-code-3也將推動(dòng)這一領(lǐng)域朝著更高效、更智能的方向發(fā)展。

參考：

??https://blog.voyageai.com/2024/12/04/voyage-code-3/??

本文轉(zhuǎn)載自公眾號(hào)Halo咯咯作者：基咯咯

原文鏈接：??https://mp.weixin.qq.com/s/OXGdbR-rS0zxnjuNJaqwPQ??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

大語(yǔ)言模型

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

今日arXiv最熱NLP大模型論文：微軟重磅：AgentAI，下一代人工智能的關(guān)鍵

pangguiyu ? 4825瀏覽 ? 0回復(fù)
ICLR 2024 | 脈沖神經(jīng)網(wǎng)絡(luò)的meta架構(gòu)設(shè)計(jì)：?jiǎn)l(fā)下一代神經(jīng)形態(tài)芯片設(shè)計(jì)

laokugonggao ? 3006瀏覽 ? 0回復(fù)
集體出走的Stability AI 發(fā)布全新代碼大模型，3B以下性能最優(yōu)，超越Code Llama和DeepSeek-Coder

pangguiyu ? 4323瀏覽 ? 0回復(fù)
閉環(huán)的生成式AI：將LLM和GPT集成到下一代網(wǎng)絡(luò)中

xuxiangda ? 3739瀏覽 ? 0回復(fù)
閉環(huán)的生成式AI：將LLM和GPT集成到下一代網(wǎng)絡(luò)中

xuxiangda ? 2698瀏覽 ? 0回復(fù)
扎克伯格的下一代產(chǎn)品：Llama4、社交推薦以及“去TMD”的讓人爆粗的封閉平臺(tái)

51CTO技術(shù)棧 ? 2565瀏覽 ? 0回復(fù)
蜘蛛俠妖嬈起舞，下一代ControlNet來(lái)了！賈佳亞團(tuán)隊(duì)推出，即插即用，還能控制視頻生成

Crystalcxt ? 1966瀏覽 ? 0回復(fù)
下一代RAG：MemoRAG

PaperAgent ? 2818瀏覽 ? 0回復(fù)
使用人工智能增強(qiáng) IaC以提高下一代基礎(chǔ)設(shè)施的效率

51CTO內(nèi)容精選 ? 1960瀏覽 ? 0回復(fù)
優(yōu)化文本嵌入，大幅提升RAG檢索速度

小虎哦哦 ? 3858瀏覽 ? 0回復(fù)
微軟內(nèi)部工程師突爆料：OpenAI下一代模型11月即將上架，今天離職的AGI顧問(wèn)：今天Lastday

51CTO技術(shù)棧 ? 1767瀏覽 ? 0回復(fù)
人類(lèi)如何培養(yǎng)出下一代聰明且安全的AI技術(shù)

51CTO技術(shù)棧 ? 2233瀏覽 ? 0回復(fù)
OpenAI內(nèi)部員工爆料下一代模型Orion性能堪憂(yōu)

51CTO技術(shù)棧 ? 2029瀏覽 ? 0回復(fù)
為什么多模態(tài)AI是下一個(gè)風(fēng)口？深度解讀新一代LLM

芝士AI吃魚(yú) ? 4516瀏覽 ? 0回復(fù)
Hume AI 推出 OCTAVE：下一代語(yǔ)音語(yǔ)言模型，具有動(dòng)態(tài)語(yǔ)音和個(gè)性創(chuàng)建等新的新興功能

Halo咯咯 ? 1759瀏覽 ? 0回復(fù)
神秘“Seed Edge”項(xiàng)目被曝光，已設(shè)置5大研究方向，探索下一代AI技術(shù)，算力不用愁！

51CTO技術(shù)棧 ? 2016瀏覽 ? 0回復(fù)
Manus 架構(gòu)設(shè)計(jì)揭秘：解構(gòu)下一代 AI Agent 多智能體架構(gòu)

玄姐聊AGI ? 3205瀏覽 ? 0回復(fù)
大語(yǔ)言模型（LLM）是如何思考的？講講推動(dòng)下一代人工智能推理的五種途徑

51CTO內(nèi)容精選 ? 1027瀏覽 ? 0回復(fù)
MCP：AI世界的萬(wàn)能連接器，專(zhuān)家都在關(guān)注的下一代標(biāo)準(zhǔn)

云中江樹(shù) ? 624瀏覽 ? 0回復(fù)

這個(gè)用戶(hù)很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

RAG與MCP：LLMs的“左右手”，誰(shuí)才是你的菜？ 20h前發(fā)布
Rime 開(kāi)源新工具！Arcana 和 Rimecaster 讓語(yǔ)音 AI 更懂“人話(huà)” 20h前發(fā)布

熱門(mén)推薦

2025年最值得關(guān)注的十大多模態(tài)大語(yǔ)言模型！ 0回復(fù)

GPT-4.1系列深度解析：從代碼到動(dòng)畫(huà)，從理論到實(shí)戰(zhàn)，AI的多面手來(lái)了！ 0回復(fù)

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實(shí)戰(zhàn)教程 0回復(fù)

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專(zhuān)屬極速開(kāi)源爬蟲(chóng)神器 0回復(fù)

上一篇：字節(jié)跳動(dòng)AI研究院發(fā)布FullStack Bench和SandboxFusion：用于評(píng)估真實(shí)編程場(chǎng)景中LLM的綜合基準(zhǔn)測(cè)試工具

下一篇： Infinigence AI 發(fā)布 Megrez-3B-Omni：3B 設(shè)備上開(kāi)源多模態(tài)大語(yǔ)言模型 MLLM

社區(qū)精華內(nèi)容

目錄