MCP:AI 時代的工具接口標(biāo)準(zhǔn)?
1.前言
自從 OpenAI 在 2023 年推出函數(shù)調(diào)用(Function Calling),我一直思考,咋能真正解鎖 AI Agent與工具的生態(tài)系統(tǒng)。隨基礎(chǔ)模型越來越智能,AI Agent與外部工具、數(shù)據(jù)和 API 的交互方式卻變得越來越碎片化——開發(fā)者需針對每一個系統(tǒng)單獨編寫業(yè)務(wù)邏輯,讓Agent能夠適配不同環(huán)境。
2.標(biāo)準(zhǔn)化
顯然,我們需要一個標(biāo)準(zhǔn)化的接口來執(zhí)行任務(wù)、獲取數(shù)據(jù)并調(diào)用工具。在互聯(lián)網(wǎng)時代,API 讓不同軟件之間可以相互通信,成為了軟件的通用語言。但對 AI 模型,目前還缺這樣的標(biāo)準(zhǔn)。
2024 年 11 月,**模型上下文協(xié)議(Model Context Protocol,MCP)**發(fā)布,迅速引起關(guān)注,被認(rèn)為可能成為這一問題的解決方案。本文探討:
- MCP 是什么?
- 它如何改變 AI 與工具的交互方式?
- 開發(fā)者已經(jīng)用 MCP 構(gòu)建了哪些應(yīng)用?
- MCP 仍然面臨哪些挑戰(zhàn)?
3.什么是 MCP
MCP 是一種開放協(xié)議,旨在讓不同系統(tǒng)能夠為 AI 模型提供可泛化的上下文信息。它規(guī)定了AI Agent如何調(diào)用外部工具、獲取數(shù)據(jù),并與服務(wù)交互。
Resend MCP 服務(wù)器可以同時與多個 MCP 客戶端交互,使其具備郵件發(fā)送能力。MCP 靈感源于語言服務(wù)器協(xié)議(LSP,Language Server Protocol)。在 LSP 中,當(dāng)用戶在代碼編輯器中輸入時,客戶端會向語言服務(wù)器請求自動補(bǔ)全建議或代碼診斷。
MCP進(jìn)一步拓展,采用面向 AI Agent的執(zhí)行模式:
- LSP 主要是被動的,只會在 IDE 發(fā)請求時提供反饋
- MCP 則支持 AI Agent自主決策,可以基于上下文信息選擇合適的工具,并決定調(diào)用順序,實現(xiàn)復(fù)雜任務(wù)的自動化
- MCP 還支持“人類參與(human-in-the-loop)”,允許人在關(guān)鍵節(jié)點提供額外信息或批準(zhǔn)操作
3.MCP目前的熱門應(yīng)用
如有夠多的 MCP 服務(wù)器,用戶就能將任何 MCP 客戶端變成“萬能應(yīng)用”。
3.1 Cursor
作為一個代碼編輯器,同時也是高質(zhì)量 MCP 客戶端。安裝不同 MCP 服務(wù)器,可變身為:
- Slack 客戶端(連接 Slack MCP 服務(wù)器)
- 郵件發(fā)送工具(連接 Resend MCP 服務(wù)器)
- AI 圖像生成器(連接 Replicate MCP 服務(wù)器)
更強(qiáng)大的,用戶可組合多個 MCP 服務(wù)器,解鎖新應(yīng)用場景。如Cursor中,用戶可:
- 使用前端 UI 生成 MCP 服務(wù)器,自動創(chuàng)建網(wǎng)頁界面
- 讓 AI Agent調(diào)用圖像生成 MCP 服務(wù)器,為網(wǎng)頁自動生成一張配圖
這種跨工具協(xié)作的能力,正是 MCP 帶來突破。
4.核心應(yīng)用方向
4.1 面向開發(fā)者的工作流優(yōu)化
對開發(fā)者,MCP 一大價值是減少切換工具的時間。
開發(fā)者的痛點
“我不想為做某個任務(wù)而離開 IDE?!?/p>
MCP 服務(wù)器正滿足需求,如:
- Postgres MCP 服務(wù)器 → 讓開發(fā)者直接在 IDE 里執(zhí)行 SQL 查詢,而無需打開數(shù)據(jù)庫管理界面
- Upstash MCP 服務(wù)器 → 讓開發(fā)者在 IDE 里管理緩存索引
- Browsertools MCP 服務(wù)器 → 讓代碼Agent訪問瀏覽器控制臺日志,輔助調(diào)試
MCP 還能幫助 AI Agent動態(tài)獲取代碼相關(guān)的上下文,如:
- 爬取網(wǎng)頁內(nèi)容,為Agent提供實時信息
- 通過 API 自動生成 MCP 服務(wù)器,讓 AI Agent能直接訪問工具,而無需手動集成
即開發(fā)者可更少寫模板代碼,更多專注于業(yè)務(wù)邏輯。
4.2 全新的 AI 交互體驗
盡管 MCP 目前在開發(fā)者社區(qū)最受歡迎,但它的潛力遠(yuǎn)不限于技術(shù)領(lǐng)域。如:
- Claude Desktop → 讓非技術(shù)用戶也能輕松使用 MCP 服務(wù)器,如營銷文案生成、設(shè)計、客服等任務(wù)
- Highlight MCP 客戶端 → 允許用戶通過 @ 命令調(diào)用 MCP 服務(wù)器,將生成內(nèi)容直接輸入到任何應(yīng)用
- Blender MCP 服務(wù)器 → 讓不會建模的用戶,通過自然語言描述 3D 模型,AI Agent自動生成對應(yīng)的圖像或動畫
社區(qū)還正在開發(fā)適用于 Unity 和 Unreal Engine 的 MCP 服務(wù)器,AI 生成 3D 內(nèi)容的流程正在變得越來越完善。
5.MCP現(xiàn)狀
MCP生態(tài)仍處早期階段,主要趨勢:
- 高質(zhì)量的 MCP 客戶端仍以開發(fā)工具為主,但未來會有更多面向商業(yè)場景客戶端
- 大多數(shù) MCP 服務(wù)器是本地優(yōu)先(local-first)的,未來可能會向遠(yuǎn)程 MCP 服務(wù)器擴(kuò)展
- MCP 市場和托管解決方案正在興起,如 Mintlify 的 MCP 市場、Smithery 和 OpenTools,讓開發(fā)者可以更容易發(fā)現(xiàn)和共享 MCP 服務(wù)器
6.MCP的挑戰(zhàn)
6.1 托管與多租戶支持
目前MCP服務(wù)器主要1對1,未來需支持多個用戶同時訪問,尤其SaaS場景。
6.2 身份驗證(Authentication)
MCP 目前沒有標(biāo)準(zhǔn)的身份驗證機(jī)制,開發(fā)者需要自己實現(xiàn) OAuth 或 API 令牌管理
6.3 權(quán)限管理(Authorization)
MCP 目前的權(quán)限是基于會話的,未來需要更細(xì)粒度的訪問控制。
6.4 網(wǎng)關(guān)(Gateway)
未來 MCP 可能需要一個集中式網(wǎng)關(guān),類似 API 網(wǎng)關(guān),管理身份驗證、授權(quán)、流量控制等功能
6.5 MCP 服務(wù)器發(fā)現(xiàn)與注冊機(jī)制
MCP 服務(wù)器目前需要手動配置,未來可能會有一個類似 npm 或 RapidAPI 的 MCP 服務(wù)器注冊中心,讓 AI Agent自動發(fā)現(xiàn)并集成工具。
7.MCP未來:AI Agent的 API 標(biāo)準(zhǔn)?
MCP目前像2010時的 API 生態(tài)——新穎但仍處早期階段。若MCP 成為 AI Agent的標(biāo)準(zhǔn)接口,會咋樣?
- 工具競爭力將取決于 AI Agent能否發(fā)現(xiàn)并調(diào)用它,而不僅是 API 設(shè)計是否優(yōu)秀。
- 定價模式可能改變,AI Agent可能會動態(tài)選擇最便宜、最快、最相關(guān)的工具,而不是僅僅依賴市場占有率。
- 文檔將變得至關(guān)重要,因為 AI Agent需要機(jī)器可讀的格式來理解 MCP 服務(wù)器的功能。
- API 將不再是終點,開發(fā)者需要圍繞具體場景構(gòu)建 MCP 服務(wù)器,而不是簡單地開放 API 端點。
MCP 正在重塑 AI Agent生態(tài),但它的未來取決于開發(fā)者如何解決當(dāng)前的基礎(chǔ)問題。如果一切順利,MCP 可能會成為AI Agent調(diào)用工具的默認(rèn)接口,解鎖全新的自主、多模態(tài)、深度集成的 AI 體驗。
本文轉(zhuǎn)載自??JavaEdge??,作者:JavaEdge
