1個(gè)實(shí)戰(zhàn)案例搞懂AI大模型的"萬(wàn)能手"MCP協(xié)議,微軟也下場(chǎng)了
最近爆火的 MCP(Model Context Protocol,模型上下文協(xié)議) 是 Anthropic 公司推出的一種開(kāi)放協(xié)議。
目的是讓 AI 智能體(如 Claude、ChatGPT 等) 能像“萬(wàn)能插座”一樣,輕松連接各種外部工具和數(shù)據(jù)源,比如日歷、數(shù)據(jù)庫(kù)、郵件系統(tǒng)、代碼編輯器等。
圖片
MCP 本質(zhì)就是一個(gè)標(biāo)準(zhǔn)。舉一個(gè)最簡(jiǎn)單的例子,大家去買(mǎi)電器的時(shí)候,完全不用擔(dān)心買(mǎi)來(lái)的電器插不到自己家的插座上。因?yàn)樗胁孱^和插座生產(chǎn)商遵循的都是同一套標(biāo)準(zhǔn)。
統(tǒng)一標(biāo)準(zhǔn),意味著可以大大提高開(kāi)發(fā)效率,同時(shí)降低開(kāi)發(fā)成本。
在沒(méi)有MCP情況下,我們需要讓大模型使用日歷、數(shù)據(jù)庫(kù)、郵件系統(tǒng),需要自己對(duì)接這些軟件,編寫(xiě)不同的API。
圖片
但MCP可以幫你屏蔽各種軟件API差異,給你提供一個(gè)統(tǒng)一的接口,你只管調(diào)用就可以,大大降低對(duì)接不同軟件的難度。
舉一個(gè)更實(shí)際的例子,之前給大家分享過(guò)一個(gè)自動(dòng)使用瀏覽器完成簡(jiǎn)單任務(wù)的開(kāi)源Agent——browser-use
圖片
這個(gè)開(kāi)源項(xiàng)目自己實(shí)現(xiàn)了一套操作瀏覽器的函數(shù),比如:打開(kāi)網(wǎng)站(go_to_url)、返回上一頁(yè)(go_back)、點(diǎn)擊頁(yè)面按鈕(click_element)、頁(yè)面文本框輸入文字(input_text)等一系列動(dòng)作。
圖片
不但代碼復(fù)雜,而且還要對(duì)瀏覽器內(nèi)部機(jī)制有一定的了解,如果是個(gè)人開(kāi)發(fā)者想要實(shí)現(xiàn)這樣一個(gè)Agent,難度可想而知。
那讓我們?cè)賮?lái)看看使用 MCP 后變得有多簡(jiǎn)單。
下面介紹一個(gè)微軟剛剛開(kāi)源的可操作瀏覽器的MCP服務(wù)器——microsoft/playwright-mcp
圖片
同樣也提供了一些操作瀏覽器的工具。
圖片
我們不需要關(guān)心這些工具內(nèi)部實(shí)現(xiàn)有多復(fù)雜,只需要會(huì)調(diào)用這些工具完成任務(wù)即可。
相比于 browser-use 需要自己編寫(xiě)一個(gè)個(gè)瀏覽器操作函數(shù),部署 playwright-mcp MCP服務(wù)器直接調(diào)用當(dāng)然是效率最高的。
大模型技術(shù)真實(shí)日新月異,每隔一段時(shí)間就會(huì)出現(xiàn)炸裂的模型或工具。