自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

Windsurf分享了他們對構建Agent應用的認知

發(fā)布于 2025-5-7 07:08

瀏覽

0收藏

windsurf最近發(fā)表了一篇博客，主要是討論和介紹Agent。內容上有很多基礎知識，但是也有一些特別的認知分享，今天挑出來這些不常見的insight，分享給大家。

在windsurf的理念里。一個 Agentic AI 系統(tǒng)，是非常簡潔的，就是一個由LLM做決策 + 工具干活持續(xù)迭代的2步過程。

認知誤區(qū)

在他們看來，目前存在幾個認知誤區(qū)，得掰扯清楚

Agent ≠ 普通的生成式 AI

不要把換個system prompt的東西就叫做Agent

Agent 的“推理” ≠ 模型的“思維鏈

Agent 的“推理”，特指 LLM 選擇下一步要調用哪個工具、給什么參數的決策過程。而COT不涉及調用外部工具

Agent ≠ 簡單的 AI 工作流 (Workflow)

Agent 的核心在于，LLM 是在運行時實時決策下一步調用哪個工具，具有更高的靈活性和自主性。

靈魂四問

當我們面對一個號稱是 Agent 的系統(tǒng)時，該如何去評估它的“含金量”呢？他們分享了靈魂四問分析框架~

一、這玩意兒真是 Agent 嗎？

回到上一步來看，它是否真的包含了 LLM 決策 + Tools 執(zhí)行的核心循環(huán)？還是僅僅是套了個 Agent 的殼，本質上只是個普通的生成模型、CoT 或者預設流程？

二、自主Agent還是人機協作Agent？

它是想做全自動的“自主 Agent”，還是人機協作的“協作 Agent”？

如果是前者，那就要極其嚴格地審視其魯棒性：它真的能在無人干預的情況下，穩(wěn)定可靠地完成目標任務嗎？還是說只是個漂亮的 Demo？當前的 LLM 技術水平真的支撐得起這種復雜度的自主運行嗎？

三、基礎配置夠硬核嗎？

這部分是深入 Agent 內部，看它的關鍵組件配置：

它配備了哪些工具？這些工具本身的能力如何（比如，網頁搜索工具的效果好不好）？是否容易添加新的、自定義的工具？
它用的是哪個 LLM 作為推理核心？評估重點應該是這個模型在工具調用和決策方面的表現，而不是它在通用知識問答或寫作上的得分。模型是否可以靈活替換？
它能訪問哪些數據源？權限控制做得如何？對于特定類型的數據（如代碼），它是否有特殊的處理能力（比如 AST 解析）來更好地理解和利用信息？特別注意，Agentic 模式下，如果一次檢索效果不好，它可以決定再次檢索或換參數檢索，這與傳統(tǒng) RAG 的一次性檢索有很大不同。
（尤其對協作 Agent 而言）它能否捕捉到用戶沒有明說的意圖？比如通過分析用戶在 IDE 中打開的文件、最近的編輯、終端歷史、剪貼板內容等，來更智能地推斷用戶想干什么？這能極大提升體驗。

四、起來“爽”不“爽”？(User Experience)

技術再牛，最終還是要用戶用得爽。這關乎 Agent 的“軟實力”：

跑起來快不快？一個 Agent 吭哧癟肚搞半天還失敗了，和一個秒級響應但可能需要你稍微引導一下的 Agent，哪個體驗更好？延遲是自主 Agent 面臨的一大挑戰(zhàn)，也是所有 Agent 都需要優(yōu)化的關鍵點。
我能清楚地看到 Agent 每一步在干什么嗎？當我發(fā)現它要跑偏時，能不能方便地進行引導或修正？（這是協作 Agent 的核心優(yōu)勢所在）
調用它方便嗎？結果好用嗎？交互方式是否自然地融入了我的工作流？（比如，不只是一個聊天框，可能是一個按鈕、一個右鍵菜單等）
是不是所有問題都非得用 Agent 來解決？對于某些簡單、直接的任務，傳統(tǒng)的 Copilot 式工具（如代碼補全）是不是更快、更直接、效果更好？別拿著 Agent 這把錘子，看什么都像釘子。

The Bitter Lesson

windsurf還特地提到了一個苦澀教訓 (The Bitter Lesson)

長期來看，利用通用計算規(guī)模（更多算力、更大模型、更多數據）帶來的性能提升，幾乎總是勝過依賴人類領域知識、精心設計的復雜規(guī)則或特征工程帶來的提升。

無論是計算機視覺、棋類游戲還是自然語言處理，歷史一再證明這一點。

對 Agent 的啟示：警惕過度設計！ 不要花費過多精力去設計極其復雜的 Prompt、精巧的工具選擇邏輯或人為注入的領域知識。

因為隨著模型能力不斷提升、算力成本持續(xù)下降，這些“捷徑”很可能被更強大的通用能力所淹沒。擁抱規(guī)?；?、通用化的方法可能才是長久之計。

本文轉載自????探索AGI????，作者：獼猴桃

標簽

贊

收藏

回復

舉報

回復

相關推薦

麻省理工分享ChatGPT，在教育的5個實際應用案例

Aceryt ? 5191瀏覽 ? 0回復
構建 Autonomous AI Agent ｜函數調用（Function Calling）技術實例探索

Baihai_IDP ? 3306瀏覽 ? 0回復
LazyLLM：低代碼構建多Agent大模型應用的開源項目

PaperAgent ? 3308瀏覽 ? 0回復
怎么在大模型之上構建應用？構建人工智能上層應用的框架——langchain

AI探索時代 ? 2855瀏覽 ? 0回復
微軟野心再現：對Excel和谷歌Sheet下手了！

51CTO技術棧 ? 2447瀏覽 ? 0回復
Unstructured專家分享RAG應用中文檔分塊（Chunking）的最佳實踐

Syrupup ? 4507瀏覽 ? 0回復
人類和大模型的語言發(fā)展和使用過程是否不同？Psychomatics框架對人工智能與人類認知展開對比研究

xuxiangda ? 2620瀏覽 ? 0回復
百度CEO李彥宏就當前業(yè)界對大模型的認知誤區(qū)發(fā)表了自己的看法

InfonityAI智推星 ? 2153瀏覽 ? 0回復
你對大模型認知的開始——大模型的能力問題

AI探索時代 ? 2170瀏覽 ? 0回復
有了大模型的應用經驗之后，再談對大模型的理解

AI探索時代 ? 1484瀏覽 ? 0回復
基于Agent的金融問答系統(tǒng)：Agent框架的構建

一起AI技術 ? 2045瀏覽 ? 0回復
用有限的預算構建AI應用程序

51CTO內容精選 ? 1882瀏覽 ? 0回復
我們聊聊如何構建通用LLM Agent

鴻煊的學習筆記 ? 2555瀏覽 ? 0回復
Agent不存在了？誰說必須用 Agent！

探索AGI ? 1939瀏覽 ? 0回復
聊聊DeepSeek大模型對AI Agent的影響

王吉偉自頻道 ? 2000瀏覽 ? 0回復
MCP協議——大模型構建Agent智能體的橋梁

AI探索時代 ? 1376瀏覽 ? 0回復
構建大模型 Agent 應用六個框架對比剖析

玄姐聊AGI ? 1730瀏覽 ? 0回復
提示詞工程對大模型應用的重要性

AI探索時代 ? 1275瀏覽 ? 0回復
告別“玩具” Agent！深度解析智能體框架，構建真正可靠的 AI 應用

ermulong ? 1198瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

Anthropic開源Agentic Coding最佳實踐！ 2025-04-22 07:41:06發(fā)布
英偉達押注Agent新基建！AI專屬搜索引擎問世 2025-04-10 06:40:23發(fā)布

熱門推薦

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調用實戰(zhàn)教程 0回復

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復

2025年最值得關注的十大多模態(tài)大語言模型！ 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

從零到一構建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解 0回復

上一篇： Anthropic開源Agentic Coding最佳實踐！

社區(qū)精華內容

目錄