自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

自主智能體提前實(shí)現(xiàn)了?!大佬自研Python工具包,讓大模型成為生產(chǎn)級(jí)水準(zhǔn),免費(fèi)可用! 原創(chuàng)

發(fā)布于 2024-11-27 14:30
瀏覽
0收藏

編輯 | 言征

出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)

2025年,都知道智能體會(huì)爆發(fā),然而,即將爆發(fā)的智能體會(huì)長(zhǎng)成什么樣子?

它不再只是一個(gè)“對(duì)話界面”那么簡(jiǎn)單,也不再將是“給你一項(xiàng)任務(wù),去完成吧”的人類(lèi)主動(dòng)發(fā)起的各種工具調(diào)用(滾動(dòng)聊天界面),而是一個(gè)真正意義上的自發(fā)發(fā)起任務(wù),自動(dòng)執(zhí)行,但會(huì)在關(guān)鍵環(huán)節(jié)提醒人類(lèi)進(jìn)行批準(zhǔn)確認(rèn)的高級(jí)智能。

自主智能體提前實(shí)現(xiàn)了?!大佬自研Python工具包,讓大模型成為生產(chǎn)級(jí)水準(zhǔn),免費(fèi)可用!-AI.x社區(qū)圖片

這一點(diǎn)不再是空穴來(lái)風(fēng),已經(jīng)有玩家開(kāi)始入場(chǎng)做嘗試了,就在剛剛,一個(gè)名為Humanlayer的產(chǎn)品在圈內(nèi)走紅,它能讓AI代理聯(lián)系人類(lèi),讓AI真得像得力助手一樣,只需要批準(zhǔn)確認(rèn)就行。重點(diǎn)在于,它會(huì)主動(dòng)聯(lián)系你,獲取你的反饋、意見(jiàn)和建議以及審批。

從Demo效果看,非常震撼!

自主智能體提前實(shí)現(xiàn)了?!大佬自研Python工具包,讓大模型成為生產(chǎn)級(jí)水準(zhǔn),免費(fèi)可用!-AI.x社區(qū)

多說(shuō)一嘴,Humanlayer免費(fèi)可用,且已經(jīng)放到了Github上:

??https://github.com/humanlayer/humanlayer?tab=readme-ov-file??

并且提供了免費(fèi)套餐和透明的基于使用量的定價(jià),等不及的朋友可以可以通過(guò)提供的Python或TypeScript SDK進(jìn)行嘗試,立即可以免費(fèi)試用。

1.讓大模型達(dá)到生產(chǎn)級(jí)水準(zhǔn)

嚴(yán)格意義上講,Humanlayer還不能稱之為產(chǎn)品,更多是一個(gè)API或者Python工具包,它可以讓自己的AI系統(tǒng)能夠安全地部署到生產(chǎn)環(huán)境中。

創(chuàng)始人Dex介紹,真正令人興奮之處在于,“它讓團(tuán)隊(duì)能夠部署那些原本風(fēng)險(xiǎn)過(guò)高的AI系統(tǒng),讓你能夠?qū)W⒂跇?gòu)建強(qiáng)大的代理,同時(shí)知道關(guān)鍵步驟將始終有人類(lèi)參與。當(dāng)人們開(kāi)始將動(dòng)態(tài)人類(lèi)監(jiān)督視為生產(chǎn)AI系統(tǒng)中的關(guān)鍵要素,并因此考慮更大的格局時(shí),這真是太棒了?!?/p>

Dex這個(gè)項(xiàng)目的起始原因是這樣一個(gè)智能體落地企業(yè)的痛點(diǎn)——在生產(chǎn)環(huán)境使用或落地大模型時(shí),也經(jīng)常會(huì)遇到類(lèi)似的問(wèn)題。

“這一切始于我們?yōu)閿?shù)據(jù)團(tuán)隊(duì)構(gòu)建AI代理的時(shí)候,我們想要自動(dòng)化一些繁瑣的任務(wù),比如刪除未使用的表格,但客戶理所當(dāng)然地會(huì)反對(duì)讓AI代理直接訪問(wèn)生產(chǎn)系統(tǒng)。”

想要讓AI達(dá)到“生產(chǎn)級(jí)”的可靠性,取決于“AI所執(zhí)行的任務(wù)有多危險(xiǎn)”。但問(wèn)題就在于時(shí)間成本是很昂貴的,Dex團(tuán)隊(duì)沒(méi)有3個(gè)多月的時(shí)間來(lái)進(jìn)行評(píng)估、微調(diào)和提示工程,以達(dá)到代理99.9+%的可靠性。即使做到了,讓決策者放心地按下開(kāi)關(guān)也是一項(xiàng)挑戰(zhàn)。

后來(lái),Dex構(gòu)建了一些基本的審批流程,比如“在刪除表格前在Slack中詢問(wèn)”。

但這種溝通本身也需要規(guī)范——如果代理聯(lián)系錯(cuò)了人怎么辦?如果一個(gè)團(tuán)隊(duì)負(fù)責(zé)人購(gòu)買(mǎi)的工具向CEO發(fā)送了一條煩人的Slack消息,他會(huì)怎么想?

后來(lái),客戶希望代理向利益相關(guān)者請(qǐng)求批準(zhǔn),有意思的是,客戶首先想要批準(zhǔn)的恰恰是“請(qǐng)求批準(zhǔn)”這一行為本身?;诖耍珼ex開(kāi)始思考:作為產(chǎn)品構(gòu)建者和所有者,我也想批準(zhǔn)“請(qǐng)求批準(zhǔn)‘請(qǐng)求批準(zhǔn)’”這一行為!

緊接著,Dex團(tuán)隊(duì)搭建了一個(gè)人機(jī)交互系統(tǒng),可以在他和客戶的Slack實(shí)例中處理上述這些情況。這件事情讓Dex確信任何構(gòu)建AI代理的團(tuán)隊(duì)都需要這種基礎(chǔ)設(shè)施,并決定將其作為一個(gè)獨(dú)立產(chǎn)品來(lái)打造。

“我在舊金山的一次AI聚會(huì)上展示了最小可行性產(chǎn)品(MVP),并進(jìn)行了很多精彩的交流,然后全身心投入到HumanLayer的構(gòu)建中?!?/p>

2.如何做到的?

大家都知道,功能和工具是Agentic工作流的關(guān)鍵組成部分。它們使大語(yǔ)言模型(LLMs)能夠與外界進(jìn)行有意義的交互,并自動(dòng)化執(zhí)行廣泛且具有影響力的工作。對(duì)于執(zhí)行諸如預(yù)約、與客戶互動(dòng)、管理賬單信息、編寫(xiě)和執(zhí)行代碼等有意義任務(wù)的AI代理而言,正確且準(zhǔn)確的功能調(diào)用至關(guān)重要。

然而,我們能為L(zhǎng)LMs提供的最有用的功能也是最具風(fēng)險(xiǎn)的。我們都能想象到一個(gè)AI數(shù)據(jù)庫(kù)管理員不斷調(diào)優(yōu)和重構(gòu)我們的SQL數(shù)據(jù)庫(kù)所帶來(lái)的價(jià)值,但大多數(shù)團(tuán)隊(duì)不會(huì)允許LLM在生產(chǎn)數(shù)據(jù)庫(kù)上執(zhí)行任意SQL語(yǔ)句(甚至我們大多數(shù)時(shí)候都不允許人類(lèi)這么做)。

也就是說(shuō):即使擁有最先進(jìn)的代理推理和提示路由技術(shù),LLMs在沒(méi)有人類(lèi)監(jiān)督的情況下訪問(wèn)高風(fēng)險(xiǎn)功能仍然不夠可靠。

首先,Dex團(tuán)隊(duì)定義了生產(chǎn)環(huán)境下什么功能是高風(fēng)險(xiǎn)的?以下是一些示例:

低風(fēng)險(xiǎn):訪問(wèn)公共數(shù)據(jù)的讀取權(quán)限(例如搜索維基百科、訪問(wèn)公共API和數(shù)據(jù)集)低風(fēng)險(xiǎn):與代理作者通信(例如,工程師可能會(huì)授權(quán)一個(gè)代理向他們發(fā)送包含進(jìn)度更新的私人Slack消息)中風(fēng)險(xiǎn):訪問(wèn)私有數(shù)據(jù)的讀取權(quán)限(例如讀取電子郵件、訪問(wèn)日歷、查詢CRM)中風(fēng)險(xiǎn):在嚴(yán)格規(guī)則下通信(例如,根據(jù)特定序列的硬編碼電子郵件模板發(fā)送郵件)高風(fēng)險(xiǎn):代表我個(gè)人或公司通信(例如發(fā)送電子郵件、在Slack上發(fā)布消息、發(fā)布社交/博客內(nèi)容)高風(fēng)險(xiǎn):對(duì)私有數(shù)據(jù)的寫(xiě)入權(quán)限(例如更新CRM記錄、修改功能開(kāi)關(guān)、更新賬單信息)

自主智能體提前實(shí)現(xiàn)了?!大佬自研Python工具包,讓大模型成為生產(chǎn)級(jí)水準(zhǔn),免費(fèi)可用!-AI.x社區(qū)圖片

Dex分析認(rèn)為,高風(fēng)險(xiǎn)功能是最有價(jià)值且自動(dòng)化人類(lèi)工作流程影響最大的功能,但它們也是“90%準(zhǔn)確率”不可接受的功能。當(dāng)今大語(yǔ)言模型(LLMs)傾向于產(chǎn)生幻覺(jué)或生成低質(zhì)量的、明顯由AI生成的文本,這進(jìn)一步影響了可靠性。

團(tuán)隊(duì)越早能讓代理以高質(zhì)量輸入可靠且安全地調(diào)用這些工具,他們就能越早獲得巨大收益。

HumanLayer就是圍繞能夠確定性地保證對(duì)高風(fēng)險(xiǎn)功能調(diào)用的人類(lèi)監(jiān)督,提供了一套工具。即使LLM出現(xiàn)錯(cuò)誤或產(chǎn)生幻覺(jué),HumanLayer也已經(jīng)嵌入到工具/功能本身中,確保人類(lèi)在這個(gè)“工具調(diào)用循環(huán)”中。

自主智能體提前實(shí)現(xiàn)了?!大佬自研Python工具包,讓大模型成為生產(chǎn)級(jí)水準(zhǔn),免費(fèi)可用!-AI.x社區(qū)源自Medium,Louis Dupont的“工具調(diào)用循環(huán)”概念

當(dāng)你集成HumanLayer SDK時(shí),你的AI代理可以在其執(zhí)行的任何階段請(qǐng)求人類(lèi)批準(zhǔn)。我們通過(guò)人們偏好的渠道(Slack或電子郵件,SMS和Teams也即將推出)處理將這些請(qǐng)求路由給正確的人的所有復(fù)雜性,在等待回復(fù)時(shí)管理狀態(tài),并提供完整的審計(jì)軌跡。

除了“請(qǐng)求批準(zhǔn)”之外,我們還支持一個(gè)更通用的“人類(lèi)作為工具”功能,該功能可以暴露給LLM或代理框架,并處理收集人類(lèi)對(duì)于一般問(wèn)題(如“我在上遇到了困難,我已經(jīng)嘗試了THINGS,請(qǐng)?zhí)峁┙ㄗh”)的回復(fù)(有時(shí)我們?yōu)楹笈_(tái)自動(dòng)化推出的內(nèi)部代理會(huì)收到這樣的消息)。

由于它位于工具調(diào)用層,HumanLayer的SDK可以與任何AI框架(如CrewAI、LangChain等)以及任何支持工具調(diào)用的語(yǔ)言模型一起工作。如果你正在構(gòu)建自己的代理/工具循環(huán),你可以使用更低級(jí)別的SDK原始類(lèi)型來(lái)按你的需求管理審批。我們甚至正在探索HumanLayer用于人與人之間審批的用例,而不僅僅是AI到人類(lèi)。

HumanLayer通過(guò)將人類(lèi)納入循環(huán)中,代理工具可以獲得訪問(wèn)更強(qiáng)大且更有意義的工具調(diào)用和任務(wù)的能力。

對(duì)于目前主流的大語(yǔ)言模型(如OpenAI、Llama、Claude等)和框架(如LangChain、CrewAI等),AI代理提供安全訪問(wèn)世界的能力。

總結(jié)來(lái)說(shuō),HumanLayer提供了這五項(xiàng)關(guān)鍵功能:

(1)要求函數(shù)調(diào)用需人類(lèi)批準(zhǔn):@hl.require_approval()裝飾器會(huì)阻止特定函數(shù)調(diào)用,直到咨詢過(guò)人類(lèi)——如果被拒絕,反饋將被傳遞給LLM

(2)人類(lèi)作為工具:通用的hl.human_as_tool()允許聯(lián)系人類(lèi)以獲取答案、建議或反饋

(3)全渠道聯(lián)系:通過(guò)Slack、電子郵件、Discord等多種渠道聯(lián)系人類(lèi)并收集回復(fù)

(4)精細(xì)路由:將審批路由到特定團(tuán)隊(duì)或個(gè)人

(5)自帶LLM和框架:由于HumanLayer是在工具層實(shí)現(xiàn)的,它支持任何LLM以及所有支持工具調(diào)用的主要編排框架。

3.下一代:自主代理和“外循環(huán)”

在“需要人類(lèi)基準(zhǔn)”和“人類(lèi)作為工具”之間,HumanLayer提到了下一代AI代理——自主代理,而HumanLayer只是拼圖中的一塊。

第一代Agent:聊天——人類(lèi)發(fā)起的問(wèn)答界面

第二代Agent:代理助理——框架驅(qū)動(dòng)提示路由、工具調(diào)用、思維鏈和上下文窗口管理,以獲得更高的可靠性和功能。大多數(shù)工作流程都是由人類(lèi)通過(guò)一次性“這是一個(gè)任務(wù),去完成吧”或滾動(dòng)聊天界面發(fā)起的。

第三代Agent:自主代理——不再由人類(lèi)發(fā)起,代理將生活在“外循環(huán)”中,使用各種工具和功能來(lái)推動(dòng)實(shí)現(xiàn)其目標(biāo)。人類(lèi)/代理通信是由代理發(fā)起,而不是由人類(lèi)發(fā)起。

自主智能體提前實(shí)現(xiàn)了?!大佬自研Python工具包,讓大模型成為生產(chǎn)級(jí)水準(zhǔn),免費(fèi)可用!-AI.x社區(qū)圖片

第三代自主代理將需要方法以在各種任務(wù)中向人類(lèi)咨詢意見(jiàn)。為了使這些代理能夠執(zhí)行實(shí)際且有用的工作,它們將需要人類(lèi)對(duì)敏感操作進(jìn)行監(jiān)督。

4.幾個(gè)不錯(cuò)的應(yīng)用示例

這些代理將需要方法通過(guò)聊天、電子郵件、短信等多種渠道聯(lián)系一個(gè)或多個(gè)人類(lèi)。

HumanLayer目前已經(jīng)有了一些很酷的使用方式,銷(xiāo)售、新聞、運(yùn)維等領(lǐng)域已經(jīng)有了不錯(cuò)的案例。

有客戶用它構(gòu)建了一個(gè)AI銷(xiāo)售發(fā)展代表(SDR),它起草個(gè)性化的銷(xiāo)售電子郵件,但在向潛在客戶發(fā)送任何內(nèi)容之前,會(huì)在Slack中請(qǐng)求人類(lèi)批準(zhǔn)。

另一個(gè)客戶使用它來(lái)支持一個(gè)AI新聞簡(jiǎn)報(bào),訂閱者可以與內(nèi)容進(jìn)行電子郵件對(duì)話。HumanLayer負(fù)責(zé)接收入站電子郵件,并將其路由給能夠回復(fù)的代理,并為這些代理提供回復(fù)工具。

自主智能體提前實(shí)現(xiàn)了?!大佬自研Python工具包,讓大模型成為生產(chǎn)級(jí)水準(zhǔn),免費(fèi)可用!-AI.x社區(qū)圖片

此外,一個(gè)團(tuán)隊(duì)使用HumanLayer構(gòu)建了一個(gè)面向客戶的DevOps代理——他們的AI代理審查拉取請(qǐng)求(PRs),計(jì)劃和執(zhí)行數(shù)據(jù)庫(kù)遷移,同時(shí)在關(guān)鍵步驟獲得人類(lèi)批準(zhǔn),并在遇到任何問(wèn)題時(shí)聯(lián)系團(tuán)隊(duì)進(jìn)行指導(dǎo)。

5.仍處于早期階段

雖然這些代理的早期版本可能在技術(shù)上“由人類(lèi)啟動(dòng)”,例如通過(guò)cron作業(yè)或類(lèi)似機(jī)制定期啟動(dòng),但最好的版本將能夠自行管理日程安排和成本。這將需要用于檢查成本的工具包以及類(lèi)似于sleep_until的功能。

它們需要在能夠跨可能數(shù)小時(shí)或數(shù)天不返回的工具調(diào)用持久序列化并恢復(fù)代理工作流程的編排框架中運(yùn)行。這些框架需要支持由“管理型LLM”進(jìn)行的上下文窗口管理,并允許代理分叉子鏈以處理專門(mén)的任務(wù)和角色。

創(chuàng)始人Dex表示:我們承認(rèn)現(xiàn)在還處于早期階段,歡迎大家就Agent、可靠性和平衡人類(lèi)與AI工作量方面的想法和經(jīng)驗(yàn)進(jìn)行交流。

此外,HumanLayer提供了免費(fèi)套餐和靈活的基于積分的定價(jià)。對(duì)于構(gòu)建面向客戶的代理的團(tuán)隊(duì),還可以獲得白標(biāo)、額外功能和優(yōu)先支持,可謂誠(chéng)意滿滿。

安裝操作很簡(jiǎn)單,等不及想將HumanLayer集成到你的系統(tǒng)中的朋友,不妨一試:

pip install humanlayer

from humanlayer import HumanLayer

hl = HumanLayer()



@hl.require_approval()

def send_email(to: str, subject: str, body: str):

    """Send an email to the customer"""

    ...





# made up function, use whatever

# tool-calling framework you prefer

run_llm_task(

    prompt="""Send an email welcoming the customer to

    the platform and encouraging them to invite a team member.""",

    tools=[send_email],

    llm="gpt-4o"

)

最后多提一句,大洋彼岸的OpenAI CEO奧特曼、國(guó)內(nèi)百度李彥宏近期都表態(tài)押注了智能體的方向,相信屬于開(kāi)發(fā)者的大模型應(yīng)用時(shí)代正在悄然到來(lái)!

參考鏈接:

??https://github.com/humanlayer/humanlayer?tab=readme-ov-file??

??https://www.youtube.com/watch?v=5sbN8rh_S5Q??

??https://www.humanlayer.dev/??

本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:言征

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦