自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="7gglx"><track id="7gglx"></track></cite>

^{<blockquote id="7gglx"></blockquote>}

<legend id="7gglx"><track id="7gglx"></track></legend>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

提示工程策略：利用【慢思考】的雙過(guò)程理論減少模型有害輸出精華

大語(yǔ)言模型論文跟蹤

發(fā)布于 2024-7-1 11:34

瀏覽

0收藏

1. 思考的快與慢

提示工程策略：利用【慢思考】的雙過(guò)程理論減少模型有害輸出-AI.x社區(qū) 圖片

諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主卡尼曼在《Thinking, Fast and Slow》這本書(shū)中根據(jù)前人多種雙過(guò)程理論（Dual Process Theory）進(jìn)行了總結(jié)和進(jìn)一步解釋：將人類的思考過(guò)程分為“直覺(jué)”和“推理”，這兩個(gè)過(guò)程分別被稱為“系統(tǒng)1（System 1）”和“系統(tǒng)2（System 2）”。

系統(tǒng)一的特點(diǎn)是快速，不加思考、不做計(jì)算、僅憑直覺(jué)就做出判斷。比如，當(dāng)我們回答1+1這個(gè)問(wèn)題的時(shí)候，我們的大腦可以不加思考的回答出等于2。所以系統(tǒng)一的特點(diǎn)是：快思考、熱啟動(dòng)、直覺(jué)判斷。

系統(tǒng)二的特點(diǎn)是速度，需要做復(fù)雜的計(jì)算、推理，但回答準(zhǔn)確度高。比如，當(dāng)我們回答123乘以879的時(shí)候，我們無(wú)法通過(guò)我們的快思考來(lái)回答，我們需要調(diào)用大腦的計(jì)算模塊，對(duì)這個(gè)問(wèn)題進(jìn)行復(fù)雜的計(jì)算后才能回答。所以系統(tǒng)二的特點(diǎn)是：慢思考、啟動(dòng)慢、耗費(fèi)能量高、判斷準(zhǔn)確。

為什么今天要討論大腦的思考過(guò)程？

是因?yàn)榇笳Z(yǔ)言模型在AGI的技術(shù)路線上，相當(dāng)于我們?nèi)祟惖拇竽X。大多數(shù)人在第一次使用大語(yǔ)言模型的時(shí)候，經(jīng)常會(huì)感受到大語(yǔ)言模型的愚蠢，比如，讓他計(jì)算1+1等于幾是可以計(jì)算的，但是讓他計(jì)算123乘以879時(shí)，往往會(huì)計(jì)算不對(duì)（現(xiàn)在的網(wǎng)頁(yè)版AI模型往往會(huì)在背后調(diào)用計(jì)算工具）。

提示工程策略：利用【慢思考】的雙過(guò)程理論減少模型有害輸出-AI.x社區(qū) 圖片

當(dāng)大模型計(jì)算1+1的時(shí)候，其實(shí)我們可以認(rèn)為大模型其實(shí)是在做一個(gè)最簡(jiǎn)單的快思考，回答的很快，直接通過(guò)大語(yǔ)言模型存儲(chǔ)的知識(shí)，憑大模型的“直覺(jué)”來(lái)推斷答案；當(dāng)回答復(fù)雜的計(jì)算題時(shí)，大模型需要使用一些計(jì)算工具，這些工具可以是大模型內(nèi)置的，可也是大模型外掛的，這可以理解為是大模型的慢思考。這兩個(gè)過(guò)程實(shí)際上跟我們前面介紹的系統(tǒng)1和系統(tǒng)2的特點(diǎn)是非常吻合的。

講了這么多，今天要介紹的這篇論文其實(shí)就是利用了【系統(tǒng)二】這樣的一些理論來(lái)優(yōu)化我們的提示工程策略，提高大語(yǔ)言模型回答的準(zhǔn)確性和效果，在這篇論文里是降低了大模型的有害偏見(jiàn)，有效性高達(dá)13%。

2. 大模型的語(yǔ)言偏見(jiàn)

提示工程策略：利用【慢思考】的雙過(guò)程理論減少模型有害輸出-AI.x社區(qū) 圖片

介紹如何利用【系統(tǒng)二】來(lái)提升大模型效果之前，我們先來(lái)簡(jiǎn)單介紹下大模型語(yǔ)言偏見(jiàn)的一些背景。

大語(yǔ)言模型進(jìn)展非常迅速，也取得了非常好的效果，但是大語(yǔ)言模型在表達(dá)的時(shí)候仍然可能會(huì)出現(xiàn)一些偏見(jiàn)性得表達(dá)。這些偏見(jiàn)以多種形態(tài)出現(xiàn)，如刻板印象和有偏見(jiàn)的答案，引發(fā)了關(guān)于LLM在現(xiàn)實(shí)應(yīng)用中的倫理問(wèn)題。

由于大語(yǔ)言模型的黑盒特性，其內(nèi)部參數(shù)構(gòu)成非常復(fù)雜和不透明，以及人類語(yǔ)言的靈活性和文化依賴性，識(shí)別和消除這些偏見(jiàn)變得異常困難。減輕LLM中的社會(huì)偏見(jiàn)對(duì)于確保AI在通信和決策中的公平性和包容性至關(guān)重要。

本文作者主要研究了這些偏見(jiàn)中的9大類：年齡歧視、外貌、職業(yè)與外貌、性別、制度、國(guó)籍、職業(yè)、種族、宗教。

3. 【系統(tǒng)二】原理是如何指導(dǎo)提示工程優(yōu)化大語(yǔ)言模型效果？

在本篇論文里，作者對(duì)比了12中不同的提示詞策略，12種提示詞策略包括：COT、系統(tǒng)一、系統(tǒng)二、人類角色和機(jī)器角色，以及這些的組合。

提示工程策略：利用【慢思考】的雙過(guò)程理論減少模型有害輸出-AI.x社區(qū) 圖片

上圖中的HP表示人類角色（Human Persona），MP表示機(jī)器角色（Machine Persona）。

提示工程策略：利用【慢思考】的雙過(guò)程理論減少模型有害輸出-AI.x社區(qū) 圖片

從上圖可以看出來(lái)：

? 使用【系統(tǒng)二】+人類角色提示詞策略的時(shí)候，減少的模型有害偏見(jiàn)輸出是效果最好的。系統(tǒng)一的各種組合所帶來(lái)的減少效果都不如系統(tǒng)二，這與我們的雙系統(tǒng)理論是一致的。
? 另外，COT的提示策略，并沒(méi)有有效減少偏見(jiàn)的產(chǎn)生。

提示工程策略：利用【慢思考】的雙過(guò)程理論減少模型有害輸出-AI.x社區(qū) 圖片

上圖展示了不同模型、不同提示詞策略、不同的偏見(jiàn)類型上，哪種提示工程策略表現(xiàn)最好?？梢钥闯?，當(dāng)人類角色和系統(tǒng)二結(jié)合的時(shí)候，往往可以最大程度減少有害偏見(jiàn)的輸出。

4. 思考

快思考慢思考的思維方式，可以僅僅使用提示工程就可以提高模型的表達(dá)效果，這與我們?nèi)祟惖乃季S方式極為相似。這是否正好暗示了，大語(yǔ)言模型這種方式，可能就是未來(lái)人類通向AGI的必經(jīng)之路呢？大語(yǔ)言模型是否會(huì)在未來(lái)的AGI道路上替代人類大腦呢？

本文轉(zhuǎn)載自大語(yǔ)言模型論文跟蹤，作者： HuggingAGI ????

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

生成式AI大模型之提示詞工程實(shí)踐

數(shù)字化助推器 ? 3215瀏覽 ? 0回復(fù)
好奇心驅(qū)使的自動(dòng)紅隊(duì)測(cè)試：MIT學(xué)者教你如何讓大模型避免產(chǎn)生仇恨或有害的輸出

AIGC最前線 ? 4201瀏覽 ? 0回復(fù)
與機(jī)器對(duì)話：揭示提示工程的十個(gè)秘密

51CTO內(nèi)容精選 ? 2115瀏覽 ? 0回復(fù)
大模型的提示工程：提示是對(duì)程序的搜索

lintoms ? 2509瀏覽 ? 0回復(fù)
《自然》科學(xué)期刊：多模態(tài)融合解碼人類決策過(guò)程的新策略

xuxiangda ? 3597瀏覽 ? 0回復(fù)
RePrompt：提示詞自動(dòng)化優(yōu)化策略

大語(yǔ)言模型論文跟蹤 ? 4494瀏覽 ? 0回復(fù)
AI慢思考蒸餾進(jìn)快思考，Llama2躍升至GPT-4水平，不寫(xiě)過(guò)程也能做對(duì)題

Crystalcxt ? 2042瀏覽 ? 0回復(fù)
什么是提示詞工程(prompt engineering)？為什么需要提示詞工程？

AI探索時(shí)代 ? 6256瀏覽 ? 0回復(fù)
簡(jiǎn)潔思考：輸出長(zhǎng)度對(duì)大型語(yǔ)言模型推理和成本的影響

sbf_2000 ? 3679瀏覽 ? 0回復(fù)
OpenAI前研究科學(xué)家開(kāi)源面向未來(lái)的提示工程庫(kù) ell，重新定義提示工程

Syrupup ? 2576瀏覽 ? 0回復(fù)
關(guān)于大模型的使用——提示詞工程

AI探索時(shí)代 ? 2923瀏覽 ? 0回復(fù)
提示工程中的代理技術(shù)：構(gòu)建智能自主的AI系統(tǒng)

芝士AI吃魚(yú) ? 1963瀏覽 ? 0回復(fù)
OpenAI o1 模型到來(lái)后，談?wù)?em>提示詞工程的未來(lái)

Baihai_IDP ? 2060瀏覽 ? 0回復(fù)
微軟開(kāi)源PromptWizard，摔碎了提示工程師的飯碗

PaperAgent ? 2433瀏覽 ? 0回復(fù)
大語(yǔ)言模型o1慢思考推理系統(tǒng)的破局之路：模仿、探索與自我提升的深度揭秘！

十一月雨_55 ? 3612瀏覽 ? 0回復(fù)
處女座 (Virgo)：基于文本指令微調(diào)的多模態(tài)慢思考推理系統(tǒng)

上堵吟1 ? 2306瀏覽 ? 0回復(fù)
面向開(kāi)發(fā)人員的 ChatGPT 提示工程

sulu637 ? 2524瀏覽 ? 0回復(fù)
工具調(diào)用×大模型思考=超級(jí)智能體：ReAct 策略如何改變AI能力

九歌AI大模型 ? 1777瀏覽 ? 0回復(fù)
提示詞工程對(duì)大模型應(yīng)用的重要性

AI探索時(shí)代 ? 1275瀏覽 ? 0回復(fù)

大語(yǔ)言模型論文跟蹤

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

IKEA：通過(guò)強(qiáng)化學(xué)習(xí)提高LLM檢索規(guī)劃效率（開(kāi)源） 2h前發(fā)布
ScaleMCP: 結(jié)合RAG技術(shù)增強(qiáng)MCP工具管理能力 2h前發(fā)布

熱門(mén)推薦

Hybrid-RRF：動(dòng)態(tài)權(quán)重混合檢索RAG方案 0回復(fù)

擺脫云端限制！Qwen3+MCP+Ollama 本地工具調(diào)用實(shí)戰(zhàn)教程 0回復(fù)

Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 1回復(fù)

2025年最值得關(guān)注的十大多模態(tài)大語(yǔ)言模型！ 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲(chóng)神器 0回復(fù)

上一篇： CodeRAG-Bench：RAG遇到了Coder，哪個(gè)模型在RAG的加持下最會(huì)寫(xiě)代碼？

下一篇：你想要的GraphRAG的內(nèi)容都在這了

社區(qū)精華內(nèi)容

目錄

<cite id="qx1ox"><rp id="qx1ox"><form id="qx1ox"></form></rp></cite>