自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

提示工程策略:利用【慢思考】的雙過(guò)程理論減少模型有害輸出 精華

發(fā)布于 2024-7-1 11:34
瀏覽
0收藏

1. 思考的快與慢

提示工程策略:利用【慢思考】的雙過(guò)程理論減少模型有害輸出-AI.x社區(qū)圖片

諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主卡尼曼在《Thinking, Fast and Slow》這本書(shū)中根據(jù)前人多種雙過(guò)程理論(Dual Process Theory)進(jìn)行了總結(jié)和進(jìn)一步解釋:將人類的思考過(guò)程分為“直覺(jué)”和“推理”,這兩個(gè)過(guò)程分別被稱為“系統(tǒng)1(System 1)”和“系統(tǒng)2(System 2)”。

系統(tǒng)一的特點(diǎn)是快速,不加思考、不做計(jì)算、僅憑直覺(jué)就做出判斷。比如,當(dāng)我們回答1+1這個(gè)問(wèn)題的時(shí)候,我們的大腦可以不加思考的回答出等于2。所以系統(tǒng)一的特點(diǎn)是:快思考、熱啟動(dòng)、直覺(jué)判斷。

系統(tǒng)二的特點(diǎn)是速度,需要做復(fù)雜的計(jì)算、推理,但回答準(zhǔn)確度高。比如,當(dāng)我們回答123乘以879的時(shí)候,我們無(wú)法通過(guò)我們的快思考來(lái)回答,我們需要調(diào)用大腦的計(jì)算模塊,對(duì)這個(gè)問(wèn)題進(jìn)行復(fù)雜的計(jì)算后才能回答。所以系統(tǒng)二的特點(diǎn)是:慢思考、啟動(dòng)慢、耗費(fèi)能量高、判斷準(zhǔn)確。

為什么今天要討論大腦的思考過(guò)程?

是因?yàn)榇笳Z(yǔ)言模型在AGI的技術(shù)路線上,相當(dāng)于我們?nèi)祟惖拇竽X。大多數(shù)人在第一次使用大語(yǔ)言模型的時(shí)候,經(jīng)常會(huì)感受到大語(yǔ)言模型的愚蠢,比如,讓他計(jì)算1+1等于幾是可以計(jì)算的,但是讓他計(jì)算123乘以879時(shí),往往會(huì)計(jì)算不對(duì)(現(xiàn)在的網(wǎng)頁(yè)版AI模型往往會(huì)在背后調(diào)用計(jì)算工具)。

提示工程策略:利用【慢思考】的雙過(guò)程理論減少模型有害輸出-AI.x社區(qū)圖片

當(dāng)大模型計(jì)算1+1的時(shí)候,其實(shí)我們可以認(rèn)為大模型其實(shí)是在做一個(gè)最簡(jiǎn)單的快思考,回答的很快,直接通過(guò)大語(yǔ)言模型存儲(chǔ)的知識(shí),憑大模型的“直覺(jué)”來(lái)推斷答案;當(dāng)回答復(fù)雜的計(jì)算題時(shí),大模型需要使用一些計(jì)算工具,這些工具可以是大模型內(nèi)置的,可也是大模型外掛的,這可以理解為是大模型的慢思考。這兩個(gè)過(guò)程實(shí)際上跟我們前面介紹的系統(tǒng)1和系統(tǒng)2的特點(diǎn)是非常吻合的。

講了這么多,今天要介紹的這篇論文其實(shí)就是利用了【系統(tǒng)二】這樣的一些理論來(lái)優(yōu)化我們的提示工程策略,提高大語(yǔ)言模型回答的準(zhǔn)確性和效果,在這篇論文里是降低了大模型的有害偏見(jiàn),有效性高達(dá)13%。

2. 大模型的語(yǔ)言偏見(jiàn)

提示工程策略:利用【慢思考】的雙過(guò)程理論減少模型有害輸出-AI.x社區(qū)圖片

介紹如何利用【系統(tǒng)二】來(lái)提升大模型效果之前,我們先來(lái)簡(jiǎn)單介紹下大模型語(yǔ)言偏見(jiàn)的一些背景。

大語(yǔ)言模型進(jìn)展非常迅速,也取得了非常好的效果,但是大語(yǔ)言模型在表達(dá)的時(shí)候仍然可能會(huì)出現(xiàn)一些偏見(jiàn)性得表達(dá)。這些偏見(jiàn)以多種形態(tài)出現(xiàn),如刻板印象和有偏見(jiàn)的答案,引發(fā)了關(guān)于LLM在現(xiàn)實(shí)應(yīng)用中的倫理問(wèn)題。

由于大語(yǔ)言模型的黑盒特性,其內(nèi)部參數(shù)構(gòu)成非常復(fù)雜和不透明,以及人類語(yǔ)言的靈活性和文化依賴性,識(shí)別和消除這些偏見(jiàn)變得異常困難。減輕LLM中的社會(huì)偏見(jiàn)對(duì)于確保AI在通信和決策中的公平性和包容性至關(guān)重要。

本文作者主要研究了這些偏見(jiàn)中的9大類:年齡歧視、外貌、職業(yè)與外貌、性別、制度、國(guó)籍、職業(yè)、種族、宗教。

3. 【系統(tǒng)二】原理是如何指導(dǎo)提示工程優(yōu)化大語(yǔ)言模型效果?

在本篇論文里,作者對(duì)比了12中不同的提示詞策略,12種提示詞策略包括:COT、系統(tǒng)一、系統(tǒng)二、人類角色和機(jī)器角色,以及這些的組合。

提示工程策略:利用【慢思考】的雙過(guò)程理論減少模型有害輸出-AI.x社區(qū)圖片

上圖中的HP表示人類角色(Human Persona),MP表示機(jī)器角色(Machine Persona)。

提示工程策略:利用【慢思考】的雙過(guò)程理論減少模型有害輸出-AI.x社區(qū)圖片

從上圖可以看出來(lái):

  • ? 使用【系統(tǒng)二】+人類角色 提示詞策略的時(shí)候,減少的模型有害偏見(jiàn)輸出是效果最好的。系統(tǒng)一的各種組合所帶來(lái)的減少效果都不如系統(tǒng)二,這與我們的雙系統(tǒng)理論是一致的。
  • ? 另外,COT的提示策略,并沒(méi)有有效減少偏見(jiàn)的產(chǎn)生。

提示工程策略:利用【慢思考】的雙過(guò)程理論減少模型有害輸出-AI.x社區(qū)圖片

上圖展示了不同模型、不同提示詞策略、不同的偏見(jiàn)類型上,哪種提示工程策略表現(xiàn)最好??梢钥闯?,當(dāng)人類角色和系統(tǒng)二結(jié)合的時(shí)候,往往可以最大程度減少有害偏見(jiàn)的輸出。

4. 思考

快思考慢思考的思維方式,可以僅僅使用提示工程就可以提高模型的表達(dá)效果,這與我們?nèi)祟惖乃季S方式極為相似。這是否正好暗示了,大語(yǔ)言模型這種方式,可能就是未來(lái)人類通向AGI的必經(jīng)之路呢?大語(yǔ)言模型是否會(huì)在未來(lái)的AGI道路上替代人類大腦呢?

本文轉(zhuǎn)載自大語(yǔ)言模型論文跟蹤,作者: HuggingAGI ????

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦