當(dāng)時(shí),我們的期望很高,并認(rèn)為這個(gè)行業(yè)已經(jīng)成熟,并且翹首以待迎接新的創(chuàng)新時(shí)代:是時(shí)候開始與機(jī)器進(jìn)行社交了。
那人類又何樂而不為呢?所有的預(yù)測(cè)都表示未來(lái)將會(huì)非常成功。
在2017年的世界移動(dòng)通信大會(huì)上,聊天機(jī)器人是主要的頭條新聞。會(huì)議組織者引用在“品牌和企業(yè)對(duì)聊天機(jī)器人的關(guān)注不可避免地轉(zhuǎn)移”的情況下,“壓倒性的認(rèn)可”。
事實(shí)上,關(guān)于聊天機(jī)器人的唯一重要問(wèn)題是誰(shuí)會(huì)壟斷這個(gè)領(lǐng)域,而不是聊天機(jī)器人是否會(huì)首先突然成功:一個(gè)單一的平臺(tái)是否將會(huì)出現(xiàn)并占領(lǐng)聊天機(jī)器人以及個(gè)人助理生態(tài)系統(tǒng)中呢?
一年過(guò)去了,我們對(duì)這個(gè)問(wèn)題有了答案嗎?
然而并沒有,因?yàn)闆]有一個(gè)生態(tài)系統(tǒng)可以使一個(gè)平臺(tái)占據(jù)主導(dǎo)地位。
被另一個(gè)炒作周期愚弄
聊天機(jī)器人并不是第一個(gè)被堂而皇之談?wù)摱笸蝗槐┑募夹g(shù)性發(fā)展。這個(gè)古老的炒作周期以熟悉的方式展開。
一些意見領(lǐng)袖在寫了一些非常嚴(yán)肅的文章,稱硅谷十分看好與智能自動(dòng)化對(duì)話的前景,各種信息也開始充斥聊天機(jī)器人。Slack經(jīng)歷了指數(shù)級(jí)增長(zhǎng),甚至還推出一個(gè)面向聊天機(jī)器人投資的基金。
期望逐漸建立,建立,然后……一切都失敗了。預(yù)測(cè)并沒有成為現(xiàn)實(shí)。
我們回顧了我們令人窒息的樂觀情緒,然后向彼此求助,如今有點(diǎn)困惑:“是嗎?這就是我們所期待的聊天機(jī)器人革命嗎?”
Digit的伊桑·布洛赫總結(jié)了普遍的共識(shí):“我甚至不確定我們是否可以說(shuō)聊天‘機(jī)器人已經(jīng)走到盡頭',因?yàn)槲疑踔敛恢浪鼈兪欠裨?jīng)活過(guò)。”
Heap負(fù)責(zé)產(chǎn)品設(shè)計(jì)的副總裁戴夫·費(fèi)爾德曼說(shuō),聊天機(jī)器人不僅僅是遇到一個(gè)問(wèn)題但失敗了:它們承擔(dān)了幾個(gè)任務(wù),而且都失敗了。
文本vs語(yǔ)言vs.GUI:一段顯著的歷史
機(jī)器人可以通過(guò)不同的方式與用戶交互。最大的區(qū)別是文本和語(yǔ)言。在(計(jì)算機(jī)接口)開始的時(shí)候是(書面的)單詞,用戶必須手動(dòng)輸入命令才能完成任何操作。
然后,圖形用戶界面(GUI)出現(xiàn)并挽救了局面。我們被窗戶、鼠標(biāo)點(diǎn)擊和圖標(biāo)所吸引。嘿,我們最終也提取到了顏色!
與此同時(shí),一群研究科學(xué)家正忙著開發(fā)與數(shù)據(jù)庫(kù)發(fā)的自然語(yǔ)言(NL)接口,而不是必須學(xué)習(xí)一種晦澀難懂的數(shù)據(jù)庫(kù)查詢語(yǔ)言。另一群科學(xué)家正在開發(fā)語(yǔ)音處理軟件,這樣你就可以直接和你的電腦說(shuō)話,而不必打字。
事實(shí)證明,這比任何人最初意識(shí)到的要困難得多,有這么多不同的口音,人們可能說(shuō)話太快或太慢,只是喃喃自語(yǔ)。
你說(shuō)過(guò)“recognise speech”或“wreck a nice beach”嗎?
議程上的下一個(gè)項(xiàng)目是與一臺(tái)機(jī)器進(jìn)行雙向?qū)υ?。這里有一個(gè)示例對(duì)話框(可以追溯到20世紀(jì)90年代)和VCR安裝系統(tǒng):
用戶:“你好。”
機(jī)器人:“你好,你叫什么名字?”
用戶:“Candy。”
機(jī)器人:“你好,Candy!”
用戶:“讓我們?cè)O(shè)定時(shí)鐘。”
機(jī)器人:“現(xiàn)在幾點(diǎn)了?”
用戶:“時(shí)間是上午11點(diǎn)。”
機(jī)器人把時(shí)鐘撥到上午11點(diǎn)。
很酷,對(duì)吧?系統(tǒng)以協(xié)作的方式進(jìn)行轉(zhuǎn)換,并且以聰明的方式確定用戶需求。它是精心制作的,用來(lái)處理涉及錄像機(jī)的談話,而且只能在嚴(yán)格的限制下進(jìn)行操作。
現(xiàn)代的機(jī)器人,不管它們需要打字還是語(yǔ)音輸入,都必須面對(duì)所有這些挑戰(zhàn),但也要在各種平臺(tái)上以一種高效、彈性的方式工作?;旧?,我們?nèi)栽谂?shí)現(xiàn)類似30年之前的突破創(chuàng)新。
然而,我們?cè)诤芏嗟胤匠霈F(xiàn)了偏差。
從機(jī)器人與應(yīng)用的角度思考問(wèn)題
一個(gè)超大的假設(shè)是,APP已經(jīng)“結(jié)束”,將被機(jī)器人取代。通過(guò)將兩個(gè)截然不同的概念相互對(duì)立(而不是將它們看作是為不同目的而設(shè)計(jì)的獨(dú)立實(shí)體),我們鼓勵(lì)機(jī)器人開發(fā)。
你可能還記得十年前當(dāng)應(yīng)用首次出現(xiàn)時(shí)類似的戰(zhàn)斗口號(hào),但你還記得當(dāng)應(yīng)用程序(APP)取代互聯(lián)網(wǎng)的時(shí)候嗎?據(jù)說(shuō),一種新產(chǎn)品或新服務(wù)需要滿足以下兩個(gè)要求:更好、更便宜或更快。
聊天機(jī)器人比應(yīng)用程序更便宜或者更快嗎?不,至少現(xiàn)在還沒有。
他們是否“更好”是主觀的,但我認(rèn)為更合理地來(lái)講,當(dāng)今最好的機(jī)器人無(wú)法與當(dāng)今最好的應(yīng)用相提并論。
此外,沒有人認(rèn)為使用Lyft過(guò)于復(fù)雜,或者在應(yīng)用程序上訂購(gòu)食物或購(gòu)買裙子太難。太復(fù)雜的是嘗試讓機(jī)器人完成這些任務(wù)——并且讓機(jī)器人失敗。
一個(gè)偉大的機(jī)器人可以和普通的應(yīng)用程序一樣有用。當(dāng)涉及到豐富、復(fù)雜、多層次的應(yīng)用程序時(shí),就沒有競(jìng)爭(zhēng)了。這是因?yàn)闄C(jī)器讓我們能夠訪問(wèn)龐大而復(fù)雜的信息系統(tǒng),早期的圖形信息系統(tǒng)在幫助我們定位這些系統(tǒng)方面取得了革命性的進(jìn)步。
現(xiàn)代的應(yīng)用程序受益于數(shù)十年的研究和實(shí)驗(yàn)。那我們?yōu)槭裁匆阉鼇G掉呢?
但是,如果我們把“替換”這個(gè)詞換成“擴(kuò)展”,事情就會(huì)變得有趣多了。今天最成功的機(jī)器人體驗(yàn)采用了一種混合工藝的方式,將聊天融入更廣泛的戰(zhàn)略之中,同時(shí)包含更多的傳統(tǒng)元素。
從以上圖片中看出,佩妮在傳統(tǒng)的賬戶控制面板和交易列表旁邊提供了一些很好的建議和提醒。
HubSpot對(duì)話系統(tǒng)將Facebook Messenger、現(xiàn)場(chǎng)聊天、社交媒體、電子郵件和其他消息渠道統(tǒng)一為一個(gè)共享收件箱。
Layer給開發(fā)者提供了工具,從而可以在移動(dòng)網(wǎng)絡(luò)和桌面web以及原生應(yīng)用上創(chuàng)建個(gè)性化的消息傳遞體驗(yàn)。
下一波將是多模式應(yīng)用,你可以在這里說(shuō)出你想要的(比如Siri),然后通過(guò)地圖、文本,甚至是語(yǔ)音回復(fù)的方式收到信息。
為機(jī)器人而出現(xiàn)的機(jī)器人
我的產(chǎn)品需要機(jī)器人嗎?現(xiàn)有的平臺(tái)是否能夠支持其功能?我是否有足夠的耐心去建造一個(gè)能夠做我想做的事情的機(jī)器人?
大肆宣傳的另一個(gè)問(wèn)題是,它往往會(huì)繞過(guò)像這樣的基本問(wèn)題。
對(duì)于很多公司來(lái)說(shuō),機(jī)器人并不是一個(gè)正確的解決方案。在過(guò)去的兩年里,機(jī)器人被盲目地應(yīng)用于沒必要的問(wèn)題之上。為了建造機(jī)器人而建造機(jī)器人,讓它自由進(jìn)展,并期待最好的結(jié)果永遠(yuǎn)不會(huì)有好結(jié)果。
完全沒必要的Maroon 5聊天機(jī)器人
絕大多數(shù)的機(jī)器人都是使用決策樹邏輯構(gòu)建的,在這個(gè)邏輯中,bot的響應(yīng)依賴于在用戶輸入中發(fā)現(xiàn)特定的關(guān)鍵字。這種方法的優(yōu)點(diǎn)是,很容易列出它們被設(shè)計(jì)用來(lái)覆蓋所有的情況。這也是他們的劣勢(shì)所在。
這是因?yàn)檫@些機(jī)器人純粹是對(duì)他們?cè)O(shè)計(jì)者的能力、一絲不茍以及耐心的反映,以及對(duì)他們能夠預(yù)見到的用戶需求和投入的反映。當(dāng)生活拒絕使用它們時(shí),問(wèn)題就出現(xiàn)了。
根據(jù)最近的報(bào)道,在Facebook Messenger上的10萬(wàn)個(gè)機(jī)器人中,70%不能完成簡(jiǎn)單的用戶請(qǐng)求。這在一定程度上是由于開發(fā)人員無(wú)法將他們的機(jī)器人專注于一個(gè)優(yōu)勢(shì)的焦點(diǎn)領(lǐng)域。
當(dāng)我們?cè)诮ㄔ?ldquo;咆哮機(jī)器人”時(shí),盡管人們可能會(huì)對(duì)潛在的資本問(wèn)題感到過(guò)度擔(dān)憂,但是我們決定專門針對(duì)銷售和市場(chǎng)營(yíng)銷人員進(jìn)行設(shè)計(jì):而不是使其成為一個(gè)“全能選手”。
記?。耗芎芎猛瓿梢患碌臋C(jī)器人比一個(gè)能做多件事的機(jī)器人更有幫助。
不可接近性
一個(gè)有能力的開發(fā)人員可以在幾分鐘內(nèi)構(gòu)建一個(gè)基本的機(jī)器人——但是一個(gè)可以進(jìn)行對(duì)話的機(jī)器人呢?這是另一個(gè)故事。盡管圍繞人工智能的炒作不斷,但我們要做出任何類似人類的東西還有很長(zhǎng)的路要走。
在一個(gè)理想的世界中,NLP(自然語(yǔ)言處理)的技術(shù)應(yīng)該幫助聊天機(jī)器人理解它所接收到的消息。
但是NLP只是剛剛從研究實(shí)驗(yàn)室起步,而且還處于起步階段。有些平臺(tái)提供了一些NLP,但即使是最好的平臺(tái)也能達(dá)到“孩子的水平”(例如,想想Siri理解單詞,但是不理解他們的意思)。
正如Matt Asay概述的那樣,這導(dǎo)致了另一個(gè)問(wèn)題的出現(xiàn):未能抓住開發(fā)人員的注意力和創(chuàng)造力。
“除非機(jī)器智能能夠接近人類智能,否則消費(fèi)者的興趣永遠(yuǎn)不會(huì)實(shí)現(xiàn)。”用戶的興趣取決于人工智能,這使得與機(jī)器人對(duì)話對(duì)消費(fèi)者來(lái)說(shuō)是有值得的。”
今天基于規(guī)則的對(duì)話系統(tǒng)過(guò)于脆弱,無(wú)法應(yīng)對(duì)這種不可預(yù)測(cè)性,而使用機(jī)器學(xué)習(xí)的統(tǒng)計(jì)方法也同樣有限。人工智能對(duì)話所需的人工智能水平目前來(lái)說(shuō)還不具備。與此同時(shí),很少有高質(zhì)量的機(jī)器人引領(lǐng)潮流。
就如戴夫費(fèi)爾德曼評(píng)論道:
“Slack、Facebook、谷歌、微軟、Kik和其他公司是否應(yīng)該打造自己的內(nèi)置機(jī)器人來(lái)引領(lǐng)這一發(fā)展?他們是否應(yīng)該更積極地利用他們的機(jī)器人基金和孵化器,雇傭?qū)焷?lái)教育參與者,或者提供工程和設(shè)計(jì)資源?在高知名度的合作伙伴中資助戰(zhàn)略機(jī)器人計(jì)劃呢?
在我看來(lái)絕對(duì)是的。當(dāng)涉及到平臺(tái)時(shí),開發(fā)人員是用戶;我們不依賴于用戶來(lái)理解為為何或如何使用我們的產(chǎn)品。我們必須向他們展示。”
GUI不應(yīng)該被忽略
曾幾何時(shí),與計(jì)算機(jī)交互的唯一方法就是在終端上輸入晦澀的命令。使用Windows、圖標(biāo)或鼠標(biāo)的可視化界面是我們操作信息的一場(chǎng)革命。計(jì)算從基于文本的到圖形用戶界面(GUI)的轉(zhuǎn)換是有原因的。
在輸入端,點(diǎn)擊比輸入更容易,也更快捷。點(diǎn)擊或選擇顯然比輸入整句話更可取,即使是具有預(yù)測(cè)性(通常容易出錯(cuò))的文本也是如此。在輸出端,有句老話說(shuō),一張圖片值一千個(gè)字,這句話通常是正確的。
由于我們是高度可視化的生物,所以我們可以看到信息的光學(xué)顯示。孩子們喜歡觸屏,這并非偶然。構(gòu)思圖形界面的先驅(qū)者們受到了認(rèn)知心理學(xué)以及關(guān)于大腦如何處理溝通研究的啟發(fā)。
對(duì)話式的用戶界面是為了復(fù)制人類喜愛的交流方式,但最終需要額外的認(rèn)知努力。從本質(zhì)上講,我們?cè)趯⒁恍┖?jiǎn)單的東西替換為更復(fù)雜的選擇。
當(dāng)然,有些概念是我們只能用語(yǔ)言表達(dá)的(“向我展示通往博物館的所有方法,讓我走2000,但不需要超過(guò)35分鐘”),但是大多數(shù)任務(wù)可以使用GUI更高效、更直觀地完成,而不是使用對(duì)話式的UI來(lái)完成。
人類喜歡與人交談
在業(yè)務(wù)交互中,針對(duì)人的維度是有意義的。如果有一件事是將銷售和市場(chǎng)營(yíng)銷分裂的,那就是缺乏人性:在彩票號(hào)碼、反饋表格、“不回復(fù)郵件”、“自動(dòng)回復(fù)”和“聯(lián)系我們”的表格后面所隱藏的是品牌。
Facebook的目標(biāo)是,他們的機(jī)器人應(yīng)該通過(guò)所謂的圖靈測(cè)試,這意味著你無(wú)法判斷你是在和機(jī)器人還是人類對(duì)話。
但是機(jī)器人和人類是不一樣的。它永遠(yuǎn)不會(huì)。對(duì)話所包含的不僅僅是文本。人類可以理解字里行間的寓意,利用語(yǔ)境信息,理解深層次含義,比如諷刺。
但是,機(jī)器人很快就會(huì)忘記它們?cè)谡f(shuō)什么,這意味著它有點(diǎn)像和一個(gè)短期記憶或幾乎沒有記憶的人交談。
正如HubSpot團(tuán)隊(duì)所指出的:
機(jī)器人提供了一種可擴(kuò)展的方式,可以與買家進(jìn)行一對(duì)一的互動(dòng)。然而,當(dāng)他們沒能提供一種高效、令人愉快的體驗(yàn)時(shí),他們就會(huì)失敗,因?yàn)槿藗兞?xí)慣于在消息應(yīng)用中與他人進(jìn)行復(fù)雜的、多層次的對(duì)話。
人們不容易上當(dāng)受騙,同時(shí),假裝機(jī)器人是人類,肯定會(huì)減少回報(bào)(更不用說(shuō)你對(duì)用戶撒謊的情況了)。而且,即使是那些稀有的機(jī)器人是由最先進(jìn)的NLP驅(qū)動(dòng)、擅長(zhǎng)處理并生產(chǎn)內(nèi)容,相比之下也會(huì)相形見絀。
這是另一件事。對(duì)話式的交互界面是為了復(fù)制人類喜歡與他人進(jìn)行交流的方式——并應(yīng)用于與其他人類的交流之中。但這是人類更喜歡與機(jī)器互動(dòng)的方式嗎?
不一定。在一天結(jié)束的時(shí)候,沒有多少機(jī)智的妙語(yǔ)或類似于人類習(xí)慣可以將機(jī)器人從失敗的對(duì)話中拯救出來(lái)。
我們目前會(huì)朝什么方向發(fā)展?
在某種程度上,那些早期采用者并不是完全錯(cuò)誤的。人們?cè)诩依镆蠊雀璨シ潘麄冏钕矚g的歌曲,從Domino的機(jī)器人上訂購(gòu)披薩,并從絲芙蘭那里得到一些化妝提示。
但就消費(fèi)者的反應(yīng)和開發(fā)者的參與度而言,聊天機(jī)器人并沒有達(dá)到2015或2016年左右所宣揚(yáng)的宣傳效果。甚至連接近都達(dá)不到。
計(jì)算機(jī)的功能沒有問(wèn)題。搜索數(shù)據(jù),分析數(shù)據(jù),分析觀點(diǎn),壓縮信息。計(jì)算機(jī)不擅長(zhǎng)理解人類的情感。NLP的狀態(tài)意味著他們?nèi)匀粵]有得到我們所想要的東西,更沒有將我們的感受考慮進(jìn)去。
這就是為什么我們?nèi)匀粺o(wú)法想象有效的客戶支持、銷售或營(yíng)銷,而不需要人類基本接觸,即移情和情商的情景是什么樣子的。
目前,機(jī)器人可以繼續(xù)幫助我們處理自動(dòng)化、重復(fù)、低層次的任務(wù)和查詢工作;同時(shí),在一個(gè)更大、更復(fù)雜的系統(tǒng)中承擔(dān)銷售成本的作用。由于我們期待太多,要求過(guò)急,對(duì)他們以及我們都造成了傷害。但這并不是故事的全部。
我們的行業(yè)嚴(yán)重高估了聊天機(jī)器人的初始影響效應(yīng)。
正如比爾蓋茨曾經(jīng)說(shuō)過(guò)的:
我們總是高估接下來(lái)兩年將要發(fā)生的變化,同時(shí)低估接下來(lái)10年將要發(fā)生的變化。
不要讓自己陷入一種不作為的境地。
炒作已經(jīng)結(jié)束,這是一件好事。
現(xiàn)在,我們可以開始檢查中間的灰色區(qū)域,而不是那些過(guò)度膨脹、瘋狂的黑白極端區(qū)域。我相信我們正處于爆炸性增長(zhǎng)的開端。這種反高潮的感覺對(duì)于轉(zhuǎn)換技術(shù)來(lái)說(shuō)是完全正常的。消息傳遞將繼續(xù)吸引用戶。