你該如何理解和適應(yīng)人工智能
我們每年向幾百名學(xué)生教授數(shù)據(jù)科學(xué),他們都對人工智能很著迷,并會提出很好的問題。汽車如何學(xué)習(xí)自動駕駛?亞歷克莎(Alexa)如何理解我在說什么?聲田(Spotify)是怎樣為我選擇如此精彩的播放列表的呢?臉書如何在我上傳的照片中識別我的朋友?這些學(xué)生意識到,人工智能不是來自未來的某種科幻機(jī)器人。
它存在于此時(shí)此刻。它在通過每一部智能手機(jī)改變世界。學(xué)生們都想理解人工智能,而且都想?yún)⑴c其中。
我們的學(xué)生,不是唯一對人工智能產(chǎn)生熱情的人。和他們一樣欣喜的,還有世界上最大的公司——從美國的亞馬遜、臉書、谷歌到中國的百度、騰訊、阿里巴巴。你可能聽說過,這些大型科技公司正在發(fā)動一場針對人工智能人才的昂貴的全球“軍備競賽”,他們認(rèn)為這對他們的未來非常重要。
現(xiàn)在,我們看到更多公司參與到人工智能領(lǐng)域的人才爭奪之中——比如坐擁海量數(shù)據(jù)的保險(xiǎn)和石油公司,他們同樣可以提供可觀的薪水和獨(dú)具特色的咖啡機(jī)。
這種軍備競賽當(dāng)然是真實(shí)的,但我們認(rèn)為人工智能領(lǐng)域目前還有另一個(gè)更加強(qiáng)烈的趨勢——這個(gè)趨勢不是集中,而是擴(kuò)散和傳播。是的,每家大型科技公司都在努力囤積數(shù)學(xué)和編程人才,但與此同時(shí),人工智能背后的基本技術(shù)和思想正在以極快的速度擴(kuò)散,被小公司、其他行業(yè)以及世界各地的愛好者、程序員、科學(xué)家和研究人員所掌握。這種民主化趨勢是最讓我們今天的學(xué)生感到激動的事情,因?yàn)樗麄冋诳紤]各種急切需要人工智能解決方案的問題。
比如,誰會想到一群大學(xué)生會對黃瓜數(shù)學(xué)如此著迷?當(dāng)他們聽說日本汽車工程師小池誠(MakotoKoike,音譯)的故事時(shí),他們的確很著迷。小池誠的父母有一座黃瓜農(nóng)場。在日本,黃瓜具有各種令人眼花繚亂的大小、形狀、顏色和毛刺度——人們必須根據(jù)這些外觀特征將黃瓜分屬九種類別,這些類別具有不同的市場價(jià)格。
過去,小池的母親每天要花八個(gè)小時(shí)手工分揀黃瓜。后來,小池意識到,他可以用谷歌的開源人工智能軟件TensorFlow完成這項(xiàng)任務(wù)。他可以編寫一種“深度學(xué)習(xí)”算法程序,根據(jù)照片為黃瓜分類。
小池之前從未使用過人工智能和TensorFlow,但他很容易就根據(jù)現(xiàn)有的所有免費(fèi)資源完成了自學(xué)。當(dāng)他的人工智能分揀機(jī)器視頻在YouTube上出現(xiàn)時(shí),小池成了深度學(xué)習(xí)和黃瓜這兩個(gè)領(lǐng)域的國際名人。他不僅為人們提供了一個(gè)有趣的故事,為他的母親免除了無數(shù)個(gè)小時(shí)的辛勞,他還向全世界的學(xué)生和程序員傳達(dá)了一個(gè)令人鼓舞的消息:既然人工智能可以解決黃瓜農(nóng)場的問題,那么它應(yīng)該可以解決幾乎所有領(lǐng)域的問題。
這條消息目前正在迅速傳播。醫(yī)生正在用人工智能診斷和治療癌癥。電力公司用人工智能提高發(fā)電效率。投資者用人工智能管理財(cái)務(wù)風(fēng)險(xiǎn)。石油公司用人工智能提高深海鉆井平臺的安全性。執(zhí)法機(jī)構(gòu)用人工智能追捕恐怖分子。科學(xué)家用人工智能獲取天文、物理和神經(jīng)科學(xué)的新發(fā)現(xiàn)。世界各地的公司、研究人員和愛好者正在以數(shù)千種不同的方式使用人工智能,比如探測天然氣泄漏,開采鐵礦石,預(yù)測疾病暴發(fā),避免蜜蜂滅絕,量化好萊塢電影中的性別歧視。
這僅僅是開始。
我們認(rèn)為,人工智能的真實(shí)故事恰恰體現(xiàn)了這種擴(kuò)散:從過去幾十年甚至幾百年間的幾個(gè)核心數(shù)學(xué)概念,到今天的超級計(jì)算機(jī)和講話、思考、分揀黃瓜的機(jī)器,到明天無處不在的新的數(shù)字奇跡。
我們這本書的目的就是向你講述這個(gè)故事。它在一定程度上是科技故事,但它主要講述的是思想以及思想背后的人——這些人所處的時(shí)代比現(xiàn)在早得多,他們只是在低調(diào)地解決他們面對的數(shù)學(xué)和數(shù)據(jù)問題,他們并不知道他們的解決方案將對現(xiàn)代社會起到怎樣的作用。讀完這個(gè)故事,你會理解人工智能的含義、來源、原理及其在生活中的重要意義。
人工智能到底是什么意思?
當(dāng)你聽到“人工智能”時(shí),不要想到機(jī)器人。你應(yīng)該把它看成一種算法。
算法是一組帶有步驟的指令。這些指令非常清晰,就連計(jì)算機(jī)這樣頭腦簡單的事物也能遵循。(你可能聽說過下面的笑話。一個(gè)機(jī)器人卡在浴室里出不來了,因?yàn)橄窗l(fā)水瓶身上的算法是:“涂抹。沖洗。重復(fù)。”)算法本身并不比電鉆更加聰明,它只能把一件事情做得很好,比如為數(shù)組排序,或者在網(wǎng)上搜索可愛的動物照片。不過,如果你將許多算法巧妙地組合在一起,你就可以生成人工智能,使人覺得它在某個(gè)領(lǐng)域可以做出智能行為。例如,你可能會向谷歌Home這樣的數(shù)字助理提出“奧斯汀最好的早餐玉米卷餅在哪兒”等問題。這種詢問會引發(fā)算法的連鎖反應(yīng):
一個(gè)算法將原始聲波轉(zhuǎn)化成數(shù)字信號。
另一個(gè)算法將這個(gè)信號轉(zhuǎn)化成一串英語音素,即獨(dú)特的
聽覺感知:“brek-fust-tah-koze”。
下一個(gè)算法將這些音素劃分成詞語:“breakfasttacos”。
這些詞語被發(fā)送到搜索引擎——搜索引擎本身就是海量算法的集合,可以處理查詢,做出回答。
另一個(gè)算法將這種回答轉(zhuǎn)化成清晰的英語句子。
最后一個(gè)算法以聽上去不像機(jī)器人的方式表述這個(gè)句子:
“奧斯汀最好的早餐玉米卷餅在杜瓦爾街的胡里奧餐廳。您需要導(dǎo)航嗎?”
這就是人工智能。幾乎每個(gè)人工智能系統(tǒng)都會遵循這種“算法管道”模式,不管是自動駕駛汽車、自動黃瓜分揀機(jī)還是監(jiān)測信用卡賬戶盜刷的軟件。這種管道會接收來自某個(gè)具體領(lǐng)域的數(shù)據(jù),執(zhí)行一系列計(jì)算,然后輸出預(yù)測或決定。
人工智能使用的算法有兩個(gè)明顯特征。首先,這些算法處理的通常不是確定性,而是概率。例如,人工智能中的算法不會直接指出某筆信用卡交易存在欺詐。相反,它會指出欺詐概率是92%,或者它根據(jù)數(shù)據(jù)得到的任何概率。第二個(gè)特征涉及這些算法是如何知道應(yīng)該遵循哪些指令的。在傳統(tǒng)算法中,比如運(yùn)行網(wǎng)站或處理文字的算法,這些指令是程序員提前固定下來的。不過,在人工智能中,這些指令是算法直接從“訓(xùn)練數(shù)據(jù)”中學(xué)到的。沒有人告訴人工智能算法如何判斷信用卡交易是否存在欺詐。相反,算法會看到每個(gè)類別(欺詐,無欺詐)中的許多案例,它會找到區(qū)分二者的模式。
對于人工智能來說,程序員的作用不是告訴算法應(yīng)該做什么,而是告訴算法如何根據(jù)數(shù)據(jù)和概率規(guī)則獲知自己應(yīng)該做什么。
我們是如何走到今天的?
自動駕駛汽車和家庭數(shù)字助理等現(xiàn)代人工智能系統(tǒng)屬于新鮮事物。不過,你可能會吃驚地發(fā)現(xiàn),人工智能的重要思想其實(shí)很古老——許多思想已經(jīng)存在了數(shù)百年——我們的祖先一直在用它們解決問題。以自動駕駛汽車為例,谷歌第一款自動駕駛汽車于2009年首次亮相。不過,你將在第三章發(fā)現(xiàn),這些汽車背后的主要思想之一是某個(gè)長老會牧師在18世紀(jì)50年代發(fā)現(xiàn)的——50多年前,某個(gè)數(shù)學(xué)家團(tuán)隊(duì)還用這種思想解決了冷戰(zhàn)時(shí)期最大的轟動性謎團(tuán)之一。
另一個(gè)例子是圖像分類,比如自動在臉書照片中為你的朋友做標(biāo)記的軟件。圖像處理算法在過去五年取得了很大進(jìn)步,但你將在第二章看到,這里的關(guān)鍵思想來自1805年——而且,一位不知名的天文學(xué)家亨麗埃塔·萊維特(HenriettaLeavitt),在一個(gè)世紀(jì)前利用這些思想幫助人類解答了歷史上最深刻的科學(xué)問題之一:宇宙有多大?
再以語音識別為例,這是人工智能近年來的偉大勝利之一。亞歷克莎和谷歌Home等數(shù)字助理在語言方面非常流利,而且它們只會變得越來越好。不過,第一個(gè)讓計(jì)算機(jī)理解英語的人是一位美國海軍少將,而且這件事發(fā)生在將近70年前。(見第四章。)
這里只舉了三個(gè)例子,但它們說明了一個(gè)驚人的事實(shí):不管你考察人工智能的哪些方面,你都會找到一個(gè)被人們長期研究過的思想。所以,從各方面來看,最大的歷史謎團(tuán)不是人工智能為什么會在今天出現(xiàn),而是它為什么沒有在很久以前出現(xiàn)。要想解釋這個(gè)謎團(tuán),我們必須考慮將這些寶貴思想帶入新時(shí)代的三個(gè)強(qiáng)大的技術(shù)力量。
第一個(gè)使人工智能成為可能的力量是計(jì)算機(jī)長達(dá)幾十年的指數(shù)增長速度,通常被稱為摩爾定律。你很難直觀地理解計(jì)算機(jī)目前的速度有多快。過去的常見說法是,阿波羅宇航員登陸月球時(shí)使用的計(jì)算能力還比不上一只袖珍計(jì)算器。不過,這種說法已經(jīng)無法使人產(chǎn)生共鳴了,因?yàn)?hellip;…袖珍計(jì)算器是什么東西?所以,讓我們用汽車來類比。1951年,尤尼瓦克是速度最快的計(jì)算機(jī)之一,每秒可以進(jìn)行2000次計(jì)算,而速度最快的汽車之一阿爾法羅密歐6C的時(shí)速可達(dá)180公里。之后,汽車和計(jì)算機(jī)都在提速。不過,如果汽車能像計(jì)算機(jī)那樣提速,那么現(xiàn)代阿爾法羅密歐的速度將達(dá)到光速的800萬倍。
人工智能的第二個(gè)助推器是新的摩爾定律:隨著人類所有信息的數(shù)字化,可用數(shù)據(jù)量出現(xiàn)了爆炸式增長。美國國會圖書館擁有10太字節(jié)的存儲量,但是谷歌、蘋果、臉書、亞馬遜四大科技公司2013年一年收集的數(shù)據(jù)就是這個(gè)數(shù)字的大約12萬倍。而且,從互聯(lián)網(wǎng)視角來看,這已經(jīng)是上一代的事情了。數(shù)據(jù)積累的加速節(jié)奏比阿波羅火箭還要快。2017年,YouTube每分鐘上傳的視頻超過300小時(shí),instagram每天貼出的照片超過1億張。更多的數(shù)據(jù)意味著更聰明的算法。
第三個(gè)支撐人工智能的因素是云計(jì)算。消費(fèi)者幾乎看不到這種趨勢,但它對人工智能產(chǎn)生了巨大的民主化影響。為說明這一點(diǎn),我們要對數(shù)據(jù)和石油進(jìn)行類比。假設(shè)20世紀(jì)早期的所有公司都擁有一些石油,但是它們需要獨(dú)自建設(shè)基礎(chǔ)設(shè)施,以便開采、運(yùn)輸和提煉石油。如果一家公司有了利用石油的新思想,它需要面對巨大的固定起步成本。因此,大多數(shù)石油都不會得到使用。同樣的邏輯也適用于數(shù)據(jù),即21世紀(jì)的石油。如果用自己的數(shù)據(jù)打造人工智能系統(tǒng)需要購買所有的裝備和專業(yè)人才,大多數(shù)愛好者和小公司都會面對難以負(fù)擔(dān)的成本。不過,微軟Azure、IBM和亞馬遜WebServices等平臺提供的云計(jì)算資源將這種固定成本轉(zhuǎn)化成了可變成本,極大地改變了大規(guī)模數(shù)據(jù)存儲和分析的支出比重。今天,任何想要使用個(gè)人“石油”的人都可以租用其他人的基礎(chǔ)設(shè)施,以降低成本。
當(dāng)你將這四種趨勢——更快的芯片、大量數(shù)據(jù)、云計(jì)算以及最重要的優(yōu)秀思想——放在一起時(shí),用人工智能解決實(shí)際問題的需求和能力就會出現(xiàn)爆炸式增長。
人工智能焦慮
我們已經(jīng)向你講述了我們的學(xué)生對于人工智能多么興奮,以及世界上最大的公司是如何迫不及待地迎接人工智能的。不過,如果我們說每個(gè)人都對這些新技術(shù)如此看好,我們就是在說謊。實(shí)際上,許多人對于工作、數(shù)據(jù)隱私、財(cái)富集中或者制造假新聞的俄羅斯推特機(jī)器人感到焦慮。一些人——最著名的是特斯拉和太空探索技術(shù)公司背后的科技企業(yè)家埃隆·馬斯克(Elon Musk)——描繪了更加恐怖的圖景:機(jī)器人獲得了自我意識,不再愿意被人類統(tǒng)治,開始用硅片之拳統(tǒng)治我們。
讓我們先來談一談馬斯克的憂慮。他的觀點(diǎn)獲得了許多關(guān)注,這可能是因?yàn)閾碛袃|萬身家的顛覆者對于人工智能的論述容易引起人們的注意。馬斯克聲稱,人類開發(fā)人工智能技術(shù)是在“召喚魔鬼”,智能機(jī)器是“對我們的存在產(chǎn)生最大威脅”的物種。
讀完我們這本書時(shí),你可以自行判斷這些擔(dān)憂是否可信。不過,我們想提前警告你,你很容易落入認(rèn)知科學(xué)家所說的“可得性啟發(fā)法”的陷阱,即人們根據(jù)頭腦中最早出現(xiàn)的任何例子來評估某種說法可信度的心理捷徑。對于人工智能,這些例子主要來自科幻小說,而且大部分是邪惡的——比如終結(jié)者、博格和哈爾9000。我們認(rèn)為,這些科幻案例具有強(qiáng)大的錨定效應(yīng),會使許多人減少對于“邪惡人工智能視角”應(yīng)有的懷疑。我們可以想象,可以拍電影,但這并不意味著我們能把它制造出來。今天,沒有人知道如何制造出像人類或者終結(jié)者那樣擁有通用智能的機(jī)器人。在遙遠(yuǎn)的未來,你的后代子孫也許可以想出辦法,甚至可以用機(jī)器人恐嚇埃隆·馬斯克的后代子孫。不過,這將是他們的選擇和問題,因?yàn)榻裉斓娜藗兩踔翢o法確定遙遠(yuǎn)的未來是否存在這種可能性。對于現(xiàn)在和可以預(yù)見的未來,“智能”機(jī)器只在其特定領(lǐng)域擁有智能:
亞歷克莎可以把意大利肉醬面的菜譜念給你,但她不能切洋蔥。而且,她顯然不能用菜刀攻擊你。
自動駕駛汽車可以把你帶到足球場,但它并不能充當(dāng)比賽裁判,更不能根據(jù)自己的意志將你綁在門柱上,并把球踢向你的敏感部位。
此外,如果你擔(dān)心我們很快會被擁有自我意識的機(jī)器人征服,這種擔(dān)憂就會產(chǎn)生機(jī)會成本?,F(xiàn)在關(guān)注這種可能性就像1952年實(shí)現(xiàn)首次商業(yè)飛行的德哈維蘭航空公司擔(dān)心高速星際旅行的影響一樣。也許它在未來值得擔(dān)憂,但是現(xiàn)在,我們有更加重要的事情值得擔(dān)憂——還是用航班作類比,比如如何為今天天空中的所有飛機(jī)制定明智的管理政策。
這個(gè)政策問題引出了另一組對于人工智能的焦慮,它們更加可信,急切。人工智能會使人們失去工作嗎?機(jī)器會毫無責(zé)任地制定關(guān)于我們?nèi)松闹匾獩Q策嗎?擁有最聰明機(jī)器人的人最終會擁有未來嗎?
這些問題非常重要,它們一直在被人們討論——在科技會議上,在全球各大報(bào)紙上,在我們同事的午餐餐桌上。我們應(yīng)該提前告訴你,你無法在我們的書中找到這些問題的答案,因?yàn)槲覀儾恢来鸢?。和我們的學(xué)生一樣,歸根結(jié)底,我們對人工智能的未來是樂觀的。當(dāng)你讀完這本書時(shí),希望你也能擁有這種樂觀。不過,我們不是勞動經(jīng)濟(jì)學(xué)家、政策專家和預(yù)言家。我們是數(shù)據(jù)科學(xué)家——同時(shí)也是學(xué)術(shù)人員,這意味著我們的本能是堅(jiān)守我們的專業(yè)。我們相信我們的專業(yè)知識。我們可以讓你了解人工智能,但是不能明確告訴你未來是怎樣的。
不過,我們可以告訴你,我們知道人們對于人工智能的常見觀點(diǎn),這些觀點(diǎn)都是不完整的。這些人強(qiáng)調(diào)大型科技公司的財(cái)富和力量,但是他們忽視了人工智能正在發(fā)生的、令人難以置信的民主化和擴(kuò)散。他們強(qiáng)調(diào)機(jī)器用有偏數(shù)據(jù)制定重要決策的危險(xiǎn)性,但是他們沒能承認(rèn)人類決策中持續(xù)存在的偏差甚至惡意。最重要的是,他們強(qiáng)烈關(guān)注機(jī)器可能破壞的東西,但是他們沒有看到我們將會得到的東西:新的、更好的工作,新的便利,遠(yuǎn)離重復(fù)勞動的自由,更安全的工作環(huán)境,更好的醫(yī)療保健,更少的語言障礙,新的學(xué)習(xí)和決策工具。它們將會幫助我們成為更好、更聰明的人。
以就業(yè)為例。在美國,從2010年到2017年,失業(yè)報(bào)告不斷創(chuàng)造新低,盡管人工智能和自動化作為經(jīng)濟(jì)力量在不斷壯大。機(jī)器人自動化的腳步在中國更加迅猛,但中國的工資多年來一直在大幅上升。這并不意味著人工智能沒有威脅到個(gè)體的工作。這種威脅是存在的,而且會持續(xù)存在,就像動力織布機(jī)威脅到了織工的工作,或者汽車威脅到了馬車夫的工作。新技術(shù)總會改變經(jīng)濟(jì)所需要的勞工成分,壓低一些領(lǐng)域的工資,提升另一些領(lǐng)域的工資。人工智能也不例外。我們強(qiáng)烈支持通過工作培訓(xùn)和社會福利為那些被技術(shù)取代的人提供有意義的幫助。我們甚至可以將普遍基本收入作為解決方案,就像許多硅谷老板認(rèn)為的那樣。我們承認(rèn),我們不是這方面的專家。不過,到目前為止,人工智能會使未來的人失去工作的觀點(diǎn)完全沒有得到事實(shí)證據(jù)的支持。
還有市場操縱問題。亞馬遜、谷歌、臉書和蘋果等大型公司擁有巨大的力量。我們必須對這種力量保持警惕,以免它被用于遏制競爭或削弱民主標(biāo)準(zhǔn)。不過,不要忘了,這些公司之所以成功,是因?yàn)樗鼈兲峁┝巳藗兿矏鄣漠a(chǎn)品和服務(wù)。只有保持創(chuàng)新,它們才能繼續(xù)取得成功,而這對于大型機(jī)構(gòu)并不容易。此外,許多預(yù)測認(rèn)為,今天的大型科技公司會永遠(yuǎn)保持統(tǒng)治地位,但是這些預(yù)測并不能解釋過去,更不能預(yù)測未來。還記得戴爾和微軟在計(jì)算領(lǐng)域保持統(tǒng)治地位的年代嗎?或者諾基亞和摩托羅拉稱霸手機(jī)領(lǐng)域的年代——當(dāng)時(shí)它們極為強(qiáng)盛,你很難想象到后來的事情。還記得每個(gè)律師擁有黑莓手機(jī)、每個(gè)樂隊(duì)在Myspace上開設(shè)賬戶、每個(gè)服務(wù)器來自太陽微系統(tǒng)的年代嗎?還記得美國在線、百視達(dá)、雅虎、柯達(dá)或者索尼隨身聽嗎?不同的公司來來去去,但時(shí)代一直在前進(jìn),產(chǎn)品一直在變得越來越先進(jìn)。
我們對于人工智能的出現(xiàn)抱有現(xiàn)實(shí)的觀點(diǎn):它現(xiàn)在已經(jīng)出現(xiàn)了,未來還會變得越來越普遍,不管我們每個(gè)人是否喜歡它。這些技術(shù)會帶來巨大的利益,但它們也會不可避免地反映出我們這個(gè)文明的弱點(diǎn)。所以,我們需要警惕一些危險(xiǎn),比如隱私、平等、現(xiàn)有制度的危險(xiǎn)以及沒有人能預(yù)見的危險(xiǎn)——如果我們希望在即時(shí)評論和140字符的世界里制定明智的政策,我們必須在社會層面上均衡地討論這些問題,同時(shí)考慮到它們的重要性和復(fù)雜性。本書不會進(jìn)行這種討論。不過,我們會告訴你,要想在這種討論中扮演明智的角色,你需要知道什么。
關(guān)于數(shù)學(xué)
在開始之前,我們要提醒你最后一點(diǎn):本書將會涉及一些數(shù)學(xué)內(nèi)容。即使你從不認(rèn)為自己擅長數(shù)學(xué),你也不需要擔(dān)心。人工智能的數(shù)學(xué)知識極其簡單,我們保證你能理解。我們還可以保證,這種理解是值得的:如果你懂得人工智能背后的一點(diǎn)數(shù)學(xué)知識,人工智能在你心中的神秘感就會大大降低。
我們當(dāng)然可以寫一本關(guān)于人工智能的、不包含任何數(shù)學(xué)內(nèi)容的書,因?yàn)槲覀円恢痹诼犎苏f,你可以選擇數(shù)學(xué)或朋友,但你不能全選。我們的編輯最初懇求我們采取這種策略,并且低聲嘟囔了什么,好像是“每增加一個(gè)數(shù)學(xué)符號,就會失去三千個(gè)讀者”,也可能是“每增加一個(gè)希臘字母,就會失去五千個(gè)讀者”。不管他說了什么,我們都拒絕了,因?yàn)榻?jīng)驗(yàn)告訴我們,你們并沒有如此怯懦。
我們兩個(gè)人已經(jīng)教了40年的數(shù)據(jù)科學(xué)和概率,許多工商管理碩士和本科生在學(xué)習(xí)之前也很害怕數(shù)學(xué),甚至討厭數(shù)學(xué)。不過,當(dāng)他們知道他們聽說過的所有人工智能應(yīng)用程序(比如亞歷克莎和圖像識別)的工作原理時(shí),這些學(xué)生全都眼前一亮——說到底,這些都只是大數(shù)據(jù)的概率而已。他們開始明白,那些公式并不像他們最初想象的那么難。到了最后,他們甚至覺得數(shù)學(xué)給了他們力量。他們意識到,在合適情況下,更加接近機(jī)器的思考方式——即根據(jù)數(shù)據(jù)和概率規(guī)則制定決策——甚至可以讓你變得更加聰明。