自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

精英數(shù)據(jù)科學(xué)家應(yīng)該具備這些能力和特質(zhì)

大數(shù)據(jù)
成為數(shù)據(jù)科學(xué)家需要具備哪些條件呢?下面就是我們根據(jù)IT領(lǐng)導(dǎo)者、行業(yè)分析師、數(shù)據(jù)科學(xué)家的看法,總結(jié)出的一些重要屬性和技能。

數(shù)據(jù)科學(xué)家的需求仍然很高,幾乎每個(gè)行業(yè)的企業(yè)都希望從其蓬勃發(fā)展的信息資源中獲得最大價(jià)值。

“隨著企業(yè)開(kāi)始充分利用內(nèi)部數(shù)據(jù)資產(chǎn),以及審視數(shù)百個(gè)第三方數(shù)據(jù)源的整合,數(shù)據(jù)科學(xué)家的作用也在變得越來(lái)越重要,”咨詢(xún)公司Protiviti總監(jiān)Greg Boyd這樣說(shuō)。

“過(guò)去,負(fù)責(zé)數(shù)據(jù)的團(tuán)隊(duì)只是IT部門(mén)的后臺(tái),執(zhí)行關(guān)鍵數(shù)據(jù)庫(kù)任務(wù),確保各種公司系統(tǒng)得到數(shù)據(jù)‘燃料’的支持,這讓企業(yè)高管能夠報(bào)告運(yùn)營(yíng)情況并提供財(cái)務(wù)結(jié)果。”

這個(gè)角色很重要,但冉冉升起的業(yè)務(wù)明星都是那些精明的數(shù)據(jù)科學(xué)家,他們不僅能夠利用復(fù)雜的統(tǒng)計(jì)和可視化技術(shù)處理大量數(shù)據(jù),而且具有極強(qiáng)的敏銳度,讓他們可以從數(shù)據(jù)中得到前瞻性的洞察,這些洞察有助于預(yù)測(cè)潛在結(jié)果,并減少對(duì)企業(yè)的潛在威脅。

[[225170]]

那么,成為數(shù)據(jù)科學(xué)家需要具備哪些條件呢?下面就是我們根據(jù)IT領(lǐng)導(dǎo)者、行業(yè)分析師、數(shù)據(jù)科學(xué)家的看法,總結(jié)出的一些重要屬性和技能。

批判性思維

數(shù)據(jù)科學(xué)家應(yīng)該是具有批判性的思想家,能夠在提出意見(jiàn)或作出判斷之前,針對(duì)特定主題或問(wèn)題對(duì)事實(shí)進(jìn)行客觀(guān)的分析。

咨詢(xún)公司普華永道負(fù)責(zé)數(shù)據(jù)分析的全球人工智能和創(chuàng)新負(fù)責(zé)人Anand Rao表示:“他們需要了解業(yè)務(wù)問(wèn)題或業(yè)務(wù)決策,并能夠‘模擬’或‘抽象’解決問(wèn)題的關(guān)鍵,而不是那些無(wú)關(guān)的、可以忽略的事情。這項(xiàng)技能比其他任何因素都更多地決定著數(shù)據(jù)科學(xué)家能否取得成功。”

數(shù)據(jù)科學(xué)家需要有經(jīng)驗(yàn),但也要能夠摒棄先見(jiàn),Zeta Global公司首席信息官Jeffry Nimeroff補(bǔ)充說(shuō)。

Nimeroff說(shuō):“這種特質(zhì)是要知道在任何領(lǐng)域工作都能有所期待,但也知道經(jīng)驗(yàn)和直覺(jué)是不完美的。有經(jīng)驗(yàn)是件好事,如果我們過(guò)于自滿(mǎn),那風(fēng)險(xiǎn)也是存在的。這就是摒棄先見(jiàn)的重要性所在。”

這并不是說(shuō)要以新手的視角來(lái)看待事情,而是要從多個(gè)角度重新審視,或者能夠評(píng)估問(wèn)題和情況。

寫(xiě)代碼

頂尖的數(shù)據(jù)科學(xué)家知道如何寫(xiě)代碼,并且能夠輕松處理各種編程任務(wù)。

Rao說(shuō):“數(shù)據(jù)科學(xué)的語(yǔ)言選擇正在朝著Python方向傾斜,R語(yǔ)言也有大量追隨者。”此外,還有其他一些正在使用中的語(yǔ)言,例如Scala、Clojure、Java和Octave。

“要成為一名非常成功的數(shù)據(jù)科學(xué)家,編程技能就需要同時(shí)覆蓋到計(jì)算方面——處理大量數(shù)據(jù)、處理實(shí)時(shí)數(shù)據(jù)、云計(jì)算、非結(jié)構(gòu)化數(shù)據(jù)以及統(tǒng)計(jì)——和工作與統(tǒng)計(jì)模型方面——如回滾、優(yōu)化、集群、決策樹(shù)、隨機(jī)森林等。”

安全軟件公司McAfee的首席數(shù)據(jù)科學(xué)家Celeste Fralick說(shuō),大數(shù)據(jù)從20世紀(jì)90年代末開(kāi)始產(chǎn)生影響力以來(lái),就要求越來(lái)越多的數(shù)據(jù)科學(xué)家理解并能夠使用諸如Python、C ++或Java等語(yǔ)言進(jìn)行編碼。

如果一個(gè)數(shù)據(jù)科學(xué)家不懂如何寫(xiě)代碼,那么就應(yīng)該聘請(qǐng)一群會(huì)寫(xiě)代碼的人。“把數(shù)據(jù)科學(xué)家和開(kāi)發(fā)人員組成一個(gè)團(tuán)隊(duì),這被證明是非常成效的,”Fralick這樣說(shuō)。

數(shù)學(xué)

對(duì)于不喜歡或不擅長(zhǎng)數(shù)學(xué)的人來(lái)說(shuō),數(shù)據(jù)科學(xué)可能不是一個(gè)很好的職業(yè)選擇。

Boyd表示:“在我們與全球組織的合作中,我們認(rèn)識(shí)了很多希望開(kāi)發(fā)復(fù)雜財(cái)務(wù)或運(yùn)營(yíng)模式的客戶(hù),為了使這些模型具有統(tǒng)計(jì)相關(guān)性,就需要有大量的數(shù)據(jù)。數(shù)據(jù)科學(xué)家的角色,就是利用他們?cè)跀?shù)學(xué)方面的深厚專(zhuān)業(yè)知識(shí),開(kāi)發(fā)出可用于開(kāi)發(fā)或轉(zhuǎn)移關(guān)鍵業(yè)務(wù)戰(zhàn)略的統(tǒng)計(jì)模型。”

數(shù)據(jù)科學(xué)家應(yīng)該是擅長(zhǎng)數(shù)學(xué)和統(tǒng)計(jì)學(xué)的,同時(shí)具備與業(yè)務(wù)線(xiàn)主管密切協(xié)作的能力,以確保業(yè)務(wù)可以信賴(lài)其結(jié)果和建議的方式,與業(yè)務(wù)線(xiàn)主管溝通在復(fù)雜的“黑盒子”中實(shí)際發(fā)生了什么。

機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、人工智能

計(jì)算能力不斷提高,連接性增加,以及收集到的海量數(shù)據(jù),很多行業(yè)都在飛速的發(fā)展中。 “數(shù)據(jù)科學(xué)家需要走在研究前沿,知道在什么時(shí)候運(yùn)用什么技術(shù)。很多時(shí)候,數(shù)據(jù)科學(xué)家會(huì)采用那些‘性感’而新奇的技術(shù),而他們實(shí)際要解決的問(wèn)題遠(yuǎn)沒(méi)有那么復(fù)雜。”

數(shù)據(jù)科學(xué)家需要對(duì)他們要解決的問(wèn)題有著深入的了解,數(shù)據(jù)本身會(huì)告訴你需要什么。Fralick說(shuō):“意識(shí)到生態(tài)系統(tǒng)的計(jì)算成本、可解釋性、延遲、帶寬,以及其他系統(tǒng)邊界條件,還有客戶(hù)的成熟度,這可以幫助數(shù)據(jù)科學(xué)家知道他們應(yīng)該運(yùn)用哪種技術(shù)。”的確如此,只要他們對(duì)這種技術(shù)是了解的。

統(tǒng)計(jì)方面的能力也是很重要的。Fralick說(shuō),大多數(shù)雇主都沒(méi)有考慮這方面的技能,因?yàn)樗麄冚p而易舉地就能使用各種自動(dòng)化工具和開(kāi)源軟件。“但是,了解統(tǒng)計(jì)數(shù)據(jù)是理解這些工具和軟件所做假設(shè)的關(guān)鍵能力,”她說(shuō)。

數(shù)據(jù)存儲(chǔ)公司Micron首席信息官Trevor Schulze說(shuō),僅僅理解機(jī)器學(xué)習(xí)算法的功能接口是不夠的。“為了選擇合適的算法,數(shù)據(jù)科學(xué)家需要了解方法中的統(tǒng)計(jì)數(shù)據(jù)以及數(shù)據(jù)準(zhǔn)備技術(shù),以最大限度地提高任何模型的整體性能。”

Schulze說(shuō),計(jì)算機(jī)科學(xué)能力也很重要。因?yàn)閿?shù)據(jù)科學(xué)的工作主要是在鍵盤(pán)上進(jìn)行的,所以堅(jiān)實(shí)的軟件工程基礎(chǔ)能起到幫助作用。

溝通能力

溝通技巧的重要性不言而喻。如今各種技術(shù)幾乎沒(méi)有哪些技術(shù)是在真空中使用的;系統(tǒng)、應(yīng)用、數(shù)據(jù)和人員之間總是存在著整合。數(shù)據(jù)科學(xué)也是如此,能夠利用數(shù)據(jù)與利益相關(guān)者進(jìn)行交流,這是一個(gè)重要特質(zhì)。

“用數(shù)據(jù)‘講故事’的能力,是可以把數(shù)學(xué)結(jié)果轉(zhuǎn)化為可操作的洞察或者干預(yù)。作為業(yè)務(wù)、技術(shù)和數(shù)據(jù)的交叉點(diǎn),數(shù)據(jù)科學(xué)家需要善于向每個(gè)利益相關(guān)者‘講故事’。”

這其中包括,向業(yè)務(wù)主管傳達(dá)數(shù)據(jù)的商業(yè)利益;技術(shù)和計(jì)算資源;數(shù)據(jù)質(zhì)量、隱私和機(jī)密性方面的挑戰(zhàn);以及該組織感興趣的其他領(lǐng)域。

Nimeroff表示,作為一名優(yōu)秀的溝通者,能夠?qū)⒕哂刑魬?zhàn)性的技術(shù)信息提煉成完整的、準(zhǔn)確且易于呈現(xiàn)的形式。“數(shù)據(jù)科學(xué)家必須記住,他們執(zhí)行所產(chǎn)生的結(jié)果,可以并且將用于支持業(yè)務(wù)的特定行動(dòng)。因此,要確保受眾理解并接受擺在他們面前的所有內(nèi)容,包括問(wèn)題、數(shù)據(jù)、成功標(biāo)準(zhǔn)和結(jié)果,這是至關(guān)重要的。”

Schulze說(shuō),優(yōu)秀的數(shù)據(jù)科學(xué)家必須具有商業(yè)頭腦和好奇心,才能充分地與業(yè)務(wù)利益相關(guān)者溝通,了解問(wèn)題并確定哪些數(shù)據(jù)可能是相關(guān)的。

此外,數(shù)據(jù)科學(xué)家需要能夠向業(yè)務(wù)領(lǐng)導(dǎo)者解釋算法。Schulze說(shuō):“解釋算法是如何實(shí)現(xiàn)預(yù)測(cè)的,是獲得領(lǐng)導(dǎo)者對(duì)作為業(yè)務(wù)流程一部分的預(yù)測(cè)模型的信任的關(guān)鍵技能。”

數(shù)據(jù)架構(gòu)

數(shù)據(jù)科學(xué)家必須從一開(kāi)始、到模型、再到業(yè)務(wù)決策的過(guò)程中,就了解數(shù)據(jù)的所有情況。

“如果不去了解架構(gòu)可能會(huì)對(duì)樣本規(guī)模的推論和假設(shè)產(chǎn)生這樣嚴(yán)重的影響,這就會(huì)導(dǎo)致錯(cuò)誤的結(jié)果和決策,”Fralick說(shuō)。

更糟糕的是,架構(gòu)內(nèi)部也可能會(huì)發(fā)生變化。Fralick說(shuō),如果不了解對(duì)模型的影響是從何而起的話(huà),數(shù)據(jù)科學(xué)家最終可能會(huì)“不得不重做模型”,或者突然遇到模型不準(zhǔn)確的情況而不知道其中原因。

Fraclick表示,雖然Hadoop通過(guò)將代碼傳遞給數(shù)據(jù)(而不是相反)來(lái)通過(guò)提供大數(shù)據(jù),但了解數(shù)據(jù)流或數(shù)據(jù)管道的復(fù)雜性對(duì)于確?;谑聦?shí)的決策制定是至關(guān)重要的。

風(fēng)險(xiǎn)分析、過(guò)程改進(jìn)、系統(tǒng)工程

敏銳的數(shù)據(jù)科學(xué)家需要了解分析業(yè)務(wù)風(fēng)險(xiǎn)、改進(jìn)流程以及系統(tǒng)工程等概念。

Fralick表示:“我所知的優(yōu)秀數(shù)據(jù)科學(xué)家無(wú)一不具備這些能力。他們緊密合作,對(duì)內(nèi)焦點(diǎn)是數(shù)據(jù)科學(xué)家,對(duì)外專(zhuān)注于客戶(hù)。”

對(duì)內(nèi),數(shù)據(jù)科學(xué)家應(yīng)該謹(jǐn)記“科學(xué)家”三個(gè)字,遵循良好的科學(xué)理論,F(xiàn)ralick這樣說(shuō)。

在模型開(kāi)發(fā)開(kāi)始時(shí)進(jìn)行風(fēng)險(xiǎn)分析可以降低風(fēng)險(xiǎn)。“表面上看,這些都是數(shù)據(jù)科學(xué)家了解客戶(hù)想要解決什么問(wèn)題索要具備的技能。”

Fralick表示,將支出與流程改進(jìn)聯(lián)系起來(lái),了解固有的那些公司風(fēng)險(xiǎn),以及可能影響數(shù)據(jù)或模型結(jié)果的其他系統(tǒng),這些可以通過(guò)數(shù)據(jù)科學(xué)家的努力實(shí)現(xiàn)更高的客戶(hù)滿(mǎn)意度。

解決問(wèn)題的能力和良好的商業(yè)直覺(jué)

一般來(lái)說(shuō),偉大的數(shù)據(jù)科學(xué)家所展現(xiàn)的特質(zhì),與任何一個(gè)好的問(wèn)題解決者都是相同的。Nimeroff表示:“”他們會(huì)從多角度看待世界,他們會(huì)在動(dòng)用所有工具之前,先了解他們應(yīng)該做什么,他們以嚴(yán)謹(jǐn)而完整的方式工作,并且能夠順利地解釋他們的執(zhí)行結(jié)果。”

當(dāng)評(píng)估數(shù)據(jù)科學(xué)家等職位的技術(shù)專(zhuān)業(yè)人士時(shí),Nimeroff會(huì)尋找這些特質(zhì)。“這種方法成功的幾率要比失敗的幾率高得多,并且也確保了潛在的優(yōu)勢(shì)得以最大化,因?yàn)榕行运季S已經(jīng)走到了最前沿。”

尋找一位優(yōu)秀的數(shù)據(jù)科學(xué)家,就是要尋找擁有某種矛盾性技能的人:可以應(yīng)對(duì)數(shù)據(jù)處理,并創(chuàng)建有用的模型;能直觀(guān)地理解他們正在嘗試解決的業(yè)務(wù)問(wèn)題、數(shù)據(jù)的結(jié)構(gòu)和細(xì)微差別、以及模型的工作原理,商業(yè)軟件供應(yīng)商Paytronix Systems的Paytronix Data Insights主管Lee Barnes這樣說(shuō)道。

“其中第一個(gè)是最容易找到的;大多數(shù)擁有良好數(shù)學(xué)能力,擁有數(shù)學(xué)統(tǒng)計(jì)學(xué)、工程學(xué)或其他科學(xué)學(xué)科學(xué)位的人,可能在這方面是非常出色的。第二個(gè)卻很難找到。令人驚訝的是,很多人建立了復(fù)雜的模型,但是當(dāng)他們被問(wèn)及為什么他們認(rèn)為這個(gè)模型能夠奏效、或者為什么他們選擇這個(gè)方法的時(shí)候,他們卻無(wú)法給出一個(gè)很好的答案。”

這些人也許能夠解釋模型有多準(zhǔn)確,“但是,如果不理解模型為什么以及如何工作,就很難對(duì)他們的模型抱有很大的信心。能夠?qū)τ谡谧龅氖虑橛懈钊氲牧私夂椭庇X(jué),這樣的人才是真正的數(shù)據(jù)科學(xué)家,并且可能在這個(gè)領(lǐng)域擁有成功的職業(yè)生涯。”Barnes說(shuō)。

責(zé)任編輯:未麗燕 來(lái)源: cio.com
相關(guān)推薦

2018-05-22 09:07:54

數(shù)據(jù)科學(xué)語(yǔ)言職位

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2013-05-06 10:45:34

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析

2019-12-04 15:02:22

數(shù)據(jù)科學(xué)家故事數(shù)據(jù)分析

2020-08-03 12:47:58

DevOps數(shù)據(jù)科學(xué)家代碼

2017-08-22 10:25:43

IT人才數(shù)據(jù)科學(xué)HR

2017-04-12 09:34:30

數(shù)據(jù)科學(xué)家統(tǒng)計(jì)學(xué)家好習(xí)慣

2012-12-27 09:50:36

Facebook

2019-03-25 21:18:41

數(shù)據(jù)科學(xué)家大數(shù)據(jù)技能

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2012-12-06 15:36:55

CIO

2012-12-25 09:58:50

數(shù)據(jù)科學(xué)家大數(shù)據(jù)

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2015-09-15 09:32:50

2018-10-16 14:37:34

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析數(shù)據(jù)科學(xué)

2012-06-12 09:33:59

2020-08-17 17:19:42

數(shù)據(jù)科學(xué)家技能數(shù)據(jù)科學(xué)

2022-09-07 10:16:25

雇傭IT領(lǐng)導(dǎo)者

2018-03-12 12:44:59

數(shù)據(jù)科學(xué)家人工智能數(shù)據(jù)科學(xué)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)