自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

避開機(jī)器學(xué)習(xí)中的陷阱 數(shù)據(jù)比算法更重要

安全 算法
用戶行為分析、網(wǎng)絡(luò)威脅檢測,一股新的浪潮正在持續(xù)發(fā)酵。安全數(shù)據(jù)分析被用于掌握情況、發(fā)現(xiàn)問題和預(yù)測風(fēng)險(xiǎn),并帶來了潛力不可限量的營銷前景。理想的情況是從攻擊中提取出機(jī)器學(xué)習(xí)程序所支持的數(shù)據(jù),并把它交給算法,然后一切安全狀況盡在掌握。

用戶行為分析、網(wǎng)絡(luò)威脅檢測,一股新的浪潮正在持續(xù)發(fā)酵。安全數(shù)據(jù)分析被用于掌握情況、發(fā)現(xiàn)問題和預(yù)測風(fēng)險(xiǎn),并帶來了潛力不可限量的營銷前景。理想的情況是從攻擊中提取出機(jī)器學(xué)習(xí)程序所支持的數(shù)據(jù),并把它交給算法,然后一切安全狀況盡在掌握。

[[179782]]

作為信息安全工具,“機(jī)器學(xué)習(xí)”的噱頭顯然掩蓋了數(shù)據(jù)科學(xué)不那么吸引人但卻本質(zhì)的一面:數(shù)據(jù)的收集和準(zhǔn)備(后者占據(jù)了數(shù)據(jù)科學(xué)家約80%的時(shí)間)。事實(shí)是,機(jī)器學(xué)習(xí)和其他算法需要應(yīng)用于適當(dāng)、干凈、容易理解的數(shù)據(jù)來獲取有效的結(jié)果。

安全市場存在這種誤導(dǎo)性的風(fēng)向不足為奇,但是當(dāng)這種情況出現(xiàn)在安全領(lǐng)域,就可能帶來有害的影響。信息安全有如此多復(fù)雜而不同的數(shù)據(jù)集,并通過自動(dòng)化分析為不同的利益群體(比如首席信息安全官,安全運(yùn)維人員,IT運(yùn)維人員,風(fēng)險(xiǎn)委員會(huì))拼接和呈現(xiàn)。

如果機(jī)器學(xué)習(xí)產(chǎn)品夸下??趨s成果有限,那么對數(shù)據(jù)一向執(zhí)懷疑態(tài)度的人會(huì)咬住這一點(diǎn)不放,甚至包括那些決定安全項(xiàng)目預(yù)算的人。只要搞砸一次,他們就不可能再次購買同數(shù)據(jù)驅(qū)動(dòng)的方案。

如果你要購買一個(gè)宣稱能“點(diǎn)數(shù)據(jù)成金”的分析/度量工具,你應(yīng)先考慮一下幾條關(guān)鍵信息:

1. 該工具需要那些數(shù)據(jù)來得到其所所承諾的結(jié)果?

有些分析產(chǎn)品如果沒有按照特定方式從系統(tǒng)獲取的數(shù)據(jù),就根本無法工作。舉例而言,如果你想購買的平臺使用web代理數(shù)據(jù),你給它的登錄許可帶來的風(fēng)險(xiǎn)和你為了安全所做的種種措施該如何權(quán)衡呢?怎樣滿足信息安全增長的登錄需求?怎樣滿足其數(shù)據(jù)存儲需求?

為了獲取你所要的信息,你需要更多來自于全網(wǎng)的數(shù)據(jù)。否則,你決策時(shí)可能僅僅只會(huì)基于所看見的危險(xiǎn),而非不能忽視的所有重要風(fēng)險(xiǎn)。

如果你的分析產(chǎn)品有特定的數(shù)據(jù)或數(shù)據(jù)集無法獲取,廠商應(yīng)該告知你決策所用的信息完整性和營銷材料上存在差異。

此外,你還要考慮為了獲取不同的數(shù)據(jù)來源需要做的種種瑣碎工作。這些數(shù)據(jù)歸誰所有:信息安全廠商還是第三方(如基礎(chǔ)設(shè)施或外部供應(yīng)商)?你能得到它嗎,又以何種格式呢——數(shù)據(jù)被修改了么?這至關(guān)重要,因?yàn)槿绻@種情況發(fā)生,這會(huì)影響可能的分析結(jié)果。

你獲取數(shù)據(jù)的速度有多快,你又能在數(shù)據(jù)創(chuàng)建后多久才能獲取它?是僅僅通過一個(gè)API從云中獲取數(shù)據(jù)(比如脆弱性數(shù)據(jù)),還是網(wǎng)絡(luò)團(tuán)隊(duì)不得不通過你的基礎(chǔ)層來轉(zhuǎn)存日志(比如活動(dòng)目錄事件日志)?數(shù)據(jù)生成和獲取之間的延遲可能會(huì)影響你及時(shí)采取行動(dòng)的能力。

2. 產(chǎn)品安裝后需要收集多久數(shù)據(jù)以實(shí)現(xiàn)承諾的準(zhǔn)確性和有效性水平,另一方面,在這之前的什么時(shí)候,結(jié)果是可用的(哪怕達(dá)不到理想水平)?

機(jī)器學(xué)習(xí)模型需要被訓(xùn)練。例如,對于一個(gè)用于尋找網(wǎng)絡(luò)異常行為的威脅檢測工具,必須先提供涵蓋所有近期常見的網(wǎng)絡(luò)行為的數(shù)據(jù)。如果模型有更多的數(shù)據(jù),它將更擅長發(fā)現(xiàn)真正不尋常的行為。當(dāng)使用該工具解決特定時(shí)間的問題時(shí),廠商應(yīng)該及時(shí)提供給你有關(guān)模型訓(xùn)練的所有具體說明細(xì)節(jié)。

3. 分析工具輸出的數(shù)據(jù)以何種方式呈現(xiàn)?要把這些輸出變成可操作的“結(jié)果”,你的團(tuán)隊(duì)需要什么后續(xù)工作?

如果你的新威脅檢測方案每天都產(chǎn)生1500份需要處理的警報(bào),你將不得不去招募更多負(fù)責(zé)安全運(yùn)維的員工。此外,你的服務(wù)供應(yīng)商能信誓旦旦地表示,這些警報(bào)里有多少是真實(shí)的呢?

機(jī)器學(xué)習(xí)模型將始終返回“虛假的威脅”,所以務(wù)必向供應(yīng)商核實(shí)算法的精確程度(真正的威脅占所有威脅數(shù)目的比例)和為此必須付出的調(diào)試成本。如果精度很低,您的團(tuán)隊(duì)將不得不面對大量的噪聲成本。如果噪聲過高,而供應(yīng)商的分析師仍需要大量的調(diào)試才能達(dá)到這一水平,你最好不要對他們的能力抱有太大信息。

即使你需要從七個(gè)難以獲取、網(wǎng)際傳輸困難的來源獲取數(shù)據(jù),這可能并不重要。即使你不得不等九個(gè)月讓機(jī)器受訓(xùn)才能知道你的投資的回報(bào)比是否理想,這可能也不是什么大問題。但是如果你不知道上述這些可能,那才是真的麻煩。因?yàn)檫@些因素將影響你對時(shí)間、人力和金錢的投入方式,以及你設(shè)定對成果的心理預(yù)期的方式。

責(zé)任編輯:趙寧寧 來源: 安全牛
相關(guān)推薦

2018-07-22 22:21:00

物聯(lián)IOT數(shù)據(jù)

2019-02-25 23:02:16

數(shù)據(jù)科學(xué)職業(yè)數(shù)據(jù)科學(xué)家

2018-06-12 00:33:20

AI機(jī)器學(xué)習(xí)人工智能

2009-07-29 17:40:56

ibmdwAIX

2021-09-02 18:36:18

網(wǎng)絡(luò)配置審計(jì)網(wǎng)絡(luò)數(shù)據(jù)流

2019-08-21 19:49:21

機(jī)器學(xué)習(xí)人工智能

2021-06-28 22:43:20

安全自動(dòng)化安全運(yùn)營中心SOC

2020-09-21 13:41:11

Cloudops

2020-04-07 23:31:17

邊緣計(jì)算云計(jì)算IT

2010-05-14 11:00:01

桌面虛擬化節(jié)約

2011-12-01 09:25:33

iOS 5移動(dòng)開發(fā)iOS

2020-12-07 09:07:41

程序員技能開發(fā)者

2016-12-26 15:55:08

技術(shù)思維評估

2018-05-30 09:00:00

2017-01-23 08:41:43

云計(jì)算

2021-12-08 14:02:46

小數(shù)據(jù)機(jī)器學(xué)習(xí)人工智能

2013-11-29 17:03:22

2009-11-11 10:41:05

2015-04-15 14:31:21

好工具互聯(lián)網(wǎng)+

2019-08-01 08:15:06

機(jī)器學(xué)習(xí)谷歌算法
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號