Facebook數(shù)據(jù)造假,竟涉及多家中國(guó)公司
一個(gè)創(chuàng)立十五年的社交網(wǎng)站,全球用戶量超過(guò)20億。但是卻屢屢遭遇隱私問(wèn)題爭(zhēng)議,最近還出現(xiàn)相關(guān)報(bào)告發(fā)布稱其20億用戶或超半數(shù)都為“虛假賬戶”……
多年來(lái)的“私人恩怨”
在Facebook不斷發(fā)展的過(guò)程中,似乎從來(lái)不缺人氣與爭(zhēng)議。
除了隱私之外,還存在“私人恩怨”。扎克伯格哈佛校友的艾倫·格林斯潘,曾宣稱擁有facebook商標(biāo)的所有權(quán),并且多年來(lái)堅(jiān)持同facebook公司“斗爭(zhēng)”。
格林斯潘說(shuō)自己在Facebook上線前三個(gè)月就提出了類似的創(chuàng)意,名字叫「the Face Book」,他甚至還主動(dòng)聯(lián)系過(guò)扎克伯格希望合作。為此,他對(duì)外公布了一些早期的通訊記錄,甚至還專門寫了本書,描述自己創(chuàng)造HouseSYSTEM網(wǎng)站的過(guò)程,并宣稱它是facebook的始祖。
“有好幾次,在路上碰到、從我的門前經(jīng)過(guò)、在帕羅阿托的餐廳吃墨西哥餐,我示以微笑,或者向他招招手,他都可以走過(guò)來(lái),道個(gè)歉的。但是,他從來(lái)都沒(méi)這樣做過(guò)。他一點(diǎn)都不感覺(jué)愧疚?!?/p>
但是硬氣如扎克伯格,格林斯潘始終沒(méi)有等來(lái)Facebook的“解釋”。于是格林斯潘堅(jiān)持“斗爭(zhēng)”,在各個(gè)方面找扎克伯格茬,越來(lái)越“檸檬”了,并且2012年的時(shí)候就直接狀告Facebook盜用其商標(biāo)。
跨國(guó)官司的引火線
沒(méi)想到上訴也沒(méi)得到道歉,一氣之下格林斯潘憋了一個(gè)大招。
2019年1月底,格林斯潘公布了一個(gè)關(guān)于Facebook的報(bào)告,長(zhǎng)達(dá)70多頁(yè)的報(bào)告直接指出Facebook的20億月活用戶中有超過(guò)一半都是虛假賬戶。
報(bào)告一出就引起軒然大波,沸沸揚(yáng)揚(yáng)的隱私安問(wèn)題還沒(méi)有解決,就又出現(xiàn)了“虛假賬號(hào)”的負(fù)面新聞。Facebook官方也趕緊出來(lái)澄清,說(shuō):“有關(guān)虛假賬戶的報(bào)告是明顯錯(cuò)誤的,并且是不負(fù)責(zé)任的?!敝缶椭苯悠鹪V了四家中國(guó)公司和三位個(gè)人。
就這樣,跨國(guó)官司的序幕打開(kāi)。
被狀告的四家中國(guó)公司主要販賣Facebook、twitter等國(guó)外社交賬號(hào)。Facebook指控這些企業(yè)和個(gè)人創(chuàng)建及銷售虛假網(wǎng)絡(luò)賬號(hào)、點(diǎn)贊和關(guān)注者,用于傳播虛假消息或其他欺詐行為。從2017年開(kāi)始,這些公司通過(guò)myfacebook.cc和9xiufacebook.com等六個(gè)與Facebook有相似域名的網(wǎng)站行銷和賣出了大量虛假賬號(hào)。
糾纏數(shù)年的噩夢(mèng)——虛假賬戶
回過(guò)頭來(lái)看,虛假賬戶并非新傷,而是Facebook的一個(gè)糾纏了數(shù)年的噩夢(mèng):
2012年9月,F(xiàn)acebook開(kāi)始嚴(yán)打僵尸粉,刪除虛假賬號(hào);
2013年3月,F(xiàn)acebook可能有8300萬(wàn)個(gè)“僵尸賬號(hào)”;
2015年3月,F(xiàn)acebook清理僵尸粉導(dǎo)致名人點(diǎn)贊量下降10%;
2018年8月,F(xiàn)acebook刪除試圖干預(yù)美國(guó)中期選舉的虛假賬號(hào);
2018年11月,F(xiàn)acebook公布有害內(nèi)容清理報(bào)告:清理15億虛假賬號(hào);
2019年2月,有報(bào)告稱:Facebook 20億月活用戶一半都是假賬號(hào);
2019年2月,F(xiàn)acebook狀告4家中國(guó)公司和3位個(gè)人推銷虛假賬號(hào)、點(diǎn)贊和用戶好友;
……
除了官方公布虛假賬號(hào)情況之外,早在2014年在YouTube就出現(xiàn)過(guò)一個(gè)名為《Facebook Fraud》的視頻,里面主要介紹一位博主參與Facebook的推廣計(jì)劃之后,出現(xiàn)了粉絲量增加但推文關(guān)注、互動(dòng)情況不變甚至減少的情況,懷疑Facebook用戶中存在著大量“機(jī)器用戶”。
Facebook Fraud
而這次格林斯潘的報(bào)告中,指出Facebook的系統(tǒng)性欺詐“不容小覷”。根據(jù)Statista的數(shù)據(jù),F(xiàn)acebook在2018年的廣告收入高達(dá)338億美元。 也就是說(shuō),如果說(shuō)10億的“虛假賬號(hào)”數(shù)量是真實(shí)的,那么就意味著Facebook從廣告主那里獲得的收益是“不義之財(cái)”。
圖片來(lái)自新浪財(cái)經(jīng)
不僅如此,除了Facebook這次上訴的幾家中國(guó)企業(yè),全球售賣虛假賬號(hào)的灰產(chǎn)鏈條也早就野蠻生長(zhǎng)、遍地開(kāi)花了。
比如美國(guó),類似Devumi、SocialBoss等營(yíng)銷推廣網(wǎng)站,內(nèi)容點(diǎn)贊、漲粉、視頻播放刷量都應(yīng)有盡有,價(jià)格多從1到20美元不等,還有一些網(wǎng)站直接售賣相關(guān)賬號(hào)。
而國(guó)內(nèi)相關(guān)的灰產(chǎn)就更多了,根據(jù)帶不帶cookie、注冊(cè)年限、好友多少,賬號(hào)價(jià)格不等。
有意思的是,通過(guò)灰產(chǎn)的宣傳,發(fā)現(xiàn)其實(shí)國(guó)內(nèi)外購(gòu)買這些虛假賬號(hào)的目的也有些許的差別。美國(guó)購(gòu)買賬號(hào)的大部分主要用于漲粉、增加點(diǎn)贊量等,而中國(guó)購(gòu)買賬號(hào)還涉及到不少跨境電商推廣等商業(yè)目的。
在上述博主的視頻中通過(guò)統(tǒng)計(jì),發(fā)現(xiàn)他的“虛假粉絲”主要來(lái)源于發(fā)展中國(guó)家。Facebook在2017年的觀察報(bào)告中也指出,大部分虛假帳戶來(lái)自孟加拉國(guó)、印度、埃及和巴基斯坦等國(guó)。而這背后也反映出整個(gè)虛假賬號(hào)、虛假流量市場(chǎng)不同地域的犯罪成本差距。與發(fā)達(dá)國(guó)家比較,發(fā)展中國(guó)家的確存在相關(guān)法律不健全、監(jiān)管不到位、懲戒體系不完善、意識(shí)很欠缺等問(wèn)題,甚至在斯里蘭卡、埃及、印尼等地區(qū)還存在“機(jī)器工廠”,點(diǎn)擊1000次只需要1美金??傮w來(lái)說(shuō)犯罪成本都遠(yuǎn)遠(yuǎn)低于發(fā)達(dá)國(guó)家,所以也就出現(xiàn)下圖的情況。
機(jī)器之爭(zhēng),如何掌握主動(dòng)權(quán)
而如今困擾各大社交平臺(tái)的“虛假賬號(hào)”、“虛假流量”其實(shí)在發(fā)展初期并沒(méi)有受到過(guò)多的關(guān)注與打擊,甚至還成為當(dāng)時(shí)用戶量、活躍度統(tǒng)計(jì)中重要的一部分。遺憾的是,水能載舟亦能覆舟。當(dāng)初各平臺(tái)所追求的“數(shù)字”如今卻成為難以擺脫的夢(mèng)魘。
當(dāng)然,從2012年到今天,其實(shí)我們也看到了Facebook在面對(duì)“虛假賬號(hào)”、“虛假流量”之下在不斷作出努力。甚至還想過(guò)請(qǐng)F(tuán)BI調(diào)查…
但是就目前來(lái)看還是存在許多問(wèn)題:
- 一是誤殺較多,影響用戶體驗(yàn);
- 二是對(duì)于異常賬戶檢測(cè)技術(shù)方面還有許多進(jìn)步空間。
第一個(gè)誤殺的情況,由于Facebook的封禁是從設(shè)備硬件、賬號(hào)登錄情況、運(yùn)營(yíng)內(nèi)容等多維度進(jìn)行的。Facebook主管分析的副總裁Alex Schultz之前在采訪中透露,平臺(tái)已經(jīng)在使用機(jī)器學(xué)習(xí)判定假賬號(hào)。通常來(lái)說(shuō),一個(gè)被批量制造出來(lái)的帳號(hào)會(huì)在幾分鐘內(nèi)被移除。
這樣一來(lái),如果出現(xiàn)IP、賬號(hào)反復(fù)登錄等異常情況,很可能就會(huì)被封禁,誤殺率就這樣被提高了。
第二點(diǎn)是從2012年到現(xiàn)在,F(xiàn)acebook多次大面積封禁虛假賬號(hào),但是這“野草燒不盡”般的勢(shì)頭背后反映出其在防御策略和技術(shù)方面還是有很多進(jìn)步空間。
而目前對(duì)于異常賬戶的檢測(cè)主要有以下幾種方式:
- 基于行為特征的檢測(cè)方案;
- 基于內(nèi)容的檢測(cè)方案;
- 基于圖的檢測(cè)方案;
- 無(wú)監(jiān)督學(xué)習(xí)。
目前很多平臺(tái)主要使用的還是基于內(nèi)容的檢測(cè)方案,輔之基于行為特征的檢測(cè)方案。但是隨著AI的不斷發(fā)展,“機(jī)器賬號(hào)”的偽裝能力越來(lái)越強(qiáng),這場(chǎng)機(jī)器之戰(zhàn)之下,我們必須采用更為精細(xì)、科學(xué)的處理方式。比如從注冊(cè)審核環(huán)節(jié)、使用軌跡等維度建立多維度、多環(huán)節(jié)、長(zhǎng)周期的分析模型,盡力提高對(duì)于異常賬戶的檢測(cè)精度。
而目前隨著圖學(xué)習(xí)、社交網(wǎng)絡(luò)等研究的不斷發(fā)展,我們也可以采用基于圖的檢測(cè)方案。這種方式的關(guān)鍵是構(gòu)造一個(gè)圖,在圖中異常帳號(hào)與正常帳號(hào)具有不同的結(jié)構(gòu)或者連接方式,然后利用圖挖掘的相關(guān)算法找到圖中具體的異常結(jié)構(gòu)或者異常節(jié)點(diǎn)。從一個(gè)“異常賬號(hào)”找到相類似的更多機(jī)器賬號(hào)。
對(duì)于異常賬戶的檢測(cè),一直是做安全、做風(fēng)控的研究重點(diǎn)。隨著機(jī)器學(xué)習(xí)的發(fā)展,這兩年復(fù)雜網(wǎng)絡(luò)、GCN逐漸崛起,新技術(shù)的創(chuàng)新將近在咫尺。