“量化一切”移動大數(shù)據(jù)伴你左右
原創(chuàng) IT技術給我們帶來最大的變化就是從PC轉(zhuǎn)向移動設備,比如在2012年第四季度,每天通過移動設備訪問Facebook的人數(shù)首次超過了通過PC訪問的數(shù)量。同時,智慧城市的建設當然也離不開“移動”這個主題。在我們實施的智慧城市系統(tǒng)中,無一例外都要建設無線城市門戶,要求所有的智慧系統(tǒng)提供手機客戶端系統(tǒng)。
移動互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展迅速,據(jù)工信部相關數(shù)據(jù),移動互聯(lián)網(wǎng)用戶超過4億,相關產(chǎn)業(yè)規(guī)模超過9000億元,中國已經(jīng)成為第一大智能手機和平板市場,潛力巨大。
需求方的轉(zhuǎn)移 促使移動大數(shù)據(jù)快速發(fā)展
過往幾年,是移動大數(shù)據(jù)上升的階段,各行各業(yè)對數(shù)據(jù)的需求越來越強烈,同時對數(shù)據(jù)的質(zhì)量要求也越來越高、越來越靈活。
TalkingData CTO肖文峰表示:移動大數(shù)據(jù)市場發(fā)展很快,在2014年上半年的時候,我們需要出去找客戶談需求。但是2014年下半年,很多客戶拿著需求來找我們。同時,我們已經(jīng)組建專門獨立的數(shù)據(jù)采集、數(shù)據(jù)計算、數(shù)據(jù)存儲、數(shù)據(jù)挖據(jù)、以及數(shù)據(jù)可視化的團隊。
市場開始要求大數(shù)據(jù)公司的研發(fā)體系具備很靈活的資源配置以應對業(yè)務需求。對于過去的大數(shù)據(jù)公司而言,其研發(fā)團隊一般是按照產(chǎn)品線區(qū)分的,有通用統(tǒng)計分析產(chǎn)品線、有特定行業(yè)的運營分析產(chǎn)品線、有廣告監(jiān)測產(chǎn)品線以及數(shù)據(jù)的產(chǎn)品線,這些產(chǎn)品線都是互相獨立的,每一塊配制相對獨立的資源,互相之間缺乏共享。
為了應對移動大數(shù)據(jù)市場靈活的變化,數(shù)據(jù)公司的研發(fā)團隊開始向功能模塊服務化的方向遷移,從數(shù)據(jù)采集SDK、數(shù)據(jù)收集、數(shù)據(jù)初加工,再到數(shù)據(jù)的可視化都成為服務模塊。
移動大數(shù)據(jù)的要求更高
本質(zhì)上來講,移動大數(shù)據(jù)和PC大數(shù)據(jù)的技術棧應該是差別不大,但是服務等級不同。移動大數(shù)據(jù)有多樣性的特征,比如通過手機收集的數(shù)據(jù)與PC端不一樣,PC端上沒有傳感器,但是智能手機上有位置傳感器、有加速度傳感器、有光感、有聲音、有磁場等,這些信息都是對用戶的刻畫,給移動大數(shù)據(jù)帶來新的價值。
另外,移動數(shù)據(jù)也具備實時性的特征,比如地理位置信息是不斷變化的,有衰減的特性,需要數(shù)據(jù)不斷更新,以拿到最新的用戶畫像。
正因為移動數(shù)據(jù)具有多樣性和實時性的特性,所以才導致數(shù)據(jù)在量級和復雜度上比PC端上大很多,對數(shù)據(jù)的處理性能也要求更高,其技術架構(gòu)也會面臨更多壓力。
移動大數(shù)據(jù)的新戰(zhàn)場:SDK
針對移動大數(shù)據(jù)來說,絕大部分行業(yè)和公司還沒有重視傳感器信息,比如廣告精準投放,位置信息再加上操作系統(tǒng)信息是現(xiàn)在的普遍做法,這與真正的“精準”還存在距離。對于移動大數(shù)據(jù)的“精準”,應該與智能手機用戶的場景關聯(lián)起來,應適應景應人,所謂沒有場景就談不上精準。
對此,TalkingData帶來了場景感知SDK。這個SDK能做什么事兒?它可以將用戶手持智能手機時的步態(tài)數(shù)據(jù),例如靜止、走路、跑步或駕車等,通過API的方式提供給App訪問。這樣一來,App就可以知道用戶當時是在飯店吃飯,還是在健身房健身。另一方面也提供地理圍欄的觸發(fā)功能,讓開發(fā)者能判斷用戶地理位置相關的場景,比如用戶是否是快要到家了。通過場景感知,App可以對用戶有更清晰深刻的認識。
對于一些O2O的App來說,場景感知可以決定在什么時候推送什么樣的功能、內(nèi)容和服務。比如上班的路上,在咖啡廳附近推送一杯咖啡的優(yōu)惠券;下班的路上經(jīng)過花店,推送一束鮮花的優(yōu)惠?;趫鼍?,功能和服務的轉(zhuǎn)換率和效果會大大增高。
TalkingData CTO肖文峰:TalkingData始終聚焦于移動大數(shù)據(jù),我們希望通過各種各樣的數(shù)據(jù)把智能設備后面那個人刻畫出來,刻畫的越細越好,越細價值越大。
#p#
做務實的移動大數(shù)據(jù)團隊
研發(fā)人員,尤其一線研發(fā)人員,很容易頭腦發(fā)熱,什么熱門學什么,什么熱門用什么,但是學得用的都不扎實。比如,很多工程師簡歷里面都寫著,掌握了各種大數(shù)據(jù)的技術,實際上深入后可能會發(fā)現(xiàn),他們掌握的其實非常淺,比如能夠部署Hadoop成功,會說自己精通Hadoop。每一項技術,引入都很容易,但是一旦深度使用,就會發(fā)現(xiàn)各種各樣的坑,這些都需要對這項技術有很深的了解才可能解決。從MongoDB到Redis,從Hadoop到Kafka,甚至是硬件,在更大量級的數(shù)據(jù)壓力下,都可能出現(xiàn)新的問題,需要不斷投入資源去應對。
采用何種技術,還需要根據(jù)需求來確定。數(shù)據(jù)變化導致需求變化,需求變化才是技術更新的原因所在,對于大數(shù)據(jù),尤其是移動大數(shù)據(jù)來說,一次次技術的創(chuàng)新才是對數(shù)據(jù)梳理、整合、拆分以及分析、挖掘最有的放矢的處理辦法。
TalkingData CTO肖文峰:TalkingData技術團隊是一個務實的團隊,從來不會為了引進新技術而引進新技術。同時,我們也是一個開放的團隊,我們團隊會有20%左右的時間做前沿技術的研究,也會定期和技術社區(qū)以及硅谷的技術專家作交流和分享,確保我們能夠充分理解新的技術,以準確判斷新技術對業(yè)務的影響。
移動大數(shù)據(jù)的未來
對于移動大數(shù)據(jù)未來的發(fā)展,我們借用一下TalkingData的核心價值來說:用數(shù)據(jù)去改變企業(yè)做決定的方式,用數(shù)據(jù)去幫助人們了解周圍的環(huán)境。
基于這兩點,對于移動大數(shù)據(jù)需要聚焦在兩個方向上:一是如何讓數(shù)據(jù)能夠像水一樣高效流動,并加快流動的效率。在移動大數(shù)據(jù)市場上,線上、線下的數(shù)據(jù)需求非常強烈,包括數(shù)據(jù)的提取、加工、交換,需要一個公共的框架能夠成為數(shù)據(jù)的“水庫“,匯聚從各個不同的數(shù)據(jù)源流入的數(shù)據(jù),并加工成不同質(zhì)量的”水“,然后提供給不同行業(yè)來滿足不同需求。
二是了解周圍環(huán)境,這需要對智能手機傳感器進行研究,包括處理傳感器數(shù)據(jù)的算法。場景化能夠幫助開發(fā)者把應用做得更加智能,幫助他們?nèi)ヅ袛嘤脩舢斍暗臓顟B(tài)和目的。如果知道是什么樣的人,在什么時刻做什么事情的話,就能觸發(fā)一些更有針對性的功能、服務和內(nèi)容,提升用戶體驗。
世界的本質(zhì)就是數(shù)據(jù),萬物皆可被數(shù)據(jù)化——而移動互聯(lián)網(wǎng)時代為此提供了更加可行的方案。過去,只有客觀世界才能用數(shù)據(jù)描述,實現(xiàn)定量分析的目標,而現(xiàn)在,大數(shù)據(jù)甚至可以描述人類精神、社會行為等主觀世界。移動大數(shù)據(jù),將通過“量化一切”來實現(xiàn)數(shù)據(jù)的無處不在!