盤(pán)點(diǎn)四種常用的推薦算法
本文轉(zhuǎn)載自微信公眾號(hào)「大數(shù)據(jù)DT」,作者劉強(qiáng)。轉(zhuǎn)載本文請(qǐng)聯(lián)系大數(shù)據(jù)DT公眾號(hào)。
01 基于內(nèi)容的推薦
推薦系統(tǒng)是通過(guò)技術(shù)手段將標(biāo)的物與人關(guān)聯(lián)起來(lái),標(biāo)的物包含很多屬性,用戶通過(guò)與標(biāo)的物的交互會(huì)產(chǎn)生行為日志,通過(guò)這些行為日志可以挖掘出衡量用戶對(duì)標(biāo)的物偏好的標(biāo)簽(將標(biāo)的物的屬性賦予喜歡它的用戶,讓用戶具備這個(gè)標(biāo)簽),通過(guò)這些偏好標(biāo)簽為用戶做推薦就是基于內(nèi)容的推薦算法。
拿視頻推薦來(lái)說(shuō),視頻有標(biāo)題、國(guó)別、年代、演職員、標(biāo)簽等信息,用戶以前看過(guò)某類視頻,就代表用戶對(duì)這些視頻有興趣,比如用戶偏好恐怖、科幻類電影,這樣用戶的電影偏好就被打上了恐怖、科幻的標(biāo)簽,我們就可以根據(jù)這些興趣特征為用戶推薦恐怖、科幻類電影。
02 協(xié)同過(guò)濾
用戶在產(chǎn)品上的交互行為為用戶留下了標(biāo)記,我們可以利用“物以類聚、人以群分”的樸素思想來(lái)為用戶提供個(gè)性化推薦。
具體來(lái)說(shuō),“人以群分”就是找到與用戶興趣相同的用戶(有過(guò)類似的行為),將這些興趣相同的用戶瀏覽過(guò)的標(biāo)的物推薦給用戶,這就是基于用戶的協(xié)同過(guò)濾算法。
“物以類聚”就是如果有很多用戶都對(duì)某兩個(gè)標(biāo)的物有相似的偏好,說(shuō)明這兩個(gè)標(biāo)的物是“相似”的,我們可以通過(guò)推薦與用戶喜歡過(guò)的標(biāo)的物相似的標(biāo)的物這種方式為用戶提供個(gè)性化推薦,這就是基于物品的協(xié)同過(guò)濾推薦算法。
圖1-2簡(jiǎn)單說(shuō)明了這兩類協(xié)同過(guò)濾算法。
▲圖1-2 兩類協(xié)同過(guò)濾推薦算法
03 基于模型的推薦
一般來(lái)說(shuō),可基于用戶行為記錄、用戶相關(guān)信息(年齡、性別、地域和消費(fèi)習(xí)慣等)及標(biāo)的物相關(guān)信息來(lái)構(gòu)建算法模型,預(yù)測(cè)用戶對(duì)物品的偏好,常用的算法包括logistic回歸、矩陣分解、分解機(jī)等。
隨著深度學(xué)習(xí)技術(shù)的發(fā)展,目前有很多深度學(xué)習(xí)相關(guān)的算法落地到了推薦系統(tǒng)上,并產(chǎn)生了很好的效果。
04 基于社交關(guān)系的推薦
我們?cè)谌粘I钪薪?jīng)常為別人或者要求別人給我們推薦書(shū)籍、 餐廳、電影等,這種推薦方式往往效果較好,大家也更容易接受。
微信“看一看”模塊中的“在看”就是通過(guò)將你的微信好友看過(guò)的文章展示給你來(lái)實(shí)現(xiàn)推薦的,張小龍?jiān)?019年微信8周年的微信公開(kāi)課上說(shuō)到,“在看”比“看一看”模塊中的“精選”效果好很多,而“精選”就是通過(guò)算法來(lái)實(shí)現(xiàn)的推薦。
在這些推薦算法中,基于內(nèi)容的推薦和協(xié)同過(guò)濾推薦是最古老、最常用的推薦算法,實(shí)現(xiàn)相對(duì)簡(jiǎn)單,效果也很不錯(cuò),在工業(yè)界得到了大規(guī)模的應(yīng)用。
關(guān)于作者:劉強(qiáng),碩士學(xué)歷,09年畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué)數(shù)學(xué)系。有12年大數(shù)據(jù)與推薦系統(tǒng)實(shí)踐經(jīng)驗(yàn),精通企業(yè)級(jí)推薦系統(tǒng)的構(gòu)建。從零到一打造過(guò)千萬(wàn)級(jí)DAU視頻APP的推薦系統(tǒng),推薦系統(tǒng)產(chǎn)生的流量占全APP流量的30%。在過(guò)去的3年內(nèi)為多家中小型互聯(lián)網(wǎng)公司(流媒體、在線教育、跨境電商等)提供技術(shù)咨詢,幫助他們從零到一構(gòu)建推薦系統(tǒng)。
本文摘編自《構(gòu)建企業(yè)級(jí)推薦系統(tǒng)》,經(jīng)出版方授權(quán)發(fā)布。