自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

從架構(gòu)演進和統(tǒng)一看搜索與推薦

原創(chuàng) 精選
開發(fā) 架構(gòu)
本篇文章介紹了搜索和推薦的區(qū)別與聯(lián)系,架構(gòu)演進以及架構(gòu)統(tǒng)一。

作者 | 侯瑜美

搜索與推薦的區(qū)別

1. 場景需求不同

搜索的場景故名思義,就是用戶提供想要尋找的內(nèi)容的描述,系統(tǒng)返回給用戶匹配到的結(jié)果,常見的場景如文字輸入框的搜索,圖片搜索,聽音識曲,標簽篩選等,看似很多場景,其實只是用戶輸入內(nèi)容的形式不同。

推薦的場景我們常見的有各大App首頁的個性化推薦(如猜你喜歡/每日歌曲推薦),選擇頁面的關(guān)聯(lián)推薦(買了還買,看了還看,買了它的用戶還買等等)等,推薦的場景更加的豐富,因為沒有用戶提供的內(nèi)容的限制,場景更具多樣性,推薦方法也多種多樣,例如基于內(nèi)容的推薦,基于用戶行為的推薦,協(xié)同過濾等等。

各大互聯(lián)網(wǎng)平臺由于服務(wù)內(nèi)容不同,平臺成熟度的不同,對搜索和推薦的偏重程度也就不盡相同,但都是缺一不可。

例如對于房地產(chǎn)應(yīng)用來說,用戶目標明確,搜索服務(wù)會帶來更大的購買力,但關(guān)聯(lián)推薦會給用戶帶來更多的選擇,同樣也是不可缺少的。

對于短視頻平臺而言,由于用戶較難通過文字或圖片提供內(nèi)容的描述,那么自然會偏重推薦服務(wù)。

對于電商在初期肯定是搜索服務(wù)帶來了更多的購買率,當(dāng)購買率到達瓶頸時,推薦帶來的購買率就是突破瓶頸和繼續(xù)發(fā)展的必要手段。

2. 輸入輸出不同

不論搜索還是推薦,實際上對于用戶來說,都是一個提供服務(wù)的黑盒,它能夠根據(jù)用戶/物品/場景等信息,從候選物品的池子中選出與用戶匹配的的物品列表。

不同的是對于搜索服務(wù),還額外提供了用戶對于自己訴求的描述信息(當(dāng)然可能描述的并不準確)。

輸入的區(qū)別天然的導(dǎo)致了用戶對于結(jié)果的不同期待:

(1) 個性化程度不同

推薦系統(tǒng)更強調(diào)個性化,甚至更注重驚喜感。往往要在準確性和多樣性之間作出權(quán)衡;搜索系統(tǒng)更強調(diào)相關(guān)性,如果搜索結(jié)果與用戶的目標不符,用戶的接受程度會很差,個性化對于搜索系統(tǒng)來說既沒意義又有風(fēng)險。

(2) 排的更好與搜的更全

對于推薦系統(tǒng)來說,排序更加重要,因為只有最開始的推薦結(jié)果吸引了用戶,用戶才可能向后瀏覽。

對于搜索系統(tǒng)來說,召回更加重要,因為用戶會主動向后瀏覽,以期望找到自己的目標,但如果最終沒有找到,也就是搜的不全,就會有很差的用戶體驗。

(3) 快速滿足還是持續(xù)服務(wù)

提到搜索系統(tǒng),往往會提到馬太效應(yīng),只有與用戶搜索的結(jié)果更為匹配的物品才會被呈現(xiàn)給用戶,讓用戶得到快速滿足,那么滿足需求的物品那么多,搜索的越準確,用戶就越不會向后瀏覽,最終點擊的熱度就只會集中在少量的物品上。這也就是為什么廣告最初誕生在搜索系統(tǒng)中的原因。提到推薦系統(tǒng),往往會提到長尾效應(yīng),也就是讓用戶時刻保持新鮮感和驚喜感,考慮用戶的長期興趣,提高用戶粘性,期望留住用戶,并提供持續(xù)的服務(wù),這也就是為什么刷短視頻停不下來的原因。

(4) 實時性與滯后性

搜索的數(shù)據(jù)實時性要求是特別高的,數(shù)據(jù)常常要求秒級更新,例如一個商品已經(jīng)沒有貨了就不應(yīng)該被搜出來了。而推薦的數(shù)據(jù)很多是可以容忍天級更新的,由于推薦要考慮大量的用戶行為信息,一定是具有一定滯后性的。

搜索與推薦的聯(lián)系

1. 相同的本質(zhì)

搜索與推薦本質(zhì)上都是當(dāng)前時代信息過載的產(chǎn)物,解決的根本思路都是通過匹配(召回)、排序為用戶在過載的信息中挑選出用戶想要的信息。只是根據(jù)業(yè)務(wù)場景的不同,在召回,排序階段考慮的側(cè)重點不同。

2. 搜索與推薦的協(xié)同作用

(1) 推薦中的搜索

推薦服務(wù)中基于內(nèi)容的推薦實際上相當(dāng)于一種無聲的搜索,常常在實現(xiàn)時會采用搜索服務(wù)的中的倒排索引等技術(shù),例如基于內(nèi)容的推薦,常常是通過規(guī)則或推薦模型得到用戶感興趣的內(nèi)容的標簽,然后利用搜索服務(wù)的方法進行標簽搜索和匹配即可得到最終的推薦列表。

(2) 搜索中的推薦

當(dāng)搜索出來符合用戶的數(shù)據(jù)量很多時,需要根據(jù)推薦服務(wù)中用戶畫像等結(jié)果幫助搜索服務(wù)匹配用戶的需求。例如周一的晚上進行搜索得到的結(jié)果列表和周五的晚上進行搜索得到結(jié)果列表就會有所差異。

推薦與搜索常常在一個頁面中協(xié)同為用戶提供服務(wù),例如搜索引擎搜索結(jié)果頁面的關(guān)聯(lián)推薦,電商軟件搜索瀏覽頁面的相關(guān)推薦等。

架構(gòu)演進與架構(gòu)統(tǒng)一

1. 搜索架構(gòu)的演進

一般而言,一個企業(yè)的搜索引擎,由于在初始階段業(yè)務(wù)線不多,提供簡單的搜索服務(wù)即可。隨著業(yè)務(wù)的不斷增多,對搜索需求的不斷抽象和統(tǒng)一,逐漸可以發(fā)展為平臺階段,提供多數(shù)據(jù)源的寫入與多業(yè)務(wù)的統(tǒng)一搜索能力,不同業(yè)務(wù)的不同需求可以靈活配置。

等到業(yè)務(wù)線不斷增多,對接業(yè)務(wù)的工作占據(jù)了大部分的開發(fā)時間時,開發(fā)更加方便的運維與管理能力,幫入業(yè)務(wù)自助接入平臺就能夠進一步提高搜索功能開發(fā)的效率,此時搜索架構(gòu)就進入到了運維更為便捷的云平臺的階段。

2. 推薦架構(gòu)的演進

對于推薦引擎,起步階段一般會采用基于內(nèi)容的推薦方法,由于數(shù)據(jù)不足,企業(yè)初期會基于業(yè)務(wù)側(cè)提供的經(jīng)驗規(guī)則對物品和用戶進行標注,然后通過在線匹配標簽的方式進行推薦。繼續(xù)發(fā)展,隨著業(yè)務(wù)的不斷豐富和迭代,會對推薦系統(tǒng)有更多的期望,當(dāng)不斷修改或增加經(jīng)驗規(guī)則卻滿足不了業(yè)務(wù)需求時,就需要一些基于模型的推薦方法以及個性化的推薦的服務(wù)了。再進一步,與搜索引擎一樣,推薦引擎也需要對接多個業(yè)務(wù)線,向平臺階段發(fā)展,提供統(tǒng)一的公共服務(wù),通過配置滿足不同的業(yè)務(wù)線的需求。

3. 架構(gòu)統(tǒng)一

從上面的介紹和架構(gòu)演進我們可以發(fā)現(xiàn),推薦和搜索的架構(gòu)有很多可以復(fù)用的地方,因而可以進行架構(gòu)的統(tǒng)一。

(1) 流程上的統(tǒng)一:不論是搜索還是推薦,都會經(jīng)歷召回-排序-重排等流程,最終得到呈現(xiàn)給用戶的物品列表,只不過流程中各個階段的目標會不太相同。

(2) 數(shù)據(jù)與數(shù)據(jù)平臺的復(fù)用:被搜索的物品和被推薦的物品是統(tǒng)一的,召回排序訓(xùn)練模型時所需要的埋點數(shù)據(jù)/用戶行為數(shù)據(jù)等也是統(tǒng)一的,那么自然獲取數(shù)據(jù)/處理數(shù)據(jù)的平臺自然就是可以復(fù)用的。

(3) 算法與算法平臺的復(fù)用:搜索和推薦發(fā)展到一定階段,當(dāng)簡單的專家規(guī)則不再能夠支撐復(fù)雜的搜索和推薦需求時,都會發(fā)展到基于模型進行召回排序的階段,此時都需要根據(jù)用戶數(shù)據(jù)/物品數(shù)據(jù)/埋點數(shù)據(jù)進行模型訓(xùn)練,只不過由于二者的訓(xùn)練目標不同,訓(xùn)練的模型的參數(shù)可能會不相同,但算法平臺或者大家常說的機器學(xué)習(xí)/AI平臺是可以復(fù)用的。

(4) A/B Test實驗平臺的復(fù)用:由于業(yè)務(wù)需求的不斷變化,模型的不斷更替,通過A/B Test平臺能夠通過分流的方式拿到真實的生產(chǎn)環(huán)境中的用戶反饋,以幫助企業(yè)不斷驗證和優(yōu)化搜索和推薦策略。

(5) 配置中心的復(fù)用:可以通過配置中心針對不同業(yè)務(wù)和服務(wù)配置不同的搜索和推薦策略,并且提供便捷的一鍵部署能力。

所以很多公司,在業(yè)務(wù)領(lǐng)域上搜索和推薦分屬于不同的部門,但很多的公共的部分都有成熟的內(nèi)部平臺可以快速復(fù)用。

總結(jié)

本篇文章介紹了搜索和推薦的區(qū)別與聯(lián)系,架構(gòu)演進以及架構(gòu)統(tǒng)一。我們都知道架構(gòu)是因為需求的擴增而不斷演進來的,例如從服務(wù)階段發(fā)展到平臺階段,是因為要提高多業(yè)務(wù)的對接效率;從基于內(nèi)容的推薦到復(fù)雜的融合在線用戶畫像和離線用戶畫像的個性化推薦,是因為簡單基于規(guī)則或標簽的推薦無法滿足用戶和業(yè)務(wù)側(cè)的需求。

所以不要在一開始被過于復(fù)雜的架構(gòu)綁住手腳,可以針對自身業(yè)務(wù)的需求進行搜索/推薦的簡單架構(gòu)設(shè)計,然后逐步演進和優(yōu)化架構(gòu)。

責(zé)任編輯:趙寧寧 來源: Thoughtworks洞見
相關(guān)推薦

2020-04-03 13:12:09

函數(shù)架構(gòu) Serverless

2023-12-22 08:00:00

2019-08-14 10:20:32

算法數(shù)組鏈表

2015-12-02 09:59:14

2020-03-06 09:00:31

微信看一看質(zhì)量

2022-08-15 19:49:57

Consul架構(gòu)注冊中心

2021-10-20 06:47:50

Elasticsear場景引擎

2012-06-07 16:57:01

思科UCS統(tǒng)一計算

2019-01-28 08:31:47

360架構(gòu)系統(tǒng)

2022-11-30 14:33:51

網(wǎng)絡(luò)安全安全技術(shù)

2017-06-29 09:15:36

推薦算法策略

2013-05-06 12:32:03

統(tǒng)一通信融合社交媒體

2024-11-04 14:25:16

2021-05-06 09:05:11

深度學(xué)習(xí)

2010-01-27 13:54:52

IT電影

2025-04-08 02:30:00

2020-02-14 08:00:00

WindowsLinuxSamba

2022-06-02 08:37:10

架構(gòu)DDDMVC
點贊
收藏

51CTO技術(shù)棧公眾號