自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

海納“千川”:得物多場景統(tǒng)一推薦平臺

開發(fā) 架構
千川用戶行為較為分散,不同場景下行為稀疏且差異較大。為處理這類偏差,千川匯集全場景下用戶的長短期行為,設計I2I、重定向、Trigger選取、向量化等一系列策略。

一、千川由來

得物的推薦場景,除了首頁瀑布流等幾個比較大的場景之外,還有很多長尾的小場景,包括:頻道、會場、購中購后場景、品牌墻等。這類場景存在單個場景體量小(UV和GMV均偏?。鼍傲闵?、類型多元的情況。如需對這類場景進行單獨優(yōu)化,涉及的成本投入遠高于產出。而隨著業(yè)務發(fā)展,這類長尾場景只會越來越多,對這類場景的優(yōu)化亟待解決。因此,我們需要這樣一個通用推薦平臺,來承接住這些小場景,并能夠持續(xù)優(yōu)化,帶來收益?!盎銥檎薄ⅰ凹嫒莶?、“統(tǒng)一平臺”,這就是千川。

圖片

二、千川需要解決的難題

結合各類需求及定位,千川作為統(tǒng)一推薦系統(tǒng),面臨不少難題,至少需具備五種能力。

圖片

困難

能力

挑戰(zhàn)

場景商品集不同

靈活圈選商品集

依據場景和商品集合的關系,實現(xiàn)不同場景不同商品的可推池

場景目標不一致

支持場景多元化目標調整

結合場景,以價值性導向及發(fā)現(xiàn)性導向調整多元化目標

場景策略差異大

分場景差異化策略配置

在業(yè)務需求基礎上,完善各種策略并支持分場景差異化配置

推薦類型多樣

兼顧多類型推薦

除具備商品排序能力外,對場景間、主題、會場、品牌等也具備推薦能力

資源空間有限

低成本、高效率、易擴展

在低成本前提下,實現(xiàn)相對高效率的提升,且便于擴展新場景

三、工程和算法解決方案

應對上述困難,千川提出統(tǒng)一推薦框架。在千川ID體系基礎上,實現(xiàn)多場景推薦的統(tǒng)一優(yōu)化。

圖片

千川推薦框架總體分五層

  • APP服務層:對接各個長尾場景,目前接入了包括主題、頻道、會場、購中購后獨立流、出圖等場景
  • 千川接入層:目前提供兩種接入方式,一種是通過商品投放服務接入,一種是注冊千川直連。千川依據接入場景的差異建立千川ID體系,會為每個接入的場景提供特定的千川ID(或者千川ID集合)。
  • 千川DPP層:提供多種DPP推薦模塊,滿足多類型推薦需求,包括商品推薦DPP,多類型推薦DPP,樓層推薦DPP,品牌推薦DPP。每個DPP模塊框架基本一致,會根據推薦類型設計差異化推薦策略。
  • 算法層:搭建完整推薦鏈路,在召回、粗排、精排、策略等全流程上進行效率和體驗優(yōu)化。
  • 召回階段:設計包括I2I、U2I等在內5類召回,盡可能處理場景、行為、興趣偏差,召回用戶喜好商品。
  • 粗排階段:在滿足高性能要求上,提供單目標及多目標粗排能力,為后續(xù)精排提升空間。
  • 精排階段:針對場景差異、用戶興趣、多種目標、大促應用方面進行一系列模型迭代。
  • 策略階段:結合業(yè)務需求提供策略干預、場景差異化配置、流控調權、多樣性重排、多類型分發(fā)等能力。
  • 基建層:依托包括機器學習平臺、索引平臺、特征服務、流控平臺等在內的強大能力支持,方可打造出整套千川推薦框架。

四、算法迭代過程

4.1 召回粗排演進

因千川多業(yè)務場景的特色,召回和粗排階段面臨一系列挑戰(zhàn),包括:場景行為偏好差異、多場景下用戶興趣偏差、場景目標定位差異。

挑戰(zhàn)1:場景行為偏好差異

千川用戶行為較為分散,不同場景下行為稀疏且差異較大。為處理這類偏差,千川匯集全場景下用戶的長短期行為,設計I2I、重定向、Trigger選取、向量化等一系列策略。

圖片

  • I2I、重定向捕獲行為偏好
  • 不同的Trigger選取策略兼顧長短期行為
  • GraphEmb、RankI2I實現(xiàn)行為偏好的向量化

挑戰(zhàn)2:多場景下用戶興趣偏差

不同場景下用戶的興趣不完全一致,具體表現(xiàn)如:男性用戶A在主題落地頁更多關注鞋、運動、3C等之類的商品,在送禮頻道更關注化妝品相關商品;女性用戶B在主題落地頁更傾向于包袋、玩偶等,在送禮頻道更關注籃球、休閑服之類的商品。用戶在不同場景之間的興趣表現(xiàn)既有共性又存在差異,千川通過實現(xiàn)全場景的DSSM向量表征與結合場景特征的MIND向量表征多場景下用戶的興趣偏差。

  • DSSM引入全場景數據表征用戶對商品的基礎興趣
  • MIND結合場景特征擴展用戶在多場景多興趣上的表征

挑戰(zhàn)3:場景目標定位差異

因場景定位不同,對應的目標也不一致。整體可歸納為dpv導向場景和uv價值導向場景。dpv導向場景對應的是對點擊的預估,uv價值導向場景需要同時預估點擊和轉化。千川針對兩類場景目標,設計了粗排雙塔和粗排ESMM模型實現(xiàn)分目標差異化預估,消除場景目標定位差異。

圖片

  • 粗排雙塔模型實現(xiàn)點擊預估
  • 粗排ESMM實現(xiàn)點擊與轉化的多目標預估

4.2 排序模型迭代

挑戰(zhàn)1: 用戶興趣建模

用戶興趣建模一直是推薦系統(tǒng)中重要的優(yōu)化點之一,用戶的歷史行為則是用戶潛在興趣最直接的表達。

之前的工作主要針對用戶實時和中短期行為進行建模,僅使用近期行為無法建模用戶長期以來穩(wěn)定的興趣和周期性的行為,同時也會將推薦系統(tǒng)的數據反饋循環(huán)限制在局部的熱門的內容中。


圖片

另一方面則是特征交叉的不足,模型從deepFM單目標范式遷移到基于dmt范式下的多目標模型,去掉了fm側結構,雖然可以充分挖掘用戶行為序列特征,但是對稀疏特征在模型上的交叉還較少,有一定的優(yōu)化空間。

挑戰(zhàn)2: 場景差異建模

由于不同的場景往往具備自身獨特的定位,服務的用戶、包含的商品都有較大的差異。而小場景本身的用戶分布和行為偏好也隨活動和運營策略等變化發(fā)生較大的波動。

新人落地頁、新人頻道等場景,新用戶占比較高,點擊率偏高而轉化率明顯偏低;補貼頻道主要以性價比高商品為主,點擊、轉化的意向都不錯,但是aov較整體有明顯的下降;女性頻道的受眾基本是女性,這個場景的商品集較主流場景有著明顯差異,女性用戶在喜好上也有明顯偏向,數據上看這個場景的女裝、箱包占比有明顯提升;而會場等場景,日常和大促用戶分布和商品池變化很大,用戶行為也有相應的變化,在預熱期收藏意愿持續(xù)提升,直到大促當天集中實現(xiàn)轉化。而對于購后、支付后等場景,由于用戶需求已經部分滿足,瀏覽深度就相應偏低。

迭代1: 用戶興趣建模

為了充分建模用戶的興趣的差異,我們在構建場景下用戶、商品各種顯式交叉統(tǒng)計特征的基礎上,進一步通過優(yōu)化對用戶行為序列的充分建模和隱式的特征交叉方式,提升我們對用戶偏好刻畫的準確性。

  1. 首先我們增加了transformer的結構來處理用戶的長短期用戶行為序列,并對行為序列做了合并和去重處理來增大信息容量。
  2. 我們增加了顯式的對用戶統(tǒng)計特征、稀疏特征的交叉,提升模型效果。
  3. 增加千川id、商品、用戶屬性對用戶行為的交叉特征,并利用co-action結構做隱式交叉。
  1. 用戶行為序列作為Feed Feature, 復用attention之前的sequence embedding
  2. cspu、qcid、gender、brand等作為Induction Feature,構建3層mlp
  3. 做3次階乘,增加高階的特征交叉

圖片

圖片

迭代2: 多場景差異建模

為了充分建模不同場景的差異,我們在構建場景下商品、品牌、類目的交叉統(tǒng)計特征基礎上,進一步通過模型結構的優(yōu)化,充分學習用戶在不同場景的偏好差異。

  1. 通過構建特征刻畫場景偏好以及場景效率的差異

維度

區(qū)分

品牌偏好

uvctr、pvctr、uvcvr、pvcvr... 場景下不同的【品牌|類目】商品聚合統(tǒng)計效率指標

類目偏好

exp_uv_per、exp_pv_per... 同場景下,不同【品牌|類目】的【曝光|點擊|收藏|訂單】占比

時間

1d、3d、7d、14d、30d

效率

pvctr、uvctr、pvcvr、uvcvr、aov、uvv、dpv...

指標

gmv、exp_uv、exp_pv、clk_uv、clk_pv、ord_uv...

  1. 通過構建特征刻畫用戶活躍度、用戶生命周期標簽等特征
  1. 用戶標簽-生命周期
  2. 用戶-不同場景-活躍度 【exp|clk|buy|clickbuy && cspu|brand|cate】
  3. 用戶-全場景-活躍度【exp|clk|buy|clickbuy && cspu|brand|cate】
  1. 通過mmoe結構,使得模型進一步學習到場景的差異。
  2. 盡管豐富了特征,但是不同場景的樣本混合,只用一個模型會使得不同場景互相干擾覆蓋,難以達到最優(yōu)的效果,所以進一步對模型結構做了調整,復用了mmoe的結構。
  3. 為了凸顯場景的差異性,需要對原始的MMoE的 Gate 網絡的輸入做調整,為此只選擇千川id的本身信息作為特征,利用場景id的信息對experts進行選擇,使得不同場景經過softmax輸出不同的Gate 權重。
  4. 針對不同的場景,模型能夠感知場景的差異,不同場景能夠選擇不同的experts子網絡的組合,從而實現(xiàn)不同場景的差異化建模。
  5. 通過poso結構,使得模型能進一步學習到用戶群的差異。
  6. 在初步使用用戶特征時,發(fā)現(xiàn)新用戶的特征因為數據稀少(新用戶的樣本只占所有樣本的4.6%),并沒有被網絡充分學習利用,導致這些特征即使被MASK也幾乎不影響網絡參數分布。
  7. 為了解決不平衡分布的特征的處理,采用了POSO的結構,主要在Gate側輸入用戶標簽特征,例如是否新客、是否賣家、性別等特征。然后在全連接結構使用POSO時,全連接的每層輸出和gate的輸出按位相乘。


圖片



圖片


圖片

按照預估點擊率分桶,可以看到模型在對新客的預估上,準確率明顯提升,而且從整體的pcoc上看,模型建模效果也顯著提升。


圖片



圖片


5、未來展望

5.1 業(yè)務

千川一如既往的支持各類業(yè)務發(fā)展:

  • 規(guī)范對接流程,繼續(xù)擴展新場景,做到準確高效,如:會場主圖,金剛位出圖等。
  • 歸納業(yè)務訴求,提煉需求共性,進一步擴展能力,如:多類型分發(fā)能力、多樣性重排能力等。
  • 維護系統(tǒng)穩(wěn)定,完善監(jiān)控、神盾巡檢,及時發(fā)現(xiàn)、處理相關問題。

5.2 算法

千川召回迭代會繼續(xù)聚焦在處理場景、行為、興趣偏差上:一方面從場景相關特征入手,圍繞場景特征進行召回模型迭代,如:將場景特征作為獨立塔引入,加入場景、用戶、商品之間的特征交叉,探索SDM模型結構等;一方面持續(xù)深挖用戶、商品特征,強化價格因素占比,豐富價格特征、加深價格與場景、用戶、商品的關聯(lián),實現(xiàn)精準建模。

千川精排迭代會繼續(xù)聚焦在多場景差異建模方向上,一方面探索現(xiàn)有建模范式的進階方向,例如PepNet等。一方面繼續(xù)挖掘特征,例如場景內的用戶行為序列等,并探索與之適配的模型結構,如SAR-Net等。

另外在許多千川的實際應用中,有許多非瀑布流場景,K個商品可能一次性呈現(xiàn)給用戶。例如金剛位、中通位、會場樓層內、商品分類等等場景。此時,這K個商品如同被呈現(xiàn)在一張卡片上,且這K個推薦位之間是相互影響的。會嘗試探索生成重排等整屏優(yōu)化的算法方向。

而千川會場商品推薦很容易受外界干預和大促日程節(jié)點的影響,排序模型常常出現(xiàn)日常表現(xiàn)優(yōu)于基線,但是到了大促就效率大幅下滑的現(xiàn)象。這既是挑戰(zhàn)也是算法技術創(chuàng)新的機遇。會進一步探索諸如持續(xù)學習、實時ODL、LTR等方向。

5.3 通用性

此外,我們會繼續(xù)升級,將千川變得更加通用,爭取做到組件化、構建算法庫、靈活擴展和可復制。

圖片


責任編輯:武曉燕 來源: 得物技術
相關推薦

2023-08-21 19:37:21

得物DGraph引擎

2025-02-20 09:17:50

2023-08-30 09:00:05

2023-01-11 18:34:22

推薦精排模型

2023-05-10 18:34:49

推薦價格體驗優(yōu)化UV

2023-07-07 19:26:50

自建DTS平臺

2024-11-12 14:19:53

2018-11-30 09:57:37

物聯(lián)網工業(yè)協(xié)議

2022-03-28 14:23:26

HarmonyAI算法統(tǒng)一推理接口

2023-11-29 18:41:35

模型數據

2023-04-10 18:36:30

得物API協(xié)作平臺

2021-06-15 14:14:21

統(tǒng)一推送聯(lián)盟AndroidiOS

2025-04-17 04:00:00

2023-05-15 18:33:09

得物前端巡檢

2023-05-12 18:42:13

得物AI平臺

2024-08-08 10:38:40

算法云音樂多場景建模

2017-12-12 10:34:33

AndroidGoogle安卓

2023-03-30 18:39:36

2022-12-12 18:56:04

2019-12-09 16:35:03

awkLinux命令
點贊
收藏

51CTO技術棧公眾號