奧推網

選單
科技

搜推策略產品十做十不做

搜尋推薦到底該怎麼做呢?是要照著老闆說的做,還是根據使用者反饋做?本文作者總結了搜推策略產品的十做十不做,並對其中的三點進行了分析,一起來看一下吧。

搜尋推薦到底怎麼做?按老闆說的做,照競品抄,根據使用者反饋做、透過資料分析做?8年京東、美團搜推經驗,建議大家那些該做,那些不該做的,搜推策略產品十做十不做,但要根據具體情況定。

01 硬加權不做,但柔性智慧化流量調控要做

什麼叫硬加權,就是給某個商品的排序直接從後面提到前面,這個叫硬加權。比如有運營來找你,說我這個東西這麼好,怎麼排序靠後呢,你得給我加權呀、或者是某個業務找到你,說我這個業務是今年公司重點,但流量不足呀,你得加權呀……

為什麼不能硬加權,硬加權損效率呀!為什麼損效率呀,用點黑話,是因為使用者不Buy in呀,就是使用者不點呀!

那為什麼柔性智慧化流量調控可以做呢?這有幾個關鍵點,一個是前置的篩選分層,如果是電商就是精細化選品,看哪些品是預期可以多獲得一些流量,也能承接得住的。

比如阿里今年雙11出了一個價格力加權,就是你這個商品優惠力度大,我可以多給你流量;再比如阿里的優質商家商品流量加權,也是說這個商品有一定的潛力,我多給他一些流量,應該也能承接的住;還有就是中間的賽馬機制,效率好的晉升,效率差的汰換,同時要有運營診斷指導,為什麼效率差,商品價格高、沒什麼評論積累、主圖示題不清晰等。

當然還有很多,不一一展開說了。還有一個重要的點是,對於協同部門要疏不是堵,就是你給他提供抓手,可以讓他有玩的東西,然後一點一點有軼序地玩。

02 亂七八糟標籤不用做,但使用者商品基礎標籤、營銷標籤、人群節日標籤要做

什麼叫亂七八糟的標籤?就是一提起推薦,大家就說你是基於那些標籤推薦的, 我們能不能在商品或內容上打些標籤,然後你們用呀?我們之前打的標籤你們用了嗎,效果怎麼樣?你看我們還需要打什麼標籤……這裡說明下,標籤對於推薦來講是重要的,但不是最重要的,尤其是在大資料量的情況下。所以,不要提到推薦,大家就認為標籤做好了,推薦就做好了,推薦沒做好,就是標籤沒做好。

1. 推薦原理

回答什麼是亂七八糟標籤前,我先基於我的理解給大家科普下推薦原理。其實這也不能怪大家,早期推薦技術也沒那麼先進,然後資料量可能也不多,所以,大家就冷啟的時候讓你選興趣點標籤,推薦的時候根據文字標籤推薦,模型上也是LR、GBDT一類的。

這就讓沒搞過搜推的人覺得,啊,推薦就是標籤推薦,但他不知道,現在都是DNN了,都是基於使用者行為推薦,基於I2I推薦,基於KNN,基於Embedding、Vector推薦,只有個別情況下,資料探勘不到的,才會透過早期的文字標籤做召回推薦。

舉些例子吧,要不然,這麼說,懂的人懂,不懂的人還是覺得推薦就是標籤推薦,推薦沒做好,就是沒標籤,或者標籤不準,或者標籤用得不好……那以電商為例,基本可以透過共購買,共點選等資料探勘到相似或相關的商品。

比如你點選了小米的手機,那可能會推薦給你華為的手機,因為很多人點了小米後,也會點華為,甚至最後還購買了華為,這麼說還是籠統,更細節是你點的是小米支援5G的,8G+512G記憶體+儲存的、5英寸的、雙攝的……那演算法就透過大資料幫你找到的是華為P40\P50,而不會找到Nokia。

那你這例子不還是說推薦就是基於標籤推薦的嗎?這裡其實又涉及到了演算法可解釋的問題,通常業務會問,你這排序的邏輯是什麼,為什麼這麼排,為什麼這個排前面,那個排在後面?你看給我推了這個,你看我是這樣的使用者,我年薪百萬,怎麼不給我推那個?你這個推的多Low呀,一點都不高階……那演算法同學呢,一般的回答就是,呃,這是演算法推薦的,是DNN深度學習的,是黑盒的,是不可解釋的,我們也不知道為什麼這麼推;產品經理呢一般會說:啊,你點過這些吧,這是根據你的行為和畫像推薦的。

2. 模型可解釋

我先撈乾的,理論上DNN深度神經網路是不可解釋的,不像GBDT的樹模型那樣是可解釋的,這說的是從模型的角度,什麼Feature Important角度是不可解釋的。但實際上任何模型也都是可解釋的,因為人的選擇是可解釋的,人的購物決策和瀏覽內容的偏好是可解釋的,只不過是你要根據不同人、不同時間、不同地點、不同場景、不同……太多了,這樣就不好解釋了,而且你還是要解釋給不瞭解演算法的人。

那這就變成,本來是可解釋的也解釋不清楚了,或者解釋清楚了也聽不清楚……大部分情況下,排序就兩種結果:有使用者行為的非新使用者就是點什麼推什麼,無行為的新使用者就是熱門推薦。

就像行業裡的頭條、抖音、快手什麼的,早期甚至現在都是你第一次開啟就是美女、時效熱點事件、當地特色內容等;然後你就一直看,演算法就認為你喜歡,就一直找相似的推;然後你美味佳餚吃夠了,偶爾也想來點粗糧,這時你就劃掉那些美女了,或者自己搜尋點什麼,那演算法就認為你喜歡上其他內容了,那就幫你找新的相似的內容。

但這些說的都是表面哈,我來講點深度的。其實演算法裡有個概念叫特徵,特徵是什麼呢?就是能表達這個商品或者內容好壞的東西,其實就像“白、富、美”就是表達一個女人的特徵。那演算法裡一般用什麼特徵呢,比如內容類關鍵的就是點選量、點贊量、評論數、點選率、完播率、停留時長、好評率……然後這些特徵呢,還有周期,比如7天點選量、3天點選量、1小時點選量等。好這樣估計有些人能理解推薦一些了。

03 為了多樣性而做的多樣性不做,但基於人群、使用者行為、時令節日、空間等變化的多樣性要做

1. 什麼是多樣性

一般推薦結果的多樣性就是,連續Top N個結果是不同的,不同的維度一般是類目維度。這個是通俗的定義,如果要科學定義的話,其實是透過基尼係數、熵等來衡量的。

這裡再多說一些多樣性,僅是類目維度的多樣性還不夠,有些場景下需要下分到二、三、四級類、甚至是詞維度,同時還可以根據圖片、價格、商家、品牌、屬性、作者等等很多維度不同的多樣性。那大家如何理解多樣性的呢?這裡就會根據不同的屁股、不同的認知來理解了,抽象地講沒有感覺,我舉些例子,做為推薦產品經理遇到比較多的情況應該是:

1)老闆覺得多樣性不夠

這裡多吐槽一下,在網際網路公司推崇扁平化、去官僚化的情況下,做為一個底層人員,仍然要面對很多層級的老闆,而且這些老闆們的想法還都不一樣,想法不一樣也就算了,關鍵是他們還不聽一線人員的方案。一般打仗是在前線的人員,最清楚狀況,最知道怎麼打,且將在外,軍令可有所不從,但你在網際網路公司,你要敢不從,那你就等著走人吧。

那老闆們都如何理解多樣性呢,比如甲老闆會說,這怎麼每天都給我推差不多的內容,我們平臺上不是有很多內容嗎,我們那個主推的怎麼沒看見;乙老闆會說,一樣的內容推得太多了;丙老闆會說我在其他平臺上看到的內容,咱們這怎麼沒推呢……

2)業務覺得多樣性不夠

業務經常是說,怎麼沒有我們品類的內容呢,怎麼都是那個品類的內容呢?

3)使用者覺得多樣性不夠

很多使用者是不願意反饋的,一般也就反饋點什麼推什麼、看過買過還推。

2. 如何做多樣性

前面雖然提到了什麼叫多樣性,但不夠具體,所以,在如何做前,還是要定義清楚什麼是多樣性,做到什麼樣,大家能滿意。這裡先說那些不是多樣性不夠:

1)不區分場景的多樣性不是多樣性問題

老闆們不分任何時候,都想要多樣性,這裡有一個經典的場景,比如某個使用者此刻想買個冰箱,或者是想了解某個事件,這時你非要為了多樣性,再給他推薦個洗衣機、電視,雖然都是家裝三件套,但這個使用者可能不是新裝修呀,有可能就是想換個冰箱,或者是給家裡人買、或者是放到租房的地方,反正他不缺電視。

那你說想買上衣的時候,推薦褲子可以吧,這個場景看似成立,但不是適合所有使用者;那這種跨品類的,組合式的推薦什麼時候成立呢,這個要根據每個使用者的意圖強弱,行為豐富度等來動態判斷。比如使用者就是逛,就是什麼都點,那基本上,你的推薦就可以發散一些,否則,有明確意圖的,你就要幫他收斂,快速幫他找到他想要的,可能是他有一個價格心理,或者是一個屬性風格的心理。

2)行為與意圖茅盾的不是多樣性問題

什麼意思呢?就是經常有些內部的人,他不是想看真的內容或者購買那個東西,而是沒有目的地亂點、亂看,點著點著,自己也忘了都點過什麼,然後演算法基本會基於你最近的點選等行為進行推薦。且由於演算法貪心的Point wise模式,推薦的內容確實會是相似的多,這樣就會造成錯覺,怎麼給我推的內容都差不多?

這裡的差不多,就是上面說的,演算法會基於行為推薦類目相似、價格相似等的內容,但老闆要看到的是不同價格段的都來點,或者其他想法,反正是有自己的想法。有時能代表使用者,但更多時候是參雜著自己的意願,以及平臺的導向。

比如也會說咱們平臺不是還有很多內容嗎,這裡其實你可以建議你的老闆去內容庫或者商品庫裡看全部內容,推薦演算法不可能把全部分類都推出來,那和過去的貨架式、陳列式沒什麼區別了。

我們繼續說多樣性如何做。做之前呢,要知道目標,做到什麼標準算好,那這裡基本上是需要定量和定性去衡量的,比如定量上要提升瀏覽深度、CTR、停留時長、不同品類的曝光佔比等,不同業務可能不太一樣,定性上是否明顯的Badcase在減少等。

有了衡量標準後,就是具體策略了,這個策略也要從多層進行制定,基本上推薦要想最佳化一個問題,都是要全方面的調整,不可能有一個大招,就解決所有問題,那一般都是從資料、召回、排序、互動上去最佳化:

1)資料

資料這不多說了,核心是三點,資料要全面、準確、實時;你要搞清楚人的畫像和商品內容的畫像,要不然無法進行準確的召回和匹配。

2)召回

這裡要多說一點,召回源是推薦最重要的部分,如果你只有一路相似召回,那你就沒法做多樣性。至少要按人群、時間、空間、場景等維度進行差異化的召回,比如新人召回熱銷、或者基於CF的召回;非新更多是基於使用者行為的相似相關召回。

還有些人會深度將人群分得更細,比如阿里的八大人群。從時間上會基於平日、季節、節日、大促、熱點、上新等進行召回;從空間上會基於LBS召回;場景上則會比較多,比如是使用者動線購前、中、後等,使用者需求的具體場景,比如辦年貨、吃火鍋等。除了這些召回外,還有一些更偏演算法的,比如KNN,KG,Base Model CF。

3)排序

這裡和多樣性相關的應該是模型由Point wise調整為List Wise,以及透過MMR等進行打散的排序,還可能加入一些硬規則的M出N的排序,然後EE和生態排序也可以算到這裡。

4)互動

這裡最重要的是,要實時捕捉使用者的正負反饋,根據正反饋加強推薦,根據負反饋削弱推薦;同時要在產品互動形態上做到動態互動,既使用者點選某個Item後回到列表頁時,下一個如何進行動態的推薦;以及使用者翻頁時,要進行重新推薦,這裡有些會使用端智慧,但感覺端智慧還是提升有限,最好還是進行服務端重新的推薦。

總結一下多樣性的要點:

使用者意圖非常明確收斂時,不要做大力度的多樣性;

使用者意圖發散時,要加強多樣性;

要合邏輯地做多樣性,不要為了多樣性而多樣性;

04 其他

個人觀點的體感不做,但大多數人的使用者體驗,敏感商品遮蔽等要做;

拍腦袋的功能不做,但透過資料分析、行業調研、ROI高的要先AB實驗做;

前端樣式變來變去的策略產品不做,但分人群等個性化的UE及方案等要做;

天天干預配置的運營、策略產品不做,但要提供工具給產品運營用;

天天幫研發找表、跑數的保姆不做,但跨部門協調、資料分析等要做;

左手導右手的不做,但如果能形成全域性效率最大化的要做;

人情類的需求不做,但為了生存有選擇性地做。

以上為個人觀點,不代表任何機構。

本文由 @元氣 原創釋出於人人都是產品經理,未經許可,禁止轉載。

題圖來自 Unsplash,基於 CC0 協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供資訊儲存空間服務。