【乾貨】電商運營如何用大資料+大資料，構建電商使用者評分體系？！

編輯導語：如今電商平臺發展的十分繁榮，電商平臺的運營也要發揮很大的作用為產品帶來流量，加上如今大資料的幫助，精細化運營成了一種好辦法；本文作者分享了關於構建電商使用者評分體系，我們一起來了解一下。

花花是某電商公司的一名產品運營，如果新上線一款產品他的一貫做法都是做活動、蹭熱點、做營銷等等；但是，這些做法引來了大量的羊毛黨，獲取的客戶卻是屈指可數。

正在花花為此事頭疼之際，同組的前輩豆豆給他支了個招，運用AHP 和 RFM 構建使用者評分體系，精細化運營，能帶來很好的效果；開心之餘，花花趕緊使用度娘搜尋，AHP 和 RFM 究竟是什麼東西？又怎麼運用呢？接下來作者就給你嘮叨嘮叨。

一、AHP 制定權重

1. AHP 是什麼？

層次分析法（Analytic Hierarchy Process）簡稱 AHP，20 世紀 70 年代中期由美國運籌學家托馬斯·塞蒂（T·L·Saaty）提出。

AHP 是指將與決策有關的元素分解成目標、準則、方法等層次，主要用於定性的問題進行定量化分析決策。

比如，某電商平臺根據使用者行為資料對使用者做綜合評分模型，找出忠誠使用者、活躍使用者、沉默使用者等等，進而對各類使用者進行精細化運營。

2. AHP 基本原理

AHP 的思路是密切的和決策者的主觀判斷以及推理聯絡起來，也就是對決策者的推理或者判斷過程進行量化，從而避免決策者在結構複雜或方案較多時邏輯推理失誤。

具體步驟如下：

1）建立評分體系

構建使用者價值評分體系，對各類使用者進行精細化運營。

設定目標，列出影響目標的所有元素。採用專家打分、使用者問卷等方式，逐一列出所有的影響因素，比如活躍度、忠誠度、購買力等。

2）構建層次結構、判斷矩陣

列出影響因素的指標或方案。

判斷影響使用者活躍度的指標有瀏覽頁面次數、停留時長、瀏覽商品次數、下單次數。

判斷影響使用者忠誠度的指標有最近訪問時間、訪問頻率、主動評價次數。

判斷影響使用者購買力的指標有單筆最高金額、平均訂單金額、購買次數。

3）算出權重係數

分別算出各個指標層、準則層的指標權重，然後再算出決策公式（如下圖）。

4）一致性校驗

若一致性指標 CR<0。1，就進入下一環節；否則，對各指標權重重新賦值（即，重新構建判斷矩陣）。

5）層次排序

層次排序分為層次單排序和層次總排序。所謂層次單排序，指對於上一層某因素而言，本層次各因素的重要性的排序；所謂層次總排序，指確定某層所有因素總目標相對重要性的排序權值過程。

層次排序是從最高層到最底層依次進行的。對於最高層次而言，其層次單排序的結果也是總排序的結果。

3. 確定權重

1）構建判斷矩陣

在確定各層次各因素間的權重時，如果僅是定性的結果，則通常不容易被其他人接受；因而 Saaty 提出一致性矩陣法，即兩兩因素相互比較，採用標度，儘可能減少不同因素相互比較的困難，以提高準確度。

運用專家打分將所有因素兩兩比較確定合適的標度。建立層次結構後，比較因子及下屬指標的各個比重，實現定性向定量轉化；比如，採用 1-9 分標度法，構建決策層的打分矩陣 A，如下圖。

實際上，上述打分矩陣就是層次分析法中的判斷矩陣。

2）一致性檢驗

一致性檢驗是為了檢驗各元素重要程度之間的協調性，避免出現 A 比 B 重要，B 比 C 重要，而 C 又比 A 重要，這樣的矛盾情況。

相關理論：

一致性矩陣：

判斷矩陣是否為一致性矩陣：

在判斷矩陣的構造中，並不要求判斷矩陣一定具有一致性，這是由客觀事物的複雜性和人的認識多樣性決定的；但判斷矩陣是計算排序權向量的依據，因此要求判斷矩陣應該滿足大體上的一致性。

對判斷矩陣一致性校驗：

先求解特徵向量，採用手工計算方法——和積法：

手工計算矩陣 A 的特徵值：

求特徵向量：

求最大特徵值：

手工求解精確度較低，只是求得最大特徵值的近似值。

一致性校驗

3）計算指標層權重

計算活躍度的權重：

因此，準則層相對活躍度的權重依次為：

瀏覽頁面次數的權重：b1=0。63231

停留時長的權重：b2=0。21452

瀏覽商品次數的權重：b3=0。10961

下單次數的權重：b4=0。04357

計算忠誠度的權重：

因此，準則層相對忠誠度的權重依次為：

最近訪問時間的權重：c1=0。61935

訪問頻率的權重：c2=0。28423

主動評價次數的權重：c3=0。09642

計算購買力的權重：

因此，準則層相對購買力的權重依次為：

單筆最高金額的權重：d1=0。70706

平均訂單金額的權重：d2=0。20141

購買次數的權重：d3=0。09153

列出全部權重：

如果一致性校驗沒有透過，怎麼辦？

作者在實際構建評分矩陣時，發生了好幾次一致性校驗不透過（如 CR>=0。1）。這可能由於一些主觀因素導致，也可能是由於構建模型不合理導致。所以需要專家重新構建打分矩陣，甚至需要重新構建層次分析模型。

構建模型影響：

因素是否合理、含義是否清晰、要素間是否重疊，這都會有影響。建議每層要素儘量不超過 7 個；如果元素之間的強度相差很大，儘量不要放在同一個層級。

計算精度影響：

特徵值求解方法的不同（比如和積法、方根法等）、Excel 計算值的誤差、計算工具的誤差等，都可能導致一致性校驗結果有些偏差，可以使用 Matlab 等精度更高的計算工具，如下圖。

4）結論

運用 AHP 模型得出和公式：

活躍度=b1*瀏覽頁面次數+b2*停留時長+b3*瀏覽商品次數+b4*下單次數；

忠誠度=c1*最近訪問時間+c2*訪問頻率+c3*主動評價次數；

購買力=d1*單筆最高金額+d2*平均訂單金額+d3*購買次數；

使用者價值評分=0。64339*活躍度+0。28284*忠誠度+0。07377*購買力。

AHP 方法使用較少的定量資料，就可以構建模型，最終的結論只能表明因素的重要程度，不能得出使用者價值的評分值是多少。

因此，將 RFM 模型和 AHP 模型相結合，算出各個因素的分值，得出每個使用者的評分。

二、RFM 計算分值

1. RFM 是什麼？

RFM 模型是衡量客戶價值和客戶創利能力的重要工具和手段。

該模型透過一個客戶的近期購買行為（Recency）、購買的總體頻率（Frequency）以及消費金額（Monetary）3 項指標切分出多類客戶，最後根據不同型別客戶（如下圖）佔比情況來評估客戶的整體分佈，並針對不同型別的客戶進行有針對性的營銷。

一個 RFM 使用者分層模型，重要發展客戶到底多少分？一般價值客戶多少分？作者將用某電商公司 2018 年 11 月 1 日-2019 年 4 月 30 日共 5 個月的交易資料來講述，為了保護隱私，資料經過脫敏處理。

2. 構建 RFM 模型的步驟

1）獲取與清洗資料

RFM 模型主要用於分析使用者購買行為，通常獲得的資料包含付款時間、實付金額、訂單狀態等等資訊的資料，部分資料如下圖。

獲得資料後，其中可能存在空值、異常值等情況，這類髒資料無法進行分析，需要透過簡單的資料清洗去除；資料清洗的方式有兩類：異常值處理，如刪除、均值補差等；異常值識別，如按業務規則查詢、語義衝突等。

比如，作者獲得交易資料後，發現 “發貨時間” 為空，是髒資料，需要剔除；對應 “訂單狀態” 的值是 “付款以後使用者退款成功，交易自動關閉”，退款使用者資料不該納入模型，需要去除。

清洗完之後，分別對 “發貨時間”、“訂單狀態” 進行篩選，這時發現 “發貨時間” 為空或訂單狀態為 “付款以後使用者退款成功，交易自動關閉” 這類資料已經不存在了，說明已經篩選乾淨了。

2）建立模型

接下來，作者需要提取 R、F、M 的值：R（最近一次購買距今天的天數）、F（購買了幾次）和 M（平均購買金額）。

構建一張透視表，將 “買家暱稱” 分別拖到行位置和值位置，對 “買家暱稱” 進行計數彙總，也就是得出買家的消費次數，即 F 值；將 “付款時間” 拖到值位置，設為最大值，將 “實付金額” 拖到值位置，設為平均值，即 M 值，如下圖。

將初步透視好的資料複製到一張新的表格（選擇性貼上「值和數字格式」）；接著處理 R 的值，由於訂單截止日期是 2019 年 4 月 30 日，作者將建模時間設為 2019 年 5 月 1 日，求距離 5 月 1 日這一天客戶最近一次付款時間的間隔天數，就是求每個客戶的 R 值，如下圖。

用 RFM 的計算方式，對所有因素（R、F、M）進行 0-5 評分割槽段的對映。

或者用下面的公式歸一化處理（如下圖），正相關使用第一個公式，負相關使用第二個公式，R 屬於負相關，因為最近一次購買時間距越小，那麼越重要。F 和 M 都是正相關。

規範化計算也可以使用（X-Xmin）/均值（X）和（Xmax-X）/均值（X），需要注意的是，如果真實資料分佈不平均的話，均值就可能出現偏差，比如有人消費 100 萬元，有人消費 1000 元，平均數的偏差就很大；所以，可以使用三分位、中位數或者（Xmax-Xmin）等方式進行歸一化。

由於獲取的資料欄位有限，無法透過指標層得到準則層的權重，所以直接用AHP算出的活躍度、忠誠度和購買力的權重，依次分別是0。64339、0。28284、0。07377。

得出標準化的資料以及一定權重的使用者價值，如下圖：

把 R、F、M、使用者價值按照 0、1 區分，如果大於均值為 1，否則為0，得到 16 種使用者型別，如下圖。

將使用者型別代入資料中，得出的部分結果，如下圖。

3. 模型視覺化

1）分析各類客戶佔比

對剛剛完成 RFM 模型表格進行透視，將 “客戶型別” 拖至行區域，再把 “客戶型別” 拖至值區域兩次，第一次是為了計數，第二次是為了檢視客戶佔比，如下圖。

繪圖，更清晰的檢視不同客戶型別的使用者數佔比，如下圖。

2）分析客戶金額佔比

對RFM模型表格進行透視，將“客戶型別”拖至行區域，再把“累計金額”拖至值區域兩次，第一次是為了計算每類客戶的累計消費金額，第二次是為了檢視每類客戶的金額佔比，如下圖。

繪圖，更清晰的檢視不同客戶型別的金額佔比，如下圖。

三、總結與建議

1）從各類客戶佔比圖中看出，次一般挽留客戶（0000）的人數最高，竟達 8725 人，人數佔比 34。52%；此類客戶近期沒有購買，購買頻次低於平均值，下單平均金額比較低，並且使用者價值也較低，大約在 2018 年雙11 下的單，屬於價格敏感性客戶，所以可以在促銷活動（如國慶節、六一等）時試著喚醒他們。

2）次重要挽留客戶（0010），最近沒有購買商品，消費頻率較低，消費金額較大的一類客戶，有 6905 人，人數佔比 27。16%，支付金額佔比最高；換句話說，對於該商家銷售額貢獻率最高的一批客戶，下單時間遠，購買次數低，已經處於流失的邊緣，但是不同於次一般挽留客戶，這類客戶的平均銷售額較高。

對於這類客戶，運營人員需要獲取他們的聯絡方式，進行回訪，詢問客戶沉睡的原因；或者說商品本身就屬於復購率低、消費金額佔比高的商品；或者從商品本身入手，試著比較客戶購買時間與商品的回購日期，是不是上次購買的商品還沒有用完。

3）重要發展客戶（1011），最近購買，購買頻次低，消費金額大，使用者價值大的客戶有 2614 人，佔總人數的 20。28%，支付金額相對較高。這類客戶大致是新客戶。

對於這類客戶，運營人員近期適當的進行簡訊推送，優惠券發放等形式，來提高他們的購買頻率，爭取提高這類使用者的忠誠度，最終將他們轉變成重要價值客戶。

本文由 @貓耳朵原創釋出於人人都是產品經理，未經許可，禁止轉載

題圖來自 Unsplash，基於 CC0 協議

奧推網

【乾貨】電商運營如何用大資料+大資料，構建電商使用者評分體系？！

相關文章閱讀