1.
确定数据来源与唯一识别键
- 列出所有来源:虾皮賣場後台(訂單、買家ID)、Shopee Ads、Google Analytics、Facebook/IG Ads、電商客服系統、Email/SMS 發送平台、POS/退貨系統。
- 為每來源定義可用的識別鍵(例如:Shopee Buyer ID、訂單編號、電子郵件、手機號碼、cookie 或 client_id)。
- 建議:把「訂單編號 + buyer_id」設為首要匹配鍵,email/phone 為二次鍵,cookie/client_id 用於跨裝置比對。
2.
設計資料模型與欄位映射表
- 建一張欄位對照表(mapping table),記錄來源欄位、型態、更新頻率、敏感性(PII)。
- 定義統一客戶屬性(姓名、email、phone、buyer_id、first_purchase_date、lifetime_value、最近購買渠道等)。
- 建議格式:CSV/Google Sheet 作為初版,包含樣本值與示例轉換規則(例如:手機加國碼、email 小寫化)。
3.
資料萃取(ETL/ELT)實作步驟
- 步驟1:從虾皮 Seller Center API/匯出CSV 拉訂單與買家資料(每日增量)。
- 步驟2:廣告平台與GA透過API抓取點擊、曝光、campaign 標籤與utm 參數;Email/SMS 平台抓取發送與點擊回報。
- 步驟3:使用ETL工具(如: Airbyte、Fivetran、或自建 Python 腳本)把資料導入到資料湖或雲端資料庫(BigQuery、Snowflake、MySQL)。
4.
清洗、標準化與身份解析(Identity Resolution)
- 清洗:去除空值、格式統一(電話、email 小寫、時間時區統一)。
- 去重與匹配規則:先用 buyer_id+order_id 精準合併;再用 email、phone 做確定匹配;最後用模糊匹配(姓名+地址、IP+UA)做補充。
- 建議工具:使用開源的 Dedupe 庫或在資料庫以 SQL 編寫相似度規則(例如 Levenshtein、soundex),並保留匹配信心分數(confidence score)。
5.
建立統一用戶檔案(Unified Profile)與分段
- 在資料倉儲建立一張主表(user_profile),包含識別鍵與衍生指標(RFM、LTV、活躍天數、偏好品類)。
- 自動化更新:每日或每小時跑批,更新最近購買、廣告互動、退貨紀錄。
- 分群:根據 profile 欄位建立常用分群(高LTV、3個月未回購、看過某類但未購買),並將分群結果寫回至資料庫或 CDP 用於啟動。
6.
激活(Activation)與成效追蹤
- 把分群名單透過API回傳到虾皮廣告客製化受眾、Facebook Custom Audiences 或 Email/SMS 平台。
- 監測指標:ROAS、再購率、每群體 CAC。為每次激活建立 UTM + campaign_id,將轉換回寫至資料庫以閉環追蹤。
- 建議做 AB 測試,並每周比對分群效果與預期。
7.
隱私與合規實務(台灣個資法 / PDPA)
- 審查每個資料來源的授權與同意紀錄(同意時間、用途),將同意狀態顯示於 user_profile。
- 對敏感資料做加密(at-rest 與 in-transit),並限制訪問權限與操作日誌。
- 保留政策:設定自動刪除或匿名化機制,符合主管機關要求。
8.
問:如何處理虾皮系統不提供 email 或手機的匿名買家?
- 答:先用 buyer_id 與訂單資料建立基本檔案,透過交易行為(商品類別、購買頻率)、cookie/client_id 與廣告曝光紀錄做行為標籤;若需跨渠道識別,可透過首次購買優惠或登入流程引導買家提供聯繫資訊以完成去匿名化。
9.
問:我沒有 CDP,可以用什麼替代方案建立完整視圖?
- 答:可先用雲端資料庫(BigQuery/Snowflake)+ ETL 工具做集中化,再以 SQL 視圖(view)或 BI 工具(Looker、Metabase)建立 user_profile;若需要即時啟動,搭配簡易 API 層或用 Zapier 等工具回推受眾。
10.
问:如何衡量我的整合是否成功?
- 答:指標包括資料完整率(具 email/phone 的 profile 比率)、匹配精準度(高信心分數的合併比例)、行銷啟動的轉換提升(再購率、ROAS)、以及合規檢核通過率。設定基準並每月回顧。
来源:跨渠道数据整合构建完整的虾皮台湾站的客户群视图方法