← 返回作品集

电商用户购买行为预测

基于电商用户历史行为数据,使用 5 种机器学习模型预测用户未来购买意图。包含完整的特征工程、模型对比、SHAP 可解释性分析和消融实验。

PythonLightGBMXGBoostRandom ForestSHAPStackingscikit-learn
模型数量:5 + 3 Baseline 特征数量:100 评估用户数:658 最佳模型:Stacking Ensemble
0.947
最佳 ROC-AUC
0.637
Recall@20
0.420
NDCG@20
100
特征维度

模型性能对比

对比 5 种机器学习模型在关键评估指标上的表现,涵盖排序能力和分类精度两个维度。

排序能力分析(Recall@K / NDCG@K)

Top-K 场景下的召回率和排序质量,衡量模型在推荐场景中的实际效果。

消融实验

移除不同特征组后模型性能变化,分析各特征组对预测结果的贡献度。

方法与技术栈

特征工程

从用户行为日志中提取 100 维特征,涵盖用户画像、商品属性、行为序列、时间窗口统计等多个维度。

模型对比

对比 Logistic Regression、Random Forest、XGBoost、LightGBM 和 Stacking Ensemble 五种模型,并设置 3 个 Baseline。

SHAP 可解释性

使用 SHAP 值分析特征贡献度,识别对购买预测最重要的特征,提升模型可解释性。

消融实验

系统性移除用户特征、商品特征、类目特征和 UI 特征,量化各特征组对模型性能的影响。