电商用户购买行为预测 | 王延涛作品集

模型性能对比

对比 5 种机器学习模型在关键评估指标上的表现，涵盖排序能力和分类精度两个维度。

Top-K 场景下的召回率和排序质量，衡量模型在推荐场景中的实际效果。

移除不同特征组后模型性能变化，分析各特征组对预测结果的贡献度。

从用户行为日志中提取 100 维特征，涵盖用户画像、商品属性、行为序列、时间窗口统计等多个维度。

对比 Logistic Regression、Random Forest、XGBoost、LightGBM 和 Stacking Ensemble 五种模型，并设置 3 个 Baseline。

使用 SHAP 值分析特征贡献度，识别对购买预测最重要的特征，提升模型可解释性。

系统性移除用户特征、商品特征、类目特征和 UI 特征，量化各特征组对模型性能的影响。