当前位置: 首页 > news >正文

第二十一讲 XGBoost 回归建模 + SHAP 可解释性分析(利用R语言内置数据集)

下面我将使用 R 语言内置的 mtcars 数据集,模拟一个完整的 XGBoost 回归建模 + SHAP 可解释性分析 实战流程。我们将以预测汽车的油耗(mpg)为目标变量,构建 XGBoost 模型,并用 SHAP 来解释模型输出。


🚗 示例:使用 XGBoost 和 SHAP 解释 mtcars 油耗预测模型


📦 步骤 1:加载所需 R 包

# 如果尚未安装,请取消注释以下行安装
# install.packages(c("xgboost", "SHAPforxgboost", "data.table", "ggplot2"))library(xgboost)
library(SHAPforxgboost)
library(data.table)
library(ggplot2)

🔍 步骤 2:准备数据

# 使用 mtcars 数据集
data(mtcars)# 将数据转换为 matrix 格式
data_matrix <- as.matrix(mtcars[, -1])  # 去除 mpg 列作为特征
labels <- mtcars$mpg                   # mpg 作为目标变量# 转为 xgboost DMatrix 格式
dtrain <- xgb.DMatrix(data = data_matrix, label = labels)

🧠 步骤 3:训练 XGBoost 回归模型

# 设置参数
params <- list(objective = "reg:squarederror", eval_metric = "rmse",eta = 0.1,max_depth = 3
)# 训练模型
xgb_model <- xgb.train(params = params,data = dtrain,nrounds = 100,verbose = 0
)

📊 步骤 4:SHAP 解释变量重要性

# 计算 SHAP 值
shap_values <- shap.values(xgb_model = xgb_model, X_train = data_matrix)
shap_long <- shap.prep(shap_contrib = shap_values$shap_score, X_train = data_matrix)# 可视化 SHAP 值
shap.plot.summary(shap_long)

这将绘制出各变量对预测油耗的贡献,颜色表示变量的取值大小,非常直观👇


 

🔥 SHAP 分析解读(示意)

  • wt(重量) 对 mpg 的负向影响最显著,越重油耗越高(mpg 越低)。

  • hp(马力) 也是一个重要负相关特征。

  • cyl(气缸数) 的影响次之。


✅ 小结

本示例中,我们用 mtcars 构建了一个 XGBoost 回归模型,并通过 SHAPforxgboost 包对模型进行可解释性分析:

步骤内容
数据准备使用内置数据集并转换格式
模型训练设置参数并训练
SHAP 分析计算贡献值并可视化

相关文章:

  • 系统环境变量有什么实际作用,为什么要配置它
  • 深入剖析 C/S 与 B/S 架构及网络通信基础
  • Android Jni(二)加载调用第三方 so 库
  • portainer.io篇
  • 【Qt】信号和槽
  • Zookeeper三台服务器三节点集群部署(docker-compose方式)
  • Zookeeper单机三节点集群部署(docker-compose方式)
  • Java EE(8)——线程安全总结(翻新版)——定时器(Timer)线程池(ThreadPoolExecutor)
  • LeetCode算法题(Go语言实现)_48
  • 智能做题:拍照解题API使用指南
  • AI对百度搜索与抖音社区的影响差异?
  • 【Python语言基础】20、模块与包
  • 用 Vue 3 + OpenAI API 实现一个智能对话助手(支持上下文、多角色)
  • fastjson2 使用bug
  • 每日算法-链表(2.两数相加、24.两两交换链表中的节点、143.重排链表)
  • 怎么通过OPPO手机进行图片编辑?图片编辑攻略,打造专业级照片
  • vscode格式化为什么失效?自动保存和格式化(Prettier - Code formatter,vue-format)
  • MySQL入门:数据表的创建
  • HTTP HTTPS RSA
  • AI核心概念之“结构化输出(Structured Output)” - 来自DeepSeek
  • 在差异中建共鸣,《20世纪美国文学思想研究》丛书出版
  • 《深化养老服务改革发展的大湾区探索》新书将于今年6月出版
  • 网贷放款后自动扣除高额会员费,多家网贷平台被指变相收取“砍头息”
  • 咖啡与乳腺健康之间,究竟有着怎样的复杂关系?
  • 乌克兰基辅遭大规模袭击,已致12人死亡
  • 新华视点丨广西抗旱一线调查