当前位置: 首页 > news >正文

Datawhale AI春训营 TASK2 学习笔记

概要

特征决定上限:有效的特征工程能显著提升模型性能

模型服务于数据:要根据数据特点选择合适模型

融合创造奇迹:加权平均可带来显著提升

从数据分析开始

plt.figure(figsize=(20,10))
for i in range(9):plt.subplot(3, 3, i+1)plt.plot(hours, train.iloc[:24, i])plt.title(train.columns[i])
plt.show()
  • 通过对数据的可视化可以发现:

  • GHI与POAI呈正相关

  • 风速分量U100/V100可合成总风速

  • 功率在凌晨时段达到峰值

  • target = target[target['时间'].str.endswith('00:00')]

    通过时间对齐来使功率数据降采样至小时级

构建有效的特征工程

特征工程指的是把原始数据转变为模型训练数据的过程,目的是获取更好的训练数据特征。

常见特征有 统计特征与时空特征

常用的处理方法有 过滤 包裹 嵌入

def feature_combine(df):df["wind_speed"] = np.sqrt(df['u100']**2 + df['v100']**2)  # 合成风速df["h"] = df.index % 24  # 时间周期性特征df["ghi/poai"] = df["ghi"] / (df["poai"] + 1e-7)  # 辐照效率比return df

模型的选取、训练与验证

如同人的能力各有千秋,选取不同的模型也会获得不同的效果,通过不断尝试来选取合适的模型

又如同智囊团,多个模型结果的再分析并输出可以获得更高的准确率

还可以采用交叉验证的策略

kf = KFold(n_splits=5, shuffle=True, random_state=2024)
for fold, (train_idx, valid_idx) in enumerate(kf.split(X)):

相关文章:

  • 用P0口控制LED(STC89C52单片机)
  • QEMU源码全解析 —— 块设备虚拟化(20)
  • 硬件电路(25)-过温保护器件ksd9700温控开关
  • 图例QCPLegend
  • 深入理解基线检查:网络安全的基石
  • 基于 JavaWeb 的 SpringBoot 办公 ERP 管理系统设计与实现(源码+文档+部署讲解)
  • 从浏览器地址栏输入 URL 到网页显示,这中间发生了什么?
  • [matlab]子图排版和线性回归
  • MySQL8启动失败 NET HELPMSG 3534
  • 016-C语言内存函数
  • 【HarmonyOS 5】VisionKit人脸活体检测详解
  • 【特殊场景应对3】创意岗简历骚操作:作品集链接的正确打开方式
  • 【Vue】组件通信(Props/Emit、EventBus、Provide/Inject)
  • keil5烧录后No Debug
  • (三)mac中Grafana监控Linux上的Redis(Redis_exporter安装使用)
  • 在win上安装Ubuntu安装Anaconda(linx环境)
  • 6.数据手册解读—运算放大器(三)
  • LeetCode hot 100—分割等和子集
  • 在 Node.js 中设置响应的 MIME 类型
  • RenderStage::drawInner
  • 纪念|巴尔加斯·略萨:写作之为命运
  • 从板凳席到指挥台,横扫广东男篮的少帅潘江究竟有何神奇
  • 女子伸腿阻止高铁关门被拘,央媒:严格依规公开处理以儆效尤
  • 美国海关新规致跨境包裹延误,DHL暂停超800美元对美个人货运
  • 人民文学奖颁出,董宇辉获传播贡献奖
  • 新城市志|全球供应链动荡加剧,中国稳外贸有信心有底气