当前位置: 首页 > news >正文

机器学习-入门-线性模型(1)

机器学习-入门-线性模型(1)

文章目录

  • 机器学习-入门-线性模型(1)
    • 3.1 线性回归
    • 3.2 最小二乘解
    • 3.3 多元线性回归

3.1 线性回归

f ( x i ) = w x i + b 使得 f ( x i ) ≃ y i f(x_i) = wx_i + b \quad \text{使得} \quad f(x_i) \simeq y_i f(xi)=wxi+b使得f(xi)yi

离散属性的处理:若有"序"(order),则连续化;否则,转化为 k k k 维向量

令均方误差最小化,有:

( w ∗ , b ∗ ) = arg ⁡ min ⁡ ( w , b ) ∑ i = 1 m ( f ( x i ) − y i ) 2 = arg ⁡ min ⁡ ( w , b ) ∑ i = 1 m ( y i − w x i − b ) 2 (w^*, b^*) = \arg\min_{(w, b)} \sum_{i=1}^m (f(x_i) - y_i)^2 = \arg\min_{(w, b)} \sum_{i=1}^m (y_i - wx_i - b)^2 (w,b)=arg(w,b)mini=1m(f(xi)yi)2=arg(w,b)mini=1m(yiwxib)2

E ( w , b ) = ∑ i = 1 m ( y i − w x i − b ) 2 E(w, b) = \sum_{i=1}^m (y_i - wx_i - b)^2 E(w,b)=i=1m(yiwxib)2 进行最小二乘参数估计

3.2 最小二乘解

E ( w , b ) = ∑ i = 1 m ( y i − w x i − b ) 2 E_{(w,b)} = \sum_{i=1}^m (y_i - wx_i - b)^2 E(w,b)=i=1m(yiwxib)2

分别对 w w w b b b 求导:

∂ E ( w , b ) ∂ w = 2 ( w ∑ i = 1 m x i 2 − ∑ i = 1 m ( y i − b ) x i ) \frac{\partial E_{(w,b)}}{\partial w} = 2 \left( w \sum_{i=1}^m x_i^2 - \sum_{i=1}^m (y_i - b)x_i \right) wE(w,b)=2(wi=1mxi2i=1m(yib)xi)

∂ E ( w , b ) ∂ b = 2 ( m b − ∑ i = 1 m ( y i − w x i ) ) \frac{\partial E_{(w,b)}}{\partial b} = 2 \left( mb - \sum_{i=1}^m (y_i - wx_i) \right) bE(w,b)=2(mbi=1m(yiwxi))

令导数为 0,得到闭式(closed-form)解:

w = ∑ i = 1 m y i ( x i − x ˉ ) ∑ i = 1 m x i 2 − 1 m ( ∑ i = 1 m x i ) 2 b = 1 m ∑ i = 1 m ( y i − w x i ) w = \frac{\sum_{i=1}^m y_i (x_i - \bar{x})}{\sum_{i=1}^m x_i^2 - \frac{1}{m} \left( \sum_{i=1}^m x_i \right)^2} \quad b = \frac{1}{m} \sum_{i=1}^m (y_i - wx_i) w=i=1mxi2m1(i=1mxi)2i=1myi(xixˉ)b=m1i=1m(yiwxi)

3.3 多元线性回归

同样采用最小二乘法求解,有

w ∗ = arg ⁡ min ⁡ w ( y − X w ) T ( y − X w ) w^* = \arg\min_{w} (y - Xw)^T (y - Xw) w=argwmin(yXw)T(yXw)

E w = ( y − X w ) T ( y − X w ) E_w = (y - Xw)^T (y - Xw) Ew=(yXw)T(yXw),对 w w w 求导:

∂ E w ∂ w = 2 X T ( X w − y ) \frac{\partial E_w}{\partial w} = 2X^T (Xw - y) wEw=2XT(Xwy)

令其为零可得 w w w

然而,麻烦来了:涉及矩阵求逆!

  • X T X X^T X XTX 满秩或正定,则 w ∗ = ( X T X ) − 1 X T y w^* = (X^T X)^{-1} X^T y w=(XTX)1XTy
  • X T X X^T X XTX 不满秩,则可解出多个 w w w

若可解出多个解,可以引入正则化得到唯一解

相关文章:

  • 【MCP】从一个天气查询服务带你了解MCP
  • 学习笔记:Qlib 量化投资平台框架 — FIRST STEPS
  • Linux系统之设置开机启动运行桌面环境
  • C++如何使用调试器(如GDB、LLDB)进行程序调试保姆级教程(2万字长文)
  • day51—二分法—x 的平方根(LeetCode-69)
  • 计算机基本理论与 ARM 相关概念深度解析
  • 一、I/O的相关概念
  • JavaScript之Webpack的模块加载机制
  • es数据导出
  • Unity Post Processing 小记 【使用泛光实现灯光亮度效果】
  • 第2讲、Tensor高级操作与自动求导详解
  • gradle eclipse [.project .classpath .settings]
  • 【有啥问啥】深入理解 Layer Normalization (LayerNorm):深度学习的稳定基石
  • 【物理学】电磁学——电动势
  • 说一下Drop与delete区别
  • Kafka批量消费部分处理成功时的手动提交方案
  • 页面需要重加载才能显示的问题修改
  • openstack热迁移、冷迁移、疏散
  • SQL注入原理及防护方案
  • 基于BenchmarkSQL的OceanBase数据库tpcc性能测试
  • 广州一季度GDP为7532.51亿元,同比增长3%
  • 凝聚多方力量,中国农科院油菜产业专家团部署单产提升新任务
  • 出国留学、来华留学呈现双增新趋势,“00后留学生个性鲜明”
  • 2025年中央金融机构注资特别国债发行,发行金额1650亿
  • 龙头券商哪家强:中信去年营收领跑,中金净利下滑
  • 宁德时代校友红利!副董事长给母校复旦豪捐10亿,曾毓群给交大捐近14亿