当前位置: 首页 > news >正文

机器学习基础理论 - 目标函数,损失函数,代价函数

目标函数,损失函数,代价函数


文章目录

  • 目标函数,损失函数,代价函数
    • 1. 经验风险与结构风险
    • 2. 损失函数,代价函数,目标函数
    • 3. 常用的损失函数
      • 1 . 0-1 损失函数
      • 2. **绝对值损失函数**
      • 3. **平方损失函数**
      • 4. **对数损失函数**
      • 5. **指数损失函数**
      • 6. **Hinge损失函数**
    • 4. 常用的代价函数
      • 1. 二次代价函数
      • 2. 交叉熵代价函数
      • 3. 对数似然函数代价函数
    • QA
      • 1. Sigmoid 为何与交叉熵搭配二不用二次方代价函数
      • 2. sigmoid 为何要与交叉熵搭配
      • 1. Logistic 回归为何要使用对数损失函数?
      • 4.为什么交叉熵损失相比均方误差损失能提高以 sigmoid 和 softmax 作为激活函数的层的性能?
      • 5. 损失函数有哪些? 怎么用?
    • Reference
      • 5. 损失函数有哪些? 怎么用?
    • Reference

1. 经验风险与结构风险

  • 经验风险指的是模型对数据的拟合程度,拟合程度越高,经验风险越小。(其实对应的就是代价函数)
  • 结构风险指的是对模型复杂度的评估,模型越复杂,结构风险越大。(其实对应的就是目标函数)

只考虑将经验风险最小化,会出现过拟合现象。

2. 损失函数,代价函数,目标函数

其实在很多论文和博客中都用的很随意,其实三者之间是有着细微的区别的:

  • 损失函数(Loss Function):一般针对单个样本的描述。其用来衡量模型预测值与真实值不一致的程度,是一个非负实值函数,通常使用 L ( Y , f ( x ) ) L(Y, f(x)) L(Y,f(x)) 表示。 损失函数越小,模型的鲁棒性就越好。

  • 代价函数(Cost Function):一般是针对总体。我们需要通过训练代价函数来获得最优参数,最常见的如平方差代价函数:
    J ( θ ) = 1 m ∑ i = 1 m ( h ( x ( i ) ) − y ( i ) ) 2 J(\theta) = \frac{1}{m}\sum_{i=1}^m(h(x^{(i)})-y^{(i)})^2 J(θ)=m1i=1m(h(x(i))y(i))2

  • 目标函数(Object Function):等价于 代价函数 + 正则化项, 其往往也是我们模型中要优化求解的函数 – 目标函数。

3. 常用的损失函数

1 . 0-1 损失函数

L ( Y , f ( x ) ) = { 1 , Y ≠ f ( x ) 0 , Y = f ( x ) L(Y, f(x)) = \begin{cases} 1,& Y\ne f(x)\\ 0,& Y = f(x) \end{cases} L(Y,f(x))={1,0,Y=f(x)Y=f(x)

相等为 0 , 不相等为1。一般的在实际使用中,相等的条件过于严格,可适当放宽条件:

L ( Y , f ( x ) ) = { 1 , ∣ Y − f ( x ) ∣ ⩾ T 0 , ∣ Y − f ( x ) ∣ < T L(Y, f(x)) = \begin{cases} 1,& |Y-f(x)|\geqslant T\\ 0,& |Y-f(x)|< T \end{cases} L(Y,f(x))={1,0,Yf(x)TYf(x)<T

2. 绝对值损失函数

L ( Y , f ( x ) ) = ∣ Y − f ( x ) ∣ ​ L(Y, f(x)) = |Y-f(x)|​ L(Y,f(x))=Yf(x)∣​

3. 平方损失函数

L ( Y ∣ f ( x ) ) = ∑ N ( Y − f ( x ) ) 2 L(Y|f(x)) = \sum_N {(Y-f(x))}^2 L(Yf(x))=N(Yf(x))2

4. 对数损失函数

L ( Y , P ( Y ∣ X ) ) = − log ⁡ P ( Y ∣ X ) L(Y, P(Y|X)) = -\log{P(Y|X)} L(Y,P(YX))=log<

相关文章:

  • C++入门(namespace/输入输出)
  • docker存储
  • 23.C语言指针相关知识点2
  • C++代码随想录刷题知识分享-----面试题链表相交
  • 传统农耕展陈如何突破?数字多媒体能否重构文化体验边界?
  • 阿里云ftp服务器登录要怎么做?如何访问ftp服务器?
  • 记录一下QA(from deepseek)
  • 开发vue项目所需要安装的依赖包
  • Redis ⑦-set | Zset
  • Leetcode刷题 | Day49_图论01
  • 《冰雪传奇点卡版》:详细打金攻略!
  • OpenGL学习笔记(法线贴图、视差贴图)
  • 基于 Spring Boot 瑞吉外卖系统开发(九)
  • 读论文《Deep learning-assited pulsed discharge plasma catalysis modeling》2023 ECM
  • 在QGraphicsView中精确地以鼠标为锚缩放图片
  • 【Light文献速览】湖南大学超表面高阶庞加莱球偏振检测时钟技术突破
  • EMC isilon/PowerScale 如何收集日志
  • 【神经网络与深度学习】五折交叉验证(5-Fold Cross-Validation)
  • 数据结构 RBT 插入操作的 Python 代码实现
  • 设计模式(行为型)解释器模式
  • 51岁国家移民管理局移民事务服务中心联络部副主任林艺聪逝世
  • 中央政治局会议举行,传递三重确定性
  • 调查丨当节气出现“时差”,陕西的果农们经历着什么?
  • 印巴在克什米尔实控线附近小规模交火,巴防长发出“全面战争”警告
  • 王旭任甘肃省副省长
  • 农贸美学、业态再构、智能管理,今天的菜市场不止有菜