当前位置：首页 > news >正文

机器学习基础 - 分类模型之逻辑回归

news 来源：原创 2025/4/23 8:40:52

机器学习：逻辑回归

文章目录

机器学习：逻辑回归
- logistic回归简介
- Logistic 回归的数学表达
- 如何求解最优的 $\theta$
- 常见问题
- - 1. 逻辑回归与线性回归
  - 2. 推导一下 LR
  - 3. LR 如何实现多分类？
  - 4. LR 为何要对特征进行离散化
  - 5. 逻辑回归中，增大 L1 正则化会是什么结果
  - 5. 逻辑回归中，增大 L1 正则化会是什么结果

logistic回归简介

logistic回归用于解决的是分类问题，其基本思想是：根据现有数据对分类边界线建立回归公式,以此进行分类。也就是说，logistic 回归不是对所有数据点进行拟合，而是要对数据之间的分界线进行拟合。

逻辑回归的本质：极大似然估计
逻辑回归的激活函数：Sigmoid
逻辑回归的代价函数：交叉熵

Logistic 回归的数学表达

$h_\theta(x) = sigmoid(\theta^T X) = \frac{1}{1 + e^{-\theta^T X}}$

如何求解最优的 $\theta$

首先，我们依旧是要找到一个合适的损失函数，在Logistic回归中的损失函数为：
$Cost(h_{\theta}(x),y) = \begin{cases} -log(h_{\theta(x)}) & if \, y = 1\\ -log(1-h_{\theta(x)}) & if \, y = 0 \end{cases}$

$J(\theta) = - \frac{1}{m} \left[ \sum_{i=1}^m y^{(i)}log(h_\theta(x^{(i)})) + (1-y^{(i)}) log(1 - h_\theta(x^{(i)})) \right]$
我们最终给它加一个正则化项：
$J(\theta) = - \frac{1}{m} \left[ \sum_{i=1}^m y^{(i)}log(h_\theta(x^{(i)})) + (1-y^{(i)}) log(1 - h_\theta(x^{(i)})) \right] + \frac{\lambda}{2m} \sum_{j=1}^{m}\theta_j^2$