1. 什么是逻辑回归?

逻辑回归是一种 分类算法,用于预测样本属于某一类别的概率。

其核心思想是用线性模型输出经过Sigmoid函数映射到(0,1)区间,表示概率。

常见应用:二分类问题,如垃圾邮件识别、肿瘤良恶性判断等。

2. 逻辑回归的数学原理

2.1 Sigmoid函数

逻辑回归的输出为:

$$ \hat{y} = \sigma(z) = \frac{1}{1 + e^{-z}}, \quad z = \mathbf{w}^\top \mathbf{x} + b $$

其中 $\sigma(\cdot)$ 为Sigmoid函数,$\mathbf{w}$为权重,$b$为偏置。

2.2 交叉熵损失函数

损失函数采用交叉熵

$$ J(\mathbf{w}, b) = -\frac{1}{n} \sum_{i=1}^n \left[ y_i \log \hat{y}_i + (1-y_i)\log(1-\hat{y}_i) \right] $$

2.3 梯度下降法

梯度下降法是一种迭代优化算法,旨在通过不断调整模型参数(权重 $\mathbf{w}$ 和偏置 $b$)来最小化损失函数 $J(\mathbf{w}, b)$。其核心思想是沿着损失函数梯度(导数)的反方向更新参数,因为梯度指向函数值增长最快的方向,所以其反方向是函数值下降最快的方向。

1. 初始化参数:随机初始化权重向量 $\\mathbf{w}$ 和偏置 $b$,通常初始化为接近零的小值。

2. 迭代更新:重复以下步骤,直到满足停止条件: