什么是逻辑回归？

2024-07-12 04:22| 来源: 网络整理| 查看: 265

要理解逻辑回归模型，我们首先要了解方程式和变量。

方程式

在数学中，方程式给出了两个变量之间的关系：x 和 y。您可以使用这些方程式或函数，通过输入不同的 x 和 y 值来沿 x 轴和 y 轴绘制图形。例如，如果绘制函数 y = 2*x 的图形，则会得到一条直线，如下所示。因此，该函数也称为线性函数。

变量

在统计中，变量是其值不同的数据因子或属性。对于任何分析，某些变量是自变量或解释变量。这些属性是结果的原因。其他变量是因变量或响应变量；它们的值取决于自变量。通常，逻辑回归通过查看两个变量的历史数据值来探索自变量如何影响一个因变量。

在上面的示例中，x 被称为自变量、预测变量或解释变量，因为它具有已知值。y 被称为因变量、结果变量或响应变量，因为其值未知。

逻辑回归函数

逻辑回归是一种统计模型，它使用数学中的逻辑函数或 logit 函数作为 x 和 y 之间的方程式。Logit 函数将 y 映射为 x 的 sigmoid 函数。

如果绘制此逻辑回归方程式，您将得到如下所示的 S 曲线。

如您所见，logit 函数仅返回因变量介于 0 和 1 之间的值，而不考虑自变量的值。这就是逻辑回归估计因变量值的方式。逻辑回归方法还可以对多个自变量和一个因变量之间的方程式进行建模。

使用多个自变量进行逻辑回归分析

在许多情况下，多个解释变量会影响因变量的值。要对此类输入数据集建模，逻辑回归公式假设不同自变量之间存在线性关系。您可以修改 sigmoid 函数并按如下公式计算最终输出变量

y = f(β0 + β1x1 + β2x2+… βnxn)

符号 β 表示回归系数。当您给它一个其中包含因变量和自变量的已知值的足够大的实验数据集时，logit 模型可以反向计算这些系数值。

对数赔率

Logit 模型还可以确定成功与失败的比率或对数赔率。例如，如果您和朋友一起玩扑克，并且赢了十场比赛中的四场，那么您的获胜赔率是 4/6，或者六分之四，这是您成功与失败的比率。另一方面，获胜的概率是十分之四。

从数学上讲，您的概率赔率是 p/(1 - p)，您的对数赔率是 log (p/(1 - p))。您可以将逻辑函数表示为对数赔率，如下所示：

逻辑回归分析有哪些类型？

有三种基于因变量结果的逻辑回归分析方法。

二元逻辑回归

二元逻辑回归适用于只有两种可能结果的二进制分类问题。因变量只能有两个值，例如“是”和“否”或 0 和 1。

即使逻辑函数计算的值范围介于 0 和 1 之间，二元回归模型也会将答案四舍五入到最接近的值。通常，小于 0.5 的答案四舍五入为 0，大于 0.5 的答案四舍五入为 1，因此逻辑函数返回二进制结果。

多项式逻辑回归

只要结果数量有限，多项式回归就可以分析具有多种可能结果的问题。例如，它可以根据人口数据预测房价是否会上涨 25％、50％、75％或 100％，但它无法预测房屋的确切价值。

多项式逻辑回归的工作原理是将结果值映射到 0 和 1 之间的不同值。由于逻辑函数可以返回一系列连续数据，如 0.1、0.11、0.12 等，因此多项式回归还会根据最接近的可能值对输出进行分组。

有序逻辑回归

有序逻辑回归或有序 logit 模型是一种特殊的多项式回归，用于解决数字代表等级而不是实际值的问题。例如，您可以使用有序回归来预测调查问题的答案，该问题要求客户根据数值（例如他们在一年中向您购买的商品数量）将您的服务评为差、一般、良好或优秀。

【本文地址】

今日新闻