Logit究竟是个啥？——离散选择模型之三 - 知乎专栏

2024-11-24

文章推薦指數： 80 %

投票人數：10人

前言：人们经常说“Logit模型”——这里的“Logit”究竟是什么？ ... Biogeme：. Biogeme入门教程（中文版） · Biogeme安装教程 · Logit模型拟合实战案例（Biogeme） ... 首发于DCM笔记无障碍写文章登录/注册前言：人们经常说“Logit模型”——这里的“Logit”究竟是什么？小伙伴们可知道“Logit”应该理解成Log-it？且听Eric为您慢慢道来！本文为离散选择模型（DiscreteChoiceModel,DCM）系列文章的第三篇。

人们常说的“Logit模型”，这里的“Logit”到底是指什么？要回答这个问题，得先弄清楚一个概念——Odds！1.何为Odds？在英语里，Odds的意思就是指几率、可能性。

《老友记》里面有这么一个场景：大家坐在一起玩转瓶子（Spinthebottle）的游戏——每次转动瓶子，瓶子的细口所指向的那个人就和转瓶子的人Kiss一下。

当Joey和Emily连续亲了3次之后，Chandler说道——Whataretheodds?意为：真是太巧了！图1《老友记》第4季第16集在统计学里，概率（Probability）和Odds都是用来描述某件事情发生的可能性的。

概率描述的是某事件A出现的次数与所有结果出现的次数之比。

公式表示：P(A)=\frac{Number\;of\;EventA}{Total\;Number\;of\;Events}........(1)概率P是一个0到1之间的实数；P=0表示一定不会发生，而P=1则表示一定会发生。

以掷骰子为例。

掷出点数为6的概率为：P=\frac{1}{6}图2掷骰子Odds指的是事件发生的概率与事件不发生的概率之比。

公式表示为：Odds=\frac{Probability\;of\;event}{Probability\;of\;no\;event}=\frac{P}{1-P}........(2)继续上面掷骰子的例子。

出现点数6的概率P=1/6，出现其它点数的概率1-P=5/6。

根据式(2)可以得到掷出点数为6这一事件的Odds为：Odds=\frac{1/6}{5/6}=\frac{1}{5}用更通俗的解释：平均来看，掷出6点的成功的概率和失败的概率之比为1:5。

和概率论中许多其它的概念一样，Odds也是在赌博中产生的一个概念。

假设甲乙二人掷骰子对赌；若甲出1块钱赌掷到6点，乙需要投注5块钱才能保证公平。

2.Odds和概率之间的关系换一个角度来看：由式（2）可以推导出如下关系：Odds=\frac{P}{1-P}=\frac{\frac{Number\;of\;Event\;A}{Total\;Number\;of\;Events}}{\frac{Number\;of\;Other\;Events}{Total\;Number\;of\;Events}}\RightarrowOdds=\frac{Number\;of\;Event\;A}{Number\;of\;Other\;Events}也就是说，事件A的Odds等于事件A出现的次数和其它（非A）事件出现的次数之比；相比之下，事件A的概率等于事件A出现的次数与所有事件的次数之比。

在图3中，随机摸出一个球、颜色为红色的概率为3/5，其所对应的Odds为3:2。

图3随机摸球实验下表1和图4展示了概率P从0.01变化到0.99时，相应的Odds变化的情况。

注意：（1）当概率等于0.5的时候，Odds等于1（等分）；（2）概率P的变化范围是[0,1]，而Odds的变化范围是[0,+\infty)。

再进一步，如果对Odds取自然对数，就可以将概率P从范围[0,1]映射到(-\infty,+\infty)。

Odds的对数称之为Logit。

表1Odds和概率P之间的关系图4概率P和Odds之间的关系图5概率P和Logit之间的关系从概率P\rightarrowOdds\rightarrowLogit，这就是一个Logit变换。

实际上，所谓Logit模型可以理解成Log-it（即it的自然对数——这里的it指的就是Odds）。

图6Logit变换与概率不同，Logit的一个很重要的特性就是没有上下限——这就给建模带来极大方便。

我在DCM系列文章第二篇《线性模型vs.Logistic模型——离散选择模型之二》中提到：不能直接套用线性回归模型Y=\beta_0+\betaX,\;\;Y\in(-\infty,+\infty)........(3)对概率P进行建模——因为（3）式左边Y的取值范围是(-\infty,+\infty)，而概率P的取值范围是[0,1]。

但是，由于Logit和(\beta_0+\beta_1X)都是在(-\infty,+\infty)上变化，我们可以尝试建立Logit和(\beta_0+\beta_1X)之间的对应关系，例如：log\;it(P_i)=\beta_0+\betaX........(4)如果将\beta和X看成向量形式，则：log\;it(P_i)=ln\frac{P_i}{1-P_i}=\beta_0+\beta_1x_{1,i}+\beta_2x_{2,i}+\cdot\cdot\cdot+\beta_nx_{n,i}........(5)上面(5)式正是二项Logit模型的基本形式。

更多的证明需要用到效用理论；后续文章会依次给出。

【本篇完】专栏文章列表（动态更新中...）入门篇离散选择模型（DiscreteChoiceModel）简介线性模型vs.Logistic模型Logit究竟是个啥？probit模型中的probit究竟是指什么？正确打开/解读Logit模型系数的方式二项Logit模型拟合实战案例（SAS）二项Logit模型拟合实战案例（Python）Odds和OddsRatio的区别二项Logit/Probit理论篇：效用最大化准则：离散选择模型的核心（Probit模型上篇）效用最大化准则：离散选择模型的核心（Probit模型下篇）效用最大化准则：离散选择模型的核心（二项Logit模型）从Gumbel分布到Logistic分布多项Logit（MNL）理论与实战：：Multi-NominalLogit中的“Nominal”究竟是什么含义?效用最大化准则：多项Logit模型（MultinomialLogit,MNL）多项Logit模型（MNL）拟合实战案例（SAS篇）MNL的IIA特性与“红公交/蓝公交悖论”（上篇）MNL的IIA特性与“红公交/蓝公交悖论”（下篇）如何将决策者的属性和方案属性同时放到MNL模型中？Logit模型中的个人属性、方案属性数据处理案例为什么条件Logit模型中没有常数项，以及，你的女神会不会不喜欢你？Logit模型中的ASC（Alternative-SpecificConstant）是指什么？嵌套Logit（NL）：NestedLogit模型NestedLogit模型拟合实战案例（SAS篇）Biogeme：Biogeme入门教程（中文版）Biogeme安装教程Logit模型拟合实战案例（Biogeme）其它：最大似然估计（上）最大似然估计（下）模型中存在共线性问题，该怎么破？多因素回归分析模型中的变量筛选方法Logistic回归的起源（上）Logistic回归的起源（中）probit模型中的probit究竟是指什么？Logistic回归的起源（下）如果您觉得本篇干货满满，请您动动手指，点赞、留言、分享三连，谢谢！-END-关注【DCM笔记】公众号，私信作者获取相关文章中的练习数据和代码：编辑于2021-11-2409:37机器学习计量经济学行为经济学赞同140578条评论分享喜欢收藏申请转载文章被以下专栏收录DCM笔记系统介绍离散选择模型的基础理论和软件实现方法