Logit究竟是个啥?——离散选择模型之三 - 知乎专栏

文章推薦指數: 80 %
投票人數:10人

前言:人们经常说“Logit模型”——这里的“Logit”究竟是什么? ... Biogeme:. Biogeme入门教程(中文版) · Biogeme安装教程 · Logit模型拟合实战案例(Biogeme) ... 首发于DCM笔记无障碍写文章登录/注册前言:人们经常说“Logit模型”——这里的“Logit”究竟是什么?小伙伴们可知道“Logit”应该理解成Log-it?且听Eric为您慢慢道来!本文为离散选择模型(DiscreteChoiceModel,DCM)系列文章的第三篇。

人们常说的“Logit模型”,这里的“Logit”到底是指什么?要回答这个问题,得先弄清楚一个概念——Odds!1.何为Odds?在英语里,Odds的意思就是指几率、可能性。

《老友记》里面有这么一个场景:大家坐在一起玩转瓶子(Spinthebottle)的游戏——每次转动瓶子,瓶子的细口所指向的那个人就和转瓶子的人Kiss一下。

当Joey和Emily连续亲了3次之后,Chandler说道——Whataretheodds?意为:真是太巧了!图1《老友记》第4季第16集在统计学里,概率(Probability)和Odds都是用来描述某件事情发生的可能性的。

概率描述的是某事件A出现的次数与所有结果出现的次数之比。

公式表示:P(A)=\frac{Number\;of\;EventA}{Total\;Number\;of\;Events}........(1)概率P是一个0到1之间的实数;P=0表示一定不会发生,而P=1则表示一定会发生。

以掷骰子为例。

掷出点数为6的概率为:P=\frac{1}{6}图2掷骰子Odds指的是事件发生的概率与事件不发生的概率之比。

公式表示为:Odds=\frac{Probability\;of\;event}{Probability\;of\;no\;event}=\frac{P}{1-P}........(2)继续上面掷骰子的例子。

出现点数6的概率P=1/6,出现其它点数的概率1-P=5/6。

根据式(2)可以得到掷出点数为6这一事件的Odds为:Odds=\frac{1/6}{5/6}=\frac{1}{5}用更通俗的解释:平均来看,掷出6点的成功的概率和失败的概率之比为1:5。

和概率论中许多其它的概念一样,Odds也是在赌博中产生的一个概念。

假设甲乙二人掷骰子对赌;若甲出1块钱赌掷到6点,乙需要投注5块钱才能保证公平。

2.Odds和概率之间的关系换一个角度来看:由式(2)可以推导出如下关系:Odds=\frac{P}{1-P}=\frac{\frac{Number\;of\;Event\;A}{Total\;Number\;of\;Events}}{\frac{Number\;of\;Other\;Events}{Total\;Number\;of\;Events}}\RightarrowOdds=\frac{Number\;of\;Event\;A}{Number\;of\;Other\;Events}也就是说,事件A的Odds等于事件A出现的次数和其它(非A)事件出现的次数之比;相比之下,事件A的概率等于事件A出现的次数与所有事件的次数之比。

在图3中,随机摸出一个球、颜色为红色的概率为3/5,其所对应的Odds为3:2。

图3随机摸球实验下表1和图4展示了概率P从0.01变化到0.99时,相应的Odds变化的情况。

注意:(1)当概率等于0.5的时候,Odds等于1(等分);(2)概率P的变化范围是[0,1],而Odds的变化范围是[0,+\infty)。

再进一步,如果对Odds取自然对数,就可以将概率P从范围[0,1]映射到(-\infty,+\infty)。

Odds的对数称之为Logit。

表1Odds和概率P之间的关系图4概率P和Odds之间的关系图5概率P和Logit之间的关系从概率P\rightarrowOdds\rightarrowLogit,这就是一个Logit变换。

实际上,所谓Logit模型可以理解成Log-it(即it的自然对数——这里的it指的就是Odds)。

图6Logit变换与概率不同,Logit的一个很重要的特性就是没有上下限——这就给建模带来极大方便。

我在DCM系列文章第二篇《线性模型vs.Logistic模型——离散选择模型之二》中提到:不能直接套用线性回归模型Y=\beta_0+\betaX,\;\;Y\in(-\infty,+\infty)........(3)对概率P进行建模——因为(3)式左边Y的取值范围是(-\infty,+\infty),而概率P的取值范围是[0,1]。

但是,由于Logit和(\beta_0+\beta_1X)都是在(-\infty,+\infty)上变化,我们可以尝试建立Logit和(\beta_0+\beta_1X)之间的对应关系,例如:log\;it(P_i)=\beta_0+\betaX........(4)如果将\beta和X看成向量形式,则:log\;it(P_i)=ln\frac{P_i}{1-P_i}=\beta_0+\beta_1x_{1,i}+\beta_2x_{2,i}+\cdot\cdot\cdot+\beta_nx_{n,i}........(5)上面(5)式正是二项Logit模型的基本形式。

更多的证明需要用到效用理论;后续文章会依次给出。

【本篇完】专栏文章列表(动态更新中...)入门篇离散选择模型(DiscreteChoiceModel)简介线性模型vs.Logistic模型Logit究竟是个啥?probit模型中的probit究竟是指什么?正确打开/解读Logit模型系数的方式二项Logit模型拟合实战案例(SAS)二项Logit模型拟合实战案例(Python)Odds和OddsRatio的区别二项Logit/Probit理论篇:效用最大化准则:离散选择模型的核心(Probit模型上篇)效用最大化准则:离散选择模型的核心(Probit模型下篇)效用最大化准则:离散选择模型的核心(二项Logit模型)从Gumbel分布到Logistic分布多项Logit(MNL)理论与实战::Multi-NominalLogit中的“Nominal”究竟是什么含义?效用最大化准则:多项Logit模型(MultinomialLogit,MNL)多项Logit模型(MNL)拟合实战案例(SAS篇)MNL的IIA特性与“红公交/蓝公交悖论”(上篇)MNL的IIA特性与“红公交/蓝公交悖论”(下篇)如何将决策者的属性和方案属性同时放到MNL模型中?Logit模型中的个人属性、方案属性数据处理案例为什么条件Logit模型中没有常数项,以及,你的女神会不会不喜欢你?Logit模型中的ASC(Alternative-SpecificConstant)是指什么?嵌套Logit(NL):NestedLogit模型NestedLogit模型拟合实战案例(SAS篇)Biogeme:Biogeme入门教程(中文版)Biogeme安装教程Logit模型拟合实战案例(Biogeme)其它:最大似然估计(上)最大似然估计(下)模型中存在共线性问题,该怎么破?多因素回归分析模型中的变量筛选方法Logistic回归的起源(上)Logistic回归的起源(中)probit模型中的probit究竟是指什么?Logistic回归的起源(下)如果您觉得本篇干货满满,请您动动手指,点赞、留言、分享三连,谢谢!-END-关注【DCM笔记】公众号,私信作者获取相关文章中的练习数据和代码:编辑于2021-11-2409:37机器学习计量经济学行为经济学​赞同1405​​78条评论​分享​喜欢​收藏​申请转载​文章被以下专栏收录DCM笔记系统介绍离散选择模型的基础理论和软件实现方法



請為這篇文章評分?