Logit究竟是个啥?——离散选择模型之三 - 知乎专栏
文章推薦指數: 80 %
前言:人们经常说“Logit模型”——这里的“Logit”究竟是什么? ... Biogeme:. Biogeme入门教程(中文版) · Biogeme安装教程 · Logit模型拟合实战案例(Biogeme) ...
首发于DCM笔记无障碍写文章登录/注册前言:人们经常说“Logit模型”——这里的“Logit”究竟是什么?小伙伴们可知道“Logit”应该理解成Log-it?且听Eric为您慢慢道来!本文为离散选择模型(DiscreteChoiceModel,DCM)系列文章的第三篇。
人们常说的“Logit模型”,这里的“Logit”到底是指什么?要回答这个问题,得先弄清楚一个概念——Odds!1.何为Odds?在英语里,Odds的意思就是指几率、可能性。
《老友记》里面有这么一个场景:大家坐在一起玩转瓶子(Spinthebottle)的游戏——每次转动瓶子,瓶子的细口所指向的那个人就和转瓶子的人Kiss一下。
当Joey和Emily连续亲了3次之后,Chandler说道——Whataretheodds?意为:真是太巧了!图1《老友记》第4季第16集在统计学里,概率(Probability)和Odds都是用来描述某件事情发生的可能性的。
概率描述的是某事件A出现的次数与所有结果出现的次数之比。
公式表示:P(A)=\frac{Number\;of\;EventA}{Total\;Number\;of\;Events}........(1)概率P是一个0到1之间的实数;P=0表示一定不会发生,而P=1则表示一定会发生。
以掷骰子为例。
掷出点数为6的概率为:P=\frac{1}{6}图2掷骰子Odds指的是事件发生的概率与事件不发生的概率之比。
公式表示为:Odds=\frac{Probability\;of\;event}{Probability\;of\;no\;event}=\frac{P}{1-P}........(2)继续上面掷骰子的例子。
出现点数6的概率P=1/6,出现其它点数的概率1-P=5/6。
根据式(2)可以得到掷出点数为6这一事件的Odds为:Odds=\frac{1/6}{5/6}=\frac{1}{5}用更通俗的解释:平均来看,掷出6点的成功的概率和失败的概率之比为1:5。
和概率论中许多其它的概念一样,Odds也是在赌博中产生的一个概念。
假设甲乙二人掷骰子对赌;若甲出1块钱赌掷到6点,乙需要投注5块钱才能保证公平。
2.Odds和概率之间的关系换一个角度来看:由式(2)可以推导出如下关系:Odds=\frac{P}{1-P}=\frac{\frac{Number\;of\;Event\;A}{Total\;Number\;of\;Events}}{\frac{Number\;of\;Other\;Events}{Total\;Number\;of\;Events}}\RightarrowOdds=\frac{Number\;of\;Event\;A}{Number\;of\;Other\;Events}也就是说,事件A的Odds等于事件A出现的次数和其它(非A)事件出现的次数之比;相比之下,事件A的概率等于事件A出现的次数与所有事件的次数之比。
在图3中,随机摸出一个球、颜色为红色的概率为3/5,其所对应的Odds为3:2。
图3随机摸球实验下表1和图4展示了概率P从0.01变化到0.99时,相应的Odds变化的情况。
注意:(1)当概率等于0.5的时候,Odds等于1(等分);(2)概率P的变化范围是[0,1],而Odds的变化范围是[0,+\infty)。
再进一步,如果对Odds取自然对数,就可以将概率P从范围[0,1]映射到(-\infty,+\infty)。
Odds的对数称之为Logit。
表1Odds和概率P之间的关系图4概率P和Odds之间的关系图5概率P和Logit之间的关系从概率P\rightarrowOdds\rightarrowLogit,这就是一个Logit变换。
实际上,所谓Logit模型可以理解成Log-it(即it的自然对数——这里的it指的就是Odds)。
图6Logit变换与概率不同,Logit的一个很重要的特性就是没有上下限——这就给建模带来极大方便。
我在DCM系列文章第二篇《线性模型vs.Logistic模型——离散选择模型之二》中提到:不能直接套用线性回归模型Y=\beta_0+\betaX,\;\;Y\in(-\infty,+\infty)........(3)对概率P进行建模——因为(3)式左边Y的取值范围是(-\infty,+\infty),而概率P的取值范围是[0,1]。
但是,由于Logit和(\beta_0+\beta_1X)都是在(-\infty,+\infty)上变化,我们可以尝试建立Logit和(\beta_0+\beta_1X)之间的对应关系,例如:log\;it(P_i)=\beta_0+\betaX........(4)如果将\beta和X看成向量形式,则:log\;it(P_i)=ln\frac{P_i}{1-P_i}=\beta_0+\beta_1x_{1,i}+\beta_2x_{2,i}+\cdot\cdot\cdot+\beta_nx_{n,i}........(5)上面(5)式正是二项Logit模型的基本形式。
更多的证明需要用到效用理论;后续文章会依次给出。
【本篇完】专栏文章列表(动态更新中...)入门篇离散选择模型(DiscreteChoiceModel)简介线性模型vs.Logistic模型Logit究竟是个啥?probit模型中的probit究竟是指什么?正确打开/解读Logit模型系数的方式二项Logit模型拟合实战案例(SAS)二项Logit模型拟合实战案例(Python)Odds和OddsRatio的区别二项Logit/Probit理论篇:效用最大化准则:离散选择模型的核心(Probit模型上篇)效用最大化准则:离散选择模型的核心(Probit模型下篇)效用最大化准则:离散选择模型的核心(二项Logit模型)从Gumbel分布到Logistic分布多项Logit(MNL)理论与实战::Multi-NominalLogit中的“Nominal”究竟是什么含义?效用最大化准则:多项Logit模型(MultinomialLogit,MNL)多项Logit模型(MNL)拟合实战案例(SAS篇)MNL的IIA特性与“红公交/蓝公交悖论”(上篇)MNL的IIA特性与“红公交/蓝公交悖论”(下篇)如何将决策者的属性和方案属性同时放到MNL模型中?Logit模型中的个人属性、方案属性数据处理案例为什么条件Logit模型中没有常数项,以及,你的女神会不会不喜欢你?Logit模型中的ASC(Alternative-SpecificConstant)是指什么?嵌套Logit(NL):NestedLogit模型NestedLogit模型拟合实战案例(SAS篇)Biogeme:Biogeme入门教程(中文版)Biogeme安装教程Logit模型拟合实战案例(Biogeme)其它:最大似然估计(上)最大似然估计(下)模型中存在共线性问题,该怎么破?多因素回归分析模型中的变量筛选方法Logistic回归的起源(上)Logistic回归的起源(中)probit模型中的probit究竟是指什么?Logistic回归的起源(下)如果您觉得本篇干货满满,请您动动手指,点赞、留言、分享三连,谢谢!-END-关注【DCM笔记】公众号,私信作者获取相关文章中的练习数据和代码:编辑于2021-11-2409:37机器学习计量经济学行为经济学赞同140578条评论分享喜欢收藏申请转载文章被以下专栏收录DCM笔记系统介绍离散选择模型的基础理论和软件实现方法
延伸文章資訊
- 1羅吉斯迴歸分析(Logistic regression, logit model) - 永析統計
- 2Logit模型- MBA智库百科
基於滯後巨集觀經濟和金融數據的Logit模型由Kumar,Moorthy和Perraudin在2003年提出, ... 全球专业中文经管百科,由121,994位网友共同编写而成,共计432,59...
- 3Logit模型_百度百科
- 4Logit - 羅吉特機率 - 國家教育研究院雙語詞彙
出處/學術領域, 英文詞彙, 中文詞彙. 學術名詞 統計學名詞, logit, 對數勝算. 學術名詞 經濟學, Logit, 羅吉特機率. 以羅吉特機率 進行詞彙精確檢索結果 ...
- 5第三章Logit 模式建構過程與應用說明
巢式多項Logit 模式(Nested Multinomial Logit Model,NMNL)是最. 常被使用的多項Logit 模式的變形,此模型是由McFadden 的一般化極值模. 式(...