羅吉斯迴歸分析(Logistic regression, logit model) - 永析統計
文章推薦指數: 80 %
羅吉斯迴歸分析(Logistic regression, logit model)-統計說明與SPSS操作 · 1. 模式係數的Omnibus測試:相當於線性迴歸裡的ANOVA-F檢定,探討羅吉斯迴歸模型 ...
Skiptocontent
羅吉斯迴歸分析(Logisticregression,logitmodel)-統計說明與SPSS操作
主頁/實務討論/統計實務/相關與迴歸分析/羅吉斯迴歸分析(Logisticregression,logitmodel)-統計說明與SPSS操作
羅吉斯迴歸分析(Logisticregression,logitmodel)-統計說明與SPSS操作
羅吉斯迴歸主要用於依變數為二維變數(0,1)的時候,以下將詳細說明其原理及SPSS操作。
一、使用狀況
羅吉斯迴歸類似先前介紹過的線性迴歸分析,主要在探討依變數與自變數之間的關係。
線性迴歸中的依變數(Y)通常為連續型變數,但羅吉斯迴歸所探討的依變數(Y)主要為類別變數,特別是分成兩類的變數(例如:是或否、有或無、同意或不同意……等)。
*【小常識】
在羅吉斯迴歸分析中,自變數x可以是類別變數,也可以是連續變數。
二、前提假設
(一)羅吉斯分配中,自變數對依變數的影響是以指數的方式做變動,因此不需要常態分配的假設。
(二)令依變數Y為二元反應的變數(成功或失敗),p為其成功的機率,受自變數x所影響,則p與x之關係如下:
Y事件成功的機率:
Y事件失敗的機率:
*【小常識】
p的值介於0~1之間,p接近0時表示Y成功的機會很小,接近1時則表示成功的機會很大
(三) 勝算(Odds):,即事件成功機率與失敗機率的比值。
以下採實驗設計為例:
事件成功
事件失敗
總和
實驗組
4
(a)
16
(b)
20
(a+b)
對照組
1
(c)
19
(d)
20
(c+d)
5
(a+c)
35
(b+d)
40
(a+b+c+d)
實驗組的勝算(Experimentaleventodds)=a/b=4/16=0.25
控制組的勝算(Controleventodds)=c/d=1/19=0.053
勝算比(oddsratio)=(a/b)/(c/d)=ad/bc=4.72
(四) 羅吉斯迴歸式:對勝算值(Odds)取自然對數(ln)即得之。
係數值()→用來計算當的值增加一單位時勝算的改變量(Δodds)。
當Δodds>1,表示當Xi 增加時,事件Y 發生的勝算會提高
Δodds<1,表示當Xi 增加時,事件Y 發生的勝算會降低
*【小常識】
Δodds又稱為OR值,在SPSS中以EXP(B)表示。
三、假說檢定
羅吉斯迴歸模型的顯著性檢定(Ftest):探討羅吉斯迴歸模型中的β係數是否全部為0。
當係數不全為0時,迴歸模型才具有預測力。
虛無假說(Nullhypothesis)→
對立假說(alternativehypothesis)→
統計值(Statistics)→
四、SPSS 操作Example
【例題1】某公司欲根據過去「溫度」與「零件測試成功與否」的資料,建立以溫度預測零件測試成功機率之迴歸模式。
→本題例子為二元羅吉斯迴歸,以一個連續型的自變數(溫度)去預測y(零件測試成功與否)。
其中,y=1表示零件測試成功,y=0表示零件測試失敗。
(一)在SPSS中輸入欲分析之資料。
(二)二元羅吉斯迴歸:分析→迴歸→二元Logistic
(三)因變數:零件測試成功與否(y)
共變量:溫度(即自變數x)
(四)報表結果:
1.模式係數的Omnibus測試:相當於線性迴歸裡的ANOVA-F檢定,探討羅吉斯迴歸模型中的β係數是否全部為0。
在本例中,顯著性p值<0.001,拒絕虛無假說。
→此羅吉斯迴歸模型顯著,具有預測能力。
2. 模式摘要:呈現關於解釋力之「-2對數概似」、「Cox-SnellR平方」、
「NagelkerkeR平方」的值做為參考。
3.分類表:呈現預測值的準確度。
4.方程式中的變數:可得到羅吉斯迴歸式與Δ odds(OR值)。
(1)根據上表我們可以得出以下的羅吉斯迴歸式:
(2)Exp(B)=1.597,即Δodds=1.597>1,表示溫度每上升一度,零件測試成功機率會比零件測試失敗機率多出1.597倍。
【例題2】某醫療單位欲根據過去肺部疾病就診病患的基本資料,建立以有無「吸菸」、有無「家族病史」預測「罹患肺癌」機率之迴歸模式。
→本題例子為二元羅吉斯迴歸,以兩個類別型的自變數(吸菸、家族病史)去預測y(罹患肺癌與否)。
其中,y=1表示罹患肺癌,y=0表示沒有罹患肺癌。
(一)在SPSS中輸入欲分析之資料。
(二)二元羅吉斯迴歸:分析→迴歸→二元Logistic
(三)因變數:罹癌與否(y)
共變量:吸菸與否(即自變數x1)
有無家族病史(即自變數x2)
(四)類別→指定類別共變量:吸菸(x1)、家族病史(x2)
(五)選項:Exp(B)之信賴區間(X)
(六)報表結果:
1.模式係數的Omnibus測試:相當於線性迴歸裡的ANOVA-F檢定,探討羅吉斯迴歸模型中的β係數是否全部為0。
在本例中,顯著性p值<0.001,拒絕虛無假說。
→此羅吉斯迴歸模型顯著,具有預測能力。
2.模式摘要:呈現關於解釋力之「-2對數概似」、「Cox-SnellR平方」、
「NagelkerkeR平方」的值做為參考。
3.分類表:呈現預測值的準確度。
4.方程式中的變數:可得到羅吉斯迴歸式與Δ odds(OR值)。
根據上表可知
(1)吸菸Exp(B)=0.031,即Δodds=0.031,表示沒有吸菸的人(=0)罹患肺癌的機率是有吸菸的人(=1)罹患肺癌機率的0.031倍。
(2)家族病史Exp(B)=0.029,即Δodds=0.029,表示沒有家族病史的人(=0)罹患肺癌的機率是有家族病史的人(=1)的0.029倍。
由於上述兩個變數皆達顯著(p<.05 daipaul2021-10-05t21:02:44 qqstat lineqqstat pageloadlink>
延伸文章資訊
- 1Logit Models for Binary Data
Logit Models for Binary. Data. We now turn our attention to regression models for dichotomous dat...
- 2邏輯迴歸- 維基百科,自由的百科全書
二類評定模型(Binary Logit Model)編輯 ; categorical, percentage, Chi-square test, 邏輯迴歸 ; persontime, KM es...
- 3Logit Model - an overview | ScienceDirect Topics
Logistic regression is a well-known procedure that can be used for classification. This is a vari...
- 4Logistic classification model (logit or logistic regression)
The logistic model (or logit) is a classification model used to predict variables that can take o...
- 5羅吉斯迴歸分析(Logistic regression, logit model) - 永析統計
羅吉斯迴歸分析(Logistic regression, logit model)-統計說明與SPSS操作 · 1. 模式係數的Omnibus測試:相當於線性迴歸裡的ANOVA-F檢定,探討羅吉...