Matching--配對@ KEEP WALKING - 隨意窩
文章推薦指數: 80 %
對了,配對如果說是分層後再進行頻率的配對,比如說分年齡層後病例與對照在每一層中的比例是力求一定的,這也可以稱為category matching分組配對。
個別配對(individual ...
KEEPWALKINGWeaknessofattitudebecomesweaknessofcharacter--AlbertEinstein日誌相簿影音好友名片
201304040823Matching--配對?Epidemiology[本文轉自2012年公共衛生年會FB]
好久以前,電視上流行著找對象的節目;從早期的我愛紅娘,紅娘愛我,為你搭起友誼的橋樑;到跑跑跑向前跑的來電50,都是配對的節目。
現在,不流行了。
因為找不到對照,對不起喔,重了流病之毒;不是找不到對照拉,是找不到對象的,都去找外配去了。
使得外配成為台灣學術界正熱門的議題,社會學領域的、教育學領域的、性別學領域的、連公衛的人都要投入插一腳,怎麼說外配是弱勢呢,中年大叔的我才是弱勢吧,都沒人要來關心我們這群大叔!
對了,什麼是配對matching,配對就是配成一對啊,但不是配成一隊,這樣會無福消受拉(沒辦法,大叔想的就是多多欲善)!配對,又稱為匹配,在流行病學的病例對照研究中即是想要力求對照在某些因素或特徵上與病例可以是一致的,其目的就是要讓病例與對照這兩組在進行比較時不會被某些因素影響了,這種影響我們就叫做干擾confounding。
而配對,又可分為頻率配對或個別配對。
頻率配對(frequencymatching)這是力求要配對的因素在對照組與在病例组中的比例(頻率)要一致,也因此叫做頻率配對。
比如大家知道嗎,風濕性關節炎rheumatoidarthritis(RA)在一般民眾中可是女性遠高於男性的,比例多是8:2;所以要進行RA的病例對照研究時,在對照組與在病例组中的比例應該力求8:2。
否則,你的RA病例組收到的性別比會趨近8:2,而你的對照一旦沒有注意到性別比的問題,比如你在社區收集對照,結果性別比是1:1,此時你在分析與RA有關的危險因子之貢獻程度時,這些貢獻程度就會被性別所解釋掉了。
但是,性別可能並不是你要研究的重點啊,這就是性別造成干擾了!所以,在對照組中的干擾因子的比例也要力求與病例組一致,這就是頻率配對。
對了,配對如果說是分層後再進行頻率的配對,比如說分年齡層後病例與對照在每一層中的比例是力求一定的,這也可以稱為categorymatching分組配對。
個別配對(individualmatching)則是病例和對照以個體為單位來進行配對,所以叫做個別配對。
這種配對可以利用定性指標在一定範圍內來配對,比如說,我要研究兒童鉛暴露與IQ的關係,但是兒童的IQ也會受到父母IQ的影響。
真的!我就覺得我女兒不是很聰明,因為我問他誰最醜,她都說是我;因此,我嚴重覺得我女兒不是很聰明。
好吧,言歸正傳!在這個研究裡,我們想要以父母的教育程度來配對,那病例組小孩的父母其教育程度是大學的就跟對照組小孩的父母有讀大學的配對,這就是依定量指標來配對。
當然,定量指標中最常被拿來配對的就是性別了。
但是,你如果要說,這樣還是不準啊,讀大學的父母不一定有大學的程度啊;看現在學生的樣子,說的也對!這嘛,唉!好吧!講深一點好了,這代表會有餘差的產生;簡言之,就是配對配得不乾淨,怎麼辦?好,你可以再進一步地進行模式調整好了。
討厭,這就是有些濫竽充數的傢伙在搗蛋!
有些定量指標如果是干擾因子,例如年齡,也常是我們想要配對的因子。
如果可以,當然最好以相同年齡的病例與對照來配對,這樣他們的生物學特性比較會是接近的。
但是,常常很難獲得足夠的研究對象讓我們來產生相同年齡之病例與對照的配對組合;所以,我們會放寬標準,認為相近的年齡也具有相似的生物學特性,這時我們就不會強求一定要以相同年齡的研究對象來配對,我們可以選擇臨近年齡範圍的研究對象來進行配對,這就叫做calipermatching,有人叫做卡鉗配對,或叫做近值配對。
至於,正負幾歲以內可以被運用來配對呢?大哉問?其實很多人就以正負三、正負五啊,隨便他做。
其實是要看疾病的致病機轉來決定,以一般慢性病而言,正負五歲都還可以接受;但是,要知道正負五歲已經很寬鬆了,因為正負五歲已經涵蓋了十歲的範圍了。
還有,要記得喔!你的研究如果是頻率配對的病例對照研究,一旦進入模式分析時,這時要運用非條件式的邏輯斯迴歸(non-conditionallogisticalregression);如果是個別配對的病例對照研究,一旦進入模式分析時,就要運用條件式的邏輯斯迴歸(conditionallogisticalregression)。
有機會講到模式時,再補充。
在去年10月29日,我也寫過一個配對的方法叫做傾向分數配對(PropensityScoreMatching),幫大家復習一下好了。
Propensityscore是一個0~1的機率,代表一個研究對象在其既有的基本特性(或干擾因子)下,得到治療或暴露的機會。
計算propensityscore的方法,其實就來自一個logisticregressionmodel:將得到治療或暴露與否當作是應變數y,把基本特性的各個因子當作是自變數x。
propensityscore就類似一個隨機分配的狀況,在隨機試驗中,每個研究對象接受到治療的propensityscore應該是0.5。
在非隨機的觀察性研究,propensityscore就會因其基本特性而異,機會介於0~1之間。
計算出propensityscore,就可以依據propensityscore來配對了,這樣做的優點在於不會因為配對因子過多而找不到配對對象。
Propensityscore可以減少非隨機觀察性研究的偏差(bias),也可以減除在統計方法中必須符合許多假設之要求。
而樣本數少而所分析的變項也很多,時常我們會被要求進行multipletesting,以避免type1error,而propensityscore被認為在處理這種的狀況,是還算不錯的解決方法。
我們繼續談談配對的一些問題。
配對因子必須選擇那些明確能引起干擾效應的因子,像是年齡、性别、教育程度、社會經濟地位狀態都是常見的干擾因子,常被用來配對。
至於何時用頻率配對或個別配對,這要根據研究目的、所需樣本數目、配對因子的特性、甚至研究進行時的實際情形來綜合考慮。
提出幾點供大家參考:研究罕見疾病,因為病例較少,較多使用個別配對;探索性的病因學研究,多使用頻率配對;如果考慮到特定干擾因素則可用個別配對。
我要強調用頻率配對或個別配對,沒有絕對的對與錯,要看你的研究之需求。
配對的比例
在個別配對時,讓我們以M代表對照的個數,則研究效率=M/(M+1)。
一般來說,配對比例M越大,統計的效率越高;但是要知道,配對比例與效率的提高是不成比例的。
讓我們看看下表:
對照與病例數目比理論上可獲得的訊息淨增加的訊息
1:11/(1+1)=50%50%–0%=50%
2:12/(2+1)=67%67%-50%=17%
3:13/(3+1)=75%75%–67%=8%
4:14/(4+1)=80%80%–75%=5%
5:15/(5+1)=83%83%–80%=3%
所以啊,在對照與病例比4:1時,訊息是增加不太上去的,也就是說你在做白工!別不相信,我就看過做白工的學生與老師,並且….多的是。
讀讀粉絲團的文章,絕對對你有幫助。
重複要強調的是,要知道為何要配對?當然是要控制住干擾因子的效應。
但是,不要忘記配對也是要提供研究的效率。
那你說,把全部變項都全部拿來配對好了,性別、年齡、收入、種族、教育、….反正你想得到的都配對。
慢點,別衝動嘛!這可是會產生過度配對(overmatching)的問題。
過度配對也就是把不必要的項目列入配對,企圖要使病例與對照的數量或屬性一致;但是,這可是會丟掉重要的訊息,增加研究的難解程度。
有增加研究的效率,反而降低了研究效率,這叫做雞婆!舉個例子好了,比如你要研究肺癌與某基因的關係,你也進行了配對,把年齡、性別、收入、教育等等都配對了;突然間你想到,抽菸這個因子太麻煩了,也把它配一配好了。
結果你分析時,顯著結果可能就不見了(我是說可能拉,我不是說絕對喔),原因可能是你要分析的基因可能與香菸代謝或解毒等等有關。
在有兩種情況下,不應該使用配對:
1.在研究因子與疾病發生的因果關係之中,此因子可能是中介變項。
例如:抽菸導致血脂濃度增加,進而導致心血管疾病;這樣的話,血脂可能就是中介因子,不應被配對掉。
2.與所欲探討的暴露因素有關而與疾病無關的因素,這也不應該被配對掉。
比如說在天主教國家是不允許使用避孕藥的,當然乳癌的發生也與天主教無關;但是當你探討避孕藥使用與乳癌的關係時,將宗教信仰進行配對,這時你將會更突顯出乳癌病患傾向於服用避孕藥。
讓我講更清楚一點,將天主教病例與天主教的對照配對,也將其他宗教的病例與其他宗教的對照配對,天主教的研究對象多是未使用避孕藥(因為不可避孕,改天我再送上一篇文章談談天主教),所以未使用避孕藥的病例與未使用避孕藥的對照會因為天主教這項配對的關係被配對掉了。
剩下的,其他宗教的配對可能都還存在病例使用避孕藥但對照未使用避孕藥的情形。
但是,因為無使用避孕的病例與對照組別因為天主教這個變項被配對而抵消掉了;所以在分析時,使用避孕藥的病例而無使用避孕藥的對照組之比例(注意喔我是說比例,分子不變,便分母變少了)卻更增加出來了,所以更看出避孕藥使用與乳癌的關係。
所以防止過度配對的口訣就是:不能配對绝不配對,不必要配對也不配對。
配對的因素不是越多越好,反而應該在保證具有可比性的情況下,應愈少愈好。
配對愈多,我們整體研究損失的訊息也就愈多;因為,被選作為配對的因子,就無法被使用來分析它和疾病以及其他因素的關係了。
還有,如果你所配對的因素是與暴露有關連,有時你不僅沒有控制住干擾,你還可能引狼入室,引入新的干擾作用。
不過,你可以將配對因子進行分層分析,來控制配對因子所導致的干擾影响。
在配對的病例對照法中,根據可能的干擾因子進行配對後,即可得到:
對照
暴露沒暴露
病例
暴露ab
沒暴露cd單位是pairs對
一致的對pairs
1.病例與對照都具有暴露的對,有a對
2.病例與對照都不具有暴露的對,有d對
不一致的對pairs
3.病例有暴露,但對照沒有暴露的對,有b對
4.病例沒有暴露,但對照有暴露的對,有c對
在我們要計算暴露對於疾病產生之危險性時,因為配對了,此時的測量單位是對pairs,而不是未配對的病例對照研究法的個人喔!好!病例與對照都具有暴露,那他們有無產生疾病就與他們的暴露沒關係了,因為大家都有暴露嘛!同樣地,病例與對照都不具有暴露的對,他們有無產生疾病也與他們沒有暴露無關了。
所以,我們就不要理這兩種狀況了!我們要關心的是不一致的對pairs,也就是病例有暴露但對照沒有暴露的對,有b對;以及病例沒有暴露但對照有暴露的對,有c對。
好,簡單地問一個問題,從研究的角度你比較關心的是b,還是C呢?跟我在念一遍喔,感覺一下:b是病例有暴露但對照沒有暴露的對;C是病例沒有暴露但對照有暴露的對。
感覺到了嗎?b如果很多,表示比較會發病嘛!因此,此時的配對危險性ORm(配對勝算比)就是(病例暴露且對照無暴的對數)/(病例無暴露且對照有暴露的對數)=b/c。
舉個例子(Ref:GoldE,etal.,Riskfactorforbraintumorsinchildren.AmJEpidemiol109:309-319,1979):早年許多研究建議,小孩具有較大的出生體重可能會有增加的癌症發生;這篇研究就來探討出生體重與腦癌的關係,數據如下:
對照
8+lb<8lb
病例
8+lb818
<8lb738單位是pairs對
這時我們來算一下ORm=(病例是8+lb且對照<8lb)的對數/(病例是<8lb且對照8+lb)的對數=18/7=2.57
可別說,2.57>1.0所以就有危險性。
這是要打屁股的,記得要檢定喔。
但是怎樣檢定呢?你想想配對的動作,其實就是在作分層;所以檢定就是用分層的卡方檢定,那什麼是分層的卡方檢定呢?我們星期三所寫的從連鎖不平衡LinkageDisequilibrium到傳遞連鎖不平衡Transmissiondisequilibriumtest(TDT)一文中我們不是有提到了McNemer'schi-squaretest。
X^2=[(|b-c|-1)^2]/(b+c)=(18-7-1)^2/(18+7)=100/25=4>3.84。
不要忘記,當alpha=0.05,自由度等於1時,卡方值是3.84喔!其實卡方分佈就是t分佈平方。
所以,你要記得一個數,就是當alpha=0.05,t=1.96!好,我告訴你一個魔術數字,(1.96)的平方就是3.84喔!為何我要你記得這些數字,因為你不要以為考試一定會給你數字或圖表。
好,4>3.84,所以p<0.05,拒絕reject虛無假設Ho:OR=1(暴露與疾病無關)。
所以,小孩具有較大的出生體重可能會增加腦癌的發生。
配對很重要,公衛考必考。
最後,我整理一下好了:
配對的優點:可提高研究效率,增加危險性估計的準確性;控制潛在干擾因子的效應。
配對的缺點:增加對照選擇的難度,不能分析配對因子和疾病以及其他因素的關係;把不必要的項目進行配對時,不但造成訊息流失,资源浪費,還可能導致過度配對。
好了,謝謝各位粉絲的支持,別僅叫我加油!大家也要加油喔,希望大家喜歡這裡,再度謝謝。
小弟涕零,銜草以對!
愛上雨天/Xuite日誌/回應(1)/引用(0)沒有上一則|日誌首頁|沒有下一則回應
加我為好友日誌相簿影音
我的相簿
rainingsky's新文章卻步不如相忘于江湖現在,你在哪裡?--品冠寂寞星球的玫瑰--鄧紫棋小幸運--田馥甄謊言2015.06.06--對話遇見--孫燕姿時程Someonelikeyou--Adele
全部展開|全部收合
關鍵字
rainingsky's新回應沒有新回應!
新資料夾
延伸文章資訊
- 1matching - 配對分組 - 國家教育研究院雙語詞彙
出處/學術領域, 英文詞彙, 中文詞彙. 學術名詞 海事, matching, 配合;相配. 學術名詞 通訊工程, matching, 匹配,配合. 學術名詞 紡織科技, matching, 配...
- 2match - Yahoo奇摩字典搜尋結果
match · 查看更多. IPA[mætʃ]. 美式. 英式. n. 比賽;對手. vt. 使相配;和…相配; 和…匹配. vi. 相配; 匹配. 牛津中文字典 · match ... mat...
- 3match中文(繁體)翻譯:劍橋詞典
match翻譯:比賽, 比賽,競賽, 棍, (一根)火柴, 同等, 旗鼓相當的人(或物);敵手, ... 在第一個練習中,你必須把首都和它們所屬的國家配對。
- 4Match 配對單身線上交友約會相親17+ - App Store
此App 只能透過iPhone 及Apple Watch 的App Store 取得。 Match 配對單身線上交友約會相親17+.
- 5Matching - 演算法筆記
maximum matching 一張圖中,配對數最多的匹配。也是maximal matching。 perfect matching 一張圖中,所有點都送作堆的匹配。也是maximum mat...