一、概要
勝算對數迴歸是一種對數機率模型,是離散選擇法模型之一,屬於多重變數分析範疇,是社會學、生物統計學、臨床、數量心理學和計量經濟學等統計實證分析的常用方法。
二、詳細介紹
(一)模型介紹
- 邏輯迴歸方法
(1) 勝算對數迴歸是一種廣義線性迴歸,因此與多重線性迴歸分析有很多相同之處。模型形式基本上相同,區別在於依變數不同,多重線性迴歸直接將wx+b作為依變數,而勝算對數迴歸則通過函數L將wx+b對應一個p,即p=L(wx+b),然後再根據p與1-p的大小決定依變數的值。如果L是logistic函數就是勝算對數迴歸,如果L是多項式函數就是多項式迴歸。
(2) 勝算迴歸的依變數可以是二分類的,也可以是多分類的,但是二分類的更為常用,也更加容易解釋。實際中最為常用的就是二分類的勝算迴歸。
2. 公式
依變數(Y)和一個或多個自變數(X)之間建立的一種迴歸方程式。
3. 指標說明
-2 對數似然值: 概似函數值自然對數的-2倍,反映模型的配適度,數值越小表示配適度越好。
Pseudo R平方:McFadden 虛擬R平方值,衡量迴歸模型對樣本觀測值的配適度,數值範圍為0-1,數值越接近1,模型的配適度越高。
AIC:AIC是權衡估計模型的複雜度和模型擬合資料優良性的標準,用於模型選擇,通常選擇AIC最小的模型。
BIC:貝氏訊息準則與AIC相似,用於模型選擇。
B:模型的迴歸係數,包括截距和斜率,顯著性水準小於0.05時有意義。
標準誤差:迴歸係數標準誤差,值越大表示迴歸係數的估計值越不可靠。
z:對自變數進行顯著性檢定,以確定變數是否被保留在模型中。
Sig:顯著性,如果0.01<sig<0.05,為差異顯著,如果sig<0.01,則為差異極顯著。
Exp(B): 優勢比
(二)研發依據
[1] Edge, M. (2021). Statistical Thinking from Scratch: A Primer for Scientists.
[2] Kotz, S.; et al., eds. (2006), Encyclopedia of Statistical Sciences, Wiley.