回上層

Enterprise Guide

共線性檢驗

根據上一節最後選定的模型,我們做一次是否有共線性的問題。在此,我們有兩種方法來判斷,(1) 變異數膨脹因子(Variance Inflation Factor,VIF) (2) 共線性診斷(Collinearity Diagnostics)。當變異數膨脹因子>10或是共線性診斷>100時,表示有共線性的問題。

做共線性的檢定可從迴歸分析的結果頁面找到「修改工作」à再次確認迴歸分析的資料是否正確=>統計值=>勾選「共線性分析」與「變異數膨脹值」。

4-1

 

4-2

由上表可知,在變異數膨脹值之下沒有任何的變數有共線性的問題;但是若用共線性診斷則會發現在條件索引的值有大於100,顯示變數有共線性的問題;在此,我們處理共線性的問題是採用拿掉變數,所以試著將Weight_log從模型中刪除,再配合用逐步迴歸選取法來看我們選定的模型。

 

4-3

 

其結果如下:

4-4

 

在逐步選取法裡,最後選定的變數為Cylinders、Length、Horsepower、MPG_Highway、Invoice。而變數在迴歸裡的估計如下:

4-5

 

當然,我們也可以用Mallows’ Cp 來看一下結果:修改工作=>在資料裡,將Weight_log從模型中刪除=>模型選擇「Mallows’ Cp」並打勾選下方的調整R平方、Akaike訊息準則(AIC)、Mallows’ Cp、與SBC=>執行=>詢問是否取代先前結果時,選擇「是」。

4-6

 

4-7

 

 

擷取前5筆資料來看,發現無論在C(p)、調整的r平方、AIC或是SBC,我們都將選擇「模型索引1」為最佳模型,所以完整的模型為:

4-8

 

我們選取「模型索引1」,其結果與逐步選取法結果一致。同時我們也解決了變異數膨脹值或是共線性診斷共線性的問題,如下表。

 

4-9

資料仍保持服從常態分配的假設。

4-10

4-11

 

 

回上層