回上層

Enterprise Guide

模型診斷

我們將著重在討論價格為35000元(單位:美金)以下之汽車。首先我們先將資料做篩選。篩選與排序 =>變數 =>全選所有的變數拖曳至右邊 =>篩選條件 =>選擇「Invoice35000」 =>確定。完成之後,即可將所有價格小於35000元的汽車篩選出來。

2-1

 

接著,我們把反應變數(EngineSize)取log,並將產生出新變數且命名為EngineSize_log。從「查詢產生器」 =>將變數「Invoice」至「Length」拖曳至右邊à按右邊「計算機」一下 =>進階運算式 =>下一步

2-2

 

 =>函數 =>將「f(.) LOG函數」連點兩下,將自動跳至上面視窗 =>從t1裡找到EngineSize後連點兩下,將自動跳至上面視窗 =>下一步 =>欄名稱命名為「EngineSize_log」後 =>完成。

2-3

 

由於MPG_City及MPG_Highway有共線性之問題,因此我們只選擇MPG_Highway變數。

再來,針對解釋變數Weight來做轉換,處理方法同EngineSize;將新變數命名為Weight_log。完成之後,我們將在右邊欄名稱的位置看到新增的二個變數,確認沒有問題後 =>執行。

2-4

 

再一次來進行迴歸分析。分析 =>迴歸 =>線性迴歸 =>資料:EngineSize_log選至應變數;其他的變數(Invoice、Cylinders、Horsepower、MPG_Highway、Wheelbase、Length、Weight_log)選至解釋變數 =>統計值:勾選「變異數膨脹值」、「不等變異性檢定」、「Durbin-Watson統計值」 =>執行。

2-5

 

估計結果如下表:

2-6

變數:Invoice、Cylinders、Horsepower、Length、Weight_log均為顯著,但是Wheelbase及MPG_Highway並未達顯著。

 

變異數檢定結果為變異數一致,而DW檢定結果為觀測的殘差值之間為獨立。如下表:

2-7

 

我們亦可以從殘差圖來看預測的EngineSize_log與殘差之間的關係:

2-8

 

在Q-Q plot裡,其資料分佈看起來亦服從常態的假設。 

2-9

 

其他變數與殘差之間的關係,看起來分散的很均勻。

2-10

2-11

將EngineSize以來表示,所以目前的迴歸模型為:

2-12 

 

 

 

下一章節我們將討論模型選取。

 

回上層