回上層

Enterprise Guide

判別分析

對於包含一或多個屬量變數及定義觀測值群組之分類變數的一組觀測值,「判別分析」工作會開發判別準則,將各觀測值分類為其中一個群組。由此資料集導出的判別準則,可於判別函數的同一個執行期間,套用到第二個資料集。

您可以使用這個工作,對自然界中發現的觀測值進行分類。例如,您可建立 SAS 資料集,其中包含 36筆植物的種類(5類)和4個不同的測量值。您可以使用此資料,將每一筆植物分類為5個種類之一的最佳分類變數,找出判別函數。

 

資料說明:

資料是作物和4個不同的測量值,其中作物變數中包含了有5種作物,分別為clover(三葉草), corn(玉米), cotton(棉花), soybeans(大豆), and sugar beets(甜菜)

在工作的快捷選單中選擇【分析】→【多變量】→【判別分析(D)】

 

1

 

於左側的選單中選擇【資料】,將要指派的變數(A)中的【x1】、【x2】、【x3】和【x4】變數拖曳至右側工作角色(T)中的分析變數欄中;

再將要指派的變數(A)中的【Crop】變數拖曳至右側工作角色(T)中的分類變數欄中;

最後再將要指派的變數(A)中的【xvalues】變數拖曳至右側工作角色(T)中的識別標籤變數欄中。

 

2

 

在左側的選單中選擇【選項】,在判別函數頁面選項中勾選【交叉驗證分類的摘要結果(O)】和【顯示各觀測值的交叉驗證結果(V)】選項。並在事前機率中選擇【比例樣本大小】。再點選左下角的【預覽程式碼】。

 

3

 

點選插入【程式碼】。

 

4

 

在程式 PROC DISCRIM 的下方點選【連按兩下以插入程式碼】。

 

5

 

在使用者程式碼的視窗中輸入 poor=no 後,點選【確定】。

 

6

 

點選【確定】。

 

7

 

關閉工作的程式碼預覽。

 

8

 

點選【執行】。

 

9

 

結果如下表所示:

我們由下表發現,交叉驗證的錯誤率估計為0.5556,比原來的錯誤率估計0.1111來的大很多。

 

10

 

11

回上層