如何進行系統聚類分析?
聚類分析用於將樣本進行分類處理,通常是以定量數據作為分類標準;用戶可自行設置聚類數量,如果不進行設置,系統會提供默認建議;通常情況下,建議用戶設置聚類數量介於3~6個之間。SPSSAU操作如下:
聚類分析時SSE是什麽意思?
在進行Kmeans聚類分析時SPSSAU默認輸出誤差平方和SSE值,該值可用於測量各點與中心點的距離情況,理論上是希望越小越好,而且如果同樣的數據,聚類類別越多則SSE值會越小(但聚類類別過多則不便於分析)。SSE指標可用於輔助判斷聚類類別個數,建議在不同聚類類別數量情況下記錄下SSE值,然後分析SSE值的減少幅度情況,如果發現比如從3個聚類到4個類別時SSE值減少幅度明顯很大,那麽此時選擇4個聚類類別較好。
聚類中心是什麽?
聚類中心是聚類類別的中心點情況,比如某類別時年齡對應的聚類中心為20,意味著該類別群體年齡基本在20歲左右。初始聚類中心基本無意義,它是聚類算法隨機選擇的聚類點,如果需要查看聚類中心情況,需要關註於最終聚類中心。實際分析時聚類中心的意義相對較小,其僅為聚類算法的計算值而已。