當前位置:編程學習大全網 - 源碼破解 - logistic回歸分析是什麽?

logistic回歸分析是什麽?

Logit回歸分析用於研究X對Y的影響,並且對X的數據類型沒有要求,X可以為定類數據(可以做虛擬變量設置),也可以為定量數據,但要求Y必須為定類數據,並且根據Y的選項數,使用相應的數據分析方法。logit回歸分析壹般可分為三類,分別是二元logit回歸、多分類logit回歸、有序logit回歸,三類logit回歸區別如下:

以二元logit回歸為例進行說明:

二元logit回歸:

基本說明

二元Logit回歸分析用於研究X對於Y的影響關系,其中X通常為定量數據(如果X為定類數據,壹般需要做虛擬(啞)變量設置)

Y為二分類定類數據,(Y的數字壹定只能為0和1)例如願意和不願意、是和否等。

2.數據處理

(1)如果X是定類數據,比如性別或學歷等。那麽就需要首先對它們做虛擬啞變量處理,使用SPSSAU“數據處理”-“生成變量”功能。操作如下圖:

(2)因變量Y只能包括數字0和1,如果因變量的原始數據不是這樣,那麽就需要數據編碼,設置成0和1,使用SPSSAU“數據處理”-“數據編碼”功能,操作如下圖:

3.SPSSAU上傳數據

(1)登錄賬號後進入SPSSAU頁面,點擊右上角“上傳數據”,將處理好的數據進行“點擊上傳文件”上傳即可。

SPSSAU分析

背景:研究影響用戶購買某品牌筆記本電腦的因素,其中0代表否,1代表是(僅供案例分析)。

(1)二元Logit回歸分析基本匯總

將價格, 品牌偏好度, 性能作為自變量,而將是否購買某品牌筆記本電腦作為因變量進行二元Logit回歸分析,從上表可以看出,總***有265個樣本參加分析,並且沒有缺失數據。

首先對模型整體有效性進行分析,從上表可知:此處模型檢驗的原定假設為:是否放入自變量(價格, 品牌偏好度, 性能)兩種情況時模型質量均壹樣;這裏p值小於0.05,因而說明拒絕原定假設,即說明本次構建模型時,放入的自變量具有有效性,本次模型構建有意義。

(3)二元Logit回歸分析結果匯總

從上表可知,將價格, 品牌偏好度, 性能***3項為自變量,而將是否購買某品牌筆記本電腦作為因變量進行二元Logit回歸分析,模型公式為:ln(p/1-p)=-9.900 + 3.663*價格-2.156*品牌偏好度 + 4.090*性能(其中p代表是否購買某品牌筆記本電腦為1 的概率,1-p代表是否購買某品牌筆記本電腦為0的概率)。最終具體分析可知:

價格的回歸系數值為3.663,並且呈現出0.05水平的顯著性(z=2.419,p=0.016<0.05),意味著價格會對是否購買某品牌筆記本電腦產生顯著的正向影響關系。以及優勢比(OR值)為38.964,意味著價格增加壹個單位時,是否購買某品牌筆記本電腦的變化(增加)幅度為38.964倍。

品牌偏好度的回歸系數值為-2.156,但是並沒有呈現出顯著性(z=-1.583,p=0.113>0.05),意味著品牌偏好度並不會對是否購買某品牌筆記本電腦產生影響關系。

性能的回歸系數值為4.090,並且呈現出0.05水平的顯著性(z=3.346,p=0.001<0.05),意味著性能會對是否購買某品牌筆記本電腦產生顯著的正向影響關系。以及優勢比(OR值)為59.750,意味著性能增加壹個單位時,是否購買某品牌筆記本電腦的變化(增加)幅度為59.750倍。

總結分析可知:價格, 性能***2項會對是否購買某品牌筆記本電腦產生顯著的正向影響關系。但是品牌偏好度並不會對是否購買某品牌筆記本電腦產生影響關系。

此外Logit回歸時會提供三個R 方值(分別是McFadden R 方、Cox & Snell R 方和Nagelkerke R 方),此3個R 方均為偽R 方值,其值越大越好,但其無法非常有效的表達模型的擬合程度,意義相對交小,而且多數情況此3個指標值均會特別小,研究人員不用過分關註於此3個指標值。壹般報告其中任意壹個R方值指標即可。

  • 上一篇:過去分詞作狀語的例句英語
  • 下一篇:禁煙標識都有哪些?
  • copyright 2024編程學習大全網