變量的相關關系如下:
相關關系指多個變量間的變化有關聯,其按某種規律在壹定範圍內變化的關系。有相關性、哪怕是很強的相關性也不能代表因果關系,我們只能依據相關的情況推測。
相關關系在生活中最廣泛,幾乎涵蓋了生活中的方方面面,很多人也會把相關關系當作因果關系。
相關關系的分類
1、按方向
正相關:兩個變量的變化趨勢相同,壹個變量隨別的變量的增減而增減;負相關:兩個變量的變化趨勢相反,壹個變量隨別的變量的增減而減增。
2、按程度
完全相關:壹個變量的變化由另壹個變量的變化確定,即函數關系;不完全相關:若兩個變量的變化互相獨立,則這兩個變量不相關;不完全相關指兩個變量間的關系介於不相關和完全相關之間。
3、按變量的數量
單相關:相關關系只反映壹個自變量和壹個因變量;復相關:反映兩個及兩個以上的自變量同壹個因變量的相關關系;偏相關:研究因變量與兩個或多個自變量相關時,如果把其余的自變量看作常量,只研究因變量與其中壹個自變量之間的相關關系。
相關性分析步驟
1、計算相關系數
首先處理好數據集,讓數據格式規範。如果用excel的話,就選中要分析相關性的變量,用correl()或pearson()函數,這兩個函數只是計算公式不同,結果是壹樣的;用Excel中的“數據”-“數據分析”-“相關系數”這個步驟也可以。
如果用的是python,就先導入數據集,然後用.corr()函數計算,它可以看到導入數據的任意兩個變量間的相關性。
如果兩個變量間的變化壹致,則相關系數r>0,變化方向相反,則r<0;變量間無線性關系則r=0,但要註意,無線性關系不代表不存在關系,其他情況就可以做擬合、回歸的計算。
2、數據可視化:散點圖
壹般可以通過散點圖了解變量間的大概關系。如果變量之間不存在相互關系,那麽在散點圖上就會表現為隨機分布的離散的點;如果存在某種相關性,那麽大部分的數據點就會相對密集並以某種趨勢呈現。
壹個簡單的相關性分析的步驟就像上面那樣,如果大家有需求,回頭可以做壹個實例或者做更多的相關分析。