相關系數r的計算公式是ρXY=Cov(X,Y)/√[D(X)]√[D(Y)]。
公式描述:公式中Cov(X,Y)為X,Y的協方差,D(X)、D(Y)分別為X、Y的方差。
公式。
若Y=a+bX,則有:
令E(X) =μ,D(X) =σ。
則E(Y) = bμ+a,D(Y) = bσ。
E(XY) = E(aX + bX) = aμ+b(σ+μ)。
Cov(X,Y) = E(XY)?E(X)E(Y) = bσ。
缺點
需要指出的是,相關系數有壹個明顯的缺點,即它接近於1的程度與數據組數n相關,這容易給人壹種假象。因為,當n較小時,相關系數的波動較大,對有些樣本相關系數的絕對值易接近於1。
當n較大時,相關系數的絕對值容易偏小。特別是當n=2時,相關系數的絕對值總為1。因此在樣本容量n較小時,我們僅憑相關系數較大就判定變量x與y之間有密切的線性關系是不妥當的。