* * * * * *面板數據計量經濟分析及軟件實現* * * * * * * *
註:以下do文件有相當壹部分來自中山大學連的STATA教程。感謝他的貢獻。我做了壹些修改和篩選。
* -面板數據模型
* 1.靜態面板模型:FE和RE
* 2.模型選擇:FE對POLS,RE對POLS,FE對RE (pols混合最小二乘估計)。
* 3.異方差、序列相關性和截面相關性檢驗
* 4.動態面板模型(DID-GMM,SYS-GMM)
* 5.面板隨機前沿模型
* 6.面板協整分析(FMOLS,DOLS)
* * *說明:1-5由STATA軟件實現,6由GAUSS軟件實現。
*生產效率分析(尤其是全要素生產率):數據包絡分析(DEA)和隨機前沿分析(SFA)
***
描述:DEA用DEAP2.1軟件實現,SFA用Frontier4.1實現,尤其是後者,重點比較C-D和Translog生產函數,壹步法和兩步法的區別。常用於區域經濟差異,FDI溢出效應(spillection
效果)、產業效率等。
*空間計量經濟分析:SLM模型和SEM模型
*說明:STATA與Matlab結合使用。常用於空間溢出效應(R & amp;d)、財政分權、地方政府公共行為等。
* -
* -常用的數據處理和繪圖。
* -
*指定面板格式
Xtset id year (id是部分名稱,year是時間名稱)。
Xtdes /*數據特征*/
Xtsum logy h /*數據的統計特征*/
sumlogyh/*數據的統計特征*/
*添加標簽或更改變量名。
標簽var h“人力資本”
重命名h hum
*排序
排序id year /*出現在STATA面板數據格式中*/
排序年份id /*以DEA格式出現*/
*刪除個別年份或省份。
如果年份& lt1992
Drop if id==2 /*註意= = */
*如何獲取連續的年份或id號(以上操作完成後,年份或id不連續,需要使用egen命令形成面板格式)。
egen year _ new =組(年)
xtset id year_new
* *保留變量或保留觀察值。
保留庫存/*刪除變量*/
* *或者
如果年份==2000,則保留
* *排序
排序id year /*以STATA面板數據格式顯示。
排序年份id /*以DEA格式出現。
* *長數據和寬數據之間的轉換
* Long > & gt& gt寬數據
重塑寬logy,i(id) j(year)
*寬度> >& gt長數據
重塑邏輯,i(id) j(年份)
* *附加數據(面板數據和時間序列)
xtset id年份
*或者
xtdes
Tsappend,add(5)/表示為面板數據在每個省再添加5年/
tsset
*或者
tsdes
。tsappend,add(8)/表示加8年,用於時間序列/
*方差分解,比如三個變量Y,X,Z是面板格式的數據,並且滿足Y=X+Z,求方差var(Y),協方差Cov(X,Y)和Cov(Z,Y)。
按年份:corr Y X Z,cov
* *生產虛擬變量
*生成年份虛擬變量
制表年份,世代(年)
*生成省份的虛擬變量
標簽id,gen(dum)
* *生成滯後項和差異項。
xtset id年份
Gen ylag=l.y /*產生壹階滯後項),也可以產生二階滯後項*/
gen ylag2=L2.y
Gen dy=D.y /*生成差分項*/
*了解2000年以前各省公開inv的平均增長率。
如果年份& lt2000年,由(id)
變量排序,變量太多的時候,按照規律排列。可用命令
奧德
或者
訂購外國直接投資開放機構
* -
*二。靜態面板模型
* -
* -導言。
*面板數據的結構(具有橫截面數據和時間序列數據的特征)
使用product.dta,清除
瀏覽
xtset id年份
xtdes
* -
* -固定效果模型。
* -
*本質上,N-1個虛擬變量被添加到傳統的線性回歸模型中。
*使每個部分都有自己的截距項,
*不同的截距項反映了不隨時間變化的個體特征。
*
*例如:lny = a _ I+b 1 * lnk+B2 * lnl+e _ it。
*考慮中國29個省份的C-D生產函數。
* * * * * * -畫畫。
*散點圖+線性擬合直線
雙向(散射邏輯h)(濾波邏輯h)
*散點圖+二次擬合曲線
雙向(散點圖h)(擬合圖h)
*散點圖+線性擬合線+置信區間
雙向(散射邏輯h)(過濾邏輯h)(過濾邏輯h)
*根據不同個體繪制散點圖和擬合線,從而對fe vs re做出初步判斷*
雙向(如果id & lt4)(l如果id & lt4) (lfit邏輯h if
id==1)(如果id==2,則為l邏輯h)(如果id==3,則為l邏輯h)
*根據不同個體畫散點圖,好美!!!*
如果id==1,則繪制雙向散點圖;如果id==2,則繪制散點圖;m symbol(Sh)
||散點圖h if id==3,msymbol(T) ||散點圖h if id==4,msymbol(d) ||,
圖例(位置(11)環(0)標(1“北京”)標(2“天津”)標(3“河北”)標(4)
“山西”))
* *散布各省的ly和H的圖表,並合並所有的圖表。
雙向散布邏輯h,by(id) ylabel(,格式(%3.0f))
xlabel(,格式(%3.0f))
*每個人的時間趨勢圖*
xtline h if id & lt11,疊加圖例(開)
*壹個例子:中國29個省份的C-D生產函數估計。
標簽id,gen(dum)
目錄
*回歸分析
reg logy logk logl dum*,
估計商店m_ols
xtreg logy logk logl,fe
估計商店m_fe
est表m_ols m_fe,b(% 6.3f)star(0.1 0.05 0.01)
*瓦爾德測試
測試日誌=日誌=0
測試日誌=日誌
* stata的估計方法分析
*目的:如果段數很大,使用啞變量的計算量太大。
*因此,我們應該尋求合理的方法來擺脫個體效應。
*因為,我們關心的是x的系數,而不是每個截面的截距項。
*處理方法:
*
* y_it = u_i + x_it*b + e_it (1)
* ym_i = u_i+xm_i*b+em_i (2)組內平均值。
* ym = um+xm*b+em (3)樣本平均值
* (1)-(2),我們可以得到:
*(y _ it-ym _ I)=(x _ it-XM _ I)* b+(e _ it-em _ I)(4)/*在估計量內*/ *
(4)+(3),我們可以得到:
*(y _ it-ym _ I+ym)= um+(x _ it-XM _ I+XM)* b+(e _ it-em _ I+em)
*可以重新表述為:
* Y_it = a_0 + X_it*b + E_it
*對這個模型進行OLS估計,可以得到b的無偏估計量
**stata後臺操作,揭開fe估算的神秘面紗!!!
Egen y _ mean w = mean (log),by (id)/*個人的內部平均值*/
Egen y _ mean =平均值(對數)/*樣本平均值*/
egen k_meanw = mean(logk),by(id)
egen k_mean =平均值(logk)
egen l_meanw = mean(logl),by(id)
egen l_mean =平均值(logl)
gen dyw = logy - y_meanw
gen dkw = logk - k_meanw
gen dlw=logl-l_meanw
reg dyw dkw dlw,nocons
估計商店m_stata
gen dy = logy - y_meanw + y_mean
gen dk = logk - k_meanw +k_mean
gen dl=logl-l_meanw+l_mean
註冊dy dk dl
估計商店m_stata
est表m_*,b(% 6.3f)star(0.1 0.05 0.01)
*解釋xtreg、fe和Fe的估計結果。
xtreg logy h inv gov open,fe
* - R^2
* y _ it = a _ 0+x _ it * b _ o+e _ it(1)池化OLS
* y_it = u_i + x_it*b_w + e_it (2)在估計量內
* ym_i = a_0 + xm_i*b_b + em_i (3)間估計量
*
*-& gt;R-sq:對應於模型(2)內的R2是真實的R2。
*-& gt;corr{xm_i*b_w,ym_i}^2之間
*-& gt;corr{x_it*b_w,y_it}^2整體
*
* * - F(4,373) = 855.93檢驗除常數項外的其他解釋變量的聯合顯著性。
*
*
* - corr(u_i,Xb) = -0.2347
*
*-σ_ u,σ_ e,ρ
*ρ= sigma_u^2/(sigma_u^2+sigma_e^2)
迪斯·e(sigma_u)^2/(e(sigma_u)^2+e(sigma_e)^2)
*
*個體效應顯著嗎?
* F(28,373)= 338.86 H0:a 1 = a2 = a3 = a4 = a29
* Prob & gtF = 0.0000表示固定效果非常顯著。
*-如何得到調整後的R2,即adj-R2?
電子退貨清單
reg logy h inv gov open dum*
*-擬合值和殘差
* y_it = u_i + x_it*b + e_it
*預測newvar,[選項]
/*
xb xb,擬合值;默認
stdp計算擬合值的標準誤差
ue u_i + e_it,組合殘差
xbu xb + u_i,包含效應的預測
u u_i,固定或隨機誤差分量
e e_it,總誤差分量*/
xtreg logy logk logl,fe
預測y hat
預測a,u
預測結果,e
預測收入,ue
gen ares = a + res
在1/10中列出ares cres
* -
* -隨機效應模型。
* -
* y_it = x_it*b + (a_i + u_it)
* = x_it*b + v_it
*基本思想:將隨機幹擾項分為兩種。
*壹個是不隨時間變化的,即個體效應A _ i。
*另壹種是時變的,即通常意義上的幹擾項u_it。
*估算方法:FGLS
* Var(v_it) = sigma_a^2 + sigma_u^2
* Cov(v_it,v_is) = sigma_a^2
* Cov(v_it,v_js) = 0
*在估計量內、估計量間使用混合OLS。
*可以估計sigma_a^2和sigma_u^2,然後可以采用GLS或FGLS。
* Re估計量是Fe估計量和Be估計量的加權平均值。
* yr_it = y_it - theta*ym_i
* xr_it = x_it - theta*xm_i
* theta = 1-sigma _ u/sqrt[(t*sigma_a^2+sigma_u^2)]
*解釋xtreg,re的估計結果
使用product.dta,清除
xtreg logy logk logl,re
* - R2
*-& gt;R-sq:在corr{(x_it-xm_i)*b_r內,y_it-ym_i}^2
*-& gt;corr{xm_i*b_r,ym_i}^2之間
*-& gt;corr{x_it*b_r,y_it}^2整體
*以上R2都不是真正意義上的R2,因為Re模型用的是GLS估計。
*
*ρ= sigma_u^2/(sigma_u^2+sigma_e^2)
迪斯·e(sigma_u)^2/(e(sigma_u)^2+e(sigma_e)^2)
*
* corr(u_i,X) = 0(假設)
*這是隨機效應模型最重要的假設之壹,也限制了該模型的應用。
*但是,使用固定效應模型,我們可以粗略估計corr(u_i,X)。
xtreg市場投資股票
*
* Wald chi 2(2)= 10962.50 Prob & gt;chi2 = 0.0000
*-時效、型號選擇和常見問題
* -目錄。
* 7.2.1時間效應(雙向固定(隨機)效應模型)
* 7.2.2模型篩選
* 7.2.3關於面板數據的常見問題
* 7.2.4面板數據轉換
* -
* -時間效應。
* -
*單向固定效應模型
* y_it = u_i + x_it*b + e_it
*雙向固定效應模型
* y it = u I+f t+x it * b+e it
快速制表年份,代(年)
掉落yr1
logy logk logl yr *,fe
*隨機效應模型中的時間效應
logy logk logl yr *,fe
* -
* -型號選擇。
* -
*固定效應模型還是混合OLS?
XT reg logk logl yr *、fe /*Wald測試*/
快速標簽id,gen(dum) /*LR測試*/
reg logy logk logl /*POLS*/
估計商店m_ols
logy logk logl dum *,nocons
估計商店m_fe
lrtest m_ols m_fe
est表m_*,b(% 6.3f)star(0.1 0.05 0.01)
* RE vs集合OLS?
* H0: Var(u) = 0
*方法1: B-P測試
xtreg logy logk logl,re
xttest0
* FE vs RE?
* y_it = u_i + x_it*b + e_it
* -豪斯曼試驗-
*基本思想:如果Corr(u_i,x_it) = 0,Fe和Re是壹致的,但Re更有效。
* If Corr(u_i,x_it)!= 0,Fe仍然有效,但Re有偏差。
*基本步驟
* * *案例1:華斯曼是正數。
xtreg logy logk logl,fe
估計商店m_fe
xtreg logy logk logl,re
估計商店m_re
豪斯曼模型
* * *情景2:
中國政府開放
預計商店fe
快速打開,回復
估計存儲re
豪斯曼·費雷
*豪斯曼測試值為負?
*通常是因為RE模型的基本假設Corr(x,u_i)=0不能滿足。
*兩個模型的方差-協方差矩陣在測試過程中是Fe模型。
西格馬萊斯·豪斯曼·費雷
*兩個模型的方差-協方差矩陣采用Re模型。
西格馬莫爾·豪斯曼·費雷
* = =為什麽有些變量會被丟棄?
使用nlswork.dta,清除
tsset代碼年份
Xtregln _ wagehours任期TTL _ exp,Fe/*正常執行*/
*生成種族虛擬變量
tab race,gen(dum_race)
xtreg ln _ wage hours tension TTL _ exp dum _ race 2 dum _ race 3,fe
dum _ race2和dum_race3為什麽掉線?
*固定效果模型的設置:y_it = u_i+x_it*b+e_it (1)
*因為個體效應u_i不隨時間變化,
*所以如果x_it包含任何不隨時間變化的變量,
*會和u_i形成多個* * *線性,Stata會自動刪除。
* * * * * *異方差、序列相關性和截面相關性問題
* -簡介。
* y_it = x_it*b + u_i + e_it
*
*因為面板數據考慮了橫截面數據和時間序列的特征,
*所以異方差和序列相關必然存在於面板數據中;
*同時,由於面板數據中各板塊(公司、個人、國家、地區)之間可能存在內在聯系,*因此,板塊的相關性也是需要考慮的問題。
*
*之前的分析基於三個假設:
* (1) var [e _ it] = sigma 2同方差假設。
*(2)corr[e _ it,e _ it-s] = 0的假設是序列無關的。
* (3) Corr[e_it,e_jt] = 0截面無關假設。
*
*當這三個假設不能滿足時,分別會出現異方差、序列相關性和截面相關性;*壹方面,我們應該使用各種方法來檢驗這些假設是否已經得到滿足;
*另壹方面,在這些假設無法滿足的情況下,也要尋求合理的估算方法。
* -假設檢驗。
* = =組間異方差檢驗(橫截面數據的特征)
* Var(e_i) = sigma_i^2
*有限元模型
xtreg logy logk logl,fe
xttest3
* Re模型
* Re本身已經在很大程度上考慮了異方差,主要體現在sigma_u^2.
* = =序列相關性檢驗
*有限元模型
* xtserial Wooldridge(2002),如果沒有序列相關,壹階差分後的殘差相關系數應為-0.5。
XT系列邏輯日誌日誌
XT串行邏輯logk logl,輸出
* Re模型
xtreg logy logk logl,re
Xttest1 /*提供多個統計測試量*/
* = =截面相關性檢驗
* xttest2命令H0:所有截面殘差的相關系數相等。
xtreg logy logk logl,fe
xttest2
* T >是必需的,因為SUE估計是在檢驗期間執行的。普通
xtreg logy logk logl if id & lt6、鐵
xttest2
* xtcsd命令(提供了三種檢查方法)
xtreg logy logk logl,fe
可持續發展委員會,佩薩蘭/*佩薩蘭(2004年)*/
xtcsd,弗裏德曼/*弗裏德曼(1937)*/
xtreg logy logk logl,re
佩薩蘭xtcsd
* -估算方法。
* = =異方差穩健估計
xtreg logy h inv gov open,fe robust
預計商店fe_rb
xtreg logy h inv gov open,fe robust
預計商店fe
*結果比較
esttab fe_rb fe,b(% 6.3f)se(% 6.3f)m title(Fe _ Rb Fe)
* = =序列相關估計
*壹階自相關xtregar,fe/re
*型號:y_it = u_i+x_it*b+v_it (1)
* v_it = rho*v_it-1 + z_it (2)
xtregar logy h inv gov open,fe
預計商店fe_ar1
xtregar logy h inv gov open,fe lbi /*Baltagi-Wu測試*/