樓主: 698348
41434 127

[其他] 【計量經濟學】變量內生性和工具變量知識匯總   [分享]

  • 0關注
  • 69粉絲

副教授

30%

還不是VIP/貴賓

-

威望
0
論壇幣
2833 個
通用積分
35.7062
學術水平
60 點
熱心指數
75 點
信用等級
24 點
經驗
8132 點
帖子
439
精華
1
在線時間
129 小時
注冊時間
2017-2-7
最后登錄
2018-12-14

樓主
698348 在職認證  發表于 2017-9-21 21:58:59 |只看作者 |倒序

【計量經濟學】變量內生性和工具變量知識匯總



計量經濟學中,線性回歸模型的本意是給定x值,然后預測(或估計)y的條件均值。在給定的x值下,y值可能忽高忽低(即y是隨機變量),其變化程度也可大可小(即y有方差),但其條件均值是可以通過回歸方法來估計的。至于y的條件方差,在只有一個固定的x值下是無法估計的(在重復測量樣本下也許可以做到,因為這時有多個固定相同的x值),所以只好簡單地假設對于任何給定的x,y的條件方差都是一樣的(即同方差假設),此時才可以通過多個樣本點來估計一個相同的方差,然后進行各種t檢驗、f檢驗。

通俗一點說,回歸的思想就是先抓住x,然后觀察y將如何變化。比如說居民收入r與消費c,先抓住1000元收入水平的消費群體,然后看他們將如何消費,c|1000是條件隨機變量(當然,實際數據中1000元水平的觀測可能只有一個);然后再抓住1500元收入水平的群體,再看他們將如何消費,依次類推。一般來說,隨著收入增長,消費的條件均值將同步增長,此時回歸關系成立。

但是,令我們苦惱的是,實際中很有可能是“無法抓住x”的,因為x在變,y也在變,然后y的變化又影響到了x,所以我們觀測到的結果,很有可能是x與y相互影響的結果;通俗一點說,就是x已經與y糾纏到了一起,你哪里還能辨清哪是x,哪是y?比如說收入與消費,可以說賺得多,花得也多,但錢花完了,又得想辦法去多賺點,這時收入與消費是相互影響的,你是無法"按住x"的。因為等你"按住x"了,去觀察y,y的變動回過頭來又造成了x的變化,你轉身一看,壞了,x已經不是原來那個x了,它已經變了!這個相互影響的過程,你是觀測不到的,你觀測到的只是結果。所以在你觀測到實際數據的時候,x已經不是本來的x,x中混雜了y的信息。既然x已經不是本來意義上的x,你又如何去估計它對Y的真實影響?這就是我們通常所說的聯立性偏誤(simultaneity bias),即x與y是同時變動的。這種情況下,x與回歸模型的誤差項表現為相關,違背了經典OLS(ordinary least square,普通最小二乘法)的假設。此時,你應該可以知道,你很難估計x對y的真實影響,即在經典回歸假設下,估計出的回歸系數是有偏的。這是造成內生性 Endogeneity 的情況之一。

還有可能是x在變,其他影響y的因素也在變(因為除了x影響y外,也有其他因素在影響y),但這些因素你沒有納入模型的解釋變量中,此時x與回歸模型的誤差項也表現為相關(因為遺漏因素的影響歸入了誤差項)。此時,你如何能辨清y的變化,有多少是x造成的,又有多少是“其他因素”造成的?于是估計再次陷入僵局。這種情況的產生,需要兩個條件:一是x變化,其他因素也同時變化(x與其他因素相關),二是其他因素要能影響y(即其他因素要與y相關),這是造成內生性的情況之二。

一、方法簡介
1、內生性的例子
工資和受教育水平同時受到能力的影響,然而,即使我們可以通過其他相關的測試得出能力的代理變量,能力是不可直接觀測的變量,這就帶來了遺漏變量的內生性問題。又比如,在聯立方程中,消費和收入同時受一些宏觀因素的影響,這就帶來了聯立方程偏誤。我們可以通過工具變量的方法來解決內生性的問題。

2、內生性的原因
內生性的根源:互為因果、聯立性、遺漏變量、測量誤差
總的說來,內生性主要由以下原因造成:
1. 遺漏變量:如果遺漏的變量與其他解釋變量不相關,一般不會造成問題。否則,就會造成解釋變量與殘差項相關,從而引起內生性問題。
2. 解釋變量與被解釋變量相互影響
3. 度量誤差 (measurement error):由于關鍵變量的度量上存在誤差,使其與真實值之間存在偏差,這種偏差可能會成為回歸誤差(regression error)的一部分,從而導致內生性問題。

3、內生性的定義
解釋變量與error term相關。例子:y is earnings, x is years of schooling,u is error term (includingability), z is proximity to college。
外生: 解釋變量x和error term u獨立影響被解釋變量y。

QQ截圖20170921214232.png


內生: error u 影響解釋變量x,因而間接影響被解釋變量y。

QQ截圖20170921214237.png


工具變量:工具變量z與x相關,但與error term u無關。即z能且只能通過x影響y。

QQ截圖20170921214245.png



4、工具變量z的要求:

QQ截圖20170921214250.png



5、Instrumental Variables的原理
假設一個linear model:y=xβ+μ
內生性問題就是當一個或多個解釋變量與error term相關:

QQ截圖20170921214256.png


OLS的估計系數將會是有偏的(biased):

QQ截圖20170921214300.png


上述方程可寫為:

QQ截圖20170921214309.png


其中,y1是被解釋變量,y2是內生變量,x1是外生變量。X由[y2, x1]組合而成,包含了內生和外生變量。

假設我們可以找到一組外生的變量(工具變量)z=[x1,x2],其中x1是自己的工具變量,x2是y2的工具變量。

6、The two stage leastsquares (2SLS) 估計過程。
兩階段OLS用工具變量對內生變量的預測值代替了內生變量本身 ,首先,在第一階段對只包含外生變量的方程進行回歸,

QQ截圖20170921214315.png


其次,產生內生變量的回歸預測值,然后用預測值代替內生變量:

QQ截圖20170921214320.png



7、關于識別的問題
階條件:工具變量的數量至少要與內生變量一樣多。
秩條件:為了求逆,矩陣z'x必須是滿秩的。

恰好識別的情況:
當每一內生變量各有一個工具變量的時候,我們稱這一工具變量模型恰好識別。估計系數是無偏的。

QQ截圖20170921214325.png



Under-identifiedmodel
當內生變量的數量多于工具變量的個數時,我們稱這一工具變量模型是Under-identified的。
此模型有無數解,所以沒有統一的估計值存在

過度識別:
當工具變量的個數大于內生變量的個數時,這時這個工具變量模型是過度識別的。此時我們可以得到兩種不同的估計值。
The twostage least squares (2SLS) (當殘差項服從獨立同分布的時候是最好的估計方法。)

QQ截圖20170921214330.png


GMM(廣義矩估計:Thegeneralized method of moments)

QQ截圖20170921214336.png


當w=(z'z)^(-1)時,這與2SLS估計一樣。通常有:

QQ截圖20170921214341.png


其中等式右邊是z'μ估計方差,當存在異方差的時候GMM估計更優。

8、檢驗
內生性的檢驗:
1、Hausman test
豪斯曼檢驗檢驗解釋變量是內生的還是外生的。
通過對比OLS和IV的結果是否存在顯著的差異來判斷,如果差別顯著,則解釋變量為內生,反之亦然。
2、Durbin-Wu-Hausmantest
TheDurbin-Wu-Hausman test主要檢驗等式

QQ截圖20170921214346.png


是否成立。
估計第一階段方程:

QQ截圖20170921214358.png


把殘差項(μ)放進方程:

QQ截圖20170921214404.png


如果μ的系數rho顯著異于0,則判斷變量為內生,反之,則為外生變量。

QQ截圖20170921214409.png


過度識別限制檢驗
用GMM方法估計并得到下面檢驗統計量:

這是一個服從自由度等于過度識別的限制數的卡方分布,原假設為:至少有一個工具變量不是有效的。

弱工具變量檢驗
當一個內生變量和一個工具變量時,這兩個變量的弱相關性可以說明這是一個弱工具變量。
當多個工具變量對一個內生變量時,工具變量的強弱可以用第一階段的F統計量來衡量,一半認為10是安全值閥,大于10安全。

弱工具變量的后果
一是會降低估計的精度;另外,IV的估計值是漸進一致、有偏的。偏誤的大小與工具變量的弱度正向相關,與樣本量的大小反向相關!(可怕啊)

9、工具變量和聯立系統方程
假設有兩個內生變量,方程如下:

QQ截圖20170921214415.png


簡化后:

QQ截圖20170921214420.png


2階段最小二乘或3階段最小二乘估計過程:
首先,通過對簡化式進行OLS估計得到y的預測值(y帽),然后用y的預測值估計下式:

QQ截圖20170921214425.png


最后,用2階段最小二乘估計的結果計算下式:

QQ截圖20170921214430.png


此時的β即為3階段最小二乘估計結果。
對比2SLS和3SLS的估計性質:3SLS比2SLS更有效。但是3SLS在殘差項存在異方差的時候的估計非一致。

關鍵詞:計量經濟學 變量內生性 工具變量 內生性的例子 內生性的原因

已有 17 人評分經驗 論壇幣 學術水平 熱心指數 信用等級 收起 理由
kongqingbao280 + 60 + 60 精彩帖子
qiaomai8886 + 1 精彩帖子
dixiahe + 5 補償
zhdefei + 1 精彩帖子
w08241081 + 5 精彩帖子
aclyang + 60 精彩帖子
靠不會吧 + 5 + 4 精彩帖子
arthistory4 + 100 精彩帖子
remlus + 100 精彩帖子
np84 + 100 精彩帖子

總評分: 經驗 + 630  論壇幣 + 265  學術水平 + 20  熱心指數 + 7  信用等級 + 4   查看全部評分

本帖被以下文庫推薦

stata SPSS
沙發
毛小舟 學生認證  發表于 2017-9-25 10:22:22 |只看作者
感謝!
已有 1 人評分經驗 收起 理由
unparalleled + 20 精彩帖子

總評分: 經驗 + 20   查看全部評分

回復

使用道具 舉報

藤椅
愛寶貝妍 發表于 2017-11-24 16:34:42 |只看作者
THANKS
已有 1 人評分經驗 收起 理由
unparalleled + 20 精彩帖子

總評分: 經驗 + 20   查看全部評分

回復

使用道具 舉報

板凳
我的人生12345 發表于 2017-11-30 15:09:00 來自手機 |只看作者
感謝,辛苦
已有 1 人評分經驗 收起 理由
unparalleled + 20 精彩帖子

總評分: 經驗 + 20   查看全部評分

回復

使用道具 舉報

報紙
不知為不知123 發表于 2018-1-3 20:45:26 |只看作者
打個電話棒棒棒棒棒棒棒
已有 1 人評分經驗 收起 理由
unparalleled + 20 精彩帖子

總評分: 經驗 + 20   查看全部評分

回復

使用道具 舉報

地板
胡不歸 發表于 2018-1-28 22:20:29 |只看作者
好貼,馬一下~~
已有 1 人評分經驗 收起 理由
unparalleled + 20 精彩帖子

總評分: 經驗 + 20   查看全部評分

回復

使用道具 舉報

7
xxxxxqs 在職認證  發表于 2018-5-5 14:30:26 |只看作者
好貼,頂一下

已有 1 人評分經驗 收起 理由
unparalleled + 20 精彩帖子

總評分: 經驗 + 20   查看全部評分

回復

使用道具 舉報

8
白色紙鳶1 發表于 2018-5-24 17:02:29 |只看作者
學習了,頂帖
已有 1 人評分經驗 收起 理由
unparalleled + 20 精彩帖子

總評分: 經驗 + 20   查看全部評分

回復

使用道具 舉報

9
guanwei519 學生認證  發表于 2018-5-28 20:06:59 |只看作者
大神棒棒的,很多計量經濟學的書是沒有這么詳細的
已有 1 人評分經驗 收起 理由
unparalleled + 20 精彩帖子

總評分: 經驗 + 20   查看全部評分

回復

使用道具 舉報

10
蘭萌萌 發表于 2018-5-28 21:30:12 |只看作者
棒!!
已有 1 人評分經驗 收起 理由
unparalleled + 20 精彩帖子

總評分: 經驗 + 20   查看全部評分

回復

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 我要注冊

京ICP備16021002-2號 京B2-20170662號 京公網安備 11010802022788號 論壇法律顧問:王進律師 知識產權保護聲明   免責及隱私聲明

GMT+8, 2019-10-16 07:25
FUN88电竞