学习体会或感悟。(一般不会考)
二、在本学期的学习中,有如下的古典假定:
(1)强外生性E(i|X)0;(2)球型扰动VarCov(|X)I; (3)弱外生性Cov(xji,i|X)0;(4)满秩Rank(X)k;(5)正态性i 简述自己对这些古典假定的认识,以及这些假设对参数估计统计性质的作用。
解答:(1)零均值,即E(i2~N(0,2)。
|X)0Covxij,i|X0;
2(2)同方差与无自相关假定,即随机扰动项的方差Var(|X)IT; (3)随机扰动项与解释变量不相关,即Cov(xji,i|X)0; (4)无多重共线性,即各解释变量之间线性无关,Rank(X)k; (5)正态性假定,即i而它们的作用在于:
第一,条件均值为零(或强外生性)能保证最小二乘估计量的无偏性。
第二,球形扰动,是指随机扰动项的方差-协方差矩阵为同方差和无自相关同时成立时的情况。违反此假设条件,被称为非球形扰动,将会影响到参数估计的有效性问题。
第三,外生性条件,表示随机扰动项中不包含有解释变量的任何信息。注意,外生性条件的不同表述方式和内涵。外生性条件的违反将影响到参数估计的一致性问题。
第四,满秩性条件,它是为了保证条件期望的唯一性,参数可求解。
第五,正态性条件,它主要与我们的统计检验和推断有关,用于推断估计式的分布。 三、对于线性模型 yX,写出下述假定条件的表达式,并说明其含义和作用。 (1)强外生性;(2)弱外生性;(3)球型扰动;(4)正态性。 解答同上。
四、什么是估计量的无偏性,有效性和一致性?计量经济学中哪些古典假定能保证这些性质成立?
~N(0,2)。
以上假设条件可总结为:①解释变量的强外生性;②球形扰动;③解释变量的外生性;④满秩;⑤正态性。
ˆ的期望等于参数的真实值,即E解答:无偏性:如果参数的估计量估计。强外生性或者条件均值为零可以保证最小二乘估计量的无偏性。
ˆ,则称ˆ是参数的无偏
有效性:一个估计量若不仅具有无偏性而且具有最小方差时,称这个估计量为有效估计量。球型扰动
VarCov(|X)2I能保证估计量的有效性。
ˆ的抽样分布依概率收敛于总体参数的真实值,即一致性:当样本容量趋于无穷大时,如果估计量ˆ1,则称估计量ˆ为一致估计量。弱外生性Cov(x,|X)0能够保ˆ或limPPlimjiixx证估计量的一致性。
五、某人依据1960-1995的时间序列数据关于如下所设定的模型
进行回归,得到了如表1-表4所示的结果。请仔细阅读这些结果,试回答以下问题
1、表1-表3是在进行什么工作?这些工作依据的基本思路是什么? 2、请写出表4回归结果的标准形式。
3、表4的结果说明什么?与表1-表3结果之间有何联系? 表1
Dependent Variable: G Method: Least Squares Date: 02/17/08 Time: 08:35 Sample: 1960 1995 Included observations: 36
Variable
C YEAR
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
令gstarresidg 表2
Dependent Variable: PG Method: Least Squares Date: 02/17/08 Time: 08:37 Sample: 1960 1995 Included observations: 36
Variable
C YEAR
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
令pgstarresidpg
Coefficient -211.0615 0.107903
Std. Error 16.86405 0.008528
t-Statistic Prob.?? -12.51547 12.65301
0.0000 0.0000
Coefficient -8756.489 4.542394
Std. Error 528.1826 0.267092
t-Statistic Prob.?? -16.57853 17.00682
0.0000 0.0000
0.894812 ????Mean dependent var 226.0944 0.891719 ????S.D. dependent var 16.64781 ????Akaike info criterion 9423.087 ????Schwarz criterion -151.2950 ????F-statistic 0.258444 ????Prob(F-statistic)
50.59182 8.516387 8.604360 289.2320 0.000000
0.824831 ????Mean dependent var 2.316611 0.819679 ????S.D. dependent var 0.531539 ????Akaike info criterion 9.606140 ????Schwarz criterion -27.30169 ????F-statistic 0.292859 ????Prob(F-statistic)
1.251735 1.627872 1.715845 160.0987 0.000000
表3
Dependent Variable: Y Method: Least Squares Date: 02/17/08 Time: 08:38 Sample: 1960 1995 Included observations: 36
Variable
C YEAR
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
令ystarresidy 表4
Dependent Variable: GSTAR Method: Least Squares Date: 02/17/08 Time: 08:57 Sample: 1960 1995 Included observations: 36
Variable PGSTAR YSTAR
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
Coefficient -11.98265 0.047818
Std. Error 2.117186 0.004526
t-Statistic Prob.?? -5.659707 10.56485
0.0000 0.0000
Coefficient -322893.7 167.9528
Std. Error 7888.457 3.989051
t-Statistic Prob.?? -40.93243 42.10344
0.0000 0.0000
0.981181 ????Mean dependent var 9232.861 0.980628 ????S.D. dependent var 248.6366 ????Akaike info criterion 2101886. ????Schwarz criterion -248.6287 ????F-statistic 0.364489 ????Prob(F-statistic)
1786.381 13.92381 14.01179 1772.700 0.000000
0.867908 ????Mean dependent var 0.000000 0.864023 ????S.D. dependent var 6.050558 ????Akaike info criterion 1244.715 ????Schwarz criterion -114.8584 ????Durbin-Watson stat
16.40826 6.492131 6.580104 0.792275
解答:1、表1为一元回归,G对year回归,得到回归的残差,令gstarresidg;表2为一元回归,PG对year回归,得到回归的残差,令pgstarresidpg;表3为一元回归,Y对year回归,得到回归的残差,令ystarresidy。
依据的基本思想:若求PG、Y变量对G的影响,即β1、β2,可以先将PG、Y与G中扣除掉包含year的信息,然后运用扣除G中包含year的信息得到残差gstar,扣除PG中包含year的信息得到残差pgstar,扣除Y中包含year的信息得到残差ystar,再将gstar对pgstar和ystar进行回归,则得到在扣除year影响后,PG与Y对G的作用情况。同时说明了系数β1、β2表示的是变量PG、Y与G的偏相关。
2、表4回归结果标准形式:
t=(-5.6597) (10.56485)
R20.8679 DW=0.79227 df=34
3、表4是利用双残差回归思想得出的结果,说明在扣除year变量的影响后,PG与Y对G有显着影响,
分别为-11.9826、0.0478。表1-表3是表4做残差回归的基础工作,表4的估计参数与原模型直接回归所得结果的β1、β2相等。
六、分析解释双残差回归的基本思想和步骤。
解答:双残差回归思想的理解:假设在一个典型的线性回归方程yX11X22中,变量集X2是我们的关注变量集,相应的X1就是我们的控制变量集。估计系数β2表示的就是在控制了变量集X1后,X2对y的影响。也就是通常说的,在其他变量保持不变的情况下,X2的变化引起的y的变化。很显然,在不同的情况下,我们可以改变我们的控制变量集,来看我们的关注变量系数是否发生显着的变化,这在实证中是很重要步骤和思想。控制变量的t值大小可以不必过于在意。
具体步骤:假设典型回归方程Y=X1β1+X2β2+ε 其中:M1*=I-X1(X1'X1)-1X1',X*2=M1X2,Y=M1Y
假设现在要求的是系数β2
(1)X2对X1进行回归,得到回归的残差记为e2。 (2)Y对X1进行回归,得到回归的残差记为e1
(3)e1对e2回归,得到的参数估计b2=(e2e2)e2e1就是β2的估计值。残差e1中扣除了Y中包含的X1的信息;残差e2扣除了X2中包含的X1的信息。因此双残差(e1、e2)回归仅反应了,在扣除了X1的影响,
'-1'X2对Y的作用情况,同样说明了系数b2表示的是变量X2与Y的偏相关。
1七、设随机变量x服从Weibull分布,fxxexpx, x,,0,若在随机抽样过程中得到
n个样本,试求
1.关于n个样本的对数似然函数 2.参数的极大似然估计表达式 解:1.
fxixi1expxiLxii1n1expxi
nnlnLnn2.nlnnln1lnxixixi0 i1i1i1八、设随机变量x服从指数分布,fx试求
xexp, x0, 0,若在随机抽样过程中得到n个样本,11.关于n个样本的对数似然函数 2.参数的极大似然估计表达式
xi解答:1、fxiexp1n1xiLexpi1 lnL1nn1n2、nlnxi2xi0
i1i1九、简述工具变量(IV)估计和两阶段最小二乘(2SLS)估计的基本含义
解答:工具变量:假设有如下模型,y01x1kxku
xk与扰动项u可能相关,而其他解释变量都是外生的。
采用工具变量估计,需要找到一个可观测的工具变量z,且工具变量满足两个条件: 1、z与误差项u不相关,covz,u0;
k1xk1z 只要系数0,该工具变量就是有效的。也就是
2、z与xk高度相关。或者说z与xk存在偏相关(即扣除其他外生变量的影响),也就是xk对所有外生变量的映射中,xk01x1说,必须保证z与
xk是在扣除了其他外生变量的影响下,仍然是相关的。这样,根据回归得到了xk的估计值
ˆz ˆk1xk1ˆ0ˆ1x1ˆkxˆk代替原来的xk,进行OLS估计,就可以得到产生的无偏估计。这实际上是将内生变量分成了内用估计出的x生部分和外生部分,通过投影得到了外生的部分,然后进入回归方程。
当使用多个工具变量来解决内生解释变量时,基本做法与上述类似。
两阶段最小二乘:解决内生解释变量的基本做法是采用工具变量估计模型,基本思想是利用工具变量替代内生解释变量,然后用OLS估计模型。这一过程通常使用了两次OLS,因此称之为两阶段最小二乘(2SLS)。 十、简要阐述矩估计和OLS估计、IV估计之间的关系。
解答:矩方法是工具变量估计方法(IV)和广义矩估计方法(GMM)的基础。在矩方法中关键是利用了
EX'0。
当样本矩条件和参数个数为R = K: 存在唯一解gT0时,参数正好识别,此时可采用OLS估计和IV
估计,即如果某个解释变量与随机项相关,只要能找到1个工具变量,仍然可以构成一组矩条件,这就是IV估计,OLS估计和IV估计是GMM估计的特例。
当R > K时,这时方程组中方程的个数多于参数的个数,此为过度识别,如果存在>k+1个变量与随机项不相关,可以构成一组包含>k+1方程的矩条件。这就是GMM。
十一、什么是工具变量?简述工具变量在实证分析中的具体步骤及注意事项。
解答:工具变量:假设有如下模型,y01x1kxku
xk与扰动项u可能相关,而其他解释变量都是外生的。
采用工具变量估计,需要找到一个可观测的工具变量z,且工具变量满足两个条件: 1、z与误差项u不相关,covz,u0;
k1xk1z 只要系数0,该工具变量就是有效的。也就是说,
2、z与xk高度相关。或者说z与xk存在偏相关(即扣除其他外生变量的影响),也就是xk对所有外生变量的映射中,xk01x1必须保证z与
xk是在扣除了其他外生变量的影响下,仍然是相关的。这样,根据回归得到了xk的估计值
ˆz ˆk1xk1ˆ0ˆ1x1ˆkxˆk代替原来的xk,进行OLS估计,就可以得到产生的无偏估计。这实际上是将内生变量分成了内用估计出的x生部分和外生部分,通过投影得到了外生的部分,然后进入回归方程。
当使用多个工具变量来解决内生解释变量时,基本做法与上述类似。 工具变量在实证分析中的具体步骤与注意事项:
依据工具变量的选择原则,首先选取替代内生解释变量的适当工具变量,然后进行如下的两阶段最小二乘估计:使用。
第一,将这个内生解释变量关于模型中所有的外生变量和选定的工具变量进行回归,得到回归方程。若工具变量系数的t值显着,并且方程的整体拟合程度较好(F统计量值大于30),则该工具变量是一个有效的工具变量,并由本步骤中建立的回归方程进行预测,得到内生解释变量的估计值。
第二,将内生解释变量的估计值带入原方程进行回归,即在原方程中,内生解释变量由内生解释变量的预测替代,再次进行回归,就可以得到方程参数的无偏估计。 十二.何为内生性问题?什么是工具变量?
在分析女性工资收入的模型
中,发现受教育年限educ具有内生性,exper和exper是外生的。若仍使用OLS估计会有什么后果?如果用父亲受教育年限fatheduc、母亲受教育年限motheduc和丈夫受教育年限huseduc作为educ的工具变量,应该如何解决内生性问题?
解答:内生性问题:如果外生性假定被违背,即E2xu0,解释变量与扰动项相关,那么模型存在内
ji生性问题。与扰动项相关的解释变量称为内生解释变量。此时最小二乘估计量将是不一致的。
工具变量:假设有如下模型,y01x1kxku
xk与扰动项u可能相关,而其他解释变量都是外生的。
采用工具变量估计,需要找到一个可观测的工具变量z,且工具变量满足两个条件: 1、z与误差项u不相关,covz,u0;
k1xk1z 只要系数0,该工具变量就是有效的。也就是说,
2、z与xk高度相关。或者说z与xk存在偏相关(即扣除其他外生变量的影响),也就是xk对所有外生变量的映射中,xk01x1必须保证z与
xk是在扣除了其他外生变量的影响下,仍然是相关的。这样,根据回归得到了xk的估计值
ˆz ˆk1xk1ˆ0ˆ1x1ˆkxˆk代替原来的xk,进行OLS估计,就可以得到产生的无偏估计。这实际上是将内生变量分成了内用估计出的x生部分和外生部分,通过投影得到了外生的部分,然后进入回归方程。
当使用多个工具变量来解决内生解释变量时,基本做法与上述类似。
解决内生性问题:解决内生解释变量的基本做法是采用工具变量估计模型,基本思想是利用工具变量替代内生解释变量,然后用OLS估计模型。
首先假设,父亲受教育年限fatheduc、母亲受教育年限motheduc和丈夫受教育年限huseduc这三个工具变量满足第一个条件,即与原模型的扰动项不相关;
接下来,看第二个条件,为此需要估计以下模型。 模型估计结果为
根据外生性第二个条件,要求用线性约束F检验,
计算结果F1、2、3至少一个不为零,即要检验原假设为H0:1230,采
RSSRRSSUq(3846.19-2089.54)/3118.25
RSSUnk2089.54747拒绝原假设,表明第二个条件成立。
于是我们使用两阶段最小二乘2SLS估计原模型:
1、生成educ的替代变量,即educ对所有外生变量回归,用educ的估计量作为工具变量z;
2、用z替代educ估计工资方程,log(wage)01exper2exper3zu
2ˆ,ˆ,它们的方差分别为v1,v2。问:当c1,c2为何值时,十三、关于参数有两个相互独立的无偏估计量12ˆcˆˆ线性组合11c22是关于参数的最小方差无偏估计?
ˆ),E(ˆ),Var(ˆ)v,Var(ˆ)v 解答:根据已知条件有:E(121122ˆcˆˆˆˆˆ11c22是无偏的,则有:E()E(c11c22)(c1c2)
所以:c1c21
ˆ、ˆ相互独立,所以 因为12代入c1c21,
可得:c1v1c2v2c1v1(1c1)v2(v1v2)c12v2c1v2 求偏导
2c12v1c2v222222c1v1v2c122v2c1v22v1v2c12v20 c1v2v1,c2。
v1v2v1v2ˆ具有最小方差性,得到:c1十四、假设
y和xj(j1,2,k)存在有限的二阶矩,且有如下的回归方程:
E()0,var(|x)2 E(xj)0(j1,2,(1)在xj(j1,2,k)
2k)是随机变量的条件下求y的方差y
2222。证明R1RSSTSS是的一致估计。 12y(2)定义总体拟合优度为解答:(1)y2var(y)Evary|xvarEy|x
2 xβ|xEvar(|x)其中,Evary|xEvar0所以,y2var(y)varxβ2
RSSN2(2)R1RSSTSS1
TSS/NplimRSSN2RSSN211所以,plimR1plim 2TSS/NplimTSS/Ny2十五、在对多元回归模型 Yi12X2i3X3ikXkiui
ESS的方程显着性检验中,通常对假设H0:23k0进行F检验,检验统计量为Fk1nkRSS,
其中k为模型中待估参数的个数。证明:此F统计量是一般的F统计量的特例,即:
ESSFRSSk1nk(RSSRRSSU)RSSUkUkR。
nkU(注:下标U代表无约束,R代表有约束)。
RSSRRSSukUkR证明:F (1)
RSSu(nkU)由RR21RSSR2RSSR1RRTSS TSS同理可得RSSu带入(1)式得
1Ru2TSS
2222RSSRRSSukUkR1RRTSS1RuTSSkUkRRuRRkUkR (2) FRSSu(nkU)1RTSS2u(nkU)1R(nk2uU)有约束模型 Yi有E1ui
1
n2in2Yi1 又Y有uiYiYuYiYei2RSSR
i1i1由TSSYYii1n22RSSRTSSRR0
带入(2)式得
十六、结合下图,简述Wald、LM以及LR三个检验的基本思想。
解答:如上图所示
ˆ是否满足c(ˆ)0的约束条件,实Wald检验是在约束条件c()0的条件下,考察无约束的参数估计量ˆ)与0的距离。构造一个马氏距离为:c(ˆ)Var(c(ˆ))c(ˆ)。如果满足约束条件,该构造际上也就是考察c(的马氏距离与0的距离在统计上就会很接近,此时就可以认为约束条件是满足的。在实际的应用中,Wald检验
1ˆ)可以采用White的稳健估计,因此在异方差的情况下,Wald统计量仍然是有效的。但是在ˆ的方差Var(中约束条件是非线性的情况,不同的约束条件表达式得到的Wald统计量是不同的,
ˆ)2(2ˆˆ0W(0)I()cii2nR21R2ˆ与之间的水平距离),这就影响了非线性约束 (度量0下Wald统计量的有限样本性质。
LM检验主要考察约束条件下求得的有约束的参数估计值,是否满足无约束条件下的最优化一阶条件
dlnL()0。如果约束条件是成立的,那么无约束估计量ˆ与约束估计量之间的差别就会很小,约束估计
ddlnL()0。在实际的应用中,LM统计量的缺陷在于计算量量也就会近似的满足无约束的一阶优化条件
d大,表达式比较复杂,LMs(0)I(0)21nR2(考察对数似然函数在0处的斜率)。但是在同方差假
定下,其计算表达式可以大大简化。进一步的,即使在异方差条件下,也可以通过回归的方法来避免复杂的计算,同样能够得到LM统计量。
LR检验的思想是考察无约束条件下最优化和约束条件下最优化求得的值函数的大小。无约束条件下的最优化值函数总是大于或等于约束条件下的值函数。如果二者的差别很小,就可以认为约束条件是成立的。在实际的应用中,LR统计量的思想比较直观,但是必须在同方差假定下,构造出的LR统计量才是有效的;另一方面,由于
LR
统计量的构造要求同时计算无约束和有约束的参数估计式,
ˆ与之间的“垂直”距离),在实际应用中就增加了计算ˆ)2lnL()nln(1R2)(考察LR2lnL(00量,使得其应用受到一定的制约。 十七
1、考虑如下模型, 无约束模型(U): LnCt= 0.3181 + 0.8756 LnIt + 0.6466 LnCt-1 - 0.6078 LnIt-1 + 0.0218 LnPt-1. t = (2.75) (10.97) (4.72) (-4.86) (2.09)
R 2 = 0.9989, RSS = 0.0015, DW = 1.95, LnL = 105.87, n= 30
和约束模型(R):
LnCt= 0.1932 + 0.9600 LnCt-1 - 0.0168 LnPt-1. t = (0.88) (19.95) (-0.78)
R = 0.9935, RSS = 0.0088, DW = 2.27, LnL = 79.47, n= 30
试用似然比(LR)检验判断,对模型(U)施加约束LnIt和LnIt-1的系数0 = 1 = 0是否成立。 (注:显着性水平0.05时, 2) = 5.99 ) 2、对某生产函数模型,
Lnyt= -8.4 + 0.67 Lnxt1 + 1.18 Lnxt2 (4.4) (3.9)
2
R2 = 0.89, F = 48.45, DW=1.3
检验2/3 = 0.5是否成立。下表运用了什么方法?说明了什么结果?
解答:1、似然比检验:LR2ln2lnLRlnLU279.47105.8752.8
所以拒绝原假设H0:010,对模型(U)施加约束LnIt和LnIt-1的系数0 = 1 = 0不成立,选择无约束模型。
RSSRRSSUq0.00880.00152如果运用F检验:F60.83
RSSUnk0.0015305所以拒绝原假设H0:010,对模型(U)施加约束LnIt和LnIt-1的系数0 = 1 = 0不成立,选择无约束模型。
2、表中运用了wald检验方法,检验结果P0.7975730.05,接受原假设,约束条件立。
十八、在计量经济分析中,经常讨论随机扰动项的分布设定问题。
230.5成
(x1)1yi(xi)yie例如,对于分布f(yi,xi,,),若设1,则其成为指数分布
()yi1f(yi,xi,)e(xi)。这里,约束条件为1。为此,某人进行了如下检验:
xiH0:1; H1:1
利用极大似然估计ML,得到如下结果(括号内数据为标准差):
Unrestricted 3.1517 (0.794292) -4.7198 (2.341235) -82.91444 0.000 0.000 -0.85628 -7.4569 -2.2423
2Restricted 1.00
15.6052 (6.790987) -88.43771 0.000 7.9162 -0.021654 -32.8987 -0.66885
试依据上述结果,回答下列问题(给定0.0513.842):
1、计算似然比检验(Likelihood Ratio Test)统计量的值,并进行判断; 2、计算沃尔德检验(Wald Test)统计量的值,并进行判断。
解答:1、似然比检验
2LR11.04654x0.0513.842,所以拒绝原假设H0:1,选择无约束模型。
2、Wald检验,H0:10 H1:10
ˆ表示无约束条件下的参数估计量 其中ˆ13.15171ˆ1ˆˆvar11所以Wˆ1var0.7942922'1227.3348
2W7.3348x0.0513.842,所以拒绝原假设H0:10,选择无约束模型。
十九、简要阐述两步广义矩估计的基本步骤
解答:1、先取加权矩阵W=单位矩阵I,或者对于线性模型YXu,取W(X'X)得到初始GMM估计量(或)。
2、取加权矩阵W1ˆ()1[1m(z,)m(z,)']1,可以证明它是1的一致估计量。于是iiiinˆ()1g() 即是通过两步完成的GMM估计量。 argming()'二十、考虑如下有K个解释变量的线性回归
其中x1t为外生变量,即Ex1tt0,x2t是内生变量,E中Z的维数为R,且RK,EzttTx2tt0。假设存在工具变量ztx1Tt,z2t,其
ˆEztytxtT0R1。试推导GMM。
TTT解答:回归方程:ytx1t1x2t2txtt
由:Eztt0
则有EzttEztytxtTEztytztxtT0
得:EztytEztxtT
ˆ所以,GMM1n1nTztxtzty nt1nt11
因篇幅问题不能全部显示,请点此查看更多更全内容