异方差的诊断及修正



《异方差的诊断及修正》由会员分享,可在线阅读,更多相关《异方差的诊断及修正(9页珍藏版)》请在装配图网上搜索。
1、- 异方差的诊断与修正 —甘子君 经济1202班 1205060432 一、 异方差的概念: 异方差性(heteroscedasticity )是相对于同方差而言的。所谓同方差,是为了保证回归参数估计量具有良好的统计性质,经典线性回归模型的一个重要假定:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。如果这一假定不满足,即:随机误差项具有不同的方差,则称线性回归模型存在异方差性。 在回归模型的经典假定中,提出的基本假定中,要求对所有的i(i=1,2,…,n)都有 也就是说具有同方差性。这里的方差度量的是随机误差项围绕其均值的分散程度。由于,所以等价地说,方差度量的是被
2、解释变量Y的观测值围绕回归线=的分散程度,同方差性实际指的是相对于回归线被解释变量所有观测值的分散程度相同。 设模型为 如果其它假定均不变,但模型中随机误差项的方差为 则称具有异方差性。也称为方差非齐性。 二、内容 根据1998年我国重要制造业的销售利润与销售收入数据,运用EV软件,做回归分析,用图示法,White检验模型是否存在异方差,如果存在异方差,运用加权最小二乘法修正异方差。 三、过程:(实践过程、实践所有参数与指标、理论依据说明等) (一) 模型设定 为了研究我国重要制造业的销售利润与销售收入是否有关,假定销售利润与销售收入之间满足线性约束,则理论模型设定为: =+
3、+ 其中,表示销售利润,表示销售收入。由1998年我国重要制造业的销售收入与销售利润的数据,如图1: 1988年我国重要制造业销售收入与销售利润的数据 (单位:亿元) 行业名称 销售利润Y 销售收入* 食品加工业 187.25 3180.44 食品制造业 111.42 1119.88 饮料制造业 205.42 1489.89 烟草加工业 183.87 1328.59 纺织业 316.79 3862.9 服装制造业 157.7 1779.1 皮革羽绒制品 81.73 1081.77 木材加工业 35.67 443.74 家具
4、制造业 31.06 226.78 造纸及纸制品 134.4 1124.94 印刷业 90.12 499.83 文教体育用品 54.4 504.44 石油加工业 194.45 2363.8 化学原料制品 502.61 4195.22 医药制造业 238.71 1264.1 化学纤维制造 81.57 779.46 橡胶制品业 77.84 692.08 塑料制品业 144.34 1345 非金属矿制业 339.26 2866.14 黑色金属冶炼 367.47 3868.28 有色金属冶炼 144.29 1535.16 金属
5、制品业 201.42 1948.12 普通机械制造 354.69 2351.68 专用设备制造 238.16 1714.73 交通运输设备 511.94 4011.53 电子机械制造 409.83 3286.15 电子通信设备 508.15 4499.19 仪器仪表设备 72.46 663.68 (二) 参数估计 1、双击“Eviews”,进入主页。输入数据:点击主菜单中的File/Open /EV Workfile—e*cel—异方差数据.*ls* ; 2、在EV主页界面的窗口,object-new object,输入“y c *”,按“Ente
6、r”。出现OLS回归结果,如图2: 估计样本回归函数 Dependent Variable: Y Method: Least Squares Date: 12/18/14 Time: 22:10 Sample: 1 28 Included observations: 28 Variable Coefficient Std. Error t-Statistic Prob. C 12.03564 19.51779 0.616650 0
7、.5428 * 0.104393 0.008441 12.36670 0.0000 R-squared 0.854696 Mean dependent var 213.4650 Adjusted R-squared 0.849107 S.D. dependent var 146.4895 S.E. of regression 56.90368 Akaike info criterion 10.98935 Sum squared resid 84188.74 Schwarz crite
8、rion 11.08450 Log likelihood -151.8508 Hannan-Quinn criter. 11.01844 F-statistic 152.9353 Durbin-Watson stat 1.212795 Prob(F-statistic) 0.000000 估计结果为: = 12.03564 + 0.104393 (19.51779) (0.008441) t=(0.616650) (12.36670) =0.854696=0.849107 S.E.=56.
9、89947 DW=1.212859 F=152.9353 这说明在其他因素不变的情况下,销售收入每增长1元,销售利润平均增长0.104393元。 =0.854696 , 拟合程度较好。在给定=0.0时,t=12.36670 > =2.056 ,拒绝原假设,说明销售收入对销售利润有显著性影响。F=152.9353 > = 4.23 ,表明方程整体显著。 (三) 检验模型的异方差 ※(一)图形法 1、在“Workfile”页面:选中*,y序列,点击鼠标右键,点击Open—as Group 2、在“Group”页面:点击View-Graph—Scatter, 得到*,Y的散
10、点图(下图3所示): 3、在“Workfile”页面:点击Generate,输入“e2=resid^2”—OK 4、选中*,e2序列,点击鼠标右键,Open—as Group 5、在“Group”页面:点击View-Graph—Scatter, 得到*,e2的散点图(下图4所示): 6、判断 由图3可以看出,被解释变量Y随着解释变量*的增大而逐渐分散,离散程度越来越大; 同样,由图4可以看出,残差平方对解释变量*的散点图主要分布在图形中的下三角部分,大致看出残差平方随的变动呈增大趋势。因此,模型很可能存在异方差。但是否确实存在异方差还应该通过更近一步的检验。 ※ (二)White
11、检验 1、 在“Equation”页面:点击View-Residual Diagnostics—Heteroskedasticity Tests—White检验(no cross),(本例为一元函数,没有交叉乘积项)得到检验结果,如图5: White检验结果 Heteroskedasticity Test: White F-statistic 3.607218 Prob. F(2,25) 0.0420 Obs*R-squared 6.270612 Prob. Chi-Square(2) 0.0435 Scale
12、d e*plained SS 7.631425 Prob. Chi-Square(2) 0.0220 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 12/18/14 Time: 22:35 Sample: 1 28 Included observations: 28 Variable Coefficient S
13、td. Error t-Statistic Prob. C -3279.779 2857.117 -1.147933 0.2619 *^2 -0.000871 0.000653 -1.334000 0.1942 * 5.670634 3.109363 1.823728 0.0802 R-squared 0.223950 Mean dependent var 3006.741 Adjusted R-squared 0.161866 S.D. depe
14、ndent var 5144.470 S.E. of regression 4709.744 Akaike info criterion 19.85361 Sum squared resid 5.55E+08 Schwarz criterion 19.99635 Log likelihood -274.9506 Hannan-Quinn criter. 19.89725 F-statistic 3.607218 Durbin-Watson stat 1.479908 Prob(F-statistic) 0.042036
15、 2、因为本例为一元函数,没有交叉乘积项,则辅助函数为 =+++ 从上表可以看出,n=6.270612 ,有White检验知,在=0,05下,查分布表,得临界值(2)=5.99147。比较计算的统计量与临界值,因为n= 6.270612 >(2)=5.99147 ,所以拒绝原假设,不拒绝备择假设,这表明模型存在异方差。 (四) 异方差的修正 在运用加权最小二乘法估计过程中,分别选用了权数=1/,=1/,=1/。 1、在“Workfile”页面:点击“Generate”,输入“w1=1/*”—OK ;同样的输入“w2=1/*^2” “
16、w3=1/sqr(*)”; 2、在“Equation”页面:点击“Procs-Specify-Estimate”进入Equation Specification对话框,点击Options按钮,在Type中勾选“Inverse std. dev”在weight series输入w1,出现如图6: 用权数的结果 Dependent Variable: Y Method: Least Squares Date: 12/18/14 Time: 22:57 Sample: 1 28 Included observations: 28 Wei
17、ghting series: W1 Weight type: Inverse standard deviation (EViews default scaling) Variable Coefficient Std. Error t-Statistic Prob. C 5.988351 6.403392 0.935184 0.3583 * 0.108606 0.008155 13.31734 0.0000 Weighted S
18、tatistics R-squared 0.032543 Mean dependent var 123.4060 Adjusted R-squared -0.004667 S.D. dependent var 31.99659 S.E. of regression 32.07117 Akaike info criterion 9.842541 Sum squared resid 26742.56 Schwarz criterion 9.937699 Log likelihood
19、-135.7956 Hannan-Quinn criter. 9.871632 F-statistic 177.3515 Durbin-Watson stat 1.465148 Prob(F-statistic) 0.000000 Weighted mean dep. 67.92129 Unweighted Statistics R-squared 0.853095 Mean dependent var 213.4650 Adjusted
20、R-squared 0.847445 S.D. dependent var 146.4895 S.E. of regression 57.21632 Sum squared resid 85116.40 Durbin-Watson stat 1.261469 3、在“Equation”页面:同样的输入“w2”,出现如图7: 用权数的结果 Dependent Variable: Y Method: Least Squares Date: 12/18/14 Time: 23:01
21、 Sample: 1 28 Included observations: 28 Weighting series: W2 Weight type: Inverse standard deviation (EViews default scaling) Variable Coefficient Std. Error t-Statistic Prob. C 6.496703 3.486526 1.863374 0.0737 * 0.106892 0.
22、010991 9.725260 0.0000 Weighted Statistics R-squared 0.922715 Mean dependent var 67.92129 Adjusted R-squared 0.919743 S.D. dependent var 75.51929 S.E. of regression 21.39439 Akaike info criterion 9.032884 Sum squared resid 11
23、900.72 Schwarz criterion 9.128041 Log likelihood -124.4604 Hannan-Quinn criter. 9.061975 F-statistic 94.58068 Durbin-Watson stat 1.905670 Prob(F-statistic) 0.000000 Weighted mean dep. 36.45276 Unweighted Statistics R-squar
24、ed 0.854182 Mean dependent var 213.4650 Adjusted R-squared 0.848573 S.D. dependent var 146.4895 S.E. of regression 57.00434 Sum squared resid 84486.88 Durbin-Watson stat 1.242212 4、在“Equation”页面:同样的输入“w3”,出现如图8: 用权数的结果 Dependent Variable: Y
25、Method: Least Squares Date: 12/18/14 Time: 23:08 Sample: 1 28 Included observations: 28 Weighting series: W3 Weight type: Inverse standard deviation (EViews default scaling) Variable Coefficient Std. Error t-Statistic Prob.
26、 C 8.640341 11.18733 0.772333 0.4469 * 0.106153 0.007746 13.70473 0.0000 Weighted Statistics R-squared 0.611552 Mean dependent var 165.8420 Adjusted R-squared 0.596612 S.D. dependent var 67.13044 S.E. of regression 42.63646
27、 Akaike info criterion 10.41205 Sum squared resid 47264.56 Schwarz criterion 10.50720 Log likelihood -143.7686 Hannan-Quinn criter. 10.44114 F-statistic 187.8197 Durbin-Watson stat 1.275429 Prob(F-statistic) 0.000000 Weighted mean dep. 123.4060
28、 Unweighted Statistics R-squared 0.854453 Mean dependent var 213.4650 Adjusted R-squared 0.848855 S.D. dependent var 146.4895 S.E. of regression 56.95121 Sum squared resid 84329.44 Durbin-Watson stat 1.233545 经估计检验,发现用权数,
29、的结果,其可决系数反而减小;只有用权数的效果最好,可决系数增大。 用权数的结果 Dependent Variable: Y Method: Least Squares Date: 12/18/14 Time: 23:12 Sample: 1 28 Included observations: 28 Weighting series: W2 Weight type: Inverse standard deviation (EViews default scaling) Variabl
30、e Coefficient Std. Error t-Statistic Prob. C 6.496703 3.486526 1.863374 0.0737 * 0.106892 0.010991 9.725260 0.0000 Weighted Statistics R-squared 0.922715 Mean dependent var 67.92129 Adjusted R-squared 0.9197
31、43 S.D. dependent var 75.51929 S.E. of regression 21.39439 Akaike info criterion 9.032884 Sum squared resid 11900.72 Schwarz criterion 9.128041 Log likelihood -124.4604 Hannan-Quinn criter. 9.061975 F-statistic 94.58068 Durbin-Watson stat 1.905670 Prob(F-statis
32、tic) 0.000000 Weighted mean dep. 36.45276 Unweighted Statistics R-squared 0.854182 Mean dependent var 213.4650 Adjusted R-squared 0.848573 S.D. dependent var 146.4895 S.E. of regression 57.00434 Sum squared resid 84486.88
33、 Durbin-Watson stat 1.242212 用权数的估计结果为: = 6.496703 + 0.106892 (1.863374) (9.725260) =0.922715 DW=1.905670 F=94.58068 括号中的数据为t统计量值。 由上可以看出,运用加权最小二乘法消除了异方差后,参数的t检验显著,可决系数提高了不少,F检验也显著,并说明销售收入每增长1元,销售利润平均增长0.106892元。 四、结果: 1、用图示法初步判断是否存在异方差:被解释变量Y随着解释变量*的增大而逐渐分散,离散
34、程度越来越大;同样的,残差平方对解释变量*的散点图主要分布在图形中的下三角部分,大致看出残差平方随的变动呈增大趋势。因此,模型很可能存在异方差。但是否确实存在异方差还应该通过更近一步的检验。 再用White检验异方差:因为n= 6.270612 > (2)=5.99147 ,所以拒绝原假设,不拒绝备择假设,这表明模型存在异方差。 2、用加权最小二乘法修正异方差: 发现用权数的效果最好,则估计结果为: = 6.496703 + 0.106892 (1.863374) (9.725260) =0.922715 DW=1.905670 F=94.58068 括号中的数据为t统计量
35、值。 由上可以看出,=0.922715,拟合程度较好。在给定=0.0时,t=9.725260 > =2.056 ,拒绝原假设,说明销售收入对销售利润有显著性影响。 F=94.58068> = 4.23 ,表明方程整体显著。 运用加权最小二乘法后,参数的t检验显著,可决系数提高了不少,F检验也显著,并说明销售收入每增长1元,销售利润平均增长0.106892元。 3、再用White检验修正后的模型是否还存在异方差: White检验结果 Heteroskedasticity Test White F-statistic 3.144597
36、 Probability 0.060509 Obs*R-squared 5.628058 Probability 0.059963 Test Equation: Dependent Variable: STD_RESID^2 Method: Least Squares Date: 12/18/14 Time: 23:15 Sample: 1 28 Included observations: 28 Vari
37、able Coefficient Std. Error t-Statistic Prob. C 1927.346 675.2246 2.854378 0.0085 * -1.456613 0.734838 -1.982223 0.0585 *^2 0.000245 0.000154 1.586342 0.1252 R-squared 0.201002 Mean dependent var 425.0258 Adjusted R-squared 0.137
38、082 S.D. dependent var 1198.210 S.E. of regression 1113.057 Akaike info criterion 16.96857 Sum squared resid 30972414 Schwarz criterion 17.11130 Log likelihood -234.5599 F-statistic 3.144597 Durbin-Watson stat 2.559506 Prob(F-statistic) 0.060509 由上看出,n=5.628058 ,由White检验知,在=0,05下,查分布表,得临界值: (2)=5.99147。 比较计算的统计量与临界值,因为n= 5.628058 < (2)=5.99147 ,所以接受原假设,这说明修正后的模型不存在异方差。 . z.
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。