intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Mô hình phân tích số liệu mảng - thực hiện trên phần mềm Stata (kỳ 2)

Chia sẻ: ViTomato2711 ViTomato2711 | Ngày: | Loại File: PDF | Số trang:5

77
lượt xem
2
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết trình bày về số liệu mảng, tầm quan trọng và các đặc trưng ưu việt của nó trong việc phân tích và dự báo kinh tế. Bài viết cũng trình bày hai mô hình cơ bản và các phương pháp ước lượng để phân tích số liệu mảng.

Chủ đề:
Lưu

Nội dung Text: Mô hình phân tích số liệu mảng - thực hiện trên phần mềm Stata (kỳ 2)

TAÏP CHÍ KHOA HOÏC ÑAÏI HOÏC SAØI GOØN Soá 25 - Thaùng 12/2014<br /> <br /> <br /> MÔ HÌNH PHÂN TÍCH SỐ LIỆU MẢNG -<br /> THỰC HIỆN TRÊN PHẦN MỀM STATA (KỲ 2)<br /> <br /> PHAN TẤT HIỂN(*)<br /> LÊ KHẮC PHONG(**)<br /> PHAN HUY BẰNG(***)<br /> <br /> TÓM TẮT<br /> Trong bài báo này chúng tôi trình bày về số liệu mảng, tầm quan trọng và các đặc<br /> trưng ưu việt của nó trong việc phân tích và dự báo kinh tế. Chúng tôi cũng trình bày hai<br /> mô hình cơ bản và các phương pháp ước lượng để phân tích số liệu mảng. Cuối cùng<br /> chúng tôi trình bày các kiểm định cho số liệu và mô hình đã trình bày ở trên.<br /> Từ khóa: số liệu mảng, mô hình tác động ngẫu nhiên, mô hình tác động cố định, Stata<br /> <br /> ABSTRACTS<br /> In this paper we present the Panel data, and the importance of its unique adVantages<br /> in Vietnam economic analysis and forecasting. We also present two basic models and<br /> estimation methods to analyze array data. Finally we present the testing for data and<br /> model presented above.<br /> Keywords: panel data, random effects models, fixed effects models, Stata<br /> <br /> <br /> 3. MÔ HÌNH TÁC ĐỘNG CỐ ĐỊNH VÀ được ci với sai số ngẫu nhiên uit mà xem<br /> ƯỚC LƯỢNG(*)(**)(***) xét nó như một thành phần của mô hình có<br /> Phần này sẽ xem xét mô hình tác động thể ước lượng được, và do đó chúng ta sẽ<br /> cố định, dùng để giải quyết các bài toán làm việc với mô hình có dạng (5.1)<br /> trong đó yếu tố không quan sát được có Chúng ta sẽ xem xét các giả thiết của<br /> dạng ci và có tương quan với biến giải mô hình<br /> thích trong mô hình. Giả thiết FE1. E (uit | X i , ci )  0 với<br /> 3.1. Mô hình – các giả thiết mọi t = 1,.., T.<br /> Viết lại mô hình tác động cá thể Giả thiết FE2: rank(E(X’X)) = k<br /> yit  1   2 X 2it  ..   k X kit  ci  uit Giả thiết FE3: var(uit | X it )   u ,<br /> 2<br /> <br /> thành dạng như<br /> cov(ui, uj) = 0 với i ≠ j<br /> sau: yit  1  2 X 2it  ..  k X kit  ci  uit<br /> 3.2. Các phương pháp ước lượng mô<br /> (5.1) hình tác động cố định<br /> Mô hình tác động cố định chủ trương Có nhiều phương pháp để ước lượng<br /> không gộp thành phần không quan sát mô hình này, trong khuôn khổ của bài báo<br /> chúng tôi xin được giới thiệu hai phương<br /> (*)<br /> ThS, Trường Đại học Sài Gòn pháp sau:<br /> (**)<br /> ThS, Trường Đại học Vinh Phương pháp ước lượng nội bộ (within<br /> (***)<br /> ThS, Trường Cao đẳng nghề Công nghệ cao<br /> Đồng An, Bình Dương estimator)<br /> <br /> 115<br /> Ý tưởng của phương pháp này là ước sau<br /> lượng các hệ số dựa trên quan sát về sự  y1t  1  c1   2 X 21t  ..   k X k1t  u1t<br /> thay đổi trong nội bộ mỗi cá thể. Phương <br /> .... (5.5)<br /> pháp này được thực hiện như sau :  y    c   X  ..   X  u<br />  nt 1 n 2 2 nt k knt nt<br /> Từ mô hình (5.1), lấy trung bình cho mỗi<br /> (5.5) cho thấy rằng chúng ta có thể ước<br /> cá thể dọc theo thời gian, ta có :<br /> lượng các ci bằng cách sử dụng biến giả<br /> yi  1  2 X 2i  ..  k X ki  ci  ui (5.2)<br /> như sau :<br /> Từ (5.1) và (5.2) ta dni = 1 nếu n =i, dni = 0 nếu n  i<br /> có : Khi đó (5.5) có thể viết gọn lại dưới<br /> yit  yi  2 ( X 2it  X 2i )  ..  k ( X kit  X ki )  (uit  ui ) (5.3) dạng :<br /> Phương pháp OLS gộp áp dụng cho mô yit  1  c1d1i  ..  cndni  2 X 2it  ..  k X kit  uit (5.6)<br /> hình (5.3) được gọi là phương pháp ước Phương pháp ước lượng với biến giả là<br /> lượng nội bộ. phương pháp OLS gộp cho bài toán<br /> Từ (5.2) ta thấy rằng ci có thể được (5.6).Để tránh hiện tượng đa cộng tuyến<br /> ước lượng theo công thức hoàn hảo trong mô hình (5.5), Stata sẽ tự<br /> sau ci  yi  ˆ2 X 2i  ..  ˆk X ki (5.4) động bỏ bớt một biến giả.<br /> Thực hiện trên STATA Kết quả ước lượng với số liệu trong<br /> Lệnh khai báo số liệu : xtset id time panel2.dta cho mô hình (5.6) cho trong<br /> Lệnh ước lượng: xtreg y x1 x2...xk, fe bảng 62.<br /> Trong đó fe ngụ ý chúng ta đang ước Lệnh thực hiện trong phần mềm Stata<br /> lượng mô hình tác động cố định. xi: reg Va vondautu i.id<br /> Với số liệu trong ví dụ panel.dta chúng Vậy về thực chất, ước lượng với biến<br /> ta sẽ viết lệnh giả chính là phương pháp ước lượng gộp<br /> xtset id year tiến hành cho số liệu mảng với n-1 biến giả<br /> xtreg Va vondautu, fe thể hiện cho n cá thể. Với phương pháp này,<br /> Trong đó: xtset id year là lệnh khai báo chúng ta một mặt có được các giá trị ước<br /> sử dụng số liệu mảng, fe: ngụ ý mô hình lượng của các ci, mặt khác có thể đưa ra các<br /> tác động cố định suy diễn thống kê về sự khác biệt giữa các<br /> Với tập số liệu nói trên, kết quả thu cá thể. Trong bảng 6 nói trên, ngành sản<br /> được cho trong bảng sau1. xuất sợi và dệt vải (tương ứng với biến giả<br /> Ở đây hệ số ước lượng của vốn đầu tư id_1) được chọn làm ngành để so sánh. Và<br /> là 2.325042, đã phù hợp với kỳ vọng của hệ số (5373001) thể hiện sự khác biệt trong<br /> chúng ta về mối quan hệ giữa giá trị gia giá trị gia tăng giữa ngành sản xuất sợi và<br /> tăng Va và vốn đầu tư. dệt vải với ngành may trang phục do tác<br /> Phương pháp ước lượng sử dụng biến động của yếu tố không quan sát được ci. Do<br /> giả kết quả ước lượng có báo cáo về giá trị sai<br /> Một cách tiếp cận khác với phương số chuẩn của hệ số ước lượng này nên ta<br /> pháp trên đây là xem xét ci như là các tham hoàn toàn có thể đưa ra các suy diễn thống<br /> kê như: sự khác biệt này là có thực sự khác<br /> số có thể ước lượng cùng với các hệ số  j .<br /> 0 không, sự khác biệt này có thể nằm trong<br /> Khi đó ta có thể viết lại mô hình (5.1) như khoảng giá trị nào.<br /> <br /> 116<br /> 4. VẤN ĐỀ LỰA CHỌN MÔ HÌNH Trong Stata thực hiện các bước như<br /> Chúng ta có thể dựa vào bản chất của sau:<br /> số liệu và mục đích nghiên cứu, cũng có Bước 1: ước lượng mô hình tác động<br /> thể dựa vào các kiểm định thống kê để lựa cố định: quietly xtreg Va vondautu, fe<br /> chọn mô hình. Trong phần này chúng tôi Bước 2: lưu giữ kết quả vừa ước lượng<br /> giới thiệu cách dùng kiểm định thống kê để với một tên nào đó, chẳng hạn là fixed:<br /> lựa chọn giữa mô hình tác động cố định và estimates store fixed<br /> mô hình tác động ngẫu nhiên. Bước 3: ước lượng mô hình tác động<br /> Sự lựa chọn giữa mô hình tác động cố ngẫu nhiên: quietly xtreg Va vondautu, re<br /> định và mô hình tác động ngẫu nhiên được Bước 4: lưu giữ kết quả vừa ước lượng<br /> dựa vào kiểm định Hausman. Ý tưởng của với một tên nào đó, chẳng hạn là random<br /> kiểm định Hausman là như sau: estimates store random<br /> Chúng ta biết rằng nếu ci là không Bước 5: hausman fixed random<br /> tương quan với các biến giải thích trong Thực hiện với số liệu panel2.dta cho<br /> mô hình thì cả hai phương pháp ước lượng kết quả như sau3:<br /> đều cho ra ước lượng vững, do đó chúng ta Trong bảng 7, giá trị xác suất P tương<br /> kỳ vọng là các hệ số ước lượng thu được từ ứng với thống kê quan sát Chi-bình-<br /> hai phương pháp là khá gần nhau. Còn nếu phương (18.31) là 0.0000, do đó chúng ta<br /> ci là có tương quan với biến giải thích thì bác bỏ giả thuyết H0 , trong đó H0 được<br /> ước lượng từ mô hình tác động cố định là hiểu là “mô hình tác động ngẫu nhiên là<br /> ước lượng vững nhưng ước lượng từ mô phù hợp” (do “sự khác biệt trong các hệ số<br /> hình tác động ngẫu nhiên lại là không là không mang tính hệ thống”)<br /> vững, do đó các ước lượng từ hai phương Khi giả thiết H0 trong giả thiết trên bị<br /> pháp sẽ là rất khác nhau. Kiểm định bác bỏ (như trong trường hợp trên) thì<br /> Hausman dựa trên sự khác biệt giữa các hệ chúng ta sẽ lựa chọn mô hình tác động cố<br /> số ước lượng bởi hai phương pháp để đưa định. Và điều này cũng mặc định là có tồn<br /> ra sự lựa chọn mô hình. tại yếu tố không quan sát được ci. Do đó<br /> Kiểm định Hausman: Kiểm định này chúng ta không nhất thiết phải kiểm định<br /> được thực hiện như sau để lựa chọn mô hình tác động cố định hay<br /> H0 : ci không tương quan với uit mô hình OLS gộp.<br /> H1 : ci có tương quan với uit 5. KẾT LUẬN<br /> Thống kê kiểm định là Như vậy, số liệu mảng là một trong<br />  2 qs  (ˆFE  ˆRE )'(VFE  VRE )1 (ˆFE  ˆRE ) những số liệu có nhiều ứng dụng nhất trong<br /> Khi giả thiết H0 là đúng thì thống kê phân tích kinh tế xã hội. Nó có những tính<br /> này tuân theo quy luật Khi bình phương ưu việt hơn hẳn các số liệu khác. Đặc biệt,<br /> với số bậc tự do bằng số hệ số trong mô với số liệu mảng rất phù hợp với bối cảnh<br /> hình trừ đi 1. Do đó nếu thống kê quan sát của các nước đang phát triển trong đó có<br /> lớn hơn giá trị tới hạn thì giả thiết H0 bị Việt Nam.<br /> bác bỏ và mô hình tác động cố định được Phân tích số liệu mảng có nhiều ứng<br /> lựa chọn. dụng và khắc phục được nhiều khuyết điểm<br /> của số liệu và biến số, đặc biệt là khuyết<br /> điểm về biến nội sinh.<br /> <br /> 117<br /> Hy vọng bài báo này sẽ giúp cho bạn và ứng dụng của số liệu mảng.<br /> đọc có một số kiến thức, kỉ năng phân tích<br /> <br /> 6. BẢNG PHỤ LỤC<br /> Bảng 6: Kết quả chạy với phương pháp tác động cố định<br /> Fixed-effects (within) regression Number of obs = 99<br /> Group Variable: id Number of groups = 9<br /> R-sq: within = 0.6005 Obs per group: min = 11<br /> between = 0.9580 avg = 11.0<br /> overall = 0.7846 max = 11<br /> F(1,89) = 133.79<br /> corr(u_i, Xb) = 0.6187 Prob > F = 0.0000<br /> ------------------------------------------------------------------------------<br /> Va | Coef. Std. Err. t P>|t| [95% Conf. InterVal]<br /> -------------+----------------------------------------------------------------<br /> vondautu | 2.325042 .2010121 11.57 0.000 1.925635 2.724449<br /> _cons | 1387131 422746.5 3.28 0.001 547143.2 2227120<br /> -------------+----------------------------------------------------------------<br /> sigma_u | 2813098.8<br /> sigma_e | 3451080.9<br /> rho | .3991995 (fraction of Variance due to u_i)<br /> ------------------------------------------------------------------------------<br /> F test that all u_i=0: F(8, 89) = 4.51 Prob > F = 0.0001<br /> <br /> Bảng 7: Ước lượng với biến giả<br /> i.id _Iid_1-9 (naturally coded; _Iid_1 omitted)<br /> Source | SS df MS Number of obs = 99<br /> -------------+------------------------------ F( 9, 89) = 54.63<br /> Model | 5.8555e+15 9 6.5061e+14 Prob > F = 0.0000<br /> Residual | 1.0600e+15 89 1.1910e+13 R-squared = 0.8467<br /> -------------+------------------------------ Adj R-squared = 0.8312<br /> Total | 6.9155e+15 98 7.0566e+13 Root MSE = 3.5e+06<br /> ------------------------------------------------------------------------------<br /> Va | Coef. Std. Err. t P>|t| [95% Conf. InterVal]<br /> -------------+----------------------------------------------------------------<br /> vondautu | 2.325042 .2010121 11.57 0.000 1.925635 2.724449<br /> _Iid_2 | -3088354 1704009 -1.81 0.073 -6474184 297476.9<br /> _Iid_3 | -3003355 1694827 -1.77 0.080 -6370939 364229.8<br /> _Iid_4 | -3057401 1731784 -1.77 0.081 -6498419 383616.1<br /> _Iid_5 | -2740366 1726771 -1.59 0.116 -6171424 690690.6<br /> _Iid_6 | -2895822 1680662 -1.72 0.088 -6235262 443617.2<br /> _Iid_7 | -2518805 1709622 -1.47 0.144 -5915789 878177.9<br /> _Iid_8 | 5373001 1471949 3.65 0.000 2448269 8297733<br /> _Iid_9 | -3023819 1733673 -1.74 0.085 -6468590 420952<br /> <br /> <br /> 118<br /> _cons | 3048789 1392242 2.19 0.031 282434.8 5815144<br /> <br /> Bảng 8: Kiểm định Hausman<br /> ---- Coefficients ----<br /> | (b) (B) (b-B) sqrt(diag(V_b-V_B))<br /> | fixed random Difference S.E.<br /> -------------+----------------------------------------------------------------<br /> vondautu | 2.325042 2.750478 -.4254356 .099427<br /> ------------------------------------------------------------------------------<br /> b = consistent under Ho and Ha; obtained from xtreg<br /> B = inconsistent under Ha, efficient under Ho; obtained from xtreg<br /> Test: Ho: difference in coefficients not systematic<br /> chi2(1) = (b-B)'[(V_b-V_B)^(-1)](b-B)<br /> = 18.31<br /> Prob>chi2 = 0.0000<br /> <br /> Chú thích:<br /> 1<br /> Bảng kết quả chạy với mô hình tác động cố định (Bảng 6)<br /> 2<br /> Xem bảng kết quả hồi quy theo phương pháp biến giả (Bảng 7)<br /> 3<br /> Xem bảng kết quả Kiểm định Hausman (Bảng 8)<br /> <br /> TÀI LIỆU THAM KHẢO<br /> <br /> <br /> 1. Arthur S.Goldberger, Econometric Theory, John Wiley & Sons,Inc<br /> 2. Brown, M. B., and A. B. Forsythe. (1974). Robust test for the equality of Variances.<br /> Journal of the American Statistical Association 69: 364-367.<br /> 3. Damodar N. Gujarati (1995), Basic Econometric, MacGraw-Hill Inc, Third Ed.<br /> 4. Nguyễn Khắc Minh (2002), Các phương pháp phân tích và dự báo trong kinh tế, Nxb<br /> Khoa học và Kỹ thuật Hà Nội.<br /> 5. Nguyễn Quang Dong (2008), Bài giảng kinh tế lượng, Nxb Giao thông vận tải Hà<br /> Nội.<br /> 6. Jeffrey M. Wooldridge (2002), Econometric Analysis of Cross Section and Panel<br /> Data, The MIT Press Cambridge, Massachusetts London, England<br /> 7. Madala, G.S-macmillan (1992), Introduction of Econometrics. 2d ed., New York.<br /> 8. Greene, W. (2000). Econometric Analysis. Upper Saddle River, NJ: Prentice–Hall.<br /> <br /> <br /> *Ngày nhận bài: 30/6/2014. Biên tập xong: 1/12/2014. Duyệt đăng: 6/12/2014<br /> <br /> <br /> <br /> 119<br />
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2