intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Phân tích dữ liệu và dự báo: Chương 4 - Trường ĐH Quy Nhơn

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:46

14
lượt xem
6
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Phân tích dữ liệu và dự báo: Chương 4 Các mô hình dự báo theo phương pháp box jenkins, cung cấp cho người đọc những kiến thức như: Tính dừng của chuỗi thời gian; Mô hình tự hồi quy AR; Mô hình trung bình động MA; Mô hình ARMA(p,q); Tịnh hóa dữ liệu; Mô hình ARIMA cho dữ liệu có tính mùa vụ; Các bước cơ bản của phương pháp ARIMA. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Bài giảng Phân tích dữ liệu và dự báo: Chương 4 - Trường ĐH Quy Nhơn

  1. CHƯƠNG 4 CÁC MÔ HÌNH DỰ BÁO THEO PHƯƠNG PHÁP BOX-JENKINS
  2. DỰ BÁO THEO PHƯƠNG PHÁP BOX-JENKINS Goal 1 1 Hiểu được khái niệm tính dừng và có thể kiểm định tính dừng của chuỗi thời gian Goal 2 2 Hiểu rõ về các mô hình: AR(p), MA(q), ARMA(p,q), ARIMA(p,d,q) Goal 3 3 Nắm được quy trình thực hiện dự báo bằng phương pháp Box-Jenkins
  3. DỰ BÁO THEO PHƯƠNG PHÁP BOX - JENKINS 1. Tính dừng của chuỗi thời gian 2. Mô hình tự hồi quy AR 3. Mô hình trung bình động MA 4. Mô hình ARMA(p,q) 5. Tịnh hóa dữ liệu 6. Mô hình ARIMA cho dữ liệu có tính mùa vụ 7. Các bước cơ bản của phương pháp ARIMA 3
  4. TÍNH DỪNG CỦA CHUỖI THỜI GIAN Một chuỗi thời gian dừng có các đặc điểm sau đây: 1. Dữ liệu dao động xung quanh một giá trị trung bình cố định trong dài hạn 2. Dữ liệu có giá trị phương sai xác định không thay đổi theo thời gian 3. Dữ liệu có một giản đồ tự tương quan với các hệ số tự tương quan sẽ giảm dần khi độ trễ tăng lên 4
  5. TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Theo ngôn ngữ thống kê, các đặc điểm trên được thể hiện bởi: (𝑌𝑌𝑡𝑡 ) 1. E(𝑌𝑌𝑡𝑡 ) là một hằng số cho tất cả các thời điểm t 𝐸𝐸 𝑌𝑌𝑡𝑡 = 𝜇𝜇, ∀𝑡𝑡 2. Var 𝑌𝑌𝑡𝑡 là một hằng số cho tất cả các thời điểm t 𝑉𝑉𝑉𝑉𝑉𝑉 𝑌𝑌𝑡𝑡 = 𝐸𝐸 𝑌𝑌𝑡𝑡 − 𝜇𝜇 2 = 𝜎𝜎 2 , ∀𝑡𝑡 3. Hiệp phương sai giữa hai giai đoạn chỉ phụ thuộc vào khoảng cách giữa hai giai đoạn 𝑐𝑐𝑐𝑐𝑐𝑐 𝑌𝑌𝑡𝑡 , 𝑌𝑌𝑡𝑡+𝑘𝑘 = 𝐸𝐸 (𝑌𝑌𝑡𝑡 − 𝜇𝜇)(𝑌𝑌𝑡𝑡+𝑘𝑘 − 𝜇𝜇) = 𝛾𝛾𝑘𝑘 , ∀𝑡𝑡 5
  6. TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) YT 4 3 2 Hình bên là ví dụ 1 minh họa cho một 0 chuỗi dừng với -1 trunh bình bằng 0 -2 -3 -4 50 100 150 200 250 300 350 400 450 500 6
  7. TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Hình bên là ví dụ YT 5,200 minh họa cho một 4,800 chuỗi không dừng 4,400 khi trung bình thay đổi 4,000 3,600 3,200 2,800 72 74 76 78 80 82 84 86 88 90 7
  8. TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) YT 3,000 2,500 Hình bên là ví dụ 2,000 minh họa cho một chuỗi không dừng khi cả trung bình 1,500 1,000 và phương sai 500 thay đổi 0 5 10 15 20 25 30 35 40 45 50 55 60 8
  9. TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Kiểm định tính dừng – Giản đồ tự tương quan Hệ số tự tương quan bậc 𝑘𝑘 được xác định bởi công thức � 𝑡𝑡−𝑘𝑘 − 𝑌𝑌) ∑𝑛𝑛𝑡𝑡=𝑘𝑘+1(𝑌𝑌𝑡𝑡 − 𝑌𝑌)(𝑌𝑌 � 𝜌𝜌𝑘𝑘 = (1) ∑𝑡𝑡=1 𝑌𝑌𝑡𝑡 − 𝑌𝑌� 𝑛𝑛 2 Chia cả tử và mẫu trong (1) cho 𝑛𝑛 ta có 𝑐𝑐𝑐𝑐𝑐𝑐(𝑌𝑌𝑡𝑡 , 𝑌𝑌𝑡𝑡−1 ) 𝜌𝜌𝑘𝑘 = (2) 𝑣𝑣𝑣𝑣𝑣𝑣(𝑌𝑌𝑡𝑡 ) Các phương trình (1) và (2) được gọi là hàm tự tương quan, ký hiệu AFC. 9
  10. TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Kiểm định tính dừng – Giản đồ tự tương quan (tt) Thống kê t Cặp giả thuyết 𝐻𝐻0 : 𝜌𝜌𝑘𝑘 = 0 (chuỗi dừng) 𝐻𝐻1 : 𝜌𝜌𝑘𝑘 ≠ 0 Với 𝛼𝛼 xác định, ta xây dựng khoảng tin cậy cho 𝜌𝜌𝑘𝑘 , trong đó 𝑠𝑠𝑠𝑠(𝜌𝜌𝑘𝑘 ) = 1/ 𝑛𝑛. Nếu 𝜌𝜌𝑘𝑘 nằm ngoài khoảng tin cậy tìm được thì ta bác bỏ giả thuyết 𝐻𝐻0 10
  11. TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Kiểm định tính dừng – Giản đồ tự tương quan (tt) Thống kê Q của Ljung – Box Cặp giả thuyết 𝐻𝐻0 : 𝜌𝜌𝑘𝑘 = 0 (chuỗi dừng) 𝐻𝐻1 : 𝜌𝜌𝑘𝑘 ≠ 0 Giá trị thống kê 𝑄𝑄: 𝑄𝑄 = 𝑛𝑛 ∑𝑚𝑚 𝜌𝜌 𝑘𝑘=1 𝑘𝑘 2 Với cỡ mẫu lớn, 𝑄𝑄 có phân phối 𝜒𝜒 2 với bậc tự do bằng số độ trễ. Với 𝛼𝛼 cho trước, nếu giá trị 𝑄𝑄 tính toán lớn hơn giá trị tra tới hạn của 𝜒𝜒 2 thì ta bác bỏ giả thuyết 𝐻𝐻0 . 11
  12. TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Kiểm định tính dừng – Giản đồ tự tương quan (tt) Date: 11/21/21 Time: 17:02 Sample: 1970Q1 1991Q4 Included observations: 88 Ví dụ về giản Autocorrelation Partial Correlation AC PAC Q-Stat Prob 1 2 0.969 0.935 0.969 -0.058 85.462 166.02 0.000 0.000 đồ tự tương 3 4 0.901 0.866 -0.020 -0.045 241.72 312.39 0.000 0.000 quan của một 5 6 0.830 0.791 -0.024 -0.062 378.10 438.57 0.000 0.000 chuỗi không 7 0.752 -0.029 493.85 0.000 dừng 8 0.713 -0.024 544.11 0.000 9 0.675 0.009 589.77 0.000 10 0.638 -0.010 631.12 0.000 12
  13. TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Kiểm định tính dừng – Giản đồ tự tương quan (tt) Ví dụ về giản đồ tự tương quan của một chuỗi dừng 13
  14. TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Kiểm định tính dừng – Kiểm định nghiệm đơn vị Giả sử có phương trình tự hồi quy sau: 𝑌𝑌𝑡𝑡 = 𝜌𝜌𝑌𝑌𝑡𝑡−1 + 𝑢𝑢𝑡𝑡 (−1 ≤ 𝜌𝜌 ≤ 1) hay Δ𝑌𝑌𝑡𝑡 = 𝛿𝛿𝑌𝑌𝑡𝑡−1 + 𝑢𝑢𝑡𝑡 𝛿𝛿 = 𝜌𝜌 − 1 Ta có các giả thuyết: 𝐻𝐻0 : 𝜌𝜌 = 1 (𝑌𝑌𝑡𝑡 là chuỗi không dừng) 𝐻𝐻0 : 𝜌𝜌 < 1 (𝑌𝑌𝑡𝑡 là chuỗi dừng) Hay tương đương: 𝐻𝐻0 : 𝛿𝛿 = 0 (𝑌𝑌𝑡𝑡 là chuỗi không dừng) 𝐻𝐻0 : 𝛿𝛿 < 0 (𝑌𝑌𝑡𝑡 là chuỗi dừng) 14
  15. TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Kiểm định tính dừng – Kiểm định nghiệm đơn vị (tt) Theo Dickey và Fuller, giá trị t ước lượng của hệ số 𝑌𝑌𝑡𝑡−1 có phân phối xác suất 𝜏𝜏 � 𝛿𝛿 Giá trị thống kê: 𝜏𝜏0 = � 𝑠𝑠𝑠𝑠(𝛿𝛿) Nếu |𝜏𝜏0 | lớn hơn giá trị thống kê 𝜏𝜏 tra bảng Dickey-Fuller thì ta bác bỏ giả thuyết 𝐻𝐻0 , tức là 𝑌𝑌𝑡𝑡 là một chuỗi dừng 15
  16. TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Bảng dưới đây là kết quả kiểm định cho chuỗi có giản đồ tương quan trường hợp không dừng ở trên Null Hypothesis: GDP has a unit root Exogenous: Constant, Linear Trend Lag Length: 1 (Automatic - based on SIC, maxlag=10) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -2.215287 0.4749 Test critical values: 1% level -4.068290 5% level -3.462912 10% level -3.157836 16
  17. TÍNH DỪNG CỦA CHUỖI THỜI GIAN (tt) Bảng dưới đây là kết quả kiểm định cho chuỗi có giản đồ tương quan trường hợp chuỗi dừng ở trên Null Hypothesis: D(GDP) has a unit root Exogenous: Constant, Linear Trend Lag Length: 0 (Automatic - based on SIC, maxlag=10) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -6.588446 0.0000 Test critical values: 1% level -4.068290 5% level -3.462912 10% level -3.157836 17
  18. MÔ HÌNH TỰ HỒI QUY - AR - Mô hình tự hồi quy bậc 1 – AR(1) 𝑌𝑌𝑡𝑡 = 𝜙𝜙0 + 𝜙𝜙1 𝑌𝑌𝑡𝑡−1 + 𝑢𝑢𝑡𝑡 (−1 < 𝜙𝜙1 < 1) - Mô hình tự hồi quy bậc 2 – AR(2) 𝑌𝑌𝑡𝑡 = 𝜙𝜙0 + 𝜙𝜙1 𝑌𝑌𝑡𝑡−1 + 𝜙𝜙2 𝑌𝑌𝑡𝑡−2 + 𝑢𝑢𝑡𝑡 (−1 < 𝜙𝜙1 , 𝜙𝜙2 < 1; 𝜙𝜙1 + 𝜙𝜙2 < 1) - Mô hình tự hồi quy bậc p – AR(p) 𝑌𝑌𝑡𝑡 = 𝜙𝜙0 + 𝜙𝜙1 𝑌𝑌𝑡𝑡−1 + 𝜙𝜙2 𝑌𝑌𝑡𝑡−2 + ⋯ + 𝜙𝜙𝑝𝑝 𝑌𝑌𝑡𝑡−𝑝𝑝 + 𝑢𝑢𝑡𝑡 𝑝𝑝 ( ∑𝑖𝑖=1 𝜙𝜙𝑖𝑖 < 1) 18
  19. MÔ HÌNH TỰ HỒI QUY – AR (tt) - Xác định độ trễ 𝑝𝑝 dựa trên giản đồ tự tương quan theo cách sau: ACF sẽ có xu hướng bằng 0 ngay lập tức, trong khi đó hệ số tự tương quan riêng phần PACF sẽ có xu hướng khác 0 một cách có ý nghĩa thống kê cho đến độ trễ 𝑝𝑝 và sẽ bằng 0 ngay sau độ trễ 𝑝𝑝 đó. - 𝑃𝑃𝑃𝑃𝑃𝑃𝐹𝐹𝑘𝑘 đo lường mức độ quan hệ giữa 𝑌𝑌𝑡𝑡 và 𝑌𝑌𝑡𝑡−𝑘𝑘 khi các ảnh hưởng của các độ trễ từ 1 đến 𝑘𝑘 − 1 đã được loại trừ. 19
  20. MÔ HÌNH TỰ HỒI QUY – AR (tt) Date: 11/21/21 Time: 21:11 Sample: 1 75 Included observations: 75 Giản đồ tự Autocorrelation Partial Correlation AC PAC Q-Stat Prob 1 2 -0.528 0.282 -0.528 0.003 21.796 28.068 0.000 0.000 tương quan 3 -0.038 0.155 28.186 0.000 ở bên cho 4 5 0.008 0.144 0.065 0.189 28.191 29.908 0.000 0.000 thấy mô 6 -0.137 0.002 31.488 0.000 hình AR(1) 7 0.147 0.026 33.316 0.000 8 -0.036 0.060 33.428 0.000 là thích hợp 9 0.068 0.084 33.831 0.000 10 -0.150 -0.184 35.841 0.000 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2