intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Toán cao cấp 1: Chương 5c - Nguyễn Văn Tiến

Chia sẻ: Minh Vũ | Ngày: | Loại File: PDF | Số trang:21

32
lượt xem
2
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng "Toán cao cấp 1 - Chương 5c: Hồi quy và tương quan" cung cấp cho người học các kiến thức: Phân tích tương quan, hệ số tương quan, đánh gía hiệp phương sai, kiểm định hệ số tương quan,... Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Toán cao cấp 1: Chương 5c - Nguyễn Văn Tiến

  1. 29/05/2017 CHƯƠNG 5c PHÂN TÍCH TƯƠNG QUAN • Correlation Analysis • Dùng để đo độ mạnh của mối quan hệ tuyến tính giữa hai biến ngẫu nhiên HỒI QUI VÀ TƯƠNG QUAN Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Hiệp phương sai (Covariance) Hệ số tương quan • Cho hai biến ngẫu nhiên X và Y. Hiệp phương sai • Hệ số tương quan của hai biến ngẫu nhiên X, Y của X và Y, ký hiệu cov(X,Y), là kỳ vọng toán của ký hiệu và định nghĩa bởi công thức: tích các sai lệch của các bnn đó và kỳ vọng toán của chúng. cov  X , Y   X ,Y   XY cov  X , Y   E  X -  X Y - Y  • Với hai biến ngẫu nhiên bất kỳ: cov  X , Y   E  XY  -  X Y -1   X ,Y  1 3 4 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Hệ số tương quan mẫu Ví dụ • Với mẫu ngẫu nhiên cỡ n: (Xi, Yi) i=1,2,…,n. Hệ • Số liệu về thời gian quảng cáo trên truyền hình số tương quan mẫu ký hiệu là rX,Y được xác định và lượng sản phẩm tiêu thụ ở một công ty sản như sau: n xuất đồ chơi trẻ em như sau:   x - x  y - y  i 1 i i Thời gian 28 37 44 36 47 35 26 29 33 32 31 28 rX ,Y  n n 2 2 Lượng tiêu thụ 41 32 49 42 38 33 27 24 35 30 34 25   x - x .  y - y  i 1 i i 1 i n • Thời gian: phút/tuần  x y - n.x. y i 1 i i • Lượng tiêu thụ: 1000sp/tuần rX ,Y   n 2 2  n 2 2 • Hãy tính hệ số tương quan mẫu và cho kết luận   xi - nx  .   yi - n y   i 1   i 1  Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 1
  2. 29/05/2017 Ví dụ Đánh giá hiệp phương sai • Đáp số: r=0,63882 • Cov(X,Y)>0: X và Y có xu hướng thay đổi cùng • Kết luận: mối liên hệ tương quan giữa thời gian chiều quảng cáo và số sản phẩm tiêu thụ được là tương quan thuận, ở mức trung bình. • Cov(X,Y)
  3. 29/05/2017 Các bước kiểm định Miền bác bỏ • Phát biểu giả thuyết H0 và đối thuyết H1 Đối thuyết Miền bác bỏ P_value • Xác định mức ý nghĩa 1: ≠0 T  ta n/ -21  p  2 P T  Tqs  • Tính giá trị kiểm định n-2 1: >0 T  ta n -1 p  P T  Tqs  Tqs  r 1- r2 • So sánh với miền bác bỏ 1:
  4. 29/05/2017 Phân tích hồi quy Hàm hồi quy tổng thể • Phân tích hồi quy được sử dụng để xác định • Hàm hồi quy tổng thể mối liên hệ giữa: E Y | X  X i   1   2 X – Một biến phụ thuộc Y (biến được giải thích) Y  1   2 X – Một hay nhiều biến độc lập X1, X2, …,Xn (còn được • Đối với một quan sát cụ thể ta có: gọi là biến giải thích) Yi  1   2 X i  i • Biến phụ thuộc Y phải là biến liên tục • Mô hình chỉ có một biến phụ thuộc Y và một biến giải • Các biến độc lập X1, X2, …, Xn có thể là biến liên thích X. tục, rời rạc hay phân loại. • và gọi là hệ số chặn (intercept) và hệ số góc (slope) của đường thẳng hồi quy. Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Đường hồi quy tổng thể Hàm hồi quy mẫu SRF 700 Hàm hồi quy tổng thể • Ta ít khi có số liệu của cả tổng thể mà chỉ có số Y= b1b2Xi 600 Yi= b1 + b2Xi + i liệu của mẫu (số liệu quan sát được) i 500 • Ta dùng số liệu mẫu để ước lượng tổng thể Tiêu dùng, Y (XD) E(Y/Xi)= b1 + b2Xi 400 • Hàm hồi quy mẫu: 300 Yi  1  2 X i Yi b2 Y = E(Y/Xi) 200 100 b1 • Đối với quan sát thứ i: 0 Xi Y i  1  2 X i  e i 0 100 200 300 400 500 600 700 800 900 Thu nhập khả dụng, X (XD) Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến PRF và SRF PRF và SRF Trong đó Y SRF bˆ 2 • là ước lượng cho b1. PRF b2 •   là ước lượng cho b2. •   là ước lượng cho Y hay E(Y|Xi) b1 bˆ1 • Ta sử dụng phương pháp bình phương nhỏ nhất thông thường (OLS) để tìm   ;   X Hệ số hồi quy trong hàm hồi quy PRF và SRF Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 23 Bài giảng Toán Cao cấp 1 24 Nguyễn Văn Tiến 4
  5. 29/05/2017 Phương pháp OLS Phương pháp OLS • Từ hàm hồi quy mẫu ta có: • Ta lấy đạo hàm theo biến  ;   ta có: ei  y i   y i  y i   1   2x i    SSE   n • Tổng bình phương sai số (Sum of squares for Errors   2  y i   1   2x i  0  – SSE) hay tổng bình phương thặng dư cho n điểm 1 i 1  SSE   dữ liệu : n   2   2  y i   1   2x i x i  0   y  n n SSE  e 2 i  i   1   2x i  2 i 1 i 1 i 1 • Nội dung của phương pháp bình phương bé nhất là tìm các ước lượng sao cho SSE đạt giá trị bé nhất. Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Phương pháp OLS Phương pháp OLS • Ta được hệ phương trình sau: • Để thuận tiện ta ký hiệu như sau: 2  n   n   n    n        y i   1   2x i  0   y i  n  1   2  x i  0  x i      i 1 n  n   i n 1     xi  x   xi  i 1 i 1 S xx  2     n n n       n   y i   1   2x i x i  0  x iy i   1  x i   2  x i  0 2 i 1 i 1   i 1     i 1  n  n   x i    y i  i 1 i 1    x 2 .y  x .xy n n     i 1   x y  xy    1  S xy  x y   i 1   2 i i i i    ny  n   n  x  0       x  y  x2  x i 1 i 1 n   1 2   1 2                 n .xy  n  1 x  n  2 x 2  0     x   2 x 2  xy  1     xy  x .y  • Ta có:  2  S 2    x2  x       2  xy 1  y  2x S xx Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Ví dụ Ví dụ • Quan sát sự biến động của nhu cầu gạo Y • Ta lập bảng sau: Stt Xi Yi XiYi X^2 (tấn/tháng) vào đơn giá X (ngàn đồng/kg) ta 1 1 10 10 1 được các số liệu cho ở bảng. Hãy lập mô hình 2 4 6 24 16 hôi quy mẫu biễu diễn mối phụ thuộc về nhu 3 2 9 18 4 cầu vào đơn giá gạo 4 5 5 25 25 5 5 4 20 25 Xi 1 4 2 5 5 7 6 7 2 14 49 Yi 10 6 9 5 4 2 sum 24 36 111 120 24 36 • Ta có: X 4 Y  6 6 6 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 5
  6. 29/05/2017 Ví dụ Ví dụ • Ta có: • Nhận xét: Yˆi  11,5 - 1,375 . X i n Y X i i - n. X .Y • X và Y có quan hệ nghịch biến 111 - 6.4.6 bˆ2  i 1 n   -1,375 • = 11,5 nên nhu cầu tối đa là 11,5 tấn/tháng 2 2 120 - 6.(4)2 X i 1 i - n.( X ) • = −1,375 nên khi giá tăng 1000 đồng/kg thì bˆ1  Y - bˆ2 X  6 - (-1,375).4  11,5 nhu cầu trung bình sẽ giảm 1,375 tấn/tháng với các yếu tố khác trên thị trường không đổi. Yˆi  11,5 - 1,375 . X i Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Giải hồi quy bằng máy tính Bài tập 1 1. Bật tần số: Shift+Mode+↓ +4+1 (Freq On Thu thập số liệu về điểm học tập của học sinh và 2. Chọn Mode Regression: Mode+3+2(chọn mức thu nhập hàng năm của bố mẹ ta có bảng số A+Bx) liệu sau: 3. Nhập dữ liệu theo cột Xi 45 60 30 90 75 45 105 60 4. Kiểm tra và nhấn AC thoát Yi 8,75 7,5 6,25 8,75 7,5 5,0 9,5 6,5 5. Xem kết quả: Shift +1+ 3,4,5 (tùy theo Sum, Var hay Reg) Hãy tìm hàm hồi quy mẫu và tính các đặc trưng của nó Xi: thu nhập (triệu/năm) Yi: điểm trung bình Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 33 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 34 Ước lượng OLS Ước lượng OLS • Các ước lượng  ;   tìm được gọi là các ước • Từ hàm hồi quy mẫu: Y i  1  2 X i  e i lượng bình phương tối thiểu • Đặt: • Đường thẳng = + gọi là các ước Y i  1  2 X i lượng bình phương tối thiểu. • Gọi giá trị quan sát trung bình của y và trung bình của x là: Ta có: ei  y i    y i  y i   1   2x i  y, x ei là sự khác biệt giữa giá trị thực tế yi • Ứng với xi ta gọi yi là giá trị quan sát thực tế và và giá trị dự đoán theo phương trình hồi quy • là giá trị ước lượng theo đường hồi quy mẫu tuyến tính SRF Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 6
  7. 29/05/2017 Ước lượng OLS Tính chất đường hồi quy mẫu SRF • Một số tính chất: • Ứng với một mẫu cho trước thì các hệ số • A) Tổng bình phương sai số đạt giá trị nhỏ nhất  ;   được xác định duy nhất • Đường hồi quy mẫu SRF đi qua điểm có tọa độ  y  n 2  SSE  i  yi giá trị trung bình x ; y  i 1 • B) Tổng các giá trị thặng dư triệt tiêu. • Giá trị trung bình của các ước lượng bằng giá trị trung bình các quan sát  y  n n  SE   yi  e 0 1 n 1 n  Y  n  Y i i i 1 i 1 i i n i 1 i 1 • SE: Sum of Errors Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Tính chất đường hồi quy mẫu SRF Các tổng bình phương độ lệch • Giá trị trung bình của các phần dư ei bằng 0 • Ta có: n y         y  y i  y  yi  yi e i 0   y  y    y  y    y   2 y  y y  i n 2 n 2 n 2 n    i 1 i i i  yi i i  yi i 1 i 1 i 1 i 1 • Các phần dư ei và không tương quan  y y  y   0 n n • Mà y  e i .Yi  0 i i i i 1 i 1 • Các phần dư ei và Xi không tương quan • Nên ta có:  y   y  n n n 2  y  2 2 n  y  y   yi  e .X i i 0 i 1 i i 1 i i 1 i i 1 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Đo sự biến thiên của dữ liệu a Đo sự biến thiên của dữ liệu b • Tổng bình phương toàn phần (Total Sum of Squares) • Tổng bình phương toàn phần (Total Sum of Squares) n n  y   y  2 2 TSS  i  yi SST  i  yi i 1 i 1 • Tổng bình phương hồi quy (Regression Sum of • Explained Sum of Squares - Bình phương sai số được Squares) giải thích   n 2    n 2 RSS   y i  y i SSE   y i  y i  i 1 i 1 • Tổng bình phương sai số (Error Sum of Squares) • Tổng bình phương sai số (Residual Sum of Squares)  y  n 2  y  n  2 ESS  i  yi SSR  i  yi i 1 i 1 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 7
  8. 29/05/2017 Ý nghĩa các độ đo Tính các độ đo • SST: đo sự biến thiên của các giá trị xung • Ta có: quanh giá trị trung tâm của dữ liệu n  y     e 2  2 2 • SSR: giải thích sự biến thiên liên quan đến mối SST  i  yi  2  xi  x 2 i i 1 quan hệ tuyến tính của X và Y  y  n   2 • SSE: giải thích sự biến thiên của các nhân tố 2 2 SSR  i  yi   2  x i  x khác (không liên quan đến mối quan hệ tuyến i 1 tính của X và Y)  y  n 2 n 2  SSE  i 1 i  yi   e i 1 i Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Tính các độ đo Các tổng bình phương độ lệch  y  n 2  • Ta có: SSE  i  yi Y i 1  x  2 SRF SSR 2 x 2 S2   2   2 X2 i R2  Tổng chênh lệch  y  y  SST 2 SSE SY n Yˆi  y  2 i SST  i  yi i 1 SSR n n Yi  y   x  2 2  y  n 2 i y i x SSR  i  yi 2 2 S Y  i 1 ;S X  i 1 i 1 n 1 n 1 Xi X Ý nghĩa hình học của SST, SSR và SSE Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 46 Hệ số xác định Hệ số xác định • Coefficient of determination • Hệ số xác định của một mô hình hồi quy cho • Là tỷ lệ của tổng sự biến thiên trong biến phụ phép ta đánh giá mô hình tìm được có giải thích thuộc gây ra bởi sự biến thiên của các biến độc tốt cho mối liên hệ giữa biến phụ thuộc Y và lập (biến giải thích) so với tổng sự biến thiên biến độc lập X hay không toàn phần. • Tên gọi: R_bình phương (R squared) • Ký hiệu: 2 SSR R  SST • Dễ thấy: 0  R2  1 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 8
  9. 29/05/2017 Tính chất của hệ số xác định R2 Hệ số xác định điều chỉnhR2 • 0≤ R2≤1 2 n -1 R  1- (1 - R2 ) • Cho biết % sự biến động của Y được giải thích bởi n-k các biến số X trong mô hình. • R2 =1: đường hồi quy phù hợp hoàn hảo • Khi k > 1, R2 < R2. • R2 =0: X và Y không có quan hệ • Do vậy, khi số biến X tăng,R2 sẽ tăng ít hơn R2. • Nhược điểm: R2 tăng khi số biến X đưa vào mô hình tăng, dù biến đưa vào không có ý nghĩa. • Khi đưa thêm biến vào mô hình mà làm choR2 • => Sử dụng R2 điều chỉnh (adjusted R2 -R2) để quyết tăng thì nên đưa biến vào và ngược lại. định đưa thêm biến vào mô hình. Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 49 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 50 Hệ số xác định Hệ số xác định Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Hệ số xác định Các giả thiết của phương pháp OLS • Giả thiết 1: Các giá trị Xi được xác định trước và không phải là đại lượng ngẫu nhiên. • VD: Mẫu 1 Mẫu 2 Chi tiêu Y Thu nhập X Chi tiêu Y Thu nhập X 70 80 55 80 65 100 88 100 90 120 90 120 95 140 80 140 110 160 118 160 115 180 120 180 120 200 145 200 140 220 135 220 155 240 145 240 150 260 175 260 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 54 9
  10. 29/05/2017 Các giả thiết của phương pháp OLS Các giả thiết của phương pháp OLS • Giả thiết 2: Kỳ vọng hoặc trung bình số học của các sai số là bằng 0 (zero conditional mean), nghĩa là E =0 Phương • Giả thiết 3: Các sai số có phương sai bằng nhau sai sai số (homoscedasticity). đồng nhất V = σ2 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 55 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 56 Các giả thiết của phương pháp OLS Các giả thiết của phương pháp OLS • Giả thiết 4: Các sai số không có sự tương quan, nghĩa là Cov( , ) = E( ) = 0, nếu i  j Phương sai sai số không đồng nhất: var(Ui|Xi) = i2 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 57 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 58 Các giả thiết của phương pháp OLS Sai số chuẩn của các ước lượng OLS • Giả thiết 5: Các sai số độc lập với biến giải • Các nhiễu (sai số) của tổng thể có phương thích. Cov( , Xi) = 0 sai: 2 • Giả thiết 6: Đại lượng sai số ngẫu nhiên có phân   V i  phối chuẩn ~ N(0, σ2 ) • Trong thực tế ta không biết được giá trị này nên ta ước lượng bằng ước lượng không chệch của mẫu: 2 ˆ 2  e i  SSE n-2 n-2 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 59 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 10
  11. 29/05/2017 Sai số chuẩn của các ước lượng OLS Tính chất của các ước lượng OLS  ;   là ước lượng điểm của ; tìm được bằng phương pháp OLS có tính chất: Sai số chuẩn của hồi quy: là •  ;   được xác định một cách duy nhất với n 2 ˆ  e i độ lệch tiêu chuẩn các giá trị cặp giá trị quan sát (Xi , Yi) n-2 Y quanh đường hồi quy mẫu •  ;   là các đại lượng ngẫu nhiên, với các mẫu khác nhau, giá trị của chúng sẽ khác nhau • Ta đo lường độ chính xác các ước lượng bằng sai số chuẩn (standard error – se). Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 61 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 62 Tính chất của các ước lượng OLS Sai số chuẩn của các ước lượng OLS • Ta có: 2  x  2 • A)  ;   có phân phối chuẩn. bˆ1  1   SSE  1 x  2 V b 1    n S xx  SE(bˆ1)  .   n - 2  n Sxx   • B) Kỳ vọng và phương sai của  ;   lần lượt là:    2   x    E  1   1     V  1     n 1   2 S xx  bˆ2   V b  2 2 SE(bˆ2 )  SSE /  n - 2   Sxx Sxx     2  E  2   2 V  2  S xx V: phương sai SE: UL sai số chuẩn Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 64 Định lý Gauss-Markov Định lý Gauss-Markov • Định lý: Với những giả thiết (từ 1 đến 5) của mô • Một ước lượng được gọi là “ước lượng không chệch hình hồi quy tuyến tính cổ điển, mô hình hồi quy tuyến tính tốt nhất” (BLUE) nếu thỏa các điều kiện: tuyến tính theo phương pháp bình phương tối – Nó là tuyến tính, có nghĩa là một hàm tuyến tính thiểu là ước lượng tuyến tính không chệch tốt của một biến ngẫu nhiên, nhất, tức là, chúng là BLUE. n – Nó không chệch, bˆ j   kiYi i 1 – Nó có phương sai nhỏ nhất, hay còn gọi là ước lượng hiệu quả (efficient estimator). E ( bˆ )  b j j var( bˆ ) min j Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 65 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 66 11
  12. 29/05/2017 Phân phối của các ước lượng OLS Phân phối của các ước lượng OLS • Ta có: • Tương tự ta có:       2    2   2 ~ N   2 ;   Z 2  2  N 0;1   S xx  2   1   1 ~ t n  2   Z2 S xx  ~ t n  2  t    SSE  2  / n  2   1 x  SSE      n  2   2 SSE  1 2   .    2   n  2   n S xx  2   2   t  ~ t n  2  SSE / n  2  2 S xx Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Khoảng tin cậy của hệ số hồi quy b1 , b2 Khoảng tin cậy của hệ số hồi quy b1 Bài toán: Tìm khoảng ( − ; + ) sao cho Khoảng tin cậy của hệ số b1 xác suất của khoảng ( − ; + ) chứa giá trị thực của bi là 1 - a hay:  1  1 ;  1  1  Trong đó:  -  b  b   1-a Pbi i i i i  SSE  1   2  x   Với: 1  t  /2 n  2  . .    n  2   n S xx     i  ta /2  n - 2  .SE b i   Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 69 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 70 Khoảng tin cậy của hệ số hồi quy b2 Khoảng tin cậy của hệ số hồi quy b1 , b2 Khoảng tin cậy của hệ số b2 • ( − ; + ): là khoảng tin cậy • i : độ chính xác của ước lượng  2  2 ;  2  2  • 1 - a: hệ số tin cậy, • a với (0 < a < 1): là mức ý nghĩa. Trong đó: • ta/2(n-2): giá trị tới hạn (tìm bằng cách tra bảng số t-student) SSE 1 2  t  /2 n  2  . . • n: số quan sát n  2  S xx • Ví dụ: nếu a = 0,05 = 5%, ta đọc “xác suất để khoảng tin cậy chứa giá trị thực của b1 , b2 là 95%. Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 71 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 72 12
  13. 29/05/2017 Khoảng tin cậy của hệ số hồi quy σ2 Khoảng tin cậy của hệ số hồi quy σ2 • Phân phối xác suất của SSE: • Khoảng tin cậy của phương sai sai số tổng thể: SSE ~  2  n - 2  SSE SSE  2  2 ; 2  SSE  a /2   n - 2  1-a /2     n - 2   P  12-a /2  n - 2  2  a2/2  n - 2   1 - a     SSE SSE   P  2 2  2   1-a  a /2   n - 2  1-a /2  n - 2   Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Ví dụ Ví dụ Thu thập số liệu về điểm học tập của học sinh và • Tìm khoảng ước lượng cho các hệ số hồi quy mức thu nhập hàng năm của bố mẹ ta có bảng số với độ tin cậy 95% liệu sau: • Với mức ý nghĩa 5% có thể kết luận thu nhập Xi 45 60 30 90 75 45 105 60 của bố mẹ có ảnh hưởng đến kết quả học tập Yi 8,75 7,5 6,25 8,75 7,5 5,0 9,5 6,5 của con cái không • Tính SSE, SST Hãy tìm hàm hồi quy mẫu và tính các đặc trưng của nó Xi: thu nhập (triệu/năm) Yi: điểm trung bình Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 75 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến KIỂM ĐỊNH GIẢ THUYẾT KIỂM ĐỊNH GIẢ THUYẾT 1. Kiểm định giả thuyết về hệ số hồi quy • Do ei theo phân phối chuẩn, các ước lượng OLS của b1 và b2 cũng theo phân phối chuẩn vì chúng là các hàm số tuyến tính của ei. H 0 : b i  b i* Hai phía: • Chúng ta có thể áp dụng các kiểm định t, F, và H1 : b i  b i* 2 để kiểm định các giả thuyết về các ước Phía phải: H 0 : bi  bi* lượng OLS. H1 : b i  b i* Phía trái: H 0 : bi  b i* H1 : b i  bi* Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 77 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 78 13
  14. 29/05/2017 Kiểm định giả thuyết về hệ số hồi quy Kiểm định giả thuyết về hệ số hồi quy H 0 : b i  b i* ; H 1 : b i  b i* f(t) Cách 1: Phương pháp giá trị tới hạn Bước 1: Tính t bˆ i - b i* t  SE ( bˆ i ) Bước 2: Tra bảng t-student để có ta / 2  n - 2  1-a Bước 3: Quy tắc quyết định a/2 Miền chấp nhận Ho a/2 Nếu t  ta /2  n - 2  bác bỏ H0. Miền bác bỏ Ho Miền bác bỏ Ho -t t Nếu t  ta /2  n - 2  chấp nhận H0. a/2 a/2 -4 -3 -2 -1 0 1 2 3 4 t Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 79 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 80 Kiểm định giả thuyết về hệ số hồi quy Kiểm định giả thuyết về hệ số hồi quy Cách 2: Phương pháp khoảng tin cậy Cách 3: Phương pháp p-value Khoảng tin cậy của bi: Bước 1: Tính ˆ * bi - bi bi  (bˆi -  i ; bˆi   i ) i  ta /2  n - 2 .SE(bˆi ) ti  SE ( bˆ i ) với mức ý nghĩa a trùng với mức ý nghĩa của H0 Bước 2: Tính P (T  t i )  p Quy tắc quyết định Bước 3: Quy tắc quyết định - Nếu bi*  (bˆi -  i ; bˆi   i ) chấp nhận H0 - Nếu p ≤ a: Bác bỏ H0 - Nếu bi  (bˆi -  i ; bˆi   i ) bác bỏ H0 * - Nếu p > a: Chấp nhận H0 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 81 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 82 Kiểm định giả thuyết về hệ số hồi quy Kiểm định giả thuyết về hệ số hồi quy Thực tế H0 đúng H0 sai Quyết định Loại GT H0 H1 Miền bác bỏ Không bác Quyết định đúng, Quyết định sai, xác Hai phía βi = βi* βi ≠ βi* |t|>ta/2 (n-2) bỏ xác suất 1-α suất β (Sai lầm loại 2) Phía phải βi ≤ βi* βi > βi* t > ta (n-2) Phía trái βi ≥ βi* βi < βi* t < -ta (n-2) Quyết định sai, Quyết định đúng, xác Bác bỏ xác suất α suất 1-β (Sai lầm loại 1) Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 83 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 84 14
  15. 29/05/2017 Kiểm định phía phải Kiểm định phía trái f(t) f(t) H0 : βi ≤ βi* H0 : βi ≥ βi* H1 : βi > βi* H1 : βi < βi* 1-a 1-a a a Miền bác bỏ Ho Miền bác bỏ Ho t -t a a 0 t 0 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 t Nguyễn Văn Tiến 86 85 Kiểm định sự phù hợp của mô hình Kiểm định sự phù hợp của mô hình Kiểm định giả thiết H0: R2 = 0 b. Phương pháp p-value (tương đương H0: β2= 0) Bước 2: Tính p-value= p (Fa(1,n-2)>F) với mức ý nghĩa a hay độ tin cậy 1 - a Bước 3: Quy tắc quyết định Bước 1: R 2 (n - 2) - Nếu p ≤ a : Bác bỏ H0 Tính F  2 1- R - Nếu p > a: Chấp nhận H0 a. Phương pháp giá trị tới hạn Bước 2: Tra bảng F với mức ý nghĩa a và hai bậc tự do (1, n-2) Bước 3: Quy tắc quyết định - Nếu F > Fa(1,n-2): Bác bỏ H0 - Nếu F ≤ Fa(1,n-2): Chấp nhận H0 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 87 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 88 Kiểm định sự phù hợp của mô hình DỰ BÁO F • Ta cần dự đoán giá trị của biến phụ thuộc Y ứng với một giá trị cho trước của biến độc lập X, chẳng hạn là Thống kê F X0. • Có hai câu hỏi: • Giá trị thực của Y0 là bao nhiêu • Giá trị trung bình của Y0 là bao nhiêu Miền bác bỏ Ho Miền chấp nhận Ho a=0,05 Fa(1,n-2) Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 90 89 15
  16. 29/05/2017 DỰ BÁO DỰ BÁO • Dựa vào mối quan hệ tuyến tính giữa Y và X thì: Ước lượng khoảng cho giá trị thực của Y0 với độ Y0  b 1  b 2 X 0   0 tin cậy 1 − là: • Trong đó: Y0 là giá trị thực của Y; X0 là giá trị của X và 0 là sai số ngẫu nhiên.  Y0  Yˆ0 -  1 ; Yˆ0   1  • Các hệ số 1; 2 được ước lượng từ mẫu. 0 được ước lượng bằng 0  1  ta / 2  n - 2  .SE (Yˆ0 - Y0 ) • Như vậy ước lượng điểm của Y0 là: 2 Yˆ0  bˆ1  bˆ 2 X 0 1 SE (Yˆ0 - Y0 )   1    x0 - x  n S xx Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 91 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 92 DỰ BÁO Ví dụ 1 Ước lượng khoảng cho giá trị trung bình của Y0 là E (Y / X 0 )  (Yˆ0 -  2 ; Yˆ 0   2 ) Với:  2  ta / 2  n - 2  .SE (Yˆ0 ) a) Tìm đường thẳng hồi quy b) Tìm ước lượng 2 c) Tìm khoảng tin cậy 95% của các hệ số 1; 2 2 d) Tìm khoảng dự đoán 95% tại x=5. SE (Yˆ0 )   1   x - x0  n S xx Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 93 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 94 VÍ DỤ 2 VÍ DỤ 2 Theo số liệu quan sát sự biến động của nhu cầu a.Hãy lập mô hình hồi quy mẫu biễu diễn mối phụ gạo Y (tấn/tháng) vào đơn giá X (ngàn đồng/kg) thuộc về nhu cầu vào đơn giá gạo STT Xi Yi b.Tìm khoảng tin cậy của b1, b2 với a=0,05 1 1 10 c. Hãy xét xem nhu cầu của loại hàng trên có phụ thuộc vào đơn giá của nó không với a=0,05. 2 4 6 d. Có thể nói rằng nếu giá gạo tăng 1.000đ/kg thì 3 2 9 nhu cầu gạo trung bình giảm 2 tấn/tháng không? 4 5 5 Cho với a=0,05 5 5 4 6 7 2 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 95 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 96 16
  17. 29/05/2017 VÍ DỤ 2 VÍ DỤ 2 e. Hãy kiểm định sự phù hợp của mô hình. Cho a. Mô hình hồi quy mẫu biễu diễn mối phụ thuộc về nhu cầu vào đơn giá gạo a=0,05. f. Hãy dự báo nhu cầu trung bình và nhu cầu thực Stt Xi Yi XiYi Xi^2 Yi^2 của loại hàng trên khi đơn giá ở mức 6.000 1 1 10 10 1 100 đồng/kg với độ tin cậy 95%. 2 4 6 24 16 36 g. Hãy viết lại hàm hồi quy nếu nhu cầu gạo được 3 2 9 18 4 81 tính theo đơn vị là tạ và giá có đơn vị là đồng. 4 5 5 25 25 25 h. Tính SST, SSE, SSR, R2 5 5 4 20 25 16 6 7 2 14 49 4 sum 24 36 111 120 262 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 97 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 98 Ví dụ 2 Ví dụ 2 • Ta có: X  Xi24   4; Y Yi 36  6 • Giả sử mô hình hồi quy mẫu dạng: n 6 n 6 2 Yˆi  bˆ1  bˆ 2 X i XY   i i  111 X Y X2    120  20 X • Ta có: n 6 n 6 X Y - X .Y 1 1 1 / 6 - 4 .6 2 bˆ 2  2   - 1, 3 7 5 2   X - X  20 - 4  4 2 X 2 - X   4 Sxx 2   X - X   X - n X   120 - 6.4  24 2 2 2 • Chú ý sinh viên có thể tính bằng CT sau: i i Syy i 2  Y -Y   Y - nY   262 - 6.6  46 i 2 2 2 bˆ 2   XY - n X .Y  1 1 1 - 6 .4 .6  - 1, 3 7 5 X 2 - nX 1 2 0 - 6 .4 2 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Ví dụ 2 VÍ DỤ 2 Như vậy, mô hình hồi quy mẫu • Hệ số 1 ta tính như sau: Yˆi  11,5 - 1,375 . X i  x 2 .y  x .xy 1  => X và Y có quan hệ nghịch biến  2 x2  x *bˆ = 11,5: nhu cầu tối đa là 11,5 tấn/tháng 1 • Hoặc đơn giản hơn: * bˆ 2 = -1,375: khi giá tăng 1000 đồng/kg thì nhu cầu trung bình sẽ giảm 1,375 tấn/tháng với điều kiện bˆ1  Y - bˆ2 X  6 - (-1,375).4  11.5 các yếu tố khác trên thị trường không đổi. Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 102 17
  18. 29/05/2017 Ví dụ 2b Chú ý 1 • Để thuận tiện sinh viên có thể sử dụng công thức sau: • Tìm khoảng tin cậy của b1, b2 với a=0,05 2 2 • Ta có:   Sxx   Xi - X  Xi2 - n X ;  2 2  Y -Y   Y - nY  2 2   ˆ ˆ b1 - 1  b1  b1  1; 1  ta /2  n - 2 . SSE  1 x  .   Syy i i  n - 2  n Sxx  Sxy   X - X Y -Y   XY - nX.Y i i   Sxy b2  SST  Syy SSE 1 Sxx bˆ2 -  2  b2  bˆ2   2 ;  2  ta /2  n - 2 . .  n - 2 Sxx  .S SSR  b 2 SSE  SST - SSR 2 xx Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Chú ý 2 Ví dụ 2b • Để thuận tiện sinh viên có thể sử dụng công thức sau: • Ta có: 2 SSR  2 Sxx SSE SST - SSR  2 SST   Yi - Y    S yy  46 R2   b2 .   SSR  b2  b2 S xx   -1,375 .24  45,375 2 2 2  X  2 SST Syy n-2 n-2 i -X 2 SSE  SST - SSR  0,625    . SE b   X i    1  ta/2  n - 2 .SE b 1 1 SSE 0,625 nSxx ˆ    0,395285 n-2 4 1 SE b2   .   2  ta/2  n - 2 .SE b2   R2  SSR 45,375   0,986413 Sxx SST 46 t0,025  4  2,776 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Chú ý 2 Ví dụ 2b – cách cũ • Vậy: 2 • Do đó:    . SE b  X i  0,625 120  0,360844 1  2,776. 0,625  1 42  .    1,001702717 1 nSxx 4 6.24 4  6 24    2,776*0,360844 1,001703 1  ta/2  n - 2 .SE b1    2  2,776. 0,625 1 .  0,2239875369 4 24 • Vậy:    . 1  0,625 1  0,080687 SE b  2 Sxx 4 24 11,5 -1,0017  b1  11,5  1,0017 2  ta /2  n - 2 .SE b2  2,776*0,080687  0,223988 -1,375 - 0,22399  b2  -1,375  0,22399   Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 18
  19. 29/05/2017 Ví dụ 2c Ví dụ 2c • Hãy xét xem nhu cầu của loại hàng trên có phụ • Giá trị quan sát:: thuộc vào đơn giá của nó không với a=0,05. -1,375 - 0 • Bài toán kiểm định: t qs   -17, 0379 0, 0806 H 0 : b2  0 • Miền bác bỏ:   H 1: b 2  0 Wa  t : t  t0,025  4   2, 776 • Tiêu chuẩn kiểm định: bˆ2 - b 2* • Do t qs  Wa nên bác bỏ H0, chấp nhận H1. t ~ t n - 2 SE ( bˆ2 ) • Nhu cầu trung bình có phụ thuộc vào đơn giá Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Ví dụ 2c, e Ví dụ 2c • Sử dụng kiểm định F để kiểm định hệ số R2 • Giá trị quan sát:: • Bài toán kiểm định: (6 - 2)0,986413 2 Fqs   290,3991  H 0 : R  0 (1 - 0,986413)  2  H 1: R  0 • Miền bác bỏ: • Tiêu chuẩn kiểm định: Wa  F : F  F0,05 1; 4   7, 71 2 ( n - 2) R F ~ F 1; n - 2  • Do Fqs  Wa nên bác bỏ H0, chấp nhận H1. (1 - R 2 ) • Nhu cầu trung bình có phụ thuộc vào đơn giá Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Ví dụ 2d,f,g Ví dụ 2f • d. Có thể nói rằng nếu giá gạo tăng 1.000đ/kg • Ước lượng điểm của nhu cầu khi giá gạo là thì nhu cầu gạo trung bình giảm 2 tấn/tháng X0=6000 không? Cho với a=0,05 Yˆ0  11, 5 - 1, 375.6  3, 25 • f. Hãy dự báo nhu cầu trung bình và nhu cầu • Dự báo giá trị trung bình của Y0: thực của loại hàng trên khi đơn giá ở mức 6.000 E (Y / X  6)  Yˆ0  ta /2  n - 2  .SE (Yˆ0 ) đồng/kg với độ tin cậy 95%. • g. Hãy viết lại hàm hồi quy nếu nhu cầu gạo • Với: được tính theo đơn vị là tạ và giá có đơn vị là  x - x0  2 2 1 0, 625 1  4 - 6  đồng. SE (Yˆ0 )     .   0, 228218 n S xx 4 6 24 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 19
  20. 29/05/2017 Ví dụ 2f Ví dụ 2f • Vậy ta có: • Dự báo giá trị thực của Y0: ta / 2  n - 2  .SE (Yˆ0 )  2, 776 * 0, 228218  0, 633532 Y0  Yˆ0  ta /2  n - 2  .SE (Y0 - Yˆ0 ) • Do đó: • Với: 2 E Y X 0    3, 25 - 0, 6335; 3, 25  0, 6335  1 SE (Y0 - Yˆ0 )   1    x - x0  n S xx E Y X 0    2, 6165; 3,8835  0, 625 1 4 - 6 2 SE (Y0 - Yˆ0 )  . 1   0, 456435 4 6 24 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Ví dụ 2f Ví dụ 3 • Vậy ta có: • Cho số liệu chi tiêu Yi Xi tiêu dùng Y 70 80 ta / 2  n - 2  .SE (Y0 - Yˆ0 )  2, 776 * 0, 456435  1, 267065 65 100 (USD/tuần) và thu 90 120 nhập hàng tuần X 95 140 • Do đó: Y0   3, 25 - 1, 2671; 3, 25  1, 2671 (USD/tuần) của 10 hộ 110 160 Y0  1, 9829; 4, 5171 gia đình. Giả sử X và Y 115 180 có quan hệ tuyến tính 120 200 • Vậy, khi đơn giá là 6.000 đồng/kg ở một tháng trong đó Y là biến phụ 140 220 nào đó thì nhu cầu sẽ dao động từ 2-4,5 tấn. thuộc 155 240 150 260 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Ví dụ 3 VÍ DỤ 2 1. Viết hàm hồi quy Y theo X. Ý nghĩa các hệ số hồi Chạy số liệu trên Eviews, ta có kết quả sau quy 2. Tính khoảng tin cậy của 2. Ý nghĩa của khoảng tin cậy này là gì? Cho độ tin cậy 95%. 3. Nếu thu nhập của hộ gia đình tăng 1 USD/tuần thì chi tiêu trung bình của hộ gia đình có tăng 0.7 USD/tuần không? Cho mức ý nghĩa 5%. 4. Mô hình có phù hợp không? Cho mức ý nghĩa 1%. 5. Dự báo chi tiêu và chi tiêu trung bình của hộ gia đình khi thu nhập là 300 USD/tuần. Cho mức ý nghĩa 5% và X trung bình là 170 USD/tuần. t 0 ,025  8   2, 306 F0 ,01 (1, 8)  11, 26 Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến Bài giảng Toán Cao cấp 1 Nguyễn Văn Tiến 120 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2