intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Thực hành 5: Ngoại suy thống kê (Statistical Inferences)

Chia sẻ: Ngoccuong Ngoccuong | Ngày: | Loại File: DOC | Số trang:22

143
lượt xem
68
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Cùng nắm kiến thức trong bài thực hành 5 "Ngoại suy thống kê (Statistical Inferences)" thông qua việc tìm hiểu các nội dung sau: kiểm định F, kiểm tra độ tin cậy của toàn mô hình, mở rộng mô hình, kiểm định đồng thời một số giả thuyết, mức quảng cáo tối ưu, hồi quy với thông tin bổ trợ, xây dựng mô hình, đa cộng tuyến.

Chủ đề:
Lưu

Nội dung Text: Thực hành 5: Ngoại suy thống kê (Statistical Inferences)

  1. Thöïc Haønh 5: Ngoaïi Suy Thoáng Keâ (Statistical Inferences) I. Kieåm ñònh F: Nhö tronghoài quy ñôn giaûn,ta ñaõduøngkieåmñònht ñeåkieåmñònhgiaûthuyeát vôùi MOÄT giaûthuyeát.Tronghoài quy tuyeántính ña bieán,ta vaãncoù theåduøng kieåmñònht nhötreân.Tuy nhieân,neáuta muoánkieåmñònhgiaûthuyeátvôùi HAI giaûthuyeátÑOÀNG THÔØI trôûleân,ta phaûi duøngkieåmñònhF. Ta xeùttieápví duï veàBig Andy BurgerBarn, ta öôùclöôïng moâhình: Si = β1 + β2Pi + β3Ai + εi Ta coù theå duøng kieåm ñònh t ñeå kieåm ñònh giaû thuyeát H0: β2 = 0 so vôùi H1: β2 ≠ 0. Moät caùch khaùc ñeå kieåm ñònh laø duøng kieåm ñònh F. Neáu giaû thuyeát H0 laø ñuùng thì haøm soá giôùi haïn (töùc laø vôùi β2 = 0) seõ ñöôïc vieát thaønh Si = β1 + β3Ai + εi Kieåm ñònh F so saùnh toång bình phöông sai soá cuûa hai moâ hình : khoâng giôùi haïn vaø coù giôùi haïn. Neáu coù söï khaùc bieät lôùn giöõa hai moâ hình, ta coù theå suy luaän raèng, giôùi haïn ta ñaët ra laø khoâng ñuùng. Giaù trò kieåm ñònh F laø: SSER vaø SSEU laø toång bình phöông soá dö cuûa moâ hình giôùi haïn vaø moâ hình khoâng giôùi haïn laáy töø baûng ANOVA cuûa hai moâ hình. J laø soá löôïng giôùi haïn, töùc giaû thuyeát caàn kieåm ñònh. N laø soá löôïng quan saùt cuûa moâ hình khoâng giôùi haïn vaø K laø soá löôïng bieán ñoäc laäp (keå caû giao ñieåm) trong moâ hình khoâng giôùi haïn. Neáu giaû thuyeát H0 laø ñuùng, F seõ phaân phoái theo phaân phoái FJ/N-K. Trong Excel, ta khoâng coù tieän ích naøo thöïc hieän kieåm ñònh naøy tröïc tieáp. Ta coù theå xaây döïng moät template cho kieåm ñònh naøy nhö sau.
  2. Trong baûng tính treân, ta duøng : • Haøm FINV(a, j, n-k) ñeå tính giaù trò F-quyeát ñònh cuûa pheùp kieåm ñònh • Haøm FDIST(kieåm ñònh F, j, n-k) tính giaù trò p töông öùng vôùi giaù trò F ñöôïc tính toaùn. Trong pheùp kieåm ñònh naøy, ta caàn öôùc löôïng 2 moâ hình: moâ hình khoâng giôùi haïn vaø moâ hình giôùi haïn. Moâ hình khoâng giôùi haïn ta ñaõ öôùc löôïng ôû chöông tröôùc. Trong phaàn naøy, ta tieáp tuïc öôùc löôïng moâ hình giôùi haïn. Ta môû file Andy.xls, tieán haønh Tools/Data Analysis/Regression vôùi chæ 1 bieán ñoäc laäp laø Advert.
  3. Chæ coù Advert Ta coù keát quaû: Ta ñieàn vaøo ñaày ñuû caùc thoâng soá, ta seõ coù:
  4. Giaù trò kieåm ñònh F > giaù trò quyeát ñònh F , giaù trò p < a, ta coù theå keát luaän raèng taïi a = 5%, giaù caû coù aûnh höôûng ñeán toång doanh thu. II. Kieåm tra ñoä tin caäy cuûa toaøn moâ hình: Ta coù theåaùpduïngkieåmñònhF ñeåkieåmtrañoätin caäycuûatoaønmoâhình. Ta coù moâhìnhnhösau: yi = β1 + β2x2 + β3x3 + …βkxk + εi Kieåm tra ñoä tin caäy cuûa toaøn moâ hình laø kieåm tra xem caùc bieán ñoäc laäp coù goùp phaàn giaûi thích y hay khoâng, nghóa laø : H0: β2 = β3 = …=βk = 0 H1: toái thieåu 1 trong soá caùc beta baèng 0 Ta coù theå duøng template ôû treân ñeå kieåm tra moâ hình Andy’s burger barn. Ta tính moâ hình giôùi haïn vôùi khoâng coù bieán ñoäc laäp naøo ngoaøi giao ñieåm.
  5. ôû ñaây, J = 2 vì ta coù 2 giaû thuyeát β2 = β3 = 0 Ta coù theå coù keát quaû töø baûng ANOVA cho kieåm ñònh söï tin caäy cuûa toaøn moâ hình III. Môû roäng moâ hình Khaùi nieämlôïi nhuaänbieângiaûmdaànlaø moätkhaùi nieämquantroïngtrongkinh teávaø ta phaûi löu taâmkhi moâhình hoaùcaùcquanheäkinh teá.Ví duï, trongmoâ hình Andy’s BurgerBarn, ta coù theålaäpluaänraèngvôùi moãi dollar chi phí taêng theâmcho quaûngcaùoseõlaømtaênglôïi nhöngvôùi möùcñoäít daàn,vaøñeánmoät luùc naøoñoù, taêngquaûngcaùoseõkhoângtaêngdoanhsoátheâmnöõa,thaämchí coù theågiaûmlôïi nhuaän.Döïa treânphaântích ñoù, ta coù theåmôûroängmoâhình thaønh: Si = β1 + β2Pi + β3Ai + β4A2 + εi
  6. Trong worksheet chöùa döõ lieäu, ta taïo theâm moät bieán ñoäc laäp teân “ A2” vaø nhaäp coâng thöùc = C2^2 vaøo oâ D2 vaø copy coâng thöùc cho ñeán heát vuøng döõ lieäu. Ta thöïc hieän öôùc löôïng moâ hình môû roäng : Vaø ta coù keát quaû
  7. Ta thaáy, giaù caû P laïi khoâng ñöùng vöõng ôû möùc 5%, nghóa laø giaù caû khoâng aûnh höôûng tôùi doanh soá. Trong khi ñoù, Advert vaø A2 ñeàu ñöùng vöõng ôû möùc 5%. Ñieàu naøy coù nghóa laø, quaûng caùo aûnh höôûng ñeán doanh soá vaø coù bieåu hieän cuûa lôïi nhuaän bieân giaûm daàn. IV. Kieåm ñònh ñoàng thôøi moät soá giaû thuyeát Tieáptheoví duï treân,neáuta muoánkieåmtrahieäuquaûcuûaquaûngcaùo,ta phaûi kieåmtrañoàngthôøi hai giaûthuyeát: H0 : β2 = β4 = 0 ( quaûng caùo hoaøn toaøn khoâng taùc duïng) H1 : toái thieåu 1 heä soá khaùc 0 (quaûng caùo coù taùc duïng) Ta ñaõ coù moâ hình khoâng giôùi haïn, ta seõ tieán haønh öôùc löôïng moâ hình giôùi haïn vôùi : β2 = β4 = 0 tieáp theo, ta coù theå ñieàn thoâng tin caàn thieát vaøo template
  8. Ta loaïi boû giaû thuyeát H0 vaø keát luaän raèng chi phí cho quaûng caùo laø taùc ñoäng leân doanh soá. V. Möùc quaûng caùo toái öu Chuùngta ñaõchöùngtoû raèngquaûngcaùocoù lôïi nhuaänbieângiaûmdaàn.Möùc quaûngcaùotoái öu seõlaø khi lôïi nhuaänbieânbaèngchi phí bieâncuûaquaûngcaùo; nghóalaø möùcquaûngcaùotoái öu seõlaø lôïi ích (doanhsoá)seõbaèngchi phí töø 1 dollar chi phí taêngtheâmcho quaûngcaùo. Giaûi phöông trình treân cho ta A* = (1 – , trong ñoù b3 vaø b4 laø heä 3)/2b4 b soá hoài quy öôùc löôïng, , töùc laø 2014 dollar. Giaû söû Andy muoán kieåm ñònh xem möùc 1900 coù phaûi laø toái öu khoâng, chuùng ta thay 1.9 vaøo giaû thuyeát:
  9. H0 : β3 + 2β4(1.9) =1 H1 : β3 + 2β4(1.9) ≠1 Ta coù theå duøng kieåm ñònh t ñeå kieåm ñònh giaû thuyeát: Tuy nhieân, ta phaûi tính theâm cov(b3, b4). Caùch thöù 2 laø ta duøng kieåm ñònh F; ta öôùc löôïng moâ hình ñaày ñuû vaø moâ hình haïn cheá. Ta coù theå öôùc löôïng moâ hình haïn cheá baèng caùch thay : β3 + 2β4(1.9) =1  β3 = 1 – 3.8β4 vaøo moâ hình goác Si = β1 + β2Pi + β3Ai + β4A2 + εi . Ta seõ coù moâ hình haïn cheá laø S – A = β1 + β2Pi + β4 (A2 – 3.8A) + εi . Keát quaû cuûa moâ hình naøy laø: Ta coù theå copy nhöõng thoâng tin caàn thieát vaø daùn vaøo template ta ñaõ taïo cho F-test.
  10. Keát quaû laø ta khoâng theå phuû nhaän $1900 laø möùc quaûng caùo toái öu ôû möùc ñoä quyeát ñònh 5%. Ta coù theå kieåm tra hai giaû thuyeát cuøng luùc, ví duï, keøm vôùi giaû thuyeát treân laø giaû thuyeát doanh soá laø $80, giaû söû giaù laø $6 H0 : : β3 + 3.8β4 =1 vaø β1 + 6β2 + 1.9β3 + 3.61β4 H1 : toái thieåu moät trong hai giaû thuyeát treân sai. Ôû ñaây, ta coù 2 giôùi haïn, J=2 neân ta phaûi duøng F-test. Moâ hình giôùi haïn ñöôïc thieát laäp baèng caùch thay 2 giôùi haïn vaøo moâ hình goác: S – A – 80 – 1.9 = β2 (Pi -6) + β4 (A2 – 3.8A + 3.61) + εi . Ñeå öôùc löôïng haøm soá treân, ta taïo caùc bieán phuï thuoäc vaø ñoäc laäp môùi töông öùng vaø öôùc löôïng nhö bình thöôøng. Sau khi coù moâ hình giôùi haïn, ta copy nhöõng thoâng tin caàn thieát vaø daùn vaøo template F-test ñaõ taïo ( löu yù K=4 vaø J=2). VI. Hoài quy vôùi thoâng tin boå trôï:
  11. Thoângthöôøngtrongkinh teá,ta seõcoù moätsoáthoângtin veàmoâhìnhngoaøi taäp döõ lieäu.Thoângtin naøycoù theåñeántöø kinh nghieämtrongquaùkhöù,lí thuyeát, …Neáuthoângtin boåtrôï laø chínhxaùcthì ta coù theåtaêngñoächínhxaùccuûamoâ öôùclöôïng. Ñeåminhhoaï, ta nghieâncöùumoâhìnhnhucaàucuûabia (Q) döïa treângiaù(PB), giaùröôïu (PL), giaùcuûahaønghoaùvaødòchvuï khaùc(PR), vaøthunhaäp(I) vôùi döõ lieäutrongtaäptin beer.xls. thoângtin boåtrôï laø khaùchhaøngkhoângbò “aûo giaùctieànteä”,töùclaø khi taátcaûcaùcgiaùcaûvaøthunhaäpcuøngtaêngmoät löôïng gioángnhauthì nhucaàuseõgiöõ nguyeân. Ta coù moâ hình: Ln(Q) = β1 + β2ln(PB) + β3ln(PL) + β4ln(PR) + β5ln(I) + εi Töø thoâng tin boå trôï, ta coù theâm moät giôùi haïn laø b2 + b3 + b4 + b5 =0 . ta seõ ñöa thoâng tin naøy vaøo moâ hình baèng caùch saép xeáp laïi giôùi haïn treân thaønh β4 = - β2 – β3 – β5 vaø thay vaøo haøm soá goác. Ta seõ coù : Ta goïi moâ hình naøy laø moâ hình bình phöông toái thieåu coù giôùi haïn. Keát quaû seõ nhö sau :
  12. Ñeå tính b4, ta thay soá vaøo giôùi haïn b4 = - b2 – b3 – b5 , Moâ hình cuoái cuøng seõ laø : Löu yù : moâ hình log-log seõ cho ta thoâng tin veà « ñoä co daõn » chöù khoâng phaûi laø giaù trò bieân teá nhö moâ hình bình thöôøng. VII. Xaây döïng moâ hình : 1. Boû soùt yeáu toá höõu ích : Neáu baïn boû soùt caùc yeáu toá höõu ích trong moâ hình, moâ hình cuûa baïn seõ bò thieân leäch. Chuùng ta nghieân cöùu ví duï veà gia ñình coù choàng vaø vôï cuøng ñi laøm. Döõ lieäu ñöôïc chöùa trong file edu_inc.xls. Tröôùc tieân, chuùng ta laäp moâ hình hoài quy giöõa thu nhaäp gia ñình (FAMINC) döïa treân trình ñoä cuûa choàng (HE) vaø cuûa vôï (WE). Keát quaû laø :
  13. Tieáp theo, ta thöû boû yeáu toá trình ñoä cuûa vôï (WE) vaø chaïy moâ hình chæ coù trình ñoä cuûa choàng (HE), ta coù : Vaø moät moâ hình khaùc bao goàm WE vaø treû em tröôùc tuoåi ñeán tröôøng KL6 :
  14. Ta thaáy caùc öôùc löôïng cuûa chuùng ta thay ñoåi theo töøng tröôøng hôïp khi ta boû soùt caùc yeáu toá coù lieân quan tôùi moâ hình. 2. Yeáu toá thöøa : Neáu chuùng ta ñöa moät yeáu toá thöøa vaøo moâ hình, caùc öôùc löôïng cuûa chuùng ta vaãn seõ khoâng thieân leäch, tuy nhieân, ñoä chính xaùc cuûa öôùc löôïng seõ bò giaûm xuoáng. Cuï theå laø ñoä leäch chuaån cuûa haøm hoài quy seõ taêng leân. Ví duï, neáu trong moâ hình treân, ta theâm vaøo 2 bieán ñoäc laäp naøo ñoù goïi laø XTRA_X5 vaø XTRA_X6, keát quaû laø :
  15. Ta thaáy hai yeáu toá taêng theâm coù giaù trò P cao, töùc noù khoâng ñöùng vöõng neáu ta tieán haønh kieåm ñònh. Ngoaøi ra, noù laøm taêng ñoä leäch chuaån cuûa moâ hình. 3. Choïn moâ hình : Choïn daïng moâ hình ñuùng laø ñuùng laø raát quan troïng. Ngoaøi caùch duøng lí thuyeát ñeå xaây döïng moâ hình, ta coøn coù theå duøng chính taäp döõ lieäu ñaõ cho ñeå xaây döïng moâ hình. Quy trình nhö vaäy goïi laø RESET (Regression Specification Error Test), trong ñoù ta duøng F-test ñeå kieåm ñònh giöõa moâ hình goác (moâ hình giôùi haïn) vaø moâ hình khoâng giôùi haïn goàm moâ hình goác keøm vôùi daïng bình phöông cuûa noù. Thoâng qua kieåm ñònh, ta coù theå keát luaän lieäu coù theå taêng ñoä chính xaùc cuûa moâ hình baèng caùch ñöa theâm daïng bình phöông vaøo moâ hình. RESET laø moät kieåm ñònh ñôn giaûn vôùi H0 laø moâ hình cuûa baïn ñuùng, vaø H1 laø moâ hình cuûa baïn coøn thieáu soùt. Trong baøi naøy, toâi chæ ñeà caäp ñeán RESET (1), töùc laø moâ hình goác keøm theo daïng bình phöông cuûa noù. Giaû söû ta cho raèng moâ hình sau laø ñuùng : FAMINC = β1 + β2 HE + β3 WE + e
  16. RESET(1) laø ta seõ keøm vaøo moâ hình goác daïng bình phöông cuûa giaù trò döï ñoaùn cuûa bieán phuï thuoäc: FAMINC = β1 + β2 HE + β3 WE + β4 ŷ2 + e Ta coù theå tieán haønh nhö sau: 1. Môû file edu_inc.xls, tieánhaønhöôùclöôïng moâhìnhgiôùi haïn, töùcmoâ hình goác 2. Saukhi ñaõcoù moâhình goácta tính giaùtrò döï ñoaùncuûaFAMINC töø moâ hình giôùi haïn. 3. Ta taïo tieápcoätadjustedyhatvaønhaäpcoângthöùc=I2/10,000tröôùckhi bình phöôngñeåtraùnhcon soáwaùlôùn. 4. Ta taïo coätyhat2vaønhaäpcoângthöùc=J2^2
  17. 5. Sauñoùta öôùclöôïng haømsoáRESET(1) 6. Ta coù keátquaû: Ta thaáydaïngbình phöôngyhat2coù giaùtrò P nhoûhôn 0.05,ta coù theåkeát luaänraèngdaïngbình phöôngcoù theåtaêngñoächínhxaùccuûamoâhình vaøta neânñöadaïngbìnhphöôngvaøomoâhình. Trongtröôønghôïp naøy, ta chækieåmñònhmoätgiaûthuyeátneânta coù theå duønggiaùtrò P hoaëct-test.Trongtröôønghôïp ta muoántheâmdaïnglaäp phöông…., ta seõphaûi kieåmñònhhai giaûthuyeátñoàngthôøi, ta phaûi duøngF- test. VIII. Ña coäng tuyeán Khi hai hoaëcnhieàubieánñoäclaäpcoù quanheächaëtcheõvôùi nhau,ta coù ña coängtuyeán.Phöôngphaùpbìnhphöôngtoái thieåuseõkhoângphaânbieätñöôïc aûnhhöôûngcuûatöøngbieáncuï theå.
  18. Khi ña coängtuyeánseõlaømtaêngñoäleächchuaåncuûaöôùclöôïng vaøseõ khieáncaùcöôùclöôïng trôûneânkhoângvöõngneáuta thöïc hieänkieåmñònh. Khi ta coù moätcaëpbieánñoäclaäphoaëcnhieàuhônlieânheähoaønhaûo,hoài quy seõkhoângcho ta keátquaû.Trongthöïc teá,ta seõkhoânggaëptröôønghôïp lieânheätuyeántính hoaønhaûo,tuy nhieânta vaãnseõgaëpnhöõngmoái lieânheä tuyeántính chaëtcheõñuûñeålaømhaïi moâhình. Do ñoù, tröôùckhi xaâydöïng moâhình, ta phaûi ñaûmbaûocaùcyeáutoácoù möùclieânheätronggiôùi haïn cho pheùp. Ta nghieâncöùuví duï veàquanheägiöõasoádaêmxe ñi ñöôïc vôùi 1 gallon xaêngï (MPG) vaø soápistontrongmaùy.Ta môûtaäpdöõ lieäu cars.xlsvaø thöïc hieän hoài quy nhösau: vaø coù keátquaûnhösau:
  19. Baâygiôø ta theâm2 bieán:dieäntích maùytính theoinch vuoâng(ENG) vaøtroïng löôïng (WGT) Keát quaûcho ta thaáymoái quanheägiöõaMPG vaøCYL raátkhaùc
  20. Giaù trò cuûaCYL raátnhoû,ñoäleächchuaånraátcao, vaøneáuta thöïc hieänt-test thì seõthaáymoái quanheäkhoângñaùngkeå.Ñieàunaøylaø raátphi lí. Tuy nhieân,neáuta kieåmñònhCYL vaøENG cuøngluùc thì seõthaáychuùngcoù moái quanheäñaùngkeåvôùi MPG. Ñaâylaø trieäuchöùngcuûaña coängtuyeángiöõa CYL vaø ENG. Ta coù theåkieåmtratheâmbaèngcaùchtính heäsoáquanheägiöõaCYL vaø ENG. Ta vaøoTools/DataAnalysis/Correlation Ta coù keátquaû
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2