intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Lý thuyết thống kê - Đoàn Hồng Chương

Chia sẻ: Na Na | Ngày: | Loại File: PDF | Số trang:85

175
lượt xem
40
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Lý thuyết thống kê gồm 7 chương. Nội dung bài giảng lần lượt trình bày các vấn đề về các khái niệm cơ bản về thống kê, tóm tắt và trình bày dữ liệu, thống kê mô tả, ước lượng tham số tổng thể, kiểm định giả thuyết về tham số tổng thể, phân tích phương sai một nhân tố, kiểm định phi tham số.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Lý thuyết thống kê - Đoàn Hồng Chương

  1. BÀI GI NG LÝ THUY T TH NG KÊ Đoàn H ng Chương1 1 B môn Toán - TKKT, Đ i h c Kinh T - Lu t
  2. Lý thuy t th ng kê GI I THI U MÔN H C 1. Gi i thi u đ cương • Th ng kê mô t • Hư ng d n s d ng SPSS • Ư c lư ng • Ki m đ nh tham s • Ki m đ nh phi tham s 2. Ki m tra đánh giá • Ki m tra cu i kì: Tr c nghi m (20 câu h i - 60 phút) - T l 100% • Đ m u s g i vào tu n h c cu i. 3. Thông tin liên l c • Email: chuongdh@uel.edu.vn • Blog: www.chuongdh.wordpress.com Trang 1
  3. Lý thuy t th ng kê Chương 1 CÁC KHÁI NI M CƠ B N V TH NG KÊ 1.1 Th ng kê là gì? Đ nh nghĩa 1.1 (STATISTICS). Th ng kê là khoa h c v vi c thu th p, t ch c, trình bày, phân tích và di n gi i các d li u nh m đưa ra nh ng quy t đ nh hi u qu . V m t l ch s , khoa h c th ng kê ra đ i và phát tri n nh : 1. Nhu c u c a nhà nư c v vi c thu th p, x lý và gi i thích các d li u. 2. S phát tri n c a lý thuy t xác su t trong Toán h c. Phân lo i: 1. Th ng kê mô t (DESCRIPTION STATISTICS) là phương pháp t ch c, t ng h p và trình bày các d li u dư i d ng thông tin. 2. Th ng kê suy di n (INFERENTIAL STATISTICS) là phương pháp dùng ư c lư ng các tính ch t c a m t t ng th d a trên m u. Trang 2
  4. Lý thuy t th ng kê 1.2 T ng th và m u Đ nh nghĩa 1.2 (POPULATION). T ng th là t p h p toàn b các cá th ho c s v t đư c nghiên c u. Đ nh nghĩa 1.3 (SAMPLE). M u là m t ph n c a t ng th . S lư ng các ph n t đư c g i là kích thư c m u. Kí hi u: n. 1.3 Các lo i d li u Đ nh nghĩa 1.4 (QUALITATIVE DATA). D li u đ nh tính là lo i d li u ch th hi n tính ch t c a đ i tư ng đư c nghiên c u. Đ nh nghĩa 1.5 (QUANTITATIVE DATA). D li u đ nh lư ng là lo i d li u đư c th hi n dư i d ng các con s . Ví d 1.1. D li u đ nh tính & D li u đ nh lư ng • Gi i tính (Nam, N ), x p lo i (Gi i, Khá, Trung bình...), t l khách hàng hài lòng, x p h ng (Rating). • S ti n trong tài kho n (Balance account), tu i, kh i lư ng c a m t v t, kho ng cách, nhi t đ . Trang 3
  5. Lý thuy t th ng kê 1.4 C p b c d li u Đ nh nghĩa 1.6 (NOMINAL LEVEL DATA). D li u đ nh danh là lo i d li u có các đ c tính sau: • các giá tr đư c chia thành nhóm ho c ph m trù. • gi a các nhóm ho c ph m trù không có s phân bi t th t . Ví d 1.2. Lĩnh v c kinh doanh c a công ty 1. Kinh doanh 2. Tài chính 3. V n t i 4. D ch v Đ nh nghĩa 1.7 (ORDINAL LEVEL DATA). D li u th b c là lo i d li u có các đ c tính sau: • các giá tr đư c chia thành nhóm ho c ph m trù. • gi a các nhóm ho c ph m trù có th s p th t và do đó có th x p h ng các nhóm ho c ph m trù. Ví d 1.3. Student rating of a Prof. Finance1. 1 Doughlas A. Lind, William G. Marchal, and Samuel A. Wathen., "Basic Statistics for Business & Economics", McGraw Hill, Singapore, 2008. Trang 4
  6. Lý thuy t th ng kê Rating Superior Good Average Poor Inferior Frequency 6 28 25 12 3 Đ nh nghĩa 1.8 (INTERVAL LEVEL DATA). D li u kho ng là lo i d li u có các đ c tính sau: • các giá tr có th so sánh và th c hi n đư c các phép tính s h c. • đi m g c 0 c a lo i d li u này ch mang tính tương đ i. Ví d 1.4. Nhi t đ , c giày, c qu n áo là các d li u kho ng. Đ nh nghĩa 1.9 (RATIO LEVEL DATA). D li u t l là lo i d li u có các đ c tính sau: • các giá tr có th so sánh và th c hi n đư c các phép tính s h c • đi m g c 0 và t l gi a các giá tr c a lo i d li u này th c s có ý nghĩa. Ví d 1.5. Father-son income combinations2 2 Doughlas A. Lind, William G. Marchal, and Samuel A. Wathen., "Basic Statistics for Business & Economics", McGraw Hill, Singapore, 2008. Trang 5
  7. Lý thuy t th ng kê Name Father Son Lahey $80000 $40000 Nale $90000 $30000 Rho $60000 $120000 Steele $75000 $130000 1.5 K thu t ch n m u 1. Ch n m u ng u nhiên đơn gi n (PROBABILITY SAMPLING): là cách ch n ng u nhiên n ph n t b t kì t N ph n t c a t ng th . Các bư c ti n hành • L p danh sách s p th t các đơn v c a t ng th . • Th c hi n l y m u b ng cách b c thăm, quay s ho c s d ng ph n m m máy tính ch n ng u nhiên. 2. Ch n m u ng u nhiên h th ng (SYSTEMATIC SAMPLING): là cách ch n ng u nhiên n ph n t t N ph n t c a t ng th theo các bư c sau • L p danh sách và đánh s th t các ph n t c a t ng th . Trang 6
  8. Lý thuy t th ng kê • Xác đ nh c m u n. • Xác đ nh kho ng cách ch n m u k theo công th c N N n , n u n < 0, 5; k= N N n + 1, n u n ≥ 0, 5. • Trong k ph n t đ u tiên c a t ng th , ch n ng u nhiên 1 ph n t . Ph n t đư c ch n ti p theo cách ph n t đ u tiên k v trí và c th ti p t c ch n đ n ph n t cu i cùng c a m u. N Ví d 1.6. Gi s t ng th bao g m N=13, kích thư c m u n=4. Vì = 3, 25 n nên k = 3. Khi đó ta ch n m u theo t c: • Ch n ng u nhiên m t ph n t trong 3 ph n t đ u tiên. • Ph n t ti p theo đư c ch n cách ph n t đ u tiên 3 v trí. Công vi c trên đư c mô t qua sơ đ sau (ô vuông màu đen th hi n ph n t đư c ch n c a m u) Trang 7
  9. Lý thuy t th ng kê N Ví d 1.7. Gi s t ng th bao g m N=10, kích thư c m u n=6. Vì = 1, 67 n nên k = 2. Khi đó ta ch n m u theo t c: • Ch n ng u nhiên m t ph n t trong 2 ph n t đ u tiên. • Ph n t ti p theo đư c ch n cách ph n t đ u tiên 2 v trí. Công vi c trên đư c mô t qua sơ đ sau (ô vuông màu đen th hi n ph n t đư c ch n c a m u) Lưu ý. Trong trư ng h p này, chúng ta ch ch n đư c m u có kích thư c n = 5. 3. L y m u phân t ng (STRATIFIED SAMPLING) đư c s d ng khi có s khác bi t l n v tính ch t gi a các ph n t c a t ng th . Khi ch n m u phân t ng, chúng ta c n lưu ý 2 v n đ : • phân t ng theo đ c đi m gì? • phân b s lư ng m u trong các t ng. Trang 8
  10. Lý thuy t th ng kê Chương 2 TÓM T T VÀ TRÌNH BÀY D LI U 2.1 B ng phân ph i t n s , t n su t, t n s tích lũy và t n su t tích lũy Đ nh nghĩa 2.1. FREQUENCY-RELATIVE FREQUENCY • T n s ni là s l n xu t hi n c a giá tr quan sát Xi. • T n su t fi là t l xu t hi n c a giá tr quan sát Xi. Ví d 2.1. B ng t n s , t n su t v nhi t đ trung bình c a 18 ngày mùa đông (tính b ng đ 0F ) t i m t vùng: Nhi t đ Xi (0F ) T n s ni T n su t fi 12 2 11,11% 15 3 16,67% 17 4 22,22% 18 4 22,22% 20 3 16,67% 21 2 11,11% Trang 9
  11. Lý thuy t th ng kê Đ nh nghĩa 2.2 (CUMULATIVE FREQUNECY). T n s tích lũy Si đư c xác đ nh b i công th c Si = n1 + n2 + . . . + ni (2.1) Đ nh nghĩa 2.3 (CUMULATIVE RELATIVE FREQUENCY). T n su t tích lũy Fi đư c xác đ nh b i công th c F i = f 1 + f 2 + . . . + fi (2.2) Ví d 2.2. B ng t n s tích lũy, t n su t tích lũy c a ví d (2.1) là Nhi t đ Xi (0F ) T n s ni T n su t fi T n s tích lũy Si T n su t tích lũy Fi 12 2 11,11% 2 11,11% 15 3 16,67% 5 27,78% 17 4 22,22% 9 50,00% 18 4 22,22% 13 72,22% 20 3 16,67% 16 88,89% 21 2 11,11% 18 100,0% Trang 10
  12. Lý thuy t th ng kê Ví d 2.3. Năng su t lúa (t /ha) c a 50 h dân t i m t đ a phương đư c cho như sau 35 41 32 44 33 41 38 44 43 42 30 35 35 43 48 46 48 49 39 49 46 42 41 51 36 42 44 34 46 34 36 47 42 41 37 47 49 38 41 39 40 44 48 42 46 52 43 41 52 43 Hãy l p b ng phân ph i t n s , t n su t, t n s tích lũy, t n su t tích lũy c a d li u trên. 2.2 Bi u đ c t Trang 11
  13. Lý thuy t th ng kê 2.3 Histogram Đ nh nghĩa 2.4. Đ th phân ph i t n s (Histogram) là m t d ng bi u đ c t trong đó di n tích c a m i c t t l v i t n s c a các giá tr Xi. Ví d 2.4. Cho b ng t n s v nhi t đ c a m t vùng như sau: Nhi t đ Xi (0F ) 12-15 15-18 18-24 24-27 T n s ni 2 5 12 2 Khi đó Histogram c a d li u này là Trang 12
  14. Lý thuy t th ng kê 2.4 Bi u đ hình tròn 2.5 Bi u đ thân và lá Bi u đ thân và lá là công c h u hi u đ tóm t t và trình bày d li u mà v n giúp ngư i xem th y đư c cách th c phân tán d li u g c m t cách chi ti t. Qui t c l p bi u đ này là d li u đ nh lư ng dư i d ng nh ng con s s đư c tách thành 2 ph n: thân và lá. Các ch s bên ph i c a d li u đóng vai trò là lá; các ch s bên trái đóng vai trò là thân. Trang 13
  15. Lý thuy t th ng kê Ví d 2.5. Xét d li u v đ tu i c a m t nhóm nhân viên trong công ty A như sau 28 23 30 24 19 21 39 22 22 Bi u đ thân và lá c a d li u trên là 1 9 2 122348 3 09 2.6 Phân t /nhóm d li u Đ nh nghĩa 2.5. Công th c phân t d li u • Cho m t m u có kích thư c là n. S t /nhóm d li u đư c xác đ nh b i công th c sau: √3 k 2n. (2.3) • Đ r ng m i t Xmax − Xmin h . (2.4) k Trang 14
  16. Lý thuy t th ng kê Nh n xét 2.1. Các đi u ki n phân t • Các t ph i r i nhau. • Các t đư c phân chia ph i đ y đ (nghĩa là ph h t toàn b các giá tr c a d li u). • Không đư c có t là t p r ng. Ví d 2.6. Hãy th c hi n phân t cho ví d (2.3) và l p b ng t n s tương ng. Đáp s . √ Vì 3 100 = 4, 64 nên s t k = 5. Xmax − Xmin Đ r ng m i t : h = = 4, 4 5 k Năng su t lúa (t n/ha) T n s ≤35 8 35-40 8 40-45 19 45-50 12 50-55 3 Trang 15
  17. Lý thuy t th ng kê Chương 3 TH NG KÊ MÔ T 3.1 S trung bình Đ nh nghĩa 3.1 (Trung bình t ng th ). Gi s t ng th Ω có N ph n t . Khi đó giá tr N Xi i=1 µ= , (3.1) N đư c g i là trung bình t ng th . Đ nh nghĩa 3.2 (Trung bình m u). Gi s m u có kích thư c là n. Khi đó giá tr n xi i=1 X= , (3.2) n đư c g i là trung bình m u. Ví d 3.1. Tính giá tr trung bình c a m u s li u đư c cho như sau Trang 16
  18. Lý thuy t th ng kê Tu i 19 23 25 30 45 T ns 2 4 5 3 2 Gi i. 19.2 + 23.4 + 25.5 + 30.3 + 45.2 X= = 27, 1875 2+4+5+3+2 Ví d 3.2. Tính giá tr trung bình c a m u s li u đư c cho như sau Năng su t lúa (t n/ha) 30-35 35-40 40-45 45-50 50-55 T ns 8 8 19 12 3 Gi i. Trư c tiên chúng ta tính các giá tr đ i di n c a m i nhóm theo công th c xα + xβ ai = . (3.3) 2 Khi đó ta có b ng t n s Năng su t lúa (t n/ha) 32,5 37,5 42,5 47,5 52,5 T ns 8 8 19 12 3 Trang 17
  19. Lý thuy t th ng kê Khi đó giá tr trung bình m u 32, 5.8 + 37, 5.8 + 42, 5.19 + 47, 5.12 + 52, 5.3 X= = 41, 9. 8 + 8 + 19 + 12 + 3 3.2 S y u v - Mode Đ nh nghĩa 3.3 (Trư ng h p d li u nh n giá tr r i r c). Mode là giá tr xu t hi n nhi u l n nh t trong dãy s li u. Kí hi u là ModX ho c X0. Ví d 3.3. Cho b ng s li u S nhân kh u xi 1 2 3 4 5 6 ≥ 7 S gia đình ni 10 30 75 45 20 15 5 Khi đó ModX = 3. Đ nh nghĩa 3.4 (Trư ng h p d li u d ng phân t đ u nhau). Giá tr c a ModX đư c xác đ nh g n đúng theo công th c fM o − fM o−1 ModX = L + h. , (3.4) (fM o − fM o−1) + (fM o − fM o+1) Trang 18
  20. Lý thuy t th ng kê trong đó L là gi i h n dư i c a nhóm ch a Mode, h là kho ng cách c a nhóm ch a Mode, fM o là t n s c a nhóm ch a Mode, fM o−1, fM o+1 là t n s c a nhóm đ ng trư c và đ ng sau nhóm ch a Mode. Ví d 3.4. Cho b ng s li u v nhi t đ trung bình trong ngày m t vùng trong 60 ngày. Nhi t đ xi (0C) 15-18 18-21 21-24 24-27 27-30 30-33 ≥ 33 T n s ni 5 7 8 10 14 11 5 Khi đó nhóm ch a Mode là nhóm có nhi t đ trung bình trong kho ng 27 − 30 0C. Giá tr g n đúng c a 14 − 10 201 ModX = 27 + 3. = 28, 71. (14 − 10) + (14 − 11) 7 Đi u này có nghĩa là đa s các ngày, nhi t đ trung bình là 28,710C. 3.3 S trung v - Median Trang 19
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2