Nghiên cứu marketing part 8

Chia sẻ: Pham Duong | Ngày: | Loại File: PDF | Số trang:20

Thêm vào BST

Báo xấu

83
lượt xem 20
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tính hệ số quan sát, so sánh với Wα và kết luận . Ví dụ: Kiểm tra chiều dài trung bình của một chi tiết được chế tạo từ hai thiết bị khác nhau một cách ngẫu nhiên, ta có : mẫu ngẫu nhiên 15 chi tiết của thiết bị thứ nhất có chiều dài trung bình là 100 cm và độ lệch chuẩn hiệu chỉnh là 5 cm ; mẫu ngẫu nhiên 10 chi tiết của thiết bị thứ hai có chiều daì trung bình là 110 cm và độ lệch chuẩn hiệu chỉnh là 3cm. ...

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Nghiên cứu marketing part 8

Nếu H1 đúng tức µx - µy > D0, khi đó Wα: x − y − D0 btd Tα T= > ,2 ,2 s s y + x nx ny Nếu H1 đúng tức µx - µy < D0, khi đó Wα: x − y − D0 T= < − Tαbtd '2 '2 s s x y + nx ny Nếu H1 đúng tức µx - µy ≠ D0, khi đó Wα: x − y − D0 T= < − T αbtd '2 '2 s s 2 x y + nx ny Tính hệ số quan sát, so sánh với Wα và kết luận . Ví dụ: Kiểm tra chiều dài trung bình của một chi tiết được chế tạo từ hai thiết bị khác nhau một cách ngẫu nhiên, ta có : mẫu ngẫu nhiên 15 chi tiết của thiết bị thứ nhất có chiều dài trung bình là 100 cm và độ lệch chuẩn hiệu chỉnh là 5 cm ; mẫu ngẫu nhiên 10 chi tiết của thiết bị thứ hai có chiều daì trung bình là 110 cm và độ lệch chuẩn hiệu chỉnh là 3cm. Với mức ý nghĩa α = 0,05, hãy kết luận xem kích thước trung bình của chi tiết trên được chế tạo ở hai thiết bị trên có như nhau hay không. Biết chiều dài trung bình của chi tiết trên là đại lượng ngẫu nhiên phân phối chuẩn. Giải: Áp dụng phương pháp kiểm định sự khác biệt giữa hai trung bình tổng thể theo luật phân phối chuẩn (chưa biết σ và nx, ny
25 92 + ( ) 15 10 = = 22 , 84 btd 25 2 92 ( ) ( ) 15 + 10 14 9 Minh họa bằng hình vẽ: -6,242 -2,074 2,074 Miền bác bỏ Miền bác bỏ Kết luận: kqs ∈ Wα, ta bác bỏ giả thiết H0 và chấp nhận đối thuyết H1, nghĩa là chiều dài trung bình của chi tiết được chế tạo ở hai thiết bị trên là khác nhau. Hai biến (mẫu) phối hợp từng cặp Điều kiện áp dụng: Khi tiến hình so sánh sự khác nhau giữa trung bình hai tổng thể, hai mẫu cần thỏa mãn điều kiện là dữ liệu phải tuân theo quy luật phân phối chuẩn và phương sai của hai mẫu phải bằng nhau. B1. Giả thuyết và đối thuyết: Đối xứng Phải Trái H0: µx - µy = D0 H1: µx - µy ≤ D0 H0: µx - µy ≥ D0 Giả thiết H1: µx - µy ≠ D0 H1: µx - µy > D0 H1: µx - µy < D0 Đối thiết B2. Lựa chọn mức ý nghĩa α B3. Lựa chọn phương pháp kiểm định: Phương pháp kiểm định sự khác nhau trung bình của hai tổng thể (mẫu phối hợp từng cặp), chúng ta dùng bảng phân phối chuẩn (nếu mẫu lớn hơn hoặc bằng 30) hay phân phối T-student (nếu mẫu nhỏ hơn 30) B4. Tiêu chuẩn kiểm định ( x − D0 ) n với x và s’d là trung bình và độ lệch chuẩn của n khác biệt. K≡D= s'd B5. Miền bác bỏ với α cho trước: ( x − D0 ) n Nếu H0 : µx - µy > D0, khi đó Wα: T= > U1-α (hoặc -T(n-1);α nếu n
KIỂM ĐỊNH THAM SỰ KHÁC NHAU HAI TRUNG BÌNH TỔNG THỂ (dựa trên sự phân phối từng cặp) 1. Giả thiết và đối thiết: Đối xứng Phải Trái µx - µy =D0 µx - µy ≤ D0 µx - µy ≥ D0 Giả thiết H0: H0: H0: µx - µy ≠ D0 µx - µy > D0 µx - µy < D0 Đối thiết H1: H1: H1: 2. Xác định mức ý nghĩa 3. Phương pháp kiểm nghiệm sự khác nhau của hai trung bình tổng thể - Bảng phân phối chuẩn hoặc T-student (nếu n
Với mức ý nghĩa α=0,05, có thể kết luận chiến dịch khuyến mãi đã làm tăng doanh số hay không? Giải: Gọi µx , µy lần lượt là doanh số trung bình sau và trước khi thực hiện chiến dịch khuyến mãi, µx , µy là đại lượng ngẫu nhiên tuân theo quy luật phân phối T-student (vì n=15 0 H1: B2. Mức ý nghĩa α=0,05. B3. Phương pháp kiểm định: Kiểm định sự khác nhau giữa hai trung bình của tổng thể (hai mẫu phối hợp từng cặp). B4. Tính giá trị kiểm định: ( x − D0 ) n với x và s’d là trung bình và độ lệch chuẩn của n khác biệt. k qs ≡ D = s 'd Từ số liệu trên, ta tính được x =-1,2 và s’d = 5,78. Khi đó Kqs sẽ là: (x − D0 ) n − 1, 2 15 k qs = = = − 0 ,803 ' sd 5 , 78 B4. Miền bác bỏ và kết luận: (x − D 0 ) n Với H1: µx - µy > 0, khi đó Wα : T = >T(n-1);α = T(14),0,05 = 1,761 s' d Minh họa bằng hình vẽ: 1,761 -0,803 Miền bác bỏ Kết luận: vì kqs không thuộc Wα nên chưa có cơ sở để bác bỏ giả thiết H0 và chấp nhận giả thuyết đối H1 ở mức ý nghĩa α=0,05, hay chiến dịch khuyến mãi của công ty vẫn chưa làm tăng doanh số. Kiểm định sự khác nhau giữa trung bình từ hai mẫu trở lên – Phân tích ANOVA (Gồm một biến định lượng và một biến phân loại (biến định tính)) Mục tiêu của phân tích phương sai là so sánh trung bình của nhiều tổng thể dựa trên các trung bình mẫu, đây là hình thức mở rộng của kiểm định T-student. Trong trường hợp biến phân loại có nhiều hơn 2, chúng ta thường sử dụng phân tích phương sai (ANOVA – Analysis of variance). Tại sao vây?, bởi vì khi sử dụng kiểm định t đối với hai mẫu độc lập, trong trường hợp biến phân loại có 3 hoặc nhiều hơn 3 nhóm, chúng ta phải thực hiện rất nhiều cặp (k) so sánh lẫn nhau từng đôi một, điều này dẫn đến một tình trạng là sai số của kiểm định sẽ lớn hơn rất nhiều so với mong muốn ban đầu. Ví dụ, mỗi một kiểm định Z hay t (kiểm định sự khác nhau tham số trung bình giữa hai mẫu độc lập) chứa đựng một sai số dạng I, tổng sai số của dạng I đối với k đôi giá trị trung bình bằng I=1-(1 - α)k. Trong một trường hợp cụ thể, giả sử chúng ta có một biến phân loại 147
với 5 giá trị lựa chọn và α = 0,05, khi đó chúng ta sẽ có 10 so sánh nếu chúng ta dùng phương pháp kiểm định t. Sai số dạng I của kiểm định t khi đó sẽ là: I =1 – (1- α)k = 1- (1-0,05) = 1-(0,95)10 = 0.40 Trong trường hợp này, sai số để chúng ta bác bỏ giả thuyết H0 về bằng nhau của các giá trị trung bình ngay cả khi H0 đúng là 40% chứ không phải là 5% như ban đầu. Các điều kiện sử dụng: Các mẫu được rút ra theo cách ngẫu nhiên và độc lập (điều kiện này phải được đảm bảo), các tổng thể có phân phối chuẩn (hoặc gần phân phối chuẩn) và các tổng thể có cùng phương sai. Phân tích phương sai một chiều: (One-Way Analysis of Variance) Phân tích phương sai một chiều là phân tích dựa trên ảnh hưởng của một nhân tố định lượng đến một nhân tố định tính (dạng phân loại). Giả sử từ một biến phân loại, chúng ta có thể chia tổng thể thành k nhóm tuân theo quy luật phân phối chuẩn và có phương sai bằng nhau dựa trên k mẫu ngẫu nhiên độc lập gồm n1, n2,..., nk quan sát. Gọi xij là giá trị của biến định lượng đang nghiên cứu tại quan sát thứ j của nhóm thứ I, khi đó, x 1 , x 2 ,…, x k là giá trị trung bình của các nhóm, x là trung bình chung của tất cả các nhóm theo biến định lượng đang nghiên cứu. Gọi giá trị trung bình của các nhóm trong tổng thể là µ1, µ2,…, µk thì phương pháp phân tích phương sai sẽ cho phép chúng ta so sánh sự khác nhau giữa tham số trung bình của 2 hay nhiều nhóm có trong mẫu để suy rộng lên tổng thể. B1. Giả thiết và đối thiết trong phân tích phương sai một chiều được phát biểu như sau: H0: µ1= µ2 =… = µk H1: Tồn tại ít nhất một giá trị trung bình của nhóm thứ I (µi) khác với ít nhất một giá trị trung bình của nhóm còn lại. B2. Lựa chọn mức ý nghĩa α B3. Bài toán phân tích phương sai một chiều (One-way ANOVA). B4. Tính tiêu chuẩn kiểm định Để tính tiêu chuẩn kiểm định trong phân tích phương sai (ANOVA), chúng ta cần tiến hành tính các chỉ tiêu sau: - Tổng độ lệch bình phương giữa các nhóm (Sum of squares between groups): phản ánh biến thiên của biến định lượng đánh nghiên cứu do tác động của biến phân loại đang xem xét k SSG = ∑ ( x − x i ) 2 i =1 - Tổng độ lệch bình phương trong nội bộ nhóm (Sum of squares within groups) phản ánh biến thiên ngẫu nhiên do ảnh hưởng của các yếu tố khác không xem xét ở mẫu. ni k SSW = ∑ ∑ ( x ij − x i ) 2 i =1 j =1 - Tổng các độ lệch bình phương toàn bộ (Total sum of squares): phản ánh toàn bộ biến thiên của biến định lượng đang nghiên cứu. 148
ni k SST = ∑ ∑ ( xij − x) 2 hay SST = SSW + SSG. i =1 j =1 - Phương sai giữa các nhóm (Mean squares between groups): SSG MSG = k −1 - Phương sai trong nội bộ các nhóm (Mean squares within groups): SSW MSW = n−k Lúc đó tiêu chuẩn kiểm định F (Fisher) được tính bằng: MSG F= MSW Chúng ta có thể tóm gọn cách tính thông qua bảng sau: ANOVA Sum of Squares df Mean Square F Sig. SSG k Between MSG SSG = ∑ ( x − x i ) 2 MSG = F= k-1 P(F) Groups k −1 MSW i =1 ni SSW k Within SSW = ∑ ∑ ( xij − x i ) 2 MSW = n-1 Groups n−k i =1 j =1 ni k SST = ∑ ∑ ( x ij − x ) 2 Total i =1 j =1 (SST=SSG+SSW) B5. Miền bác bỏ: Với α cho trước, chúng ta bác bỏ H0 nếu F>Fk-1,n-k,α với k-1 là bậc tự do của tử số và n-k là bậc tự do của mẫu số. Ví dụ: Công ty A là công ty chuyên phân phối bột giặt cho thị trường Thành phố Đà Nẵng, hiện tại công ty phân phối đến khách hàng thông qua 4 của hàng 1, 2, 3, 4. Để đưa ra những quyết định marketing phù hợp, công ty muốn xem xét có sự khác nhau trong doanh số bán của các cửa hàng hay không, số liệu thu thập trong một năm tại các cửa hàng được thể hiện ở bảng sau: ĐVT: triệu đồng Cửa hàng số 1 Cửa hàng số 2 Cửa hàng số 3 Cửa hàng số 4 Tháng 1 120 123 112 119 Tháng 2 123 143 127 134 Tháng 3 134 132 156 245 Tháng 4 123 153 176 256 Tháng 5 132 143 145 364 Tháng 6 111 164 204 373 Tháng 7 176 174 275 367 Tháng 8 192 184 284 283 149
Tháng 9 145 142 195 293 Tháng 10 133 165 143 274 Tháng 11 126 102 134 246 Tháng 12 138 123 127 234 B1. Giả thuyết và đối thiết: H0: Doanh số bán trung bình hàng tháng của các cửa hàng là bằng nhau (µ1=µ2=µ3=µk) H1 : Tồn tại ít nhất một cửa hàng có doanh số bán khác với ít nhất một cửa hàng còn lại. B2. Mức ý nghĩa α=0,05 B3. Phương pháp kiểm định : Thực hiện phương pháp phân tích phương sai một chiều. B4. Tính tiêu chuẩn kiểm định : - Doanh số trung bình của cửa hàng số 1: 137,75 triệu - Doanh số trung bình của cửa hàng số 2: 145,67 triệu - Doanh số trung bình của cửa hàng số 3: 173,17 triệu - Doanh số trung bình của cửa hàng số 4: 265,67 triệu - Doanh số trung bình của hàng tháng của công ty là 180,56 triệu - Tham số SSG = 124176,56 - Tham số SSW = 121275,25 - Bậc tự do k-1=3 - Bậc tự do n-k = 44 - Tham số MSG = 41392,18 - Tham số MSW= 2756,25 - Hệ số Fisher (F) = 15,01 B5. Miền bác bỏ và kết luận: - Ta có Fk-1;n-k;α = F 3;47;0,05 = 2,816 - Vì F = 15,01 > 2,816 nên chúng ta bác bỏ H0, chấp nhận H1 có nghĩa là tồn tại ít nhất một của hàng có doanh số bán khác với doanh số bán của ít nhất một của hàng còn lại. Hồi quy tương quan (mối quan hệ giữa hai hay nhiều biến định lượng) Khi nghiên cứu mối quan hệ giữa hai hay nhiều biến định lượng, chúng ta có thể sử dụng phương pháp hồi quy, trong đói có một biến nguyên nhân (biến độc lập) và một biến kết quả (biến phụ thuộc). Trong phương pháp này người ta có thể tìm ra được mối quan hệ và mức độ tác động của biến nguyên nhân đến biến kết quả như thế nào. Giả sử chúng ta kiểm tra mối quan hệ tuyến tính giữa số năm làm việc trong doanh nghiệp với thu nhập. Khi đó, ta có thể thấy rằng biến phụ thuộc là biến thu nhập (biến Y) và biến độc lập là biến số năm làm việc (biến X) Điều kiên ứng dụng - Giá trị của biến X là hoàn toàn độc lập so với biến Y - Sai số trong mô hình phải tuân theo quy luật phân phối chuẩn - Trung bình các sai số của mô hình phải bằng không 150
- Phương sai của sai số là một hằng số và độc lập với giá trị X Đồ thị Trước khi xem xét mối quan hệ tương quan giữa hai biến này, chúng ta cần phải xây dựng đồ thị giữa hai biến số để chúng ta có thể dự đoán hàm số thích hợp để mô tả mối quan hệ. Qua đồ thị, chúng ta có thể dự đoán được, có thể dùng phương trình đường thẳng để mô tả mối quan hệ giữa hai biến X, Y. Khi đó, mô hình hồi quy giản đơn trên tổng thể có thể được biểu hiện như sau: Yi = β0 + β1Xi + εi (1) Trong đó: Xi là số năm làm việc của người thứ i Yi là thu nhập hàng năm của người thứ i β0 giá trị của mô hình (giá trị của biến Y) khi giá trị của biến độc lập X bằng 0 β1 đo lường mức độ thay đổi của biến Y khi biến X thay đổi một đơn vị 100000 80000 60000 Thu nhap nam (trieu) 40000 20000 0 6 8 10 12 14 16 18 20 Nam lam viec Kiểm tra sự phù hợp của mô hình Phân tích phương - ANOVA (kiểm tra sự tồn tại mối quan hệ trong mô hình) Một mô hình tuyến tính được xây dựng khi nó tồn tại mối quan hệ giữa biến độc lập và biến phụ thuộc, phân tích phương sai sẽ cho phép kiểm định mối quan hệ tuyến tính giữa hai biến. - Gọi SST là tổng bình phương các biến động (giữa giá trị thực tế và giá trị trung bình của biến n y). Khi đó ta có: SST = ∑ ( y i − y ) 2 i =1 - Gọi SSR là tổng bình phương hồi quy, là đại lượng biến động của giá trị thực tế yi được giải n thích bởi giá trị hồi quy, SSR = ∑ ( y i − y ) 2 ˆ i =1 151
- Gọi SSE là tổng bình phương biến động giữa giá trị thực tế và giá trị hồi quy, khi đó ta có thể n tính được SSE = ∑ ( yi − yi ) 2 ˆ i =1 SSR Khi đó trung bình bình phương hồi quy sẽ là MSR = với k là số biến (trong trường hợp này k SSE k=1) và trung bình bình phương phân dư MSE = n−k MSR Giá trị kiểm định F = có phân phối F (Phân phối Fisherr) dùng để kiểm định ý nghĩa của MSE mô hình hồi quy, do vậy, giá trị F càng lớn (hay P(F) càng nhỏ hơn α) thì mô hình càng có ý nghĩa. Hệ số R2 (s-square) Hệ số R2 dùng để đo lường sự phù hợp của mô hình tuyến tính và nó thường gọi là hệ số xác định (coefficient of determination). Hệ số này biểu hiện tỷ lệ phần trăm biến đội của biến y được giải SSR SSE thích bởi các biến x. Khi đó R 2 = = 1− . SST SST Tuy nhiên, R2 của mẫu có khuynh hướng là ước lượng lạc quan của thước đo sự phù hợp của mô hình đối với tổng thể. Do vậy, R2a (gọi là R2 điều chỉnh) được sử dụng để phản ánh chính xác hơn sự phù hợn của mô hình với tổng thể và: k (1 − R 2 ) R =R − 2 2 a n − k −1 Tính các hệ số trong mô hình Ở phương trình (1) chúng ta quan tâm chú ý đến hai hệ số β0 và β1, yêu cầu của mô hình hồi quy là làm nhu thế nào để tìm được các hệ số này, chúng ta có thể thể tính toán các giá trị tương ứng của β0 và β1 là b0 và b1 trên mẫu để ứng lượng lên tổng thể. Đặt (x1, y1), (x2, y2),..., (xn,yn) là mẫu gồm n cặp quan sát trên đường hồi qui tổng thể có dạng: yi = b0 + b1xi + ei Theo phương pháp bình phơng bé nhất, ta có thể ước lượng các hệ số β0 và β1 từ các hệ số b0 và tham số b1 của mẫu sao cho tổng bình phương sai số của phương trình sau đây là bé nhất: n n SSE = ∑ ei2 = ∑ ( yi − b0 − b1 xi ) 2 i =1 i =1 Khi đó các giá trị b0 và b1 được tính như sau: n n n n ∑ x i y i − ( ∑ x i )( ∑ y i ) b0 = y − bi x b1 = i =1 i =1 i =1 và n n n ∑ x − (∑ xi ) 2 2 i i =1 i =1 n n ∑ yi ∑x i y= và x = i =1 i =1 Với n n 152
Hệ số hồi quy chuẩn hóa (standardized regression coefficient) Hệ số hồi quy chuẩn hóa, kí hiệu là Beta biểu hiện độ dốc của đường thẳng (tìm được theo phương pháp bình phương bé nhất) khi cả hai biến X và Y được biểu diễn bằng thang đo chuẩn hóa, nó được tính bằng: sx Beta = β 1 với sx và sy là độ lệch chuẩn của biến X và biến Y. sy Ước lượng các tham số của tổng thể Phân tích hồi quy không chỉ mô tả các dữ kiện quan sat được mà công cho phép suy rộng các kết luận về mối quan hệ trong mẫu lên tổng thể. Suy rộng các kết quả của mẫu cho các giá trị của tổng thể dựa vào các giả định sau: - Với bất kì một giá trị X nào thì phân phối chuẩn của biến Y phải là phân phối chuẩn - Các giá trị Y độc lập đối với nhau tức là quan sát này không bị ảnh hưởng bởi các quan sát khác. - Tất cả các trị trung bình µy khi X xảy ra đều nằm trên một đường thẳng – đó là đường hồi quy tổng thể. Khi chúng ta biết các giá trị b0 và b1 trên mẫu, chúng ta sẽ suy rộng giá trị này lên tổng thể cho các giá trị β0 và β1. Nếu đặt σ2e và s2e là phương sai của sai số của mẫu (e) và tổng thể (ε), ta có: n ∑e 2 i SSE s e2 = = i =1 n−2 n −1 Nếu đặt β1 là giá trị ước lượng của b1 trên tổng thể thì phương sai của b1 sẽ là: s e2 se2 s= = 2 b1 n n ∑ (x ∑x 2 − x) − nx 2 2 i i i =1 i =1 Khi đó độ lệch chuẩn của sai số sẽ là: se2 sb1 = s = 2 b1 n ∑x 2 − nx 2 i i =1 Suy ra ước lượng không chệch của σ2b1 sẽ được xác định: s e2 σ b2 = n 1 ∑x 2 − nx 2 i i =1 Giả sử t sai số hồi quy (ei) tuân theo quy luật phân phối chuẩn thì biến ngẫu nhiên (t) là giá trị dùng để kiểm định: b1 − β1 T= sb1 153
Gọi α là mức ý nghĩa thì ta luôn luôn tìm được một khoảng tin cậy của β1, khi đó: b1 − sb1 t α−2 ≤ β1 ≤ b1 + sb1 t α−2 n n 2 2 Kiểm định các tham số của tổng thể B1. Giả thiết và đối thiết Đối xứng Phải Trái β1 = β1o β1 ≤ β1o β1 ≥ β1o Giả thiết H0: H0: H0: β1 ≠ β1o β1 > β10 β1 < β1o Đối thiết H1: H1: H1: B2. Xác định mức ý nghĩa α B3. Phương pháp kiểm định: Kiểm định t-student đối với mối quan hệ giữa hai biến. B4. Tính tiêu chuẩn kiểm định: b1 − β10 k qs ≡ T = sb1 B5. Miền bác bỏ và kết luận: Giả thiết H0 được bác bỏ khi: T ≥ t α−1 (kiểm định đối xứng) n 2 T ≥ tα −1 (kiểm định phía phải) n T < −tα −1 (kiểm định phía trái) n Dự đoán giá trị Khi chúng ta có các hệ số b0 và b1, chúng ta có thể thành lập được mô hình, thay các giá trị xn+1 vào thì ta có thể tính được giá trị dự đoán của mô hình. yi = b0 + b1xi + ei Với mỗi giá trị của xi chúng ta sẽ tìm được các giá trị dự đoán của yi tương ứng luôn này trong ˆ khoảng Y ± s y t n−α , với sai của dựa đoán sẽ là: 2 ˆ 1− 2 1 ( x n +1 − x) 2 s y = se + ˆ n (n − 1) s x 2 KIỂM ĐỊNH CHI BÌNH PHƯƠNG VỀ TÍNH PHỤ THUỘC HAY ĐỘC LẬP CỦA CÁC BIẾN Kiểm định giả thiết về quy luật phân phối của tổng thể Kiểm định giả thiết về sự phân phối của tổng thể hay có thể gọi là kiểm định sự phù hợp là kiểm định nhằm xem xét dữ liệu thu thập được phù hợp (thích hợp) đến mức nào với giả định về phân phối của tổng thể. 154
Giả sử có mẫu ngẫu nhiên n quan sát được chia thành k nhóm khác nhau, mỗi quan sát phải và chỉ thuộc về một nhóm thứ i nào đó (i=1,2,…,k). Khi đó Oi là số lượng quan sát ở nhóm thứ i, vấn đề đặt ra là ta sẽ dùng mẫu quan sát này để kiểm định giả thiết H0 thể hiện các xác suất pi để một quan sát nào đó thuộc về nhóm thứ i. Chúng ta cần tính: Tính số lượng quan sát thuộc về nhóm thứ i trong trường hợp giả thiết H0 đúng, nghĩa là tính các giá trị mong muốn Ei theo công thức: Ei =n*pi Σ Nhóm 1 2 … k GT thực tế (Oi) O1 O2 … Ok n XS theo H0 p1 p2 pk 1 Giá trị mong muốn (Ei) E1 E2 Ek n (Oi − Ei ) 2 k χ df = ∑ 2 Ei i =1 Tiêu chuẩn kiểm định: Trong đó: Oi : tần số quan sát được trong thực tế Ei : tần số theo lí thuyết df = k-1: mức độ tự do trong phép kiểm định. k : số loại tính chất hay số khoảng đã dùng phân loại tính chất pi : thông số được ước định từ số liệu thu thập được. KIỂM ĐỊNH CHI BÌNH PHƯƠNG (kiểm định về sự phân phối tổng thể) 1. Giả thiết và đối thiết: Giả thiết ……………….là bằng nhau Đối thiết ………………là khác nhau 2. Xác định mức ý nghĩa 3. Phương pháp kiểm nghiệm Chi bình phương. (O − E )2 k χ2 = ∑ i i 4. Tính tiêu chuẩn: Ei 5. Điểm tới hạn và miền bác bỏ: i=1 Là kiểm định một đuôi (df=k-1) với: λ2df;α Điểm tới hạn λ2 > λ2df;α Miền bác bỏ BB Mô hình λ2df;α 155
Ví dụ 1: Trong một đợt ra đề thi trắc nghiệm môn Kinh tế vi mô, người ta tin tưởng rằng 60% sinh viên tham gia thi sẽ đạt điểm đậu trên bài thi trắc nghiệm này với độ tin cậy 95%. Chọn một cách ngẫu nhiên 200 sinh viên tham gia thi và tiến hành điều tra. Kết quả thu được có 105 sinh viên đạt và 95 sinh viên không đạt. Hỏi kết quả này có trái với kết quả mong đợi hay không ? Giải: Gọi p là tỉ lệ sinh viên đạt điểm đậu, khi đó 1-p là tỉ lệ sinh viên không đạt B1. Giả thiết và đối thiết H0: p=0,6 H1: H0 không đúng hay p≠0,6 Chỉ tiêu Lí thuyết Thực tế Đạt 0,6*200 = 120 105 Không đạt 0,4*200 = 80 95 B3. Chọn phương pháp kiểm định α=0,05. B3. Xác định phương pháp kiểm định: Phương pháp kiểm định sự phù hợp Chi bình phương. Vì χ (2df );α = χ (21 ); 0 , 05 = 3 ,843 df= k-1= 2-1= 1 nên với độ tin cậy 95% ta có B4. Tính tiêu chuẩn kiểm định (105 − 120 ) 2 ( 95 − 80 ) 2 χ df = + = 1,88 + 2 ,81 = 4 , 69 2 120 80 Minh họa bằng hình vẽ BB 3,843 4,69 Kết luận: Vì 4,69 > 3,843 nên bác bỏ H0 ở mức ý nghĩa 0,05 và kết quả thi trái với tin tưởng của nhà soạn câu hỏi. Ví dụ 2: Để chọn một bí thư đoàn cho một trường đại học người ta đề cử 3 ứng viên và chúng ta phải kiểm tra xem tỉ lệ các đoàn viên bỏ phiếu cho mỗi ứng viên có khác nhau hay không. Một mẫu 150 cử tri hợp lệ được chọn ngẫu nhiên từ danh sách của trường đại học ấy. Kết quả kiểm phiếu thu được như sau: - Ứng viên 1: 61 - Ứng viên 2: 53 - Ứng viên 1: 36 Giải: Gọi p1, p2 ,p3 lần lượt là tỷ lệ phiếu bầu của các đoàn viên cho lần lượt các ứng viên. B1. Phát biểu giả thiết và đối thiết Giả thiết H0: p1= p2 =p3 =1/3 Đối thiết H1: Ít nhất một trong các tỷ lệ nhỏ hơn 1/3 156
B2. Mức ý nghĩa α=0,05 B3. Xác định phương pháp kiểm định: Phương pháp kiểm định sự phù hợp Chi bình phương. Vì χ 2 ,α = χ 2,0,05 = 5,9914 df 2 df= k-1= 3-1= 2 nên với độ tin cậy 95% ta có B4. Tính tiêu chuẩn kiểm định: Nếu giả thiết H0 đúng thì số cử tri theo lí thuyết bầu cho các ứng viên đều là 50. Khi đó: B5. Kết luận: Vì 6,52>5,9914 nên chúng ta có thể bác bỏ H0 tức là các đaòn viên đã bỏ phiểu (61 − 50 ) 2 (53 − 50 ) 2 (36 − 50 ) 2 χ2 = + + = 6,52 50 50 50 cho một ứng viên nhiều hơn ít nhất một ứng viên còn lại. Kiểm định chi bình phương về tính chất độc lập hay phụ thuộc (kiểm định hàng cột hay kiểm định mối quan hệ giữa hai biến biểu danh) Ở trên ta xem xét trường hợp dữ liệu thu thập được xếp theo một tiêu chí hay một yếu tố. Bây giờ chúng ta xem xét trường hợp dữ liệu được xếp theo hai tiêu chí, nghĩa là được phân theo hai yếu tố có mối liên hệ hay không. Ví dụ, trong phân tích nghiên cứu tiếp thị, chúng ta thường tìm có tồn tại hay không mối liên hệ giữa giới tính và hành vi tiêu dùng, giữa giới tính và mức độ hoàn thành công việc, giữa tuổi tác và giới tính.. Gọi Oij là số lượng quan sát ứng với hàng thứ i và cột thứ j và Eij là số lý thuyết ứng với hàng thứ i và cột thứ j, khi đó ta có: (Täøng − haìng − i) x(Täøng − cäüt − j) E ij = Täøng − âäü − låïn − cuía − máùu ri * c j E ij = n Khi đó độ tự do sẽ là df= (số cột -1)*(số hàng-1) KIỂM ĐỊNH CHI BÌNH PHƯƠNG (Kiểm định mối liên hệ) 1. Giả thiết và đối thiết: Giả thiết Không có mối liên hệ giữa hai biến .... trong tổng thể Đối thiết Có mối liên hệ giữa hai biến ..... trong tổng thể 2. Xác định mức ý nghĩa α 3. Phương pháp kiểm nghiệm Chi bình phương. 4. Tính tiêu chuẩn: Eij ) 2 (Oij r c χ = ∑∑ 2 Eij i =1 j =1 5. Điểm tới hạn và miền bác bỏ: Là kiểm định một đuôi (df=(r-1)*(c-1)) với: χ2df;α Điểm tới hạn χ2 > χ2df;α Miền bác bỏ BB Mô hình χ2df;α 157
Ví dụ 1: Một nhà nghiên cứu thị trường muốn xác định mối tương quan có thể có giữa kích cỡ xe ô tô và hãng sản xuất đối với các xe mới được mua trong thời gian gần đây. Một mẫu 1000 xe mới mua trong nước đã chọn ngẫu nhiên và phân loại theo kích cỡ và hãng sản xuất. Dữ liệu thu được: Hãng chế tạo Tổng cột j Loại xe (cj) A B C D Nhỏ 157 65 181 10 413 Trung bình 126 82 142 46 396 Lớn 58 45 60 28 191 Tổng hàng i (ri) 341 192 383 84 1000 Như vậy các giá trị thực tế quan sát được và giá trị lý thuyết như sau: Loại xe Hãng chế tạo Tổng cột j (cj) A B C D Nhỏ 157 65 181 10 413 (140,833) (79,296) (158,179) (34,692) Trung bình 126 82 142 46 396 (135,036) (76,032) (151,668) (33,264) Lớn 58 45 60 28 191 (65,131) (36,672) (73,153) (16,044) Tổng hàng i (ri) 341 192 383 84 1000 Chúng ta dùng phép kiểm định chi bình phương để so sánh giá trị qua sát được và giá trị lí thuyết với các bước sau: B1. Phát biểu giả thiết và đối thiết Giả thiết H0: Hai yếu tố dùng phân loại độc lập nhau trong tổng thể Đối thiết H1: Hai yếu tố dùng phân loại phụ thuộc nhau trong tổng thể B2. Xác định mức ý nghĩa α=0,05. B3. Phương pháp kiểm định: Phương pháp kiểm định Chi bình phương về mối quan hệ giữa hai biến. ∑ (O − E ij ) 2 ij χ2 = ij = 45 ,81 E ij B4. Tính tiêu chuẩn kiểm định B5. Kết luận : Vì df= (r-1)*(c-1)=(3-1)*(4-1)=6 nên χ (26 ); 0 ,05 = 12 ,5916 χ 2 = 45 ,81 > χ (26 ); 0 , 05 = 12 ,5916 Vậy ta bác bỏ giả thiết H0 tức là kích cỡ xe và hãng sản xuất xe do khách hàng chọn lựa là những những biến phụ thuộc lẫn nhau chứ không phải độc lập. 158
CÁC PHƯƠNG PHÁP KIỂM ĐỊNH PHI THAM SỐ Kiểm định phim tham số là các loại kiểm định ít đòi hỏi các giả thiết về phân phối của dữ kiệnn. Thông thường, kiểm định phí tham số phù hợp nhất trong các trường hợp chúng ta không thể dùng các kiểm định tham số ví dụ dữ liệu mà chúng ta thu thập là loại dữ liệu định tính (biểu danh hay thứ tự) hoặc khi các dữ liệu thuộc thang đo lường khoảng cách (interval) nhưng khi kiểm định phân phối chuẩn không thỏa. Trong những trường hợp như vậy, chúng ta thường sử dụng phương pháp kiểm định phi tham số. Trong phần này sẽ đề cập đến những kiểm định sau: Kiểm định hai mẫu phụ thuộc (Dấu, Wilcoxon, Nemar) Ở phần kiểm định tham số ta đã đề cập đến việc so sánh trung bình của hai tổng thể với giải định tổng thể phân phối chuẩn và có phương sai bằng nhau. Khi các điều kiện này không thỏa mãn ta thực hiện kiểm định dấu. Ứng dụng: Dữ liệu mẫu từng cặp phối hợp, tổng thể không phân phối chuẩn và có thể phương sai khác nhau. Việc kiểm định dấu thường được dùng khi phân tích dự liệu từ mẫu phối hợp. Tuy nhiên, người ta ít dùng kiểm định dấu do nói không làm sáng tỏ được giá trị của khác biệt, kết quả không thuyết phục lắm nên người ta thường thực hiện kiểm định Wilcoxon. Trường hợp mẫu nhỏ (n µ2 µ1 < µ2 Đối thiết H1: H1: H1: 2. Xác định mức ý nghĩa σ 3. Phương pháp kiểm nghiệm Wilcoxon - Phân phối Wilcoxon. 4. Tính tiêu chuẩn: D = x1 - x2 (xét dấu) W = min [Σ(+), Σ(-)] W = min [Σ(-)] W = min [Σ(+)] Tiêu chuẩn 5. Điểm tới hạn và miền bác bỏ: Đối xứng Phải Trái Điểm tới hạn W2α Wα Wα Miền bác bỏ W < W2α W < Wα W < Wα Mô hình BB BB BB W2α Wα Wα B1. Tính các chênh lệch D=x1 - x2 B2. Chọn mức ý nghĩa α B3. Phương pháp kiểm định : Phương pháp kiểm định Wilcoxon B4. Tính tiêu chuẩn kiểm định : - Xếp hạng giá trị tuyết đối các chênh lệch D theo thứ tự tăng dần, các giá trị bằng nhau sẽ nhận hàng trung bình (bỏ qua các trường hợp chênh lệch bằng 0). 159
- Tính tổng cộng hạng. Giá trị W của kiểm định là: W= min [Σ(+), Σ(-)] B5. Tham chiếu với giá trị ở bảng Wilconxon trong bảng phân phối, so sánh với giá trị kiểm định để đưa ra kết luận. Ví dụ: Mẫu 9 khách hàng được chọn ngẫu nhiên và yêu cầu họ cho biết sở thích của họ về hai loại kem đánh răng A, B khác nhau thông qua một thang điểm từ 1 (rất không thích) đến 5 (rất thích). Kết quả như sau: KH Kem A Kem B Ch. lệch Hạng TQ Hạng (+) Hạng (-) 1 4 3 1 1,5 1,5 2 5 5 0 3 2 5 -3 5 5 4 3 2 1 1,5 1,5 5 3 5 -2 3 3 6 1 5 -4 7 7 7 3 3 0 8 2 5 -3 5 5 9 2 5 -3 5 5 3 25 Đánh giá xem có hay không mức độ ưa chuộng giữa hai loại kem đánh răng A, B với mức ý nghĩa 5%. B1. Giả thiết và đối thiết: H0: Không có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể H1: Có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể B2. Lựa chọn mức ý nghĩa α=0,05 B3. Xác định phương pháp kiểm định : Phương pháp kiểm định Wilcoxon B4. Tính tiêu chuẩn kiểm định: Đây là loại kiểm định dạng hai đuôi (đối xứng). Theo bảng tính ta có: Kqs = W = min [3,25]=3 Tra bảng phân phối của kiểm định Wilcoxon với mức ý nghĩa 5% ta có W2α =W2*0,05=W0,1= 4 Miền bác bỏ W2α=4 W=3 Vì W
KIỂM ĐỊNH WILCOXON (mẫu lớn) 1. Giả thiết và đối thiết: Đối xứng Phải Trái µ1 = µ2 µ1 ≤ µ2 µ1 ≥ µ2 Giả thiết H0: H0: H0: µ1 ≠ µ2 µ1 > µ2 µ1 < µ2 Đối thiết H1: H1: H1: 2. Xác định mức ý nghĩa 3. Phương pháp kiểm nghiệm Wilcoxon – Tham chiếu phân phối chuẩn. 4. Tính tiêu chuẩn: T − µT k qs ≡ Z = σT 5. Điểm tới hạn và miền bác bỏ: Đối xứng Phải Trái Điểm tới hạn U1-α/2 U1-α U1-α Miền bác bỏ Z
n ( n + 1) 50 ( 49 ) µT = = = 673,5 4 4 n ( n + 1)( 2 n + 1) 50 * 51 * 101 σ T2 = = = 10731 , 25 24 24 Áp dung công thức: T − µT 625 − 637 ,5 Z= = = − 0,1206 σT 103 ,5917 Ta có Z=-0,1206 < U0,95= 1,65 nên chúng ta chưa có cơ sử để bác bỏ giả thiết H0 tức là chưa có cơ sở để chấp nhận H1 Kiểm định nhiều hơn hai mẫu phụ thuộc (Friedman, Kendall’s W, Cochran’s Q) Thang đo lương và phương thức thực hiện tương tự như Wilcoxon như mở rộng cho nhiều hơn 2 sản phẩm, tình huống và kết quả được trình bày ở phần hướng dẫn SPSS Kiểm định cho hai mẫu độc lập (Mann-Whitney U) Kiểm định không yêu cầu các giả định về hình dạng của phân phối, nó được dùng để các giả thiêt về hai mẫu độc lập có xuất phát từ hai tổng thể có phân phối có thể không giống nhau. Kiểm định này gần giống như kiểm định wilconxon vì các biến phải có thể xếp hạng (trong kiểm định wilcoxon ta phải xét cả dấu và hạng còn trong kiểm định Mann-Whitney U ta chỉ xét thứ hạng mà không cần xét dấu. Tình huống và kết quả được mô tả ở phần SPSS. Kiểm định nhiều hơn hai mẫu độc lập (Kruskal-Wallis H) Giả sử rằng chúng ta có các mẫu ngẫu nhiên độc lập gồm k quan sát, nếu ta sắp xếp các quan sát này thành từng nhóm mà mỗi nhóm có phân phối tuân theo quy luật phân phối chuẩn và phương sai của chúng bằng nhau thì chúng ta có thể dùng phương pháp kiểm định tham số (ANOVA) để phân tích. Tuy nhiên, có một số trường hợp, mẫu không thoải mãn những điều kiện để sử dụng ANOVA thì chúng ta sử dụng phương pháp kiểm định phi tham số với phương pháp Kruskal-Wallis. Từ tổng thể n quan sát ta sắp xếp các hạng một cách liên tục từ nhỏ đến lớn, nếu giá trị quan sát trùng nhau thì hạng xếp giống nhau bằng cách dùng số trung bình cộng các hạng của chúng. Gọi R1, R2,..., Rk là tổng của các hạng được xếp theo thứ tự, khi đó từ n quan sát ta có của k nhóm. B1. Giả thiết và đối thiết H0: µ1 = µ2 = ... = µk: Tham số trung bình của k nhóm đều bằng nhau H1: Tồn tại ít nhất một tham số trung bình của nhóm i khác với ít nhất một tham số trung bình của nhóm còn lại. B2. Xác định mức ý nghĩa α B3. Phương pháp kiểm định Kruskal- Wallis B4. Tiêu chuẩn kiểm định W được tính bằng Ri2 k 12 ∑ − 3(n + 1) k qs ≡ W = n(n + 1) i =1 ni B5. Miền bác bỏ và kết luận : 162
Trong trường hợp này chúng ta dùng phân phối Chi bình phương với bậc tự do là k-1, khi đó chúng ta sẽ bác bỏ H0 nếu W > χ k −1,α . 2 XỬ LÍ DỮ LIỆU CÙNG SPSS KIỂM ĐỊNH THAM SỐ Kiểm định t đối với tham số trung bình mẫu Như chúng ta đã biết, thu nhập trung bình của các đối tượng phỏng vấn là 33,224 triệu/năm, có giả thiết cho rằng thu nhập của đối tượng mà chúng ta phỏng vấn trên tổng thể là 32 triệu/năm, chúng ta cần kết luận nhận định đó có đúng không. Khi đó, giả thiết của bài toán là: H0 : µ = µ0= 32 (triệu) và H1: µ ≠ µ0 = 32 (triệu) Nhấn Analyze – Compare Means – One sample T test. Chọn biến cần phân tích vào ô Test Variable(s), đặt giá trị µ0 vào ô Test Value. Nhấn Option để thiết đặt độ tin cậy (giả sử đ tin cậy là 95%) Bấm Continue và bấm OK ở hộp hội thoại ban đầu, kết quả thu được như sau: Descriptive Statistics N Minimum Maximum Mean Std. Deviation Thu nhap nam (trieu) 200 10750 82500 33224.00 12932.72 Valid N (listwise) 200 One-Sample Statistics N Mean Std. Deviation Std. Error Mean Thu nhap nam (trieu) 200 33224.00 12932.72 914.48 163