ỨNG DỤNG PHƯƠNG PHÁP KIỂM ĐỊNH GIẢ THUYẾT<br />
THỐNG KÊ TRONG ĐÁNH GIÁ KẾT QUẢ ĐÀO TẠO<br />
SINH VIÊN TRƯỜNG ĐẠI HỌC QUẢNG NAM<br />
Lê Phước Thành1<br />
<br />
Tóm tắt: Điểm số tuyển sinh đầu vào và điểm số kết quả quá trình đào tạo là một<br />
khía cạnh để đánh giá chất lượng giáo dục tại các cơ sở giáo dục đại học. Khi dữ liệu<br />
này được sưu tập đầy đủ và tin cậy là cơ sở để đưa ra những kết luận về chất lượng<br />
đào tạo có ý nghĩa về mặt thống kê. Ngoài ra bài báo nghiên cứu khoa học này trình<br />
bày một cách có hệ thống tất cả các loại kiểm định giả thuyết tương ứng với những<br />
nhận định đó.<br />
Từ khóa: Thống kê mô tả, Thống kê suy diễn, Kiểm định giả thuyết, Ý nghĩa<br />
thống kê.<br />
1 . Mở đầu<br />
Từ năm 2002, Bộ GD&ĐT đã triển khai thi theo phương thức “3 chung” vào đại<br />
học trên cả nước, đó là chung đề thi, ngày thi và dùng chung kết quả xét tuyển. Tiếp<br />
theo là những cải tiến về gộp kỳ thi tốt nghiệp với kỳ thi đại học, xây dựng mức điểm<br />
sàn và những phương thức xét tuyển theo sự phát triển của kỹ thuật công nghệ. Với<br />
những đột phá đó, Bộ GD&ĐT đã giảm tải khá nhiều về áp lực kỳ thi (nhất là về mặt<br />
chi phí) và hướng đến xây dựng một bằng chất lượng chung cho cả nước. Với kỹ thuật<br />
cơ sở dữ liệu dùng chung kết quả tuyển sinh (điểm đầu vào) này các trường đại học dễ<br />
dàng kết nối với dữ liệu kết quả đào tạo (điểm đầu ra) để có những phân tích, đánh giá<br />
sâu hơn toàn bộ khóa đào tạo.<br />
Chất lượng đào tạo là một khái niệm đa chiều, nó được nhìn nhận ở các góc độ<br />
khác nhau. Chất lượng được đánh giá bằng “đầu vào” hoặc “đầu ra”, “chất lượng được<br />
đánh giá bằng giá trị gia tăng”, “sự hài lòng của các bên liên quan”… [4].<br />
Dưới góc độ đo lường năng lực sinh viên ra trường, chất lượng đào tạo của một<br />
cơ sở giáo dục bao gồm mức độ đạt được các chuẩn đầu ra của chương trình đào tạo<br />
(kiến thức, kỹ năng và thái độ). Các kết quả này được đánh giá bằng điểm số. Bằng<br />
cảm tính các bên liên quan thường đưa ra những nhận định chủ quan về kết quả đào<br />
tạo của nhà trường, chẳng hạn: (i) kết quả đầu vào thấp thì kết quả đầu ra của nhà<br />
1<br />
<br />
. ThS. Phòng Khảo thí và Đảm bảo chất lượng, trường Đại học Quảng Nam<br />
1<br />
<br />
LÊ PHƯỚC THÀNH<br />
<br />
trường sẽ thấp, (ii) chất lượng đầu ra của khối ngành sư phạm sẽ cao hơn khối ngành<br />
ngoài<br />
sư phạm vì chất lượng đầu vào cao hơn, … Những nhận định này chỉ là võ đoán chưa<br />
được kiểm định.<br />
Đánh giá chất lượng đào tạo hiện nay, theo truyền thống vẫn sử dụng các phương<br />
pháp như thống kê mô tả, phân phối chuẩn, tần suất, trình bày dữ liệu bằng bảng, biểu<br />
đồ … dựa trên các số liệu tổng hợp này để đưa ra những nhận định về kết quả đào tạo.<br />
Tuy nhiên, đối với một nhận định cần phải kiểm định bằng một phương pháp thống kê<br />
cụ thể trên tập dữ liệu sưu tập được để đảm bảo độ tin cậy của nhận định.<br />
Xuất phát từ những yêu cầu trên, bài báo này áp dụng những phương pháp kiểm<br />
định giả thuyết trên tập dữ liệu đã sưu tập được để công nhận hoặc bác bỏ những nhận<br />
định thường có ở những cơ sở giáo dục đại học. Tập dữ liệu dùng trong bài báo này là<br />
tập dữ liệu hoàn toàn trung thực được sưu tập tại một trường đại học ở miền Trung của<br />
khóa đào tạo đại học 4 năm 2013-2017.<br />
2.<br />
<br />
Nội dung<br />
<br />
2.1. Bài toán kiểm định giả thuyết<br />
2.1.1.<br />
<br />
Giới thiệu<br />
<br />
Trong lĩnh vực kinh tế-xã hội, giáo dục có những bài toán đặt ra yêu cầu kiểm<br />
tra tính đúng sai của một nhận định khi chỉ dựa vào một ít số liệu cảm nhận được. Khi<br />
đó phải thực hiện việc kiểm định dựa trên thông tin có từ một mẫu, bằng những phương<br />
pháp thống kê cụ thể.<br />
Kiểm định giả thuyết là quá trình dựa vào các thông tin của mẫu để đưa ra<br />
kết luận là bác bỏ hay chấp nhận giả thuyết của tổng thể [3].<br />
2.1.2.<br />
<br />
Giả thuyết thống kê<br />
<br />
Dựa vào kết quả thống kê trên mẫu, người quan sát luôn đưa ra một nhận định<br />
cho tổng thể. Để kiểm định giả thuyết này, ta nên bắt đầu từ một giả sử trái với nhận<br />
định (trái với điều chúng ta mong muốn, ta cần sưu tập nhiều bằng chứng để cố gắng<br />
bác bỏ giả thuyết), điều giả sử này gọi là giả thuyết không H0( Null Hypothesis) cho<br />
là đúng lúc ban đầu. Giả thuyết đối H1(Alternative Hypothesis) nhận giá trị đúng khi<br />
bác bỏ giả thuyết H0 (H0 sai) và nhận giá trị sai khi chấp nhận giả thuyết H0 (H0 đúng)<br />
[2] , [3].<br />
2.1.3.<br />
<br />
Các loại sai lầm<br />
<br />
2<br />
<br />
LÊ PHƯỚC THÀNH<br />
<br />
Không phải bất cứ việc kiểm định giả thuyết nào là hoàn toàn đúng với thực tế,<br />
ta gọi đây là các loại sai lầm.<br />
Sai lầm loại 1 (loại α) là sai lầm khi bác bỏ giả thuyết H0, trong khi đó trình trạng<br />
thực tế là đúng.<br />
Sai lầm loại 2 (loại β) là sai lầm khi công nhận giả thuyết H0, trong khi đó trình<br />
trạng thực tế là sai.<br />
<br />
3<br />
<br />
LÊ PHƯỚC THÀNH<br />
<br />
Bảng 1. Các loại sai lầm trong kiểm định giả thuyết<br />
Thực tế<br />
Giả thuyết H0 đúng<br />
Chấp nhận giả thuyết H0<br />
Bác bỏ giả thuyết H0<br />
2.1.4.<br />
<br />
Quyết định đúng<br />
Sai lầm loại 1 (loại α)<br />
<br />
Giả thuyết H0 sai<br />
Sai lầm loại 2 (loại β)<br />
Quyết định đúng<br />
<br />
Miền bác bỏ và miền chấp nhận<br />
<br />
Miền chấp nhận là miền chứa các giá trị thống kê mà tại đó giả thuyết H0 được<br />
chấp nhận. (Miền chưa đủ các chứng cứ để bác bỏ giả thuyết)<br />
Miền bác bỏ là miền chứa các giá trị thống kê mà tại đó giả thuyết H0 bị bác bỏ.<br />
Khi thu thập chứng cứ đến một điểm tới hạn nào đó thì chuyển sang miền bác bỏ-Miền<br />
có đủ (hoặc nhiều hơn) chứng cứ để bác bỏ giả thuyết [3].<br />
2.1.5.<br />
<br />
Mức ý nghĩa αvà giá trị P<br />
<br />
Giả thuyết là một tuyên bố về số liệu thực nghiệm và sự khác biệt có thể xuất<br />
hiện trong tổng thể. Theo quy tắc chung, mức ý nghĩa (hay alpha) thường được chọn<br />
ở mức 0,05, nghĩa là khả năng kết quả quan sát sự khác biệt được nhìn thấy trên số liệu<br />
là ngẫu nhiên chỉ là 5% (hay là xác suất tối đa cho phép giả thuyết H 0 bị bác bỏ, nếu<br />
có điều kiện chọn 100 mẫu thì sẽ có 5 mẫu phạm phải sai lầm loại 1)<br />
Trong khi đó giá trị P (P-Value) (phần mềm gọi là giá trị sig) là xác suất phạm<br />
phải sai lầm loại 1 với thông tin từ tập mẫu tính toán được. Nhận thấy rằng khi xác<br />
suất càng cao thì hậu quả khi bác bỏ giả thuyết H0 càng lớn (và ngược lại). Quy tắc<br />
chung để công nhận hay bác bỏ giả thuyết H0 như sau:<br />
Nếu sig>α thì chấp nhận giả thuyết H0<br />
Nếu sig≤α thì bác bỏ giả thuyết H0 [4]<br />
2.2 . Kiểm định các giả thuyết<br />
Để thực hiện các phương pháp kiểm định giả thuyết, tập dữ liệu được sưu tập từ<br />
khóa tuyển sinh đại học năm 2013 và tốt nghiệp năm 2017 tại trường đại học Quảng<br />
Nam gồm 12 ngành đào tạo và 2 khối ngành sư phạm và ngoài sư phạm.<br />
Tập dữ liệu kết quả đầu vào được lấy theo kỳ thi tuyển sinh đại học của Bộ Giáo<br />
dục và Đào tạo năm 2013 gồm điểm 3 môn thi và các thông tin khác như đối tượng,<br />
4<br />
<br />
LÊ PHƯỚC THÀNH<br />
<br />
khu vực ưu tiên, khối ngành, ngành trúng tuyển... Điểm đầu vào được tính theo trung<br />
bình chung của 3 môn thi và xếp loại kết quả đầu vào theo điểm trung bình chung này<br />
theo các mức “Xuất sắc”, “Giỏi”, “Khá”, “Trung bình”, …<br />
Tập dữ liệu kết quả đầu ra được lấy theo điểm trung bình kết quả học tập qua các<br />
năm, điểm kết quả học tập toàn khóa (tính theo thang điểm 10) và xếp loại tốt nghiệp.<br />
Số lượng sinh viên có đủ kết quả đầu vào và đầu ra là 589 trên 720 sinh viên tốt nghiệp<br />
khóa 2013-2017.<br />
Kích cỡ mẫu<br />
- Công thức tính kích thước mẫu, với độ tin cậy 95%, kích thước mẫu cần thiết<br />
là :<br />
N<br />
n = 2 , với N: số lượng tổng thể, e: Mức ý nghĩa 1-95% 1+ N(e)<br />
<br />
n=<br />
<br />
= 257<br />
<br />
N=720 số lượng sinh viên tốt nghiệp khóa đào tạo 2013-2017<br />
Kích thước mẫu tính được là 257, cộng với chi phí thất thoát 20% của mẫu là<br />
144. Kích thước mẫu cần đạt là 401 sinh viên. Số sinh viên chọn làm mẫu là 589, nên<br />
việc phân tích hoàn toàn có ý nghĩa thống kê.<br />
2.2.1. Kiểm định giả thuyết về giá trị trung bình của hai mẫu phụ thuộc/ phối hợp<br />
từng cặp (Paired-Sample T-TEST)<br />
Vấn đề: “Có hay không sự khác nhau về chất lượng đào tạo trước (điểm trung<br />
bình trúng tuyển) và sau khóa đào tạo (điểm trung bình toàn khóa học)”<br />
Giả thuyết H0: “Không có sự khác biệt về giá trị trung bình trước và sau đào<br />
tạo”<br />
<br />
5<br />
<br />