intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Các nhân tố ảnh hưởng đến quyết định chọn ngành hệ thống thông tin quản lý của sinh viên Trường Đại học kinh tế Huế

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:9

31
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nghiên cứu này nhằm mục đích tìm ra những nhân tố đó trên cơ sở ứng dụng phần mềm khai phá dữ liệu WEKA với các kỹ thuật trích chọn thuộc tính và phân lớp. Kết quả của nghiên cứu cho thấy có 4 nhân tố quan trọng ảnh hưởng đến quyết định chọn ngành HTTTQL của sinh viên trường Đại học Kinh tế Huế, đó là tổng điểm xét tuyển của sinh viên, niềm đam mê ứng dụng Công nghệ thông tin vào kinh tế, giới tính, và cơ hội việc làm sau khi tốt nghiệp. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Các nhân tố ảnh hưởng đến quyết định chọn ngành hệ thống thông tin quản lý của sinh viên Trường Đại học kinh tế Huế

  1. CÁC NHÂN TỐ ẢNH HƯỞNG ĐẾN QUYẾT ĐỊNH CHỌN NGÀNH HỆ THỐNG THÔNG TIN QUẢN LÝ CỦA SINH VIÊN TRƯỜNG ĐẠI HỌC KINH TẾ HUẾ FACTORS AFFECTING STUDENTS’ CHOICE OF MAJOR IN MANAGEMENT INFORMATION SYSTEMS AT COLLEGE OF ECONOMICS, HUE UNIVERSITY ThS. Mai Thu Giang Trường Đại học Kinh tế, Đại học Huế Tóm tắt Trong bối cảnh mục tiêu về phát triển giáo dục bền vững đang là chìa khóa cho phát triển kinh tế bền vững thì sự hiểu biết qua lại giữa cơ sở đào tạo và người học là điều vô cùng cần thiết. Tuy nhiên, chưa có nghiên cứu nào thực hiện việc tìm ra những nhân tố ảnh hưởng đến quyết định chọn ngành Hệ thống Thông tin Quản lý (HTTTQL) của sinh viên trường Đại học Kinh tế Huế. Nghiên cứu này nhằm mục đích tìm ra những nhân tố đó trên cơ sở ứng dụng phần mềm khai phá dữ liệu WEKA với các kỹ thuật trích chọn thuộc tính và phân lớp. Kết quả của nghiên cứu cho thấy có 4 nhân tố quan trọng ảnh hưởng đến quyết định chọn ngành HTTTQL của sinh viên trường Đại học Kinh tế Huế, đó là tổng điểm xét tuyển của sinh viên, niềm đam mê ứng dụng Công nghệ thông tin vào kinh tế, giới tính, và cơ hội việc làm sau khi tốt nghiệp. Từ khóa: Phân lớp, trích chọn thuộc tính, khai phá dữ liệu, độ chính xác phân lớp, WEKA. Abstract Education for sustainable development is one of the most important keys in national sustainable development strategies so that the understanding each other between training institutions and learners is extremely necessary. However, there is a lack of studies that point out key factors affecting the choice of the major in Information Management System (MIS) of Hue College of Economics students. This study aims to find out those factors by applying WEKA application with feature selection and classification techniques. The result shows that Total score of entrance exams, Passion for studying and working with IT, gender, and job opportunities after graduation are the most important factors affecting the choice of MIS major of Hue college of economics students. Key words: Classification, features selection, data mining, classification accuracy, WEKA. 1. Đặt vấn đề Kinh tế phát triển dựa trên nền tảng giáo dục bền vững. Tuy nhiên, thực trạng của đào tạo đại học được thống kê bởi Báo người lao động chỉ rõ, trên 64% người tìm việc không xác định được mục tiêu nghề nghiệp khi học đại học, 50% số sinh viên ra trường phải đào tạo lại [9] . Điều đó đỏi hỏi các trường đại học cần có chiến lược và những nghiên 684
  2. cứu cụ thể để thể giải quyết được những bất cập này, để không chỉ nâng cao số lượng đầu vào mà còn nâng cao chất lượng đào tạo, nắm bắt tâm lý người học, định hướng nghề nghiệp cho sinh viên. Trong xu thế của giáo dục bền vững cùng với sự cạnh tranh ngày càng cao giữa các trường đại học, đòi hỏi các trường phải tìm ra chiến lược đào tạo và thu hút đầu vào cho các chuyên ngành. Ngành Hệ thống Thông tin Quản lý (HTTTQL) là một ngành mới và đang có xu hướng được nhiều sinh viên lựa chọn. Tuy nhiên, số lượng sinh đăng ký học ngành Hệ thống Thông tin Quản lý tại trường Đại học Kinh tế Huế vẫn chưa cao, thậm chí có xu hướng giảm nhẹ. Số lượng đầu vào thấp nên chưa sử dụng được tối đa nguồn lực đào tạo và cơ sở vật chất trang bị cho đào tạo chuyên ngành. Do vậy, việc nghiên cứu để tìm ra những nhân tố tác động đến quyết định lựa chọn ngành HTTTQL của sinh viên rất quan trọng. Trên cơ sở đó, Trường Đại học kinh tế Huế có thể đề ra được chiến lược đúng đắn, hiệu quả cho việc thu hút sinh viên để nâng cao số lượng cũng như chất lượng đầu vào cho chuyên ngành. Vấn đề tìm ra các nhân tố tác động đến lựa chọn chuyên ngành học đã được nhiều tác giả trong nước và nước ngoài nghiên cứu. Ví dụ, Keshishian và cộng sự đã nghiên cứu về các nhân tố động lực ảnh hưởng đến sự lựa chọn chuyên ngành học tại trường đại học của sinh viên Y Dược [6]; Nguyễn Thị Lan Hương đã nghiên cứu các nhân tố ảnh hưởng đến động cơ chọn ngành Quản trị Doanh nghiệp của sinh viên trường Cao đẳng Kinh tế Đà Nẵng [8]; Edmonds đã nghiên cứu những nhân tố ảnh hưởng đến lựa chọn chuyên ngành học và tìm ra sự khác biệt giữa các chuyên ngành tại trường Rowan University [4]. Mặc dù đã có nhiều nghiên cứu được tiến hành nhưng chưa có nghiên cứu nào được thực hiện để tìm ra các nhân tố ảnh hưởng đến sự lựa chọn ngành Hệ thống Thông tin Quản lý của sinh viên trường Đại học Kinh tế, Đại học Huế. Nghiên cứu này sẽ ứng dụng phần mềm khai phá dữ liệu WEKA với hai kỹ thuật trích chọn thuộc tính và phân lớp để tìm ra các nhân tố quyết định đến sự lựa chọn ngành Hệ thống Thông tin Quản lý của sinh viên. 2. Tổng quan nghiên cứu và cơ sở lý thuyết 2.1. Một số nghiên cứu liên quan đến đề tài Nghiên cứu của Yazici và cộng sự đã đưa ra được nhóm các nhân tố tác động đến quyết định lựa chọn chuyên ngành học của sinh viên. Trong đó các nhân tố có ảnh hưởng khác nhau, bao gồm uy tín của trường đại học, vị trí, chi phí, và tình trạng kinh tế xã hội của sinh viên. Ngoài ra, sự thú vị của ngành học, tiềm năng cơ hội làm việc và ảnh hưởng từ bố mẹ, giáo viên đối với sinh viên trong lựa chọn chuyên ngành học là những nhân tố cơ bản [13]. Nghiên cứu của Beggs và cộng sự đã xác định được 6 nhân tố ảnh hưởng lớn nhất đến quyết định chọn chuyên ngành của sinh viên bao gồm: đặc điểm chuyên ngành học phù hợp với sở thích cá nhân, đặc điểm của cá nhân, đặc điểm công việc, lợi ích về tài chính, tâm lý và lợi ích xã hội, thông tin về ngành [2]. Nghiên cứu của Nguyễn Thị Lan Hương về những nhân tố ảnh hưởng đến động cơ chọn ngành quản trị doanh nghiệp, trên đối tượng là sinh viên trường Cao đẳng Kinh tế - 685
  3. Kế hoạch Đà Nẵng, đã đưa ra được mô mình tham chiếu cô đọng bao gồm: đào tạo liên thông, cơ hội nghề nghiệp và đối tượng tham chiếu [8]. Trong đó đối tượng tham chiếu được xác định trong nghiên cứu bao gồm Thầy Cô, Bố Mẹ, bạn bè, những sinh viên đã và đang học tại trường, người đang làm trong lĩnh vực, và các buổi nói chuyện của các chuyên gia về ngành. Tuy nhiên, một nghiên cứu khác lại cho rằng sinh viên nên đầu tư vào chuyên ngành giúp họ có một tương lai ổn định, an toàn, và thành công trong tương lai. Quyết định đó không phải chỉ dựa trên những cảm tính của cá nhân mà là dựa vào sự phù hợp nhất đối với họ [12]. Kế thừa kết quả của các nghiên cứu trước [4] [8], và căn cứ vào đặc điểm đặc trưng của chuyên ngành Hệ thống Thông tin Quản lý (HTTTQL), nghiên cứu này đã đề xuất 39 nhân tố tương ứng với 39 thuộc tính được sử dụng để đánh giá tác động đến quyết định chọn ngành HTTTQL của sinh viên bao gồm: giới tính, quê quán, dân tộc, ba môn thi dự tuyển vào đại học, điểm thành phần 3 môn dự tuyển vào đại học, tổng điểm (bao gồm điểm ưu tiên), nghề của Bố, nghề của mẹ, định hướng, Anh Chị Em trong gia đình, Thầy Cô, bạn bè, người thân, điểm tuyển sinh đầu vào, đam mê tìm hiểu công nghệ thông tin, đam mê ứng dụng công nghệ thông tin vào kinh tế, đam mê công việc thống kê tính toán, xu thế ngành, sự thách thức của chuyên ngành, thương hiệu và uy tín của ngành, đội ngũ giáo viên, giao thông, điều kiện sinh hoạt, học phí, truyền thông, hướng nghiệp, thăm quan tại trường, khung chương trình, nhu cầu về việc làm, cơ hội việc làm, cơ hội thăng tiến trong công việc, lương cao, môi trường làm việc năng động, sáng tạo, chuyên nghiệp. Thuộc tính cuối cùng của các bản ghi sinh viên là trường dữ liệu được đặt tên “class”, trường này lưu với nội dung là “Yes” nếu sinh viên đang theo học ngành Hệ thống Thông tin Quản lý; ngược lại được lưu là “No”. 2.2. Lý thuyết về phân lớp và trích chọn thuộc tính trong khai phá dữ liệu 2.2.1. Phân lớp Bao gồm các dự đoán của kết quả đầu ra dựa trên dữ liệu đầu vào cho trước. Để dự đoán kết quả đầu ra, các thuật toán xử lý một tập dữ liệu, còn gọi là tập huấn luyện (Traning set), gồm tập hợp các thuộc tính và cả thuộc tính kết quả tương ứng. Thuộc tính kết quả này được gọi là thuộc tính dự đoán hay còn gọi là lớp (class). Thuật toán tìm cách huấn luyện và khám phá mối quan hệ giữa các thuộc tính trên tập dữ liệu để dự đoán khả năng đầu ra. Sau đó, thuật toán được cho một tập dữ liệu mới, còn được gọi là tập kiểm thử (Testing set). Tập này có chứa cùng tập hợp các thuộc tính, ngoại trừ thuộc tính dự đoán (tên của lớp – không được biết trước). Thuật toán phân tích đầu vào, xử lý và đưa ra dự đoán. Độ chính xác của dự báo càng cao, giải thuật càng được đánh giá là “tốt” [10]. Hai kỹ thuật phân lớp thường được sử dụng trong phân tích dữ liệu giáo dục là Naïve Bayes và Cây quyết định (Decision tree). Trong đó, kỹ thuật Naïve Bayes phân lớp được dựa trên định lý Bayes về lý thuyết xác suất để đưa ra các phán đoán cũng như phân loại dữ liệu dựa trên các dữ liệu được quan sát và thống kê [1]. Mặt khác, Cây quyết định là một cây phân cấp có cấu trúc, được dùng để phân lớp các đối tượng dựa vào dãy các luật. Các thuộc tính của đối tượng (không bao gồm thuộc tính phân lớp) có thể thuộc kiểu dữ liệu khác nhau. Thuộc tính phân lớp, hay “class” phải có kiểu dữ liệu nhị phân hoặc có 686
  4. thứ tự. Cây quyết định sẽ sinh ra các luật để dự đoán lớp của các đối tượng chưa biết trên cơ sở dữ liệu về các đối tượng đã thu thập, và giá trị nút lá trong cây quyết định chính là nhãn của lớp [10]. Để đánh giá độ chính xác (trung bình) của mô hình phân lớp, các nghiên cứu sử dụng nhiều phương pháp đánh giá khác nhau bao gồm: Holdout (Splitting): Dữ liệu được ngẫu nhiên chia thành tập dữ liệu huấn luyện (training) và tập dữ liệu kiểm thử (testing). Thông thường 2/3 dữ liệu cấp cho huấn luyện, phần còn lại dùng cho kiểm thử. Hai tập con được chia là 2 tập không giao nhau. K-fold cross validation: Nhằm tránh sự trùng lặp giữa các tập kiểm thử, toàn bộ các bản ghi trong cơ sở dữ liệu được chia ngẫu nhiên thành k tập con không giao nhau, có kích thước xấp xỉ nhau. Mỗi lần (trong số k lần) lặp, một tập con được sử dụng làm tập kiểm thử - testing, (k-1) tập còn lại dùng làm tập huấn luyện – training. Live-one-out cross validation:Thực hiện việc kiểm thử với dữ liệu huấn luyện (training) và dữ liệu kiểm thử (testing) trên cùng một bản ghi. Điều đó có nghĩa là, sử dụng dữ liệu thu được từ một bản ghi để huấn luyện, sau đó dùng chính dữ liệu của bản ghi đó nhưng chưa dùng trong huấn luyện để kiểm tra độ chính xác theo phương pháp kiểm tra chéo [3]. 2.2.2. Trích chọn thuộc tính Mục đích của trích chọn thuộc tính là chọn tập con của tập các thuộc tính ban đầu, bằng cách loại bỏ các thuộc tính dư thừa, không liên quan hoặc không trợ giúp trong việc đưa ra dự đoán. Lựa chọn thuộc tính được chứng minh trong cả lý thuyết và thực hành thông qua hiệu quả phân lớp, tăng độ chính xác của dự đoán và giảm bộ nhớ lưu trữ dữ liệu vào, giảm thời gian thực hiện phân lớp [7]. 3. Phương pháp nghiên cứu Đối tượng điều tra và kích thước mẫu: Sinh viên k49, hệ chính quy tại trường Đại học Kinh tế, Đại học Huế là đối tượng điều tra của nghiên cứu này. Để đảm bảo mức độ đại diện, tổng mẫu cần thiết là 300 mẫu, được xác định theo bảng tính của Israel [5]. Tương ứng với tổng thể hơn 1,000 sinh viên k49, mức độ tin cậy 95%. Thiết kế bảng hỏi: Bảng hỏi cấu trúc được xây dựng. Trong đó, các câu hỏi được căn cứ vào các thuộc tính đã đề xuất. Chuẩn hóa dữ liệu: Dữ liệu thô ban đầu được lưu trữ dưới dạng file excel (.xlsx). Chuẩn hóa file dữ liệu về dạng file .ARFF (Attribute Relation File Format) để có thể sử dụng được trong WEKA. Ứng dụng WEKA Trích chọn thuộc tính: Nghiên cứu sử dụng đánh giá thuộc tính dựa vào các lớp đã được định nghĩa trong WEKA. Với đánh giá thuộc tính đề tài sử dụng lớp CfsSubsetEval và sử dụng phương pháp tìm kiếm BestFirst search [11]. Phân lớp: Áp dụng hai phương pháp phân lớp phổ biến được dùng trong nghiên cứu khai phá dữ liệu giáo dục là Naïve Bayes và Decision tree. 687
  5. Mô hình xử lý dữ liệu: Nghiên cứu đề xuất mô hình xử lý dữ liệu như sau: Đánh giá độ Dữ liệu thô chính xác và Trích chọn thuộc tính Dữ liệu sau Phân lớp thời gian trích chọn thực hiện Kết luận Những nhân tố quyết định và mô hình phân lớp hiệu quả nhất Hình 1. Mô hình xử lý dữ liệu Dữ liệu thô ban đầu được áp dụng kỹ thuật trích chọn thuộc tính để tìm ra tập dữ liệu con. Bước tiếp theo, tập dữ liệu con này sẽ được áp dụng kỹ thuật phân lớp trên đó. Với mỗi giải thuật, các kết quả về độ chính xác phân lớp và thời gian thực hiện được lưu lại để đánh giá và so sánh. Cuối cùng, tập con những nhân tố quan trọng được khẳng định đồng thời với mô hình phân lớp hiệu quả nhất được đề xuất. 4. Kết quả và thảo luận 4.1. Một số đặc điểm chính của đối tượng điều tra Kết quả điều tra cho thấy, nơi sinh của sinh viên được điều tra phân bố không đều trên 13 tỉnh. Trong đó, sinh viên sinh tại Huế chiếm tỷ lệ cao nhất với 63.67%, tiếp theo là Quảng Bình với 9%, và Quảng trị với 8.33% và Hà Tĩnh là 4.67%. Số lượng sinh viên thuộc ngành Hệ thống Thông tin Quản lý tham gia trong điều tra là 126 sinh viên, chiếm 42% tổng số phiếu điều tra. Còn lại, 174 mẫu tương ứng với 58% là sinh viên từ các ngành học khác. Bên cạnh đó, số lượng sinh viên nam tham gia vào điều tra 94 mẫu, chiếm 31.33% tổng số mẫu điểu tra; Số lượng sinh viên nữ là 206 sinh viên, tương ứng với 68.67%. Trong đó, số lượng sinh viên nam thuộc ngành Hệ thống Thông tin Quản lý là 55 sinh viên, chiếm 58.51% tổng số sinh viên nam được hỏi; số lượng sinh viên nữ thuộc ngành Hệ thống Thông tin Quản lý được hỏi là 71 sinh viên, chiếm 34.46% tổng số sinh viên nữ được hỏi. 4.2. Kết quả trích chọn thuộc tính Sau khi chạy mô hình trích chọn thuộc tính trên WEKA, dựa trên lớp đánh giá thuộc tính CfsSubsetEval và phương pháp tìm kiếm BestFirst search, kết quả cho ra 4 688
  6. thuộc tính (tương ứng với 4 nhân tố) bao gồm: giới tính, tổng điểm thi (bao gồm điểm ưu tiên), cơ hội việc làm, đam mê ứng dụng công nghệ thông tin vào kinh tế. Kết quả chạy trích chọn thuộc tính trong WEKA được thể hiện trong Hình 2: === Run information === === Attribute Selection on all input data === Search Method: Best first. Start set: no attributes Search direction: forward Stale search after 5 node expansions Total number of subsets evaluated: 246 Merit of best subset found: 0.549 Attribute Subset Evaluator (supervised, Class (nominal): 39 Class): CFS Subset Evaluator Including locally predictive attributes Selected attributes: 1,8,33,37 : 4 Gioi tinh Tong diem Dam me ung dung CNTT Viec lam Hình 2. Kết quả trích chọn thuộc tính Kết quả cho thấy, những nhân tố được rút ra được từ những nghiên cứu trước, ví dụ như, yếu tố về sự tác động các đối tượng tham chiếu (Bố mẹ, thầy cô, anh chị em, bạn bè), kiến thức hữu ích đối với cá nhân, hay nhân tố về tầm ảnh hưởng của việc quảng bá ngành học của trường đối với sinh viên không phải là những nhân tố quyết định đến lựa chọn ngành học Hệ thống Thông tin Quản lý của sinh viên trường Đại học Kinh tế. Mặt khác, kết quả này phản ánh, sinh viên quyết định chọn ngành Hệ thống Thông tin Quản lý chưa có sự tìm hiểu sâu về chuyên ngành được đào tạo, lựa chọn ngành dựa chủ yếu vào cảm tính chủ quan của cá nhân. Tuy nhiên, kết quả này phù hợp với thực tế đào tạo và đặc trưng ngành Hệ thống Thông tin Quản lý so với các ngành học khác trong trường. Thứ nhất, về giới tính, tỷ lệ sinh viên nam theo học ngành này luôn cao hơn so với sinh viên nữ. Thứ hai, để an toàn khi lựa chọn ngành, sinh viên ngành Hệ thống Thông tin Quản lý cũng như các ngành khác luôn chú trọng đến việc lựa chọn chuyên ngành có điểm đầu vào phù hợp với tổng điểm thi của mình. Thứ ba, rõ ràng khi lựa chọn học ngành Hệ thống Thông tin Kinh tế, sinh viên có nhiều cơ hội tìm kiếm việc làm bởi vì sinh viên vừa được trang bị kiến thức và kỹ năng 689
  7. cả về lĩnh vực tin học và kinh tế. Do đó, sinh viên có thể tìm kiếm được nhiều cơ hội việc làm và có nhiều lựa chọn hơn so với một số ngành khác. Cuối cùng, sinh viên tham gia học chuyên ngành này thường có khả năng tìm hiểu và ứng dụng công nghệ thông tin vào kinh tế nhanh hơn so với các chuyên ngành chỉ đơn thuần về kinh tế. Chính điều này đã tác động đến yếu tố cuối cùng đó là sự đam mê ứng dụng Công nghệ thông tin vào kinh tế. Áp dụng phương pháp xếp hạng (Ranker) trong trích chọn thuộc tính, chạy dữ liệu đầu vào là 4 thuộc tính đã được chọn. Kết quả cho thấy, thuộc tính Tổng điểm được xếp thứ tự ưu tiên cao nhất tương ứng với ảnh hưởng lớn nhất đến quyết định chọn ngành, sau đó đến đam mê ứng dụng Công nghệ thông tin vào kinh tế, giới tính, và cuối cùng là cơ hội việc làm sau khi tốt nghiệp. 4.3. Kết quả độ chính xác của phân lớp và thời gian xử lý Sau khi trích chọn 4 thuộc tính đã nêu trên, nghiên cứu thực hiện việc so sánh độ phân lớp chính xác và thời gian thực hiện mô hình phân lớp của dữ liệu trước và sau trích chọn.Bảng kết quả được tổng hợp dưới đây: Bảng 1. Độ chính xác của phân lớp, thời gian thực hiện trước và sau khi trích chọn thuộc tính Độ chính xác phân Lớp đã được định nghĩa Thời gian Kỹ thuật lớp trong WEKA (s) (%) Trước Sau trích Trước Sau trích trích chọn chọn trích chọn chọn BayesNet 89.33 90.00 0.19 0.08 Bayes Naïve Bayes 84.67 86.00 0.03 0.03 NaïveBayesMultiomialTex 58.00 58.00 0.02 0.01 t NaïveBayesUpdatable 84.67 86.00 0.05 0.02 DecisionStump 88.00 88.00 0.03 0.01 HoeffdingTree 84.67 86.34 0.14 0.06 J48 88.67 92.00 0.13 0.09 Tree LMT 90.00 90.00 18.3 0.88 RandomForest 92.67 93.33 0.56 0.31 RandomTree 88.33 90.00 0.06 0.02 REPTree 87.34 90.34 0.11 0.03 (Nguồn: Kết quả chạy mô hình sử dụng WEKA) Kết quả cho thấy, về tổng thể đối với cơ sở dữ liệu đã thu thập của đề tài, kỹ thuật phân lớp dựa trên giải thuật Cây quyết định mang lại độ chính xác phân lớp cao hơn so với kỹ thuật dựa trên giải thuật Bayes. Ví dụ, kết quả về độ phân lớp chính xác cao nhất dựa trên Bayes là 90% - cho BayesNet sau khi trích chọn thuộc tính, trong khi đối với kỹ thuậtCây quyết định, tỷ lệ phân loại chính xác cao nhất thuộc về kết quả chạy RandomForest với 93.33%. Bên cạnh đó, độ phân lớp chính xác thấp nhất khi chạy Cây 690
  8. quyết định trên dữ liệu đã được trích chọn là 86.34% cho HoefdingTree, trong khi độ chính xác thấp nhất khi phân lớp dựa trên kỹ thuật Bayes chỉ đạt có 58% cho BaïveBayesMultiomialText trên cùng dữ liệu đầu vào. Có sự cải thiện đáng kể về mức độ phân loại chính xác hơn sau khi thực hiện thao tác trích chọn dữ liệu so với dữ liệu thô. Hơn thế nữa, với tất cả các trường hợp, thời gian thực hiện mô hình phân lớp cũng nhanh hơn đáng kể sau khi trích chọn thuộc tính quan trọng.Ví dụ, xét với giải thuật phân loại tốt nhất thuộc nhóm Bayes, trước khi trích chọn thuộc tính, BayesNet cho kết quả phân lớp chính xác là 89.33% với thời gian xây dựng mô hình phân lớp là 0.19s, trong khi độ chính xác của phân lớp được tăng lên 90% và thời gian xử lý chỉ còn 0.08s sau khi dữ liệu đã được trích chọn. Thêm vào đó, có thể thấy với giải thuật tốt nhất thuộc nhóm Cây quyết định, mô hình phân lớp dựa trên RandomForest cho kết quả độ chính xác phân lớp sau khi trích chọn dữ liệu cao hơn trước khi trích chọn 0.66%, trong khi thời gian xử lý giảm 0.25s. Đặc biệt, đối với giải thuật J48 thể hiện sự chênh lệch lớn nhất về độ chính xác phân lớp giữa trước và sau trích chọn. Độ chính xác tăng 3.33% từ 88.67% trước trích chọn lên 92% sau khi trích chọn dữ liệu, nhưng thời gian xử lý lại giảm xuống từ 0.13s chỉ còn 0.09s. Mô hình phân lớp cho độ chính xác tốt nhất dựa trên 4 thuộc tính đã được trích chọn là dựa trên giải thuật RandomForest, với độ chính xác 93.33%, được thực hiện trong 0.31s. 5. Kết luận Căn cứ vào kết quả của nghiên cứu, 4 nhân tố quan trọng ảnh hưởng đến quyết định lựa chọn ngành Hệ thống Thông tin Kinh tế đã được xác định theo thứ tự giảm dần: Tổng điểm (bao gồm điểm ưu tiên), đam mê ứng dụng Công nghệ thông tin vào kinh tế, giới tính, và cơ hội việc làm. Kết quả trên cho thấy, sinh viên ngành Hệ thống Thông tin Quản lý đã lựa chọn ngành học của mình chủ yếu dựa vào điểm tổng xét tuyển phù hợp với điểm tuyển sinh của ngành, và dựa vào cảm tính cũng như mong muốn chủ quan của cá nhân, chưa có sự tìm hiểu sâu sắc về ngành học. Nghiên cứu này cũng phần nào phản ánh một thực trạng là vai trò của nhà trường và các đối tượng tham chiếu trong việc lựa chọn ngành học này của sinh viên là chưa rõ ràng. Chính điều này đã dẫn đến một thực tế mà nhà trường đang phải đối mặt là sinh viên không đáp ứng được yêu cầu đào tạo do không biết trước yêu cầu về đào tạo, vì vậy không có sự chuẩn bị trước về mặt kiến thức cũng như tinh thần để có thể đáp ứng được yêu cầu về đầu ra. Để tăng chất lượng đào tạo, đồng thời tăng số lượng sinh viên đăng ký nhập học chuyên ngành này, vai trò của nhà trường trong việc định hướng nghề nghiệp trong các buổi hướng nghiệp cho học sinh trung học phổ thông cần được tăng cường. Bên cạnh đó, việc quảng bá về ngành học cũng cần được thực hiện để người học biết đến chuyên ngành, cơ sở vật chất dành cho đào tạo chuyên ngành, đội ngũ giảng viên, yêu cầu về đầu vào, đầu ra, phẩm chất của người học,…trên cơ sở đó, người học tự mìnhcó định hướng rõ ràng hơn, tin tưởng hơn đối với chuyên ngành theo học, và họ sẽ trở thành trung tâm của hoạt 691
  9. động học tập. Khi người học đã chủ động và là trung tâm của hoạt động học tập thì nhà trường đã đạt được một trong những nhân tố vô cùng quan trọng đánh giá giáo dục bền vững, điều này chính là cơ sở cho sự phát triển bền vững về mọi mặt, trong đó có phát triển kinh tế bền vững. TÀI LIỆU THAM KHẢO Ahmed, Abeer Badr El Din, and Ibrahim Sayed Elaraby. 2014. Data Mining: A prediction for Student's Performance Using Classification Method. World Journal of Computer Application and Technology: 2 (2):43-47. Beggs, Jeri Mullins, John H Bantham, and Steven Taylor. 2008. Distinguishing the factors influencing college students'choice of major. College Student Journal: 42 (2):381. Bottou, Léon, Corinna Cortes, John S Denker, Harris Drucker, Isabelle Guyon, Lawrence D Jackel, Yann LeCun, Urs A Muller, Edward Sackinger, and Patrice Simard. 1994. Comparison of classifier methods: a case study in handwritten digit recognition. Paper read at Pattern Recognition, 1994. Vol. 2-Conference B: Computer Vision & Image Processing., Proceedings of the 12th IAPR International. Conference on. Edmonds, Jill. 2012. Factors influencing choice of college major: what really makes a difference? Israel, Glenn D. 1992. Determining sample size: University of Florida Cooperative Extension Service, Institute of Food and Agriculture Sciences, EDIS Gainesville. Keshishian, Flora, Joseph M Brocavich, R Thomas Boone, and Somnath Pal. 2010. Motivating factors influencing college students' choice of academic major. American journal of pharmaceutical education: 74 (3):46. Koller, Daphne, and Mehran Sahami. 1996. Toward optimal feature selection. Stanford InfoLab. Lan Hương, Thị Nguyễn 2012. Nghiên cứu các yếu tố ảnh hưởng đến động cơ chọn ngành quản trị doanh nghiệp của sinh viên trường Cao đẳng Kinh tế-Kế hoạch Đà Nẵng. My, Trà. 2005. Báo người lao động. Voznika, Fabricio, and Leonardo Viana. 2007. Data Mining Classification. WekaSource. Available from (http://weka.sourceforge.net/doc.stable/weka/attributeSelection/CfsSubsetEval.html) Xiao, Zhenyu, Dengfeng Wang, and Yang Liu. 2009. Economic environment and personality: how do they influence investment decisions and regret? Social Behavior and Personality: 37 (10):1297-1304. Yazici, Sedat, and Yazici Asli. 2010. Students' choice of college major and their perceived fairness of the procedure: Evidence from Turkey. Educational Research and Evaluation: 16 (4):371-382. 692
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2