Nghiên cứu khoa học công nghệ<br />
<br />
HỌC BÁN GIÁM SÁT TRONG MẠNG NƠRON MIN MAX MỜ CHO<br />
PHÂN CỤM DỮ LIỆU VỚI RÚT TRÍCH LUẬT QUYẾT ĐỊNH<br />
Vũ Đình Minh1*, Nguyễn Doãn Cường2<br />
Tóm tắt: Bài báo này đề xuất một mạng nơron min-max mờ cải tiến cho vấn đề<br />
phân cụm dữ liệu với phương pháp học bán giám sát. Mô hình đề xuất sử dụng<br />
phương pháp lan truyền nhãn trong quá trình huấn luyện gọi là MSS-FMM. Một số<br />
mẫu trong tập dữ liệu huấn luyện được gán nhãn là thông tin bổ trợ được sử dụng<br />
trong phương pháp phân cụm bán giám sát. Nghiên cứu của chúng tôi được kiểm<br />
chứng trên các tập dữ liệu đã được công bố và tập dữ liệu bao gồm 320 bệnh nhân<br />
đến khám và điều trị viêm gan mạn tại các bệnh viện Thái Nguyên. Các kết quả thực<br />
nghiệm được so sánh với kết quả thực nghiệm của các mạng nơron min-max mờ<br />
được đưa ra bởi các nhà nghiên cứu khác. Giải pháp của chúng tôi đã nâng cao<br />
đáng kể độ đo Accuracy phân loại.<br />
Từ khóa: Mạng nơron min-max mờ; Phân cụm; Có giám sát; Không giám sát; Bán giám sát.<br />
<br />
1. ĐẶT VẤN ĐỀ<br />
Mô hình mạng nơron min-max mờ (FMNN) đầu tiên được đề xuất đầu tiên bởi<br />
Simpson. Học trong FMNN gồm học có giám sát áp dụng cho bài toán phân lớp dữ<br />
liệu [11] và học không giám sát áp dụng cho bài toán phân cụm dữ liệu [12].<br />
FMNN biểu diễn dữ liệu bằng các hyperbox mờ. Sự kết hợp giữa logic mờ và khả<br />
năng học của mạng nơron là điểm mạnh của FMNN khi xử lý các thông tin không<br />
chắc chắn. Do đó, các mạng FMNN có thể ứng dụng trong rất nhiều lĩnh vực như<br />
hệ chuyên gia, dự báo, điều khiển...<br />
Tuy nhiên, hiệu suất của FMNN bị phụ thuộc rất lớn vào giới hạn kích thước<br />
tối đa của hyperbox. Nếu max càng lớn, dẫn tới số lượng hyperbox nhỏ, dẫn đến<br />
hiệu suất giảm. Ngược lại nếu max quá bé thì mô hình tính toán có thể bị quá khớp<br />
(overfitting). Đặc biệt, đối với các tập dữ liệu có kích thước các cụm dữ liệu không<br />
đồng đều thì hiệu quả của các FMNN sẽ bị giảm nhiều hơn.<br />
Cho đến nay, đã có nhiều nghiên cứu nhằm nâng cao hiệu quả của các FMNN<br />
được đề xuất, nhưng hầu hết chỉ tập trung vào cải tiến quá trình điều chỉnh kích<br />
thước hyperbox [2], [3], [4], [6], [7], [9], [10], [15]. Bên cạnh đó, một vài nghiên<br />
cứu cải tiến FMNN sử dụng phương pháp học bán giám sát cũng được đề xuất [5],<br />
[8], [13].<br />
Trong bài báo này, chúng tôi đề xuất mô hình cải tiến sử dụng thuật toán học<br />
bán giám sát để phân cụm dữ liệu được phát triển từ mô hình SS-FMM [13]. Mô<br />
hình đề xuất sử dụng phương thức học bán giám sát với một phần của dữ liệu đã<br />
được gán nhãn đi cùng các mẫu dữ liệu đầu vào. Các đóng góp chính bao gồm (i)<br />
số mẫu được gán nhãn ít hơn, (ii) không tạo ra các hyperbox có đặc tính mới, (iii)<br />
thực hiện một lần duyệt duy nhất qua các mẫu dữ liệu (iv) sử dụng tất cả các mẫu<br />
trong quá trình đào tạo, (v) giảm số lượng các hyperbox để tối ưu FMNN.<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 11 - 2018 17<br />
Công nghệ thông tin<br />
<br />
Các phần tiếp theo của bài báo gồm: phần 2 giới thiệu về mạng nơron min-max<br />
mờ, cắt tỉa các hyperbox và rút trích các luật quyết định. Phần 3 trình bày giải pháp<br />
đề xuất của chúng tôi, phần 4 đưa ra các kết quả thực nghiệm và so sánh với các<br />
phương pháp khác, phần cuối cùng là kết luận.<br />
2. MẠNG NƠRON PHÂN CỤM MIN-MAX MỜ VỚI KẾT XUẤT LUẬT<br />
2.1. Mạng nơron min max mờ<br />
FMNN [12] là mạng nơron hai lớp: lớp đầu vào FA bao gồm n nút (n là kích<br />
thước của vector đầu vào); lớp đầu ra FB bao gồm m nút, mỗi nút tương ứng với<br />
một hyperbox.<br />
Thuật toán học chỉ bao gồm quá trình điều chỉnh mở rộng/co lại các hyperbox,<br />
thuật toán học FMNN bao gồm 3 bước: tạo và mở rộng các hyperbox, kiểm tra<br />
chồng lấn giữa các hyperbox, co lại các hyperbox nếu có chống lấn. Các bước 1-3<br />
được thực hiện trên mỗi mẫu đầu vào.<br />
2.2. Cắt tỉa hyperbox sử dụng GA<br />
Để cắt tỉa các hyperbox có chỉ số sử dụng thấp, mạng nơron min-max mờ sử<br />
dụng giải thuật di truyền (GA) [14]. Quá trình chung của hoạt động di truyền được<br />
thực hiện như sau:<br />
1. Khởi tạo: Khởi tạo quần thể ban đầu bằng cách sinh ngẫu nhiên chuỗi nhị<br />
phân bao gồm tất cả các hyperbox.<br />
2. Chọn lọc: Chọn các cặp từ chuỗi ban đầu với xác suất lựa chọn theo giá trị<br />
tối thiểu của hàm mục tiêu cho mỗi cá thể trong quần thể.<br />
3. Tạo quần thể mới: Tạo quần thể mới bằng cách lai ghép chéo từ các cá thể<br />
hiện tại có chọn lọc, đồng thời tạo ra các đột biến trong quần thể mới theo một xác<br />
suất nhất định.<br />
4. Thay thế ngẫu nhiên: Các cá thể trong quần thể mới sinh ra được thay thế<br />
cho các cá thể trong quần thể cũ bằng cách thay thế ngẫu nhiên một cá thể cũ bằng<br />
một cá thể mới với giá trị hàm mục tiêu lớn nhất.<br />
5. Điều kiện dừng: Nếu các điều kiện dừng thỏa thì giải thuật dừng lại, nếu<br />
không thì quay lại bước 2.<br />
2.3. Rút trích luật quyết định từ mạng nơron min - max mờ<br />
Mỗi hyperbox được sử dụng để kết xuất thành một luật quyết định<br />
“if…then”. Các giá trị min và max được định lượng thành các mức Q trong khoảng<br />
[0,1] tương đương số phân vùng mờ trong quy tắc định lượng [1]. Các luật<br />
if…then mờ được định nghĩa theo (1):<br />
Rule R j : If x p1 is Aq and x pn is Aq<br />
Then x pis C j<br />
(1)<br />
<br />
<br />
<br />
18 V. Đ. Minh, N. D. Cường, “Học bám sát trong mạng nơron … rút trích luật quyết định.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
với xp là mẫu vào n chiều, Aq là giá trị tiền đề, Cj là cụm thứ jth.<br />
3. ĐỀ XUẤT THUẬT TOÁN CẢI TIẾN<br />
Mô hình đề xuất MSS-FMM (Modified SS-FMM) (Hình 1), sử dụng giải thuật<br />
di truyền cắt tỉa các hyperbox có chỉ số thấp và kết xuất các luật quyết định. Hình 2<br />
mô tả sơ đồ thuật toán học MSS-FMM, dữ liệu vào là các mẫu dữ liệu đi cùng<br />
nhãn trong tập huấn luyện. Các mẫu dữ liệu có nhãn được đưa vào trước, các mẫu<br />
dữ liệu không có nhãn được đưa vào sau. MSS-FMM gán nhãn cho tất cả các<br />
hyperbox mới tạo ra trong mạng từ các mẫu không có nhãn sau khi kết thúc quá<br />
trình một lần duyệt qua các mẫu dữ liệu.<br />
<br />
Dữ liệu Mở rộng Kiểm tra Điều chỉnh Gán nhãn cho<br />
vào siêu hộp chồng lấn chồng lấn hyperbox<br />
<br />
Huấn luyện mạng nơron min max mờ<br />
<br />
Cắt tỉa hyperbox<br />
<br />
<br />
Kết xuất luật<br />
<br />
Hình 1. Mô hình MSS-FMM với kết xuất luật quyết định.<br />
Tập dữ liệu huấn luyện D gồm m cặp được sắp {Ah,dl}, Ah là mẫu vào thứ h,<br />
dl {0,1,2,...,p} là nhãn đi kèm mẫu đầu vào, Ah đi kèm với dl = 0 được coi là mẫu<br />
huấn luyện không có nhãn. Thuật toán học MSS-FMM gán nhãn cho các mẫu chưa<br />
được gán nhãn, tạo và gán nhãn cho các hyperbox.<br />
Với các mẫu vào không có nhãn, thuật toán học xem xét các khả năng:<br />
1) Nếu mẫu vào thỏa mãn điều kiện ràng buộc mở rộng (2), điều chỉnh các<br />
điểm min, max của hyperbox theo (3), (4), gán nhãn của mẫu theo nhãn của<br />
hyperbox.<br />
1 n<br />
<br />
max w ji , ahi min v ji , ahi <br />
n i 1<br />
(2)<br />
<br />
v new<br />
ji <br />
min v old<br />
ji , ahi i 1, 2,..., n (3)<br />
<br />
wnew<br />
ji max w old<br />
ji ,a <br />
hi i 1, 2,..., n (4)<br />
2) Nếu mẫu vào không thỏa mãn điều kiện ràng buộc mở rộng (2), tạo<br />
hyperbox mới Hnew và xem xét các khă năng:<br />
2.1) Nếu tồn tại một Bj thỏa mãn (5). Gán nhãn cho Hnew theo nhãn của Bj,<br />
thêm hyperbox Hnew vào tập B.<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 11 - 2018 19<br />
Công nghệ thông tin<br />
<br />
<br />
Bắt đầu<br />
<br />
<br />
{Ah,dl}D<br />
<br />
<br />
Có hyperbox s Nhãn s<br />
nào chứa được Ah? của dl=0?<br />
<br />
đ đ Tạo hyperbox Bj mới;<br />
B = B{Bj}<br />
Mở rộng hyperbox<br />
Tạo hyperbox Gp mới;<br />
G = G{Gp}<br />
<br />
Có chồng s<br />
lấn hyperbox? Gán nhãn cho hyperbox theo<br />
nhãn của Ah<br />
đ<br />
Co lại hyperbox<br />
<br />
<br />
<br />
s Tất cả đ<br />
dữ liệu vào đã hết?<br />
<br />
<br />
<br />
<br />
Chọn hyperbox Gp G<br />
<br />
<br />
Tính tâm dữ liệu (Cp) của hyperbox Gp ;<br />
Tìm độ thuộc lớn nhất giữa Cp và hyperbox BjB;<br />
Gán nhãn cho Gp theo Bj<br />
<br />
<br />
G = G\{Gp} ; B = B{Gp}<br />
<br />
<br />
Không còn<br />
hyperbox nào trong G?<br />
<br />
y<br />
<br />
Kết thúc<br />
<br />
Hình 2. Sơ đồ thuật toán học MSS-FMM.<br />
<br />
<br />
max E A , B j 1,..., q <br />
h j<br />
(5)<br />
<br />
với E A , B được xác định theo công thức (6):<br />
h j<br />
<br />
<br />
<br />
n 2<br />
1<br />
E A , B 1 <br />
h j<br />
n<br />
c ji ahi (6)<br />
i 1<br />
<br />
cji được tính theo công thức (7):<br />
v ji w ji<br />
c ji (7)<br />
2<br />
<br />
<br />
20 V. Đ. Minh, N. D. Cường, “Học bám sát trong mạng nơron … rút trích luật quyết định.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
2.2) Nếu không tồn tại Bj thỏa mãn (5). Gán nhãn cho Hnew bằng 0, thêm Hnew<br />
vào tập G.<br />
3) Sau khi kết thúc quá trình duyệt một lần qua các mẫu, thuật toán học tính<br />
tâm dữ liệu của các hyperbox GpG theo (8):<br />
N<br />
1<br />
c pi <br />
N<br />
<br />
j 1<br />
a ji (8)<br />
<br />
với cpi là tâm của hyperbox Gp theo chiều thứ i, N là tổng số mẫu thuộc hyperbox<br />
Gp, aji là chiều thứ i của mẫu aj. Với mỗi hyperbox Gp, tìm hyperbox Bj có độ<br />
thuộc tương ứng với cp theo (9). Gán nhãn cho hyperbox Gp là nhãn của hyperbox<br />
có độ thuộc lớn nhất, chuyển Gp sang tập B.<br />
1 n<br />
b j Ah ,V j , Wj 1 f ahi w ji , f v ji ahi , (9)<br />
n i 1 <br />
<br />
4. THỰC NGHIỆM<br />
4.1. Dữ liệu thực nghiệm<br />
Các thực hiện thực nghiệm được tiến hành trên các tập dữ liệu Aggregation,<br />
Flame, Pathbased, Spiral, Jain, R15, Iris, Thyroid, Wine từ kho dữ liệu học máy<br />
UCI và một bộ dữ liệu của các bệnh nhân đến khám và điều trị xơ gan (Cirrhosis)<br />
được thu thập tại bệnh viện Gang thép Thái Nguyên và bệnh viện Đa khoa TW<br />
Thái Nguyên. Thông tin về các tập dữ liệu trên bảng 1.<br />
Bảng 1. Thông tin các tập dữ liệu thực nghiệm.<br />
TT Data Số mẫu Số đặc tính Số nhóm<br />
1 Flame 240 2 2<br />
2 Jain 373 2 2<br />
3 Spiral 312 2 3<br />
4 Aggregation 788 2 7<br />
5 Pathbased 317 2 3<br />
6 R15 600 2 15<br />
8 Iris 150 4 3<br />
9 Thyroid 215 5 3<br />
10 Wine 178 13 3<br />
11 Cirrhosis 320 4 2<br />
Tập dữ liệu Cirrhosis gồm 320 bệnh nhân đến khám và điều trị bệnh do rối<br />
loạn men gan gồm 2 nhóm: nhóm 1 gồm 150 hồ sơ bệnh nhân không bị xơ gan;<br />
nhóm 2 gồm 170 hồ sơ bệnh nhân được chẩn đoán là xơ gan. 4 thông tin là thuộc<br />
tính đầu vào cho thực nghiệm bao gồm: Tuổi, men AST, men ALT, tiểu cầu.<br />
4.2. Thực nghiệm và đánh giá<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 11 - 2018 21<br />
Công nghệ thông tin<br />
<br />
4.2.1. Thực nghiệm trên bộ dữ liệu chuẩn<br />
Các tham số bao gồm: = 10, β = 0.99, = 0.9. Sử dụng phương pháp kiểm<br />
tra chéo “k-fold”, với k = 10 để đánh giá.<br />
Bảng 2 biểu diễn kết quả thực nghiệm trên các tập dữ liệu từ UCI của MSS-<br />
FMM. Acc là độ đo Accuracy trên tập dữ liệu, NoH là tổng số hyperbox, max là<br />
giới hạn kích thước tối đa của hyperbox.<br />
Bảng 2. Kết quả thực nghiệm trên tập dữ liệu chuẩn.<br />
Tỉ lệ mẫu có nhãn/tổng số mẫu<br />
Tập dữ liệu 10% 90%<br />
max Acc (%) NoH max Acc (%) NoH<br />
Aggregation 0.015 99.37 160 0.015 99.87 157<br />
Flame 0.015 98,75 47 0.015 99,58 45<br />
Jain 0.03 100 42 0.03 100 43<br />
Sprial 0.02 100 63 0.02 100 62<br />
Pathbased 0.02 97,81 65 0.02 99,04 64<br />
R15 0.015 99 150 0.015 99,33 150<br />
Iris 0.015 96,00 80 0.015 96,67 80<br />
Thyroid 0.005 90,32 163 0.01 97,68 162<br />
Wine 0.015 77,61 140 0.01 95,00 139<br />
<br />
<br />
<br />
<br />
Hình 3. Mô phỏng kết quả thực nghiệm trên tập dữ liệu Flame.<br />
Hình 3 mô phỏng kết quả thực nghiệm trên tập dữ liệu Flame với số mẫu trong<br />
tập dữ liệu huấn luyện lần lượt là 10%, 50%, 90%. Kết quả thực nghiệm cho thấy<br />
MSS-FMM có kết quả tốt, đạt 100% trên tập dữ liệu Jain và Sprial, đạt 99% với<br />
Aggregation, Flame, Pathbased và trên 96% với các tập còn lại. Khi tăng giá trị<br />
max, độ đo Accuracy giảm. Độ đo Accuracy giảm ít khi giảm tỉ lệ mẫu có nhãn<br />
trong tập dữ liệu huấn luyện giảm dần.<br />
<br />
<br />
22 V. Đ. Minh, N. D. Cường, “Học bám sát trong mạng nơron … rút trích luật quyết định.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
Bảng 3 so sánh kết quả thực nghiệm trên tập dữ liệu Thyroid khi thay đổi tỉ lệ<br />
mẫu có nhãn. Kết quả cho thấy MSS-FMM tốt hơn so với GFMM [5] và RFMN<br />
[8] và tương đương với SS-FMM [13].<br />
Bảng 3. So sánh kết quả thực nghiệm của MSS-FMM với các phương thức khác.<br />
10 20 30 40 50 60 70 80<br />
Tập dữ liệu % % % % % % % % 90 %<br />
GFMM (%) 71.5 74.7 75.4 77.9 87.9 91.7 92.6 94.5 95.84<br />
RFMN (%) 74.1 76.9 87.9 88.0 91.6 92.6 94.4 95.7 96.3<br />
SS-FMM (%) 90.3 94.4 95.8 96.3 97.6 97.6 97.6 97.2 97.6<br />
MSS-FMM (%) 90.3 92.2 95.8 96.3 96.3 96.7 97.6 97.6 97.6<br />
Bảng 4 so sánh kết quả thực nghiệm của MSS-FMM với một số phương thức<br />
khác trên tập dữ liệu Thyroid, Wine, Iris. Kết quả cho thấy MSS-FMM tốt hơn so<br />
với FMM-CF[9], FMM-GA [14] và tương đương với SS-FMM [13].<br />
Bảng 4. So sánh kết quả thực nghiệm của MSS-FMM với phương thức khác.<br />
FMM- MSS-<br />
FMNN FMM-GA SS-FMM<br />
Tập dữ liệu max CF FMM<br />
(%) (%) (%)<br />
(%) (%)<br />
Thyroid 0.02 81.92 87.76 92.63 94.46 93.86<br />
Wine 0.015 91.67 91.11 93.33 96.11 96.11<br />
Iris 0.02 92.81 92.16 95.42 96.00 96.00<br />
4.2.2. Thực nghiệm trên cơ sở dữ liệu bệnh nhân<br />
Trong các thực nghiệm, phương pháp đánh giá các kết quả theo thống kê để tính<br />
trung bình bao gồm các chỉ số: Giá trị dự đoán (Acc), độ nhạy (AccSe), độ đặc<br />
hiệu (AccSp), giá trị dự đoán âm (NPV), giá trị dự đoán dương (PPV).<br />
Bảng 5 là kết quả so sánh các chỉ số được thực hiện bởi FMNN, FMM-CF,<br />
FMM-GA, SS-FMM và MSS-FMM. MSS-FMM có kết quả tốt hơn so với<br />
FMM-CF, FMM-GA, FMNN và tương đương với SS-FMM.<br />
Bảng 5. Thống kê kết quả các giá trị dự báo.<br />
Thuật toán Acc (%) AccSe (%) AccSp (%) PPV (%) NPV (%)<br />
FMNN 85.94 88.82 88.00 88.82 83.02<br />
FMM-CF 91.56 91.33 90.00 91.33 91.84<br />
FMM-GA 95.00 95.83 95.33 95.83 94.08<br />
SS-FMM 95.94 95.91 95.33 95.91 95.97<br />
MSS-FMM 95.31 95.32 94.67 95.32 95.30<br />
<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 11 - 2018 23<br />
Công nghệ thông tin<br />
<br />
Bảng 6 biểu diễn các luật tạo thành được rút trích từ các hyperbox với giới hạn<br />
kích thước max = 0.09, tổng số hyperbox là 12 tương ứng với 12 luật. Với A1, A2,<br />
A3, A4 là các đặc tính. C là kết quả chẩn đoán: 1 là có bệnh, 0 là không có bệnh.<br />
Bảng 6. Rút trích các luật quyết định.<br />
If Then If Then<br />
Luật Luật<br />
A1 A2 A3 A4 (C) A1 A2 A3 A4 (C)<br />
<br />
R1 3-5 4-5 4-5 5 1 R7 2-3 3 3 5 1<br />
R2 4-5 4 4 4-5 1 R8 4-5 3 3 3-4 1<br />
R3 3-4 3 3 4-5 1 R9 2-3 2 2 2 0<br />
R4 2-3 3 3 3-4 1 R10 1-2 2 2 2 0<br />
R5 4-5 3 3 3-4 1 R11 2-4 2 2 1 0<br />
R6 3-4 3 3 4 1 R12 4-5 2 2 1 0<br />
<br />
5. KẾT LUẬN<br />
Bài báo đã trình bày mô hình mạng nơron phân cụm dữ liệu min-max mờ<br />
MSS-FMM được cải tiến từ mô hình SS-FMM. MSS-FMM sử dụng phương pháp<br />
học bán giám sát với phương pháp lan truyền nhãn. Các kết quả thực nghiệm cho<br />
thấy MSS-FMM có kết quả tốt hơn FMNN, FMM-CF, FMM-GA.<br />
Tuy nhiên, để đạt được hiệu suất tốt MSS-FMM đòi hỏi thời gian và kinh<br />
nghiệm bằng việc “thử sai” nhiều lần để xác định các tham số điều chỉnh. Ngoài ra,<br />
việc xác định kích thước giới hạn chung cho tất cả các cụm (hyperbox) bằng<br />
ngưỡng là một vấn đề cần phải xem xét, do thực tế kích thước và mật độ dữ liệu<br />
của mỗi cụm dữ liệu trong không gian đầu vào là hoàn toàn khác nhau. Đây cũng<br />
là một hướng nghiên cứu tiếp theo cần được xem xét.<br />
TÀI LIỆU THAM KHẢO<br />
[1]. Carpenter, G. A., & Tan, A. H. (1995). "Rule extraction: From neural<br />
architecture to symbolic representation". Connection Science, 7(1), 3-27.<br />
[2]. Chaudhari, B. M., Patil, R. S., Rane, K. P., & Shinde, U. B. (2010, August).<br />
Online Signature Classification Using Modified Fuzzy Min-Max Neural<br />
Network with Compensatory Neuron Topology. In International Conference<br />
on Contemporary Computing (pp. 467-478). Springer, Berlin, Heidelberg.<br />
[3]. Davtalab, R., Dezfoulian, M. H., & Mansoorizadeh, M. (2014). Multi-level fuzzy<br />
min-max neural network classifier. IEEE transactions on neural networks and<br />
learning systems, 25(3), 470-482.<br />
[4]. Davtalab, R., Parchami, M., Dezfoulian, M. H., Mansourizade, M., & Akhtar,<br />
B. (2012, February). M-FMCN: modified fuzzy min-max classifier using<br />
<br />
<br />
24 V. Đ. Minh, N. D. Cường, “Học bám sát trong mạng nơron … rút trích luật quyết định.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
compensatory neurons. In Proceedings of the 11th WSEAS international<br />
conference on Artificial Intelligence, Knowledge Engineering and Data<br />
Bases(pp. 77-82). World Scientific and Engineering Academy and Society<br />
(WSEAS).<br />
[5]. Gabrys, B., & Bargiela, A. (2000). General fuzzy min-max neural network for<br />
clustering and classification. IEEE transactions on neural networks, 11(3),<br />
769-783.<br />
[6]. Mohammed, M. F., & Lim, C. P. (2015). An enhanced fuzzy min–max neural<br />
network for pattern classification. IEEE transactions on neural networks and<br />
learning systems, 26(3), 417-429.<br />
[7]. Nandedkar, A. V., & Biswas, P. K. (2009). A granular reflex fuzzy min–max<br />
neural network for classification. IEEE Transactions on Neural<br />
Networks, 20(7), 1117-1134.<br />
[8]. Nandedkar, A. V., & Biswas, P. Κ. (2008). Reflex Fuzzy Min Max Neural<br />
Network for Semi-supervised Learning. Journal of Intelligent Systems, 17(1-<br />
3), 5-18.<br />
[9]. Quteishat, A., & Lim, C. P. (2008, September). Application of the fuzzy min-<br />
max neural networks to medical diagnosis. In International Conference on<br />
Knowledge-Based and Intelligent Information and Engineering Systems (pp.<br />
548-555). Springer, Berlin, Heidelberg.<br />
[10]. Seera, M., Lim, C. P., Ishak, D., & Singh, H. (2012). Fault detection and<br />
diagnosis of induction motors using motor current signature analysis and a<br />
hybrid FMM–CART model. IEEE transactions on neural networks and<br />
learning systems, 23(1), 97-108.<br />
[11]. Simpson, P. K. (1992). Fuzzy min-max neural networks. I.<br />
Classification. IEEE transactions on Neural Networks, 3(5), 776-786.<br />
[12]. Simpson, P. K. (1993). Fuzzy min-max neural networks-part 2:<br />
Clustering. IEEE Transactions on Fuzzy systems, 1(1), 32-45.<br />
[13]. Vu, D. M., Nguyen, V. H., & Le, B. D. (2016, December). Semi-supervised<br />
Clustering in Fuzzy Min-Max Neural Network. In International Conference on<br />
Advances in Information and Communication Technology (pp.541-550).<br />
Springer International Publishing.<br />
[14]. Wang, J., Lim, C. P., Creighton, D., Khorsavi, A., Nahavandi, S., Ugon, J., ...<br />
& Freischmidt, A. (2015). "Patient admission prediction using a pruned fuzzy<br />
min–max neural network with rule extraction". Neural Computing and<br />
Applications, 26(2), 277-289<br />
[15]. Zhang, H., Liu, J., Ma, D., & Wang, Z. (2011). Data-core-based fuzzy min–<br />
max neural network for pattern classification. IEEE transactions on neural<br />
networks, 22(12), 2339-2352<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 11 - 2018 25<br />
Công nghệ thông tin<br />
<br />
ABSTRACT<br />
SEMI-SUPERVISED LEARNING IN FUZZY MIN-MAX NEURAL NETWORK<br />
FOR CLUSTERING WITH RULE EXTRACTION<br />
This paper proposes a modified fuzzy min-max neural network for data<br />
clustering with semi-supervised learning. The proposed model combines both<br />
unsupervised and supervised learning methods during training called MSS-<br />
FMM. Some samples in the training data set are labeled as supplementary<br />
information used in the semi-supervised clustering method. Our study was<br />
validated on published data sets and the dataset included 320 patients who<br />
came for the treatment and treatment of chronic hepatitis in Thai Nguyen<br />
hospitals. The experimental results were compared with the experimental<br />
results of the fuzzy min-max neural networks proposed by other researchers.<br />
Our solution has dramatically improved the classification accuracy.<br />
Keywords: Fuzzy min-max neural network; Clustering; Unsupervised; Supervised; Semi-supervised.<br />
<br />
<br />
Nhận bài ngày 29 tháng 06 năm 2018<br />
Hoàn thiện ngày 04 tháng 10 năm 2018<br />
Chấp nhận đăng ngày 05 tháng 11 năm 2018<br />
<br />
<br />
1<br />
Địa chỉ: Trường Cao đẳng Công nghiệp Thái Nguyên;<br />
2<br />
Viện Khoa học và Công nghệ quân sự.<br />
*<br />
Email: vmc802@gmail.com<br />
<br />
<br />
<br />
<br />
26 V. Đ. Minh, N. D. Cường, “Học bám sát trong mạng nơron … rút trích luật quyết định.”<br />