intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Chẩn đoán sớm ung thư gan sử dụng mạng nơron min-max mờ dựa trên giá trị APRI

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:8

15
lượt xem
1
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết đề xuất một phương pháp hỗ trợ chẩn đoán sớm bệnh gan mạn, được thực hiện dựa trên mạng nơron min-max mờ (FMNN). Thuật toán mới đề xuất trong mạng nơron min-max mờ với kết xuất tập luật mờ có chọn lọc dựa trên giá trị của APRI để đánh giá xơ hóa gan không xâm nhập trong tiên đoán xơ gan và ung thư gan.

Chủ đề:
Lưu

Nội dung Text: Chẩn đoán sớm ung thư gan sử dụng mạng nơron min-max mờ dựa trên giá trị APRI

  1. Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIV về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), TP. HCM, ngày 23-24/12/2021 DOI: 10.15625/vap.2021.0065 CHẨN ĐOÁN SỚM UNG THƯ GAN SỬ DỤNG MẠNG NƠRON MIN-MAX MỜ DỰA TRÊN GIÁ TRỊ APRI Vũ Đình Minh1, Nguyễn Thanh Sơn2, Lê Bá Dũng3, Nguyễn Đức Lưu1, Nguyễn Thái Cường1 Trường Đại học Công nghiệp Hà Nội 1 2 Trường Cao đẳng Công nghiệp và Thương mại 3 Khoa Công nghệ thông tin, Trường Đại học Điện lực minhvd@haui.edu.vn, sonnt@pci.edu.vn, l_bdung@yahoo.com, luund@haui.edu.vn, cuongnt@haui.edu.vn TÓM TẮT: Hầu hết bệnh gan mạn đều dẫn đến xơ hóa gan, cuối cùng tiến triển đến xơ gan và ung thư gan nếu không được điều trị kịp thời. Việc phát hiện sớm bệnh gan mạn của bệnh nhân có thể giúp ngăn chặn được diễn tiến dẫn đến ung thư gan. Trong nghiên cứu này, chúng tôi đề xuất một phương pháp hỗ trợ chẩn đoán sớm bệnh gan mạn, được thực hiện dựa trên mạng nơron min-max mờ (FMNN). Thuật toán mới đề xuất trong mạng nơron min-max mờ với kết xuất tập luật mờ có chọn lọc dựa trên giá trị của APRI để đánh giá xơ hóa gan không xâm nhập trong tiên đoán xơ gan và ung thư gan. Đây là một phương pháp đánh giá đơn giản, rẻ tiền, không có biến chứng và dễ thực hiện, đặc biệt là ở các bệnh viện tuyến dưới, nơi ít các bác sĩ chuyên ngành giỏi. Phương pháp đề xuất được tiến hành thực nghiệm trên các bộ dữ liệu máy học và đặc biệt là trên bộ dữ liệu thực tế của các bệnh nhân khám và điều trị bệnh gan. Phương pháp đề xuất của chúng tôi giúp tăng hiệu suất của FMNN so với một số phương pháp khác trước đây. Từ khóa: Fuzzy min-max, neural network, APRI, FMNN, fuzzy rule. I. GIỚI THIỆU Gan là cơ quan quan trọng trong cơ thể con người, nó thực hiện chức năng trao đổi chất, hoạt động để lọc máu, giúp tiêu hóa chất béo và quan trọng nhất là giải độc [6]. Gan vẫn có khả năng hoạt động bình thường ngay cả khi bị hư hỏng một phần, điều này làm cho căn bệnh gan trở nên đáng báo động hơn bởi vì sau đó gan có thể đã bị tổn thương vĩnh cửu. Viêm gan mạn là biểu hiện của nhiều loại tổn thương gan do nhiều nguyên nhân gây ra khác nhau [5]. Tỉ lệ các bệnh gan mạn sau đó dẫn đến xơ hóa gan và tiến triển đến xơ gan và ung thư gan là rất cao. Việc đánh giá được mức độ xơ gan là rất cần thiết trong chỉ định điều trị và tiên lượng viêm gan mạn. Điều này góp phần quan trọng để giảm tỷ lệ tiến triển đến xơ gan và ung thư gan. Đánh giá dựa trên chỉ số APRI là phương pháp đánh giá mức độ xơ gan đơn giản, nhanh chóng với chi phí thấp và có thể thực hiện ở bất kỳ cơ sở y tế nào [11]. APRI là phương pháp đánh giá không xâm nhập dựa vào các thông số có sẵn từ các xét nghiệm thường qui. Cho đến nay, mặc dù đã có nhiều phương tiện hiện đại hơn nhưng APRI vẫn có giá trị sử dụng không những ở những nước có điều kiện kinh tế khó khăn như nước ta mà cả những nước tiên tiến. Việc áp dụng các kỹ thuật thông minh trong hỗ trợ chẩn đoán sẽ trợ giúp rất nhiều cho các cơ sở y tế tuyến dưới, nơi thiếu các bác sĩ chuyên khoa, các chuyên gia giỏi. Điều này đã thúc đẩy các nhà khoa học, các chuyên gia, bác sĩ quan tâm đến chăm sóc sức khỏe nghiên cứu về các kỹ thuật thông minh và ứng dụng trong hỗ trợ chẩn đoán bệnh. Trong [2], nhóm nghiên cứu đã đề xuất phương pháp chẩn đoán tổn thương gan dựa trên hình ảnh CT (Computed Tomography). Tuy nhiên, chẩn đoán qua hình ảnh CT không thể phát hiện xơ hóa gan ở giai đoạn sớm và khó thực hiện ở các bệnh viện tuyến dưới do chi phí lớn, kỹ thuật phức tạp và cần có bác sĩ chuyên khoa giỏi. Trong [4], Darne giới thiệu mô hình kết hợp Fuzzy C-means (FCM) với FMNN (Fuzzy Min-Max Neural Network) trong phát hiện ung thư phổi. Rajakumar cùng nhóm nghiên của mình đề xuất thuật toán lai giữa FMNN và thuật toán đom đóm để chẩn đoán bệnh tim tự động [8]. Mạng nơron min-max mờ [10] cũng là một hướng tiếp cận hiệu quả trong lĩnh vực hỗ trợ chẩn đoán y khoa [12]. Sự kết hợp giữa logic mờ và khả năng học của mạng nơron là điểm mạnh của mạng nơron FMM (Fuzzy Min- Max) khi xử lý các thông tin không chắc chắn. Do đó, các mạng nơron FMM có thể ứng dụng trong rất nhiều lĩnh vực như hệ chuyên gia, dự báo, điều khiển, chẩn đoán ý tế,... Một trong các lý do khiến mạng nơron FMM được áp dụng cho các vấn đề chẩn đoán y tế là khả năng tạo các luật “if…then” rất đơn giản [12]. Mỗi luật “if…then” được mô tả bằng cách định lượng các giá trị min-max của các đặc tính đầu vào. Đặc biệt trong lĩnh vực y tế, luật “if…then” giải thích được cho các vấn đề về kết luận của chẩn đoán từ hệ thống thông minh. Mô hình mạng nơron FMM do Simpson giới thiệu lần đầu vào năm 1992 [10] và một biến thể của nó vào năm 1993[10]. Dựa trên mô hình gốc ban đầu, một số nghiên cứu đã được đề xuất nhằm cải thiện hiệu suất của mạng nơron FMM bằng cách cải thiện cấu trúc mạng, phương pháp học hoặc kết hợp với kỹ thuật khác. Để có cái nhìn tổng quan về mạng nơron FMM và các biến thể của nó, một số nhóm nghiên cứu đã trình bày các nghiên cứu tổng quan của mình theo các cách thức khác nhau. Năm 2014 Jambhulkar đã trình bày về 6 biến thể, bao gồm: FMM, GFMM, EFC, FMCN, DCFMN và MLF [Jambhulkar]. Năm 2015 Jain đã đưa ra một đánh giá tổng quan với bảy mô hình, cụ thể là FMM, GFMM, EFC, FMCN, GRFMN, DCFMN và MLF [7]. Năm 2019, nhóm nghiên cứu của Sayaydeh [9] và Alhroob [1] đã trình bày về các biến thể của mạng nơron FMM. Các nghiên cứu này đã chỉ ra các ưu điểm, nhược điểm và khả năng ứng dụng của FMNN trong thực tế.
  2. 246 CHẨN ĐOÁN SỚM UNG THƯ GAN SỬ DỤNG MẠNG NƠRON MIN-MAX MỜ DỰA TRÊN GIÁ TRỊ APRI Một trong các hạn chế của phần lớn các phương pháp được đề cập là gặp khó khăn trong vấn đề xác định, điều chỉnh sự chồng lấn hay quản lý vùng chồng lấn giữa các siêu hộp. Để khắc phục nhược điểm trên, trong nghiên cứu này, chúng tôi đề xuất một thuật toán học mới để tối ưu hóa FMNN với khả năng huấn luyện không để xảy ra sự chồng lấn giữa các siêu hộp. Thuật toán mới đề xuất được gọi là RO-FMM (Remove Overlapping in Fuzzy Min-Max neural network). Đề xuất này phát triển một mô hình chẩn đoán sớm, giúp ngăn ngừa ung thư gan bằng cách đánh giá mức độ xơ hóa gan dựa trên đánh giá các giá trị APRI. Tóm lại, những đóng góp chính của bài báo này là (i) cải tiến phương pháp học để tối ưu hóa FMNN và (ii) đánh giá hiệu quả của phương pháp đề xuất bằng bộ dữ liệu thực tế về kết quả xét nghiệm men gan của bệnh nhân tại Bệnh viện Đa khoa Trung ương Thái Nguyên. Phần còn lại của bài báo gồm: Phần II trình bày về mô hình FMNN. Phần III giới thiệu thuật toán mới RO- FMM. Phần IV mô tả các thực nghiệm đã được tiến hành trên các tập dữ liệu chuẩn từ UCI, CS và tập dữ liệu thực tế được thu thập từ Bệnh viện Đa khoa Trung ương Thái Nguyên. Cuối cùng, Phần V là kết luận và hướng nghiên cứu trong tương lai. II. MÔ HÌNH MẠNG NƠRON MIN-MAX MỜ A. Hàm thuộc và siêu hộp min-max mờ Một siêu hộp min-max mờ là một vùng của không gian mẫu n-chiều giới hạn bởi điểm min (ký hiệu là V) và điểm max (ký hiệu là W). Kích thước mỗi chiều của siêu hộp (ký hiệu là θ) nhận giá trị trong khoảng từ 0 đến 1. Không gian mẫu n-chiều có đơn vị là R n . Siêu hộp B (V , W ) bao gồm điểm min V và điểm max W. Với điểm V, W được định nghĩa theo (1) và (2) [10]: V = ( vi i = 1,..., n ) , V ∈ R n (1) W = ( wi i = 1,..., n ) , W ∈ R n (2) ( ) Hàm thuộc b ( A, B ) mô tả mức độ thuộc của mẫu A A ∈ R n vào siêu hộp B. Giá trị hàm thuộc (hay còn gọi là độ thuộc của A vào B) là một giá trị trong khoảng từ 0 đến 1 ( b ( A, B ) ∈ [ 0,1]) . Mẫu A được chứa trong siêu hộp B nếu b ( A, B ) = 1 (khi này còn có thể gọi A có độ thuộc đầy đủ vào B). Hình 1 là ví dụ minh họa biểu diễn siêu hộp B và các mẫu A1, A2 trong không gian 3-chiều. Hàm thuộc b ( A, B ) được định nghĩa theo (3) [10]: b ( A, B (V , W ) ) = 1 n ∑ 1 − f ( ai − wi , γ ) − f ( vi − ai , γ )  (3) n i =1  trong đó: A ∈ R n , A = ( ai i = 1,..., n ) ; - γ là tham số điều chỉnh tốc độ giảm của giá trị hàm thuộc b khi một mẫu bị tách ra khỏi siêu hộp; - f(x,y) là hàm ngưỡng hai tham số, được xác định theo (4) [10]: 1, xy > 1,  f ( x, y ) =  xy, 0 ≤ xy ≤ 1, (4)  0, xy < 0. W A1 B(V,W) V A2 Hình 1. Minh họa siêu hộp B (V ,W ) với b ( A1 , B ) = 1 và b ( A1 , B ) < 1 Hình 2(b) là một ví dụ minh họa về sự phân bố các siêu hộp min-max mờ trong không gian dữ liệu trên tập dữ liệu Flame [13]. Với Hình 2(a) là hình ảnh phân bố các mẫu dữ liệu trong không gian mẫu 2 chiều.
  3. Vũ Đình Minh, Nguyễn Thanh Sơn, Lê Bá Dũng, Nguyễn Đức Lưu, Nguyễn Thái Cường 247 = (a) (b) Hình 2. Một ví dụ minh họa về sự phân các siêu hộp trên tập dữ liệu Flame sau khi huấn luyện mạng nơron FMM B. Cấu trúc mạng nơron FMM Mạng nơron FMM sử dụng cấu trúc mạng nơron truyền thẳng, ba lớp (Hình 3(a)) [63]. Đầu vào gồm n nút, mỗi nút tương ứng với một thuộc tính của dữ liệu. Đầu ra gồm k nút, tương ứng với k lớp/cụm, k được xác định trước. Hình 3(b) minh họa cấu trúc của một nút nơron lớp FB, mỗi nút là một siêu hộp. a1 Ah2 b1 a2 c1 v1 b2 a1 Ah3 c2 w1 a3 Ah4 b3 • • a2 v2 b(A,B) b a4 • • • w2 • • • • ck • • vn • Ahn bq an wn an FA V, W FB U FC (a) (b) Hình 3. Minh họa mô hình mạng nơron FMNN C. Thuật toán học trong mạng nơron FMM Thuật toán học trong mạng nơron min-max mờ bao gồm quá trình mở rộng và thu hẹp các siêu hộp để điều chỉnh giá trị min-max của các siêu hộp trong mẫu không gian mẫu. Quá trình học bắt đầu bằng việc lựa chọn lần lượt từng mẫu dữ liệu trong tập dữ liệu huấn luyện để hình thành và tinh chỉnh các siêu hộp. Với mỗi mẫu dữ liệu đầu vào, thực hiện. Các bước của thuật toán học FMNN được trình bày trong Bảng 1. Bảng 1. Thuật toán học của mạng nơron FMM FMNN Input: Tập dữ liệu D, m = D ; Output: Tập siêu hộp B; 1. k = 1; h =1; 2. VBk = WBk = Ah ; (5) 3. For Ah ∈ D, (h=2,..,m) 4. Tìm Bj ∈ B thỏa mãn (6) và (7) 5. { } b j ( Ah , B j ) = max b j ( Ah , B j ) | j = 1,..., k (6) 6. θ( Ah , B j ) ≤ θ max (7) 7. - Nếu có, thì mở rộng Bj 8. - Nếu không có, tạo siêu hộp mới: k = k+1; VB = WB = Ah ; B : = B ∪ Bk ; k k 9. Kiểm tra chồng lấn giữa Bj và Bi (i ≠ j) 10. - Nếu có chồng lấn, điều chỉnh chồng lấn giữa Bj và Bi 11. Endfor Rerurn B;
  4. 248 CHẨN ĐOÁN SỚM UNG THƯ GAN SỬ DỤNG MẠNG NƠRON MIN-MAX MỜ DỰA TRÊN GIÁ TRỊ APRI III. PHƯƠNG PHÁP ĐỀ XUẤT Trong phần này, chúng tôi trình bày mô hình đề xuất RO-FMM. Thuật toán mới sẽ không cho phép RO-FMM tạo ra các vùng chồng lấn giống như các biến thể cũng như FMM gốc. Điều này giúp RO-FMM có lợi thế trong việc giải quyết các khu vực chồng lấn, đây chính là đường biên của các lớp/cụm dữ liệu. A. Ý tưởng thuật toán Ý tưởng của phương pháp này dựa trên các đánh giá về các biến thể của FMM về việc quản lý các khu vực chồng lấn [Jambhulkar], [7], [9], [1]. Trong quá trình mở rộng siêu hộp, thuật toán mới ngăn không cho RO-FMM tạo ra các vùng chồng lấn bằng cách tạo ra một siêu hộp mới và mở rộng siêu hộp với điểm min/max trùng khớp với siêu hộp có khả năng gây ra chồng lấn trước đó. Hình 4 minh họa về ý tưởng của chúng tôi. Giả sử trong quá trình huấn luyện mạng nơron FMM, thuật toán học tạo ra hai siêu hộp B1 (V1 , W1 ) và B2 (V2 , W2 ) . Tại bước duyệt tiếp theo, với mẫu vào Ah (Hình 4a), thuật toán học thực hiện tính toán độ thuộc và kiểm tra điều kiện mở rộng. Với giả sử thuật toán học chọn B1 (V1 , W1 ) là siêu hộp chiến thắng. Thuật toán học thực hiện mở rộng siêu hộp B1 (V1 , W1 ) (Hình 4b). Hình 4b cho thấy sau khi mở rộng, B1 (V1 , W1 ) chứa Ah nhưng lại tạo ra vùng chồng lấn với B2 (V2 , W2 ) . FMNN và các biến thể có hai cách để xử lý vùng chồng lấn: - Thứ nhất, loại bỏ vùng chồng lấn bằng cách điều chỉnh các điểm V và W của các siêu hộp bị chồng lấn trên chiều gây nên chồng lấn (Hình 4c) như FMM-CF, FM-GA, SCFMN, RFMN,…. - Thứ 2, tạo ra siêu hộp quản lý vùng chồng lấn (Hình 4d) như các biến thể FMCN, DCFMN, MLF. Cả hai phương pháp này đề có các nhược điểm nhất định của nó [1]. Dễ nhận thấy, trong phương pháp xử lý thứ nhất, mẫu Ah và các mẫu thuộc vùng điều chỉnh chồng lấn của B2 (V2 , W2 ) bị đẩy ra khỏi siêu hộp đã được huấn luyện trước đó. Ah Ah W1 W1 Khu vực chồng lấn W2 W2 V1 V1 V2 (a) (b) Aj W1 Ah W1 Siêu hộp chồng lấn W2 W2 V1 V1 V2 V2 (c) (d) Ah W1 W3 V3 W2 V1 V2 (e) Hình 4. Minh họa về ý tưởng không tạo ra các vùng chồng lấn trong mạng nơron FMM Khác với cách xử lý của các biến thể FMNN trước đây, RO-FMM thực hiện mở rộng mà không tạo ra vùng chồng lấn cùng với việc tạo ra một siêu hộp mới có độ thuộc đầy đủ với mẫu huấn luyện Ah. Khi mở rộng siêu hộp Bj để kết nạp thêm mẫu Ah, RO-FMM kiểm tra điều kiện mở rộng và đưa ra hai hướng xử lý: (i) Mở rộng Bj nếu việc mở rộng không gây ra chồng lấn với siêu hộp khác.
  5. Vũ Đình Minh, Nguyễn Thanh Sơn, Lê Bá Dũng, Nguyễn Đức Lưu, Nguyễn Thái Cường 249 (ii) Mở rộng siêu hộp Bj với giới hạn là đỉnh Vi/Wi của Bi (Bi là siêu hộp bị chồng lấn) và tạo thêm siêu hộp mới (Bk) với 1 đỉnh Bk là Ah và đỉnh còn lại là đỉnh Vi/Wi của siêu hộp Bi. Hình 4e minh họa về việc tạo thêm siêu hộp Bk mới, siêu hộp B3 (V3 ,W3 ) . Tập siêu hộp nhận được sẽ sinh tập luật sau khi loại bỏ các siêu hộp có chỉ số tin cậy thấp. B. Các bước của thuật toán học RO-FMM Thuật toán RO-FMM gồm 2 bước, mỗi bước của thuật toán được mô tả chi tiết dưới đây: Bước 1. Khởi tạo siêu hộp: - B : = ∅; - Tạo siêu hộp B1 có giá trị điểm max, điểm min được xác định theo (5); - B : = B ∪ B1 ; Bước 2. Tạo/mở rộng và kiểm tra chồng lấn siêu hộp: với mỗi mẫu vào Ah ∈ D ( h = 2,..., D ) , xác định siêu hộp ( ) B j ∈ B ( j = 1,..., B ) có độ thuộc b Ah , B j thỏa mãn (6) và giới hạn kích thước siêu hộp mở rộng thỏa mãn (7). - Nếu tồn tại siêu hộp Bj thỏa mãn (6) và (7), kiểm tra xem Bj dự kiến mở rộng thì sau khi mở rộng có chồng lấn với Bi ( Bi ∈ B, i ≠ j ) . + Nếu không có chồng lấn, thực hiện mở rộng Bj; + Nếu có chồng lấn: ο Tạo siêu hộp Bk; ο Mở rộng siêu hộp Bj sao cho không tạo ra vùng chồng lấn với Bi; ο B : = B ∪ Bk ; - Nếu không tồn tại siêu hộp Bj thỏa mãn (6) và (7): + Tạo siêu hộp Bk; + B : = B ∪ Bk ; Bước 2 của thuật toán được thực hiện với mỗi mẫu đầu vào trong tập dữ liệu huấn luyện. IV. KẾT QUẢ THỰC NGHIỆM A. Dữ liệu thực nghiệm Dữ liệu thực nghiệm được sử dụng trong nghiên cứu của chúng tôi bao gồm bộ dữ liệu Benchmark từ kho dữ liệu máy học UCI [14], CS [13] và bộ dữ liệu thực tế về các kết quả xét nghiệm thường quy của các bệnh nhân đến khám có liên quan đến đánh giá men gan. Chi tiết của từng tập dữ liệu được đưa ra trong Bảng 2. Lý do để chúng tôi chọn các tập dữ liệu này là để so sánh hiệu suất với một số thuật toán khác đã công bố trước đó. Bảng 2. Thông tin về bộ dữ liệu đào tạo ID Tập dữ liệu Số mẫu Số thuộc tính Số cụm 1 Thyroidnew 215 5 3 2 Iris 150 4 3 3 PID 768 8 2 4 Sonar 208 60 2 5 Wine 178 13 2 6 Liver 3500 6 2 B. Phương pháp thực nghiệm Mục tiêu thực nghiệm là đánh giá khả năng cải thiện hiệu suất, số lượng và sự phân bố các siêu hộp của thuật toán mới đề xuất. So sánh hiệu suất của RO-FMM so với một số phương thức khác đã được công bố trước đó [12]. Thực nghiệm sử dụng phương pháp kiểm tra chéo “k-fold cross-validation”, với k = 10 để đánh giá, cụ thể như sau: - Tập dữ liệu được chia ngẫu nhiên thành 10 tập con không giao nhau (10-fold) có kích thước xấp xỉ nhau. - Tiến hành kiểm tra 10 lần, với mỗi lần thực nghiệm tập kiểm thử được thay đổi và 9 tập con còn lại được sử dụng để huấn luyện. - Kết quả thực nghiệm là trung bình cộng của 10 lần thực nghiệm.
  6. 250 CHẨN ĐOÁN SỚM UNG THƯ GAN SỬ DỤNG MẠNG NƠRON MIN-MAX MỜ DỰA TRÊN GIÁ TRỊ APRI C. Kết quả thực nghiệm trên tập dữ liệu Benchmark Để đánh giá và có cơ sở để so sánh RO-FMM với một số phương thức khác, chúng tôi sử dụng độ đo Accuracy [3] được tính theo (8). Các thực nghiệm được tiến hành trên tập dữ liệu Benchmark, thông tin về các tập dữ liệu trên bảng 2. Accuracy = 1 n ( ∑ H yi = yi n i =1 ) (8) trong đó: - yi là nhãn thực sự của xi trong tập dữ liệu gốc, y là các nhãn tương ứng của xi theo kết quả thực hiện; - H(y) = 1 nếu y = y , ngược lại H(y) = 0 nếu y ≠ y , n là tổng số mẫu trong tập kiểm tra. Dữ liệu trên Bảng 3 và biểu đồ trên Hình 5 là kết quả tổng hợp và so sánh độ đo Accuracy giữa RO-FMM với FMM, FMM-CF, FMM-GA [12] trên tập dữ liệu Benchmark. Giá trị tô đậm trên Bảng 3 là kết quả tốt nhất. RO-FMM có giá trị độ đo Accuracy trên tập PID là 71,44%, Sonar là 73,43%, Thyroidnew là 93,11%, Iris là 95,79% tốt hơn các phương thức còn lại. Từ kết quả thực nghiệm cho thấy, RO-FMM có độ đo Accuracy tương ứng và nhỉnh hơn trên tập Sonar, PID, Thyroidnew so với FMM-GA và cao hơn hẳn so với các phương thức còn lại. Bảng 3. So sánh độ đo Accuracy giữa RO-FMM và FMM, FMM-CF, FMM-GA trên tập dữ liệu Benchmark Dataset FMM FMM-CF FMM-GA RO-FMM PID 61,85 62,11 70,44 71,44 Sonar 61,84 65,22 73,43 73,43 Thyroidnew 81,92 87,76 92,63 93,11 Wine 91,67 91,11 93,33 93,17 Iris 92,77 91,24 95,27 95,79 100 Accuracy 50 0 PID Sonar Thyroid Wine Iris FMM FMM-CF FMM-GA RO-FMM Hình 5. Biểu đồ so sánh độ đo Accuracy trên tập dữ liệu Benchmark D. Kết quả thực nghiệm trên tập dữ liệu thực tế Để đánh giá RO-FMM trên tập dữ liệu Liver, trong thực nghiệm của mình, chúng tôi sử dụng các giá trị dự đoán: giá trị dự đoán (Acc), độ nhạy (ASe), độ đặc hiệu (ASp), giá trị dự đoán âm (NPV), giá trị dự đoán dương (PPV) được tính toán theo các công thứ (9) đến (13) tương ứng. Acc = ( a + d ) / ( a + b + c + d ) (9) ASe = ( a ) / ( a + c ) (10) ASp = ( d ) / ( d + b ) (11) PPV = ( a ) / ( a + b ) (12) NPV = ( d ) / ( c + d ) (13) trong đó a, b, c, d là các giá trị được xác định trên Bảng 4. Bảng 4. Bảng thông tin về các giá trị chẩn đoán Bác sĩ chẩn đoán “đúng” Bác sĩ chẩn đoán “sai” Kết quả phân lớp “đúng” a b Kết quả phân lớp “sai” c d
  7. Vũ Đình Minh, Nguyễn Thanh Sơn, Lê Bá Dũng, Nguyễn Đức Lưu, Nguyễn Thái Cường 251 Giá trị dự đoán APRI được tính toán dựa theo công thức (14). AST / ULN APRI = × 100, (14) PLT trong đó: - AST là chỉ số của men gan AST(U/l) ; - ULN là giới hạn bình thường trên của phòng xét nghiệm nơi gửi mẫu máu để đo ngưỡng AST huyết thanh. Giới hạn bình thường trên của AST tại Bệnh viện Đa khoa TW Thái Nguyên và Bệnh viện Gang thép Thái Nguyên cũng như nhiều phòng xét nghiệm khác ở nước ta là 40 U/L. - PLT là số lượng tiểu cầu (109/l). Dữ liệu trên Bảng 5 và biểu đồ trên Hình 6 là kết quả tổng hợp và so sánh kết quả thực nghiệm của RO-FMM so với FMM-GA, FMMCF. Từ kết quả thực nghiệm cho thấy RO-FMM có giá trị dự đoán (Acc là 90,56%), độ nhạy (Ase là 92,23%), giá trị dự đoán dương (NPV là là 93,42%) tốt hơn các phương thức còn lại, trong khi độ đặc hiệu (ASp) và giá trị dự đoán âm (PPV) thấp hơn so với FMM-GA. Tuy nhiên, độ nhạy và giá trị dự đoán dương là những chỉ số quan trọng trong chẩn đoán y tế. Bảng 5. Bảng thông tin về các giá trị chẩn đoán Mô hình Acc (%) ASe (%) ASp (%) PPV (%) NPV (%) FMM-CF 77,78 77,50 78,00 73,81 81,25 FMM-GA 90,00 90,50 89,60 87,44 92,18 RO-FMM 90,56 92,23 89,30 87,42 93,42 100 FMM-CF FMM-GA RO-FMM 95 Giá trị dự đoán 90 85 80 75 70 Acc AccSe AccSp PPV NPV Hình 6. Biểu đồ so sánh kết quả thực nghiệm của RO-FMM và một số phương thức khác Từ kết quả thực nghiệm cho thấy, mô hình mới đề xuất RO-FMM có hiệu suất tốt hơn so với một số phương pháp khác và khả năng ứng dụng cho hỗ trợ chẩn đoán y tế. V. KẾT LUẬN Nghiên cứu này, một mô hình mới đã được đề xuất được gọi là RO-FMM. RO-FMM đã cải tiến thuật toán học của mạng nơron FMM và các biến thể trước đây. Dựa trên kết quả thực nghiệm cho thấy RO-FMM có khả năng ổn định các siêu hộp và không bị ảnh hưởng bởi thứ tự các mẫu trong tập dữ liệu huấn luyện. Tuy nhiên, cũng giống như các biến thể của mạng nơron FMM, quá trình học thích nghi của RO-FMM cần thời gian và kinh nghiệm bằng việc “thử sai” để xác định các tham số đầu vào. Đây cũng là hạn chế của FMM và các biến thể của nó. Và đây cũng là một hướng nghiên cứu tiếp theo cần được xem xét. TÀI LIỆU THAM KHẢO [1] Alhroob, E., Mohammed, M. F., Lim, C. P., & Tao, H. A critical review on selected fuzzy min-max neural networks and their significance and challenges in pattern classification. IEEE access, 7, 56129-56146, 2019. [2] Chen, Y., Yue, X., Fujita, H., & Fu, S. Three-way decision support for diagnosis on focal liver lesions. Knowledge-Based Systems, 127, 85-99, 2017. [3] Chuang, C. L. "Case-based reasoning support for liver disease diagnosis", Artificial intelligence in medicine, 53(1), 15-23, 2011. [4] Darne, K. S., & Panicker, S. S. Use of fuzzy C-mean and fuzzy min-max neural network in lung cancer detection. Int. J. Soft Comput. Eng.(IJSCE), 3(3), 265-269, 2013. [5] Jay, H. H., “Chronic hepatitis.”, Goldman: Cecil Medicine, 23rd edit, Saundes Elsevier, pp.336-356, 2007. [6] Li, B. N., Chui, C. K., Chang, S., & Ong, S. H.. “A new unified level set method for semi-automatic liver tumor segmentation on contrast-enhanced CT images”, Expert Systems with Applications, 39(10), pp. 9661-9668, 2012. [7] B. Jain and V. Kolhe, ‘‘Survey on fuzzy min-max neural networkclassification”, Int. J. Adv. Res. Comput. Commun. Eng., vol. 4, No. 12, pp. 30-34, Dec, 2015.
  8. 252 CHẨN ĐOÁN SỚM UNG THƯ GAN SỬ DỤNG MẠNG NƠRON MIN-MAX MỜ DỰA TRÊN GIÁ TRỊ APRI [8] Rajakumar, B. R., & George, A. On hybridizing fuzzy min max neural network and firefly algorithm for automated heart disease diagnosis. Computing, Communications and Networking Technologies (ICCCNT), Fourth International Conference, pp. 1-5. IEEE, 2013. [9] O. N. Al Sayaydeh, M. F. Mohammed, and C. P. Lim, ‘‘Survey of fuzzy min-max neural network for pattern classification variants and applications”, IEEE Trans. Fuzzy Syst., vol. 27, No. 4, pp. 635-645, Apr. 2019. [10] Simpson, P. K. Fuzzy min-max neural networks. I. Classification. IEEE transactions on Neural Networks, 3(5), 776-786, 1992. [11] Wai, C. T., Greenson, J. K., Fontana, R. J., Kalbfleisch, J. D., Marrero, J. A., Conjeevaram, H. S., & Lok, A. S. F., “A simple noninvasive index can predict both significant fibrosis and cirrhosis in patients with chronic hepatitis C”, Hepatology, 38(2), pp. 518-526, 2003. [12] Wang, J., Lim, C. P., Creighton, D., Khorsavi, A., Nahavandi, S., Ugon, J., ... & Freischmidt, A. Patient admission prediction using a pruned fuzzy min-max neural network with rule extraction. Neural Computing and Applications, 26(2), 277-289, 2015. [13] https://cs.joensuu.fi/sipu/datasets. [14] https://archive.ics.uci.edu/ml/datasets.html. EARLY DIAGNOSIS OF LIVER CANCER USING FUZZY MIN-MAX NEURAL NETWORK BASED ON APRI INDEX Vu Dinh Minh, Nguyen Thanh Son, Le Ba Dung, Nguyen Duc Luu, Nguyen Thai Cuong ABSTRACT: Most chronic liver diseases lead to liver fibrosis, eventually progressing to cirrhosis and liver cancer if not treated promptly. Early detection of a patient's chronic liver disease can help prevent progression to liver cancer. In this research, we propose a method to support early diagnosis of chronic liver disease, which is performed based on fuzzy min max neural network (FMNN). The new algorithm proposed in fuzzy min max neural network with selective fuzzy rule set output based on APRI value to evaluate non-invasive liver fibrosis in predicting cirrhosis and liver cancer. This is a simple, inexpensive, uncomplicated assessment method and easy to perform, especially in lower-level hospitals where there are few skilled specialists. The proposed method is experimentally conducted on machine learning data sets and especially on real data sets of patients undergoing examination and treatment for liver disease. Our proposed method helps to increase the performance of FMNN compared to some previous methods. Chẩn đoán sớm ung thư gan sử dụng mạng nơ ron min-max mờ dựa trên chỉ số APRI.
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2