intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Ứng dụng mô hình U-NET phát hiện vùng bất thường trên ảnh MRI não

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:7

16
lượt xem
2
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mô hình đánh giá trên tập dữ liệu DICOM được thu thập tại bệnh viện Trường Đại học Y Dược Cần Thơ của 10 bệnh nhân với 212 ảnh MRI (sử dụng chuỗi xung Flair) trong đó chứa 101 lát cắt MRI có vùng khối u và 111 lát cắt bình thường. Mô hình U-Net đã được hiệu chỉnh, bổ sung để đáp ứng với các hình ảnh đầu vào là ảnh DICOM

Chủ đề:
Lưu

Nội dung Text: Ứng dụng mô hình U-NET phát hiện vùng bất thường trên ảnh MRI não

  1. Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), Nha Trang, ngày 8-9/10/2020 DOI: 10.15625/vap.2020.00225 ỨNG DỤNG MÔ HÌNH U-NET PHÁT HIỆN VÙNG BẤT THƯỜNG TRÊN ẢNH MRI NÃO Lê Minh Lợi1,2, Trần Nguyễn Minh Thư1, Hồ Trọng Nguyễn1, Phạm Nguyên Khang1 1 Khoa Công nghệ Thông tin và Truyền thông, Đại học Cần Thơ 2 Trường Đại học Y Dược Cần Thơ leminhloi@gmail.com, nguyenb1607009@student.ctu.edu.vn, tnmthu@ctu.edu.vn, pnkhang@ctu.edu.vn TÓM TẮT: Chụp cộng hưởng từ (MRI) não là một phương pháp tạo hình cắt lớp giúp phát hiện các bệnh lý của não như u nang, xuất huyết, u não và các bất thường của cấu trúc não trong quá trình phát triển. Trong nghiên cứu này, mô hình U-Net được ứng dụng để dự đoán vùng bất thường trên ảnh MRI não. Mô hình U-Net được huấn luyện trên tập dữ liệu LGG (của 110 bệnh với 3929 ảnh MRI). Mô hình đánh giá trên tập dữ liệu DICOM được thu thập tại bệnh viện Trường Đại học Y Dược Cần Thơ của 10 bệnh nhân với 212 ảnh MRI (sử dụng chuỗi xung Flair) trong đó chứa 101 lát cắt MRI có vùng khối u và 111 lát cắt bình thường. Mô hình U-Net đã được hiệu chỉnh, bổ sung để đáp ứng với các hình ảnh đầu vào là ảnh DICOM. Mô hình đã đạt được độ chính xác trung bình là 85,5 % khi so sánh kết quả dự đoán được bởi mô hình và kết quả đánh giá của các bác sĩ tại bệnh viện Trường Đại học Y Dược Cần Thơ. Từ khóa: Mô hình học sâu, phát hiện vùng bất thường, ảnh MRI. I. GIỚI THIỆU Hình ảnh chụp cắt lớp sọ não MRI là tập hợp nhiều ảnh chụp cắt ngang hoặc cắt dọc sọ não để phản ảnh cấu trúc sọ và mô não bên trong [1]. Sọ não là xương, các mô não gồm chất xám, nước,… mỗi thành phần này có khả năng hấp thu năng lượng tia X đi qua khác nhau từ đó tạo nên ảnh với thể hiện và màu khác nhau. Các bác sĩ chẩn đoán hình ảnh dựa vào cơ chế tạo ảnh này để khảo sát với mục tiêu là tìm ra vùng bất thường trên ảnh MRI. Mỗi bệnh nhân khi chụp MRI được kỹ thuật viên chụp nhiều lần, mỗi lần tứng với các điều chỉnh cường độ tín hiệu khác nhau tạo nhên nhiều bộ ảnh MRI khác nhau. Để tìm ra được vùng bất thường các bác sĩ khảo một hoặc nhiều tập ảnh MRI được tạo ra bởi sự điều chỉnh cường độ tín hiệu khác nhau, đồng thời có thể khảo sát ở hai kiểu nhìn theo chiều dọc và chiều ngang. Việc khảo sát ảnh MRI như vậy khá phức tạp và sẽ mất nhiều thời gian để có thể xác định được vùng bất thường. Tự động phát hiện vùng bất thường trên ảnh MRI là một bài toán cần thiết để hỗ trợ bác sĩ xác định nhanh vùng bất thường, đồng thời có thể dự báo chính xác vùng bất thường mà không bị bỏ xót khi khảo sát bằng mắt thông thường. Để dự đoán được vùng bất thường, các giải pháp thông thường sẽ trích xuất đặc trưng vùng bất thường hay vùng có bệnh lý cụ thể nào đó, dựa vào các đặc trưng này để gán nhãn cho ảnh (bệnh nhân) có xuất hiện bất thường/bệnh lý hoặc không. Các đặc trưng được trích xuất thường dựa trên hình dạng, tổ chức đồ, kết cấu, đặc trưng SIFT kết hợp với phương pháp phân lớp để giải quyết bài toán phát hiện vùng bất thường trên ảnh y khoa [2, 3]. Phương pháp học sâu tích hợp cả trích xuất đặc trưng và phân lớp trong cùng một mô hình để phân loại ảnh hay phát hiện đối tượng [4, 5, 6]. Đối với ảnh y khoa việc giải quyết bài toán phát hiện đối tượng cũng có thể áp dụng tuy nhiên gặp nhiều khó khăn hơn do có sự thay đổi về hình dạng kích thước giải phẫu khác nhau giữa các bệnh nhân cũng như độ tương phản thấp giữa các mô tế bào [7]. Tuy nhiên, nhược điểm của phương pháp này là hạn chế về tập dữ liệu ảnh y khoa được gán nhãn bởi các chuyên gia, việc gán nhãn có thể không đồng nhất do quan điểm, kinh nghiệm khác nhau của chuyên gia y tế. Do đó nhiều nghiên cứu để tăng độ chính xác của mô hình dựa trên số ít dữ liệu huấn luyện càng được đề cao trong đó sử dụng kiến trúc U-net [8] cho kết quả rất tốt với dữ liệu đầu vào được gán nhãn hạn chế. Mô hình U-net được đề xuất vào năm 2015 bởi nhóm các nhà nghiên cứu tại Khoa Khoa học Máy tính của Đại học Freiburg, Đức [8]. Mô hình được sử dụng để phân loại các tế bào trong ảnh thu được dưới kính hiển vi. Mô hình được thực nghiệm trên các tập dữ liệu cung cấp bởi cuộc thi EM1, PhC-U3732, DIC-HeLa3. Tập dữ liệu cuộc thi EM bắt đầu thu thập từ năm 2012, tập dữ liệu sử dụng để đánh giá trong mô hình này gồm 30 hình ảnh (512x512 pixel) dây thần kinh của ấu trùng Drosophila từ kính hiển vi điện tử truyền qua mặt cắt nối tiếp. Mỗi hình ảnh trong tập huấn luyện đi kèm với một bản đồ phân đoạn được chú thích đầy đủ tương ứng cho các ô (trắng) và màng (đen). Tuy nhiên, tập dữ liệu thử nghiệm được cung cấp công khai trong khi các bản đồ phân đoạn của nó được giữ bí mật. Có thể nhận được đánh giá bằng cách gửi dự đoán cho ban tổ chức. U-net (tính trung bình trên 7 phiên bản của dữ liệu đầu vào) đạt được mà không cần tiền xử lý hay hậu xử lý với lỗi “warping error” (0,0003529) và “pixel error” (0,0382.) thấp nhất trong cuộc thi thời điểm đó. Với sự thành công của mô hình U-net cho ảnh y sinh, năm 2019 nhóm các nhà nghiên cứu của trường Đại học Duke, Bắc Carolina, Hoa Kỳ đã phân tích sự liên quan giữa các kiểu gen phụ của khối u thần kinh cấp thấp với đặc điểm hình dạng bằng mô hình U-Net [9]. Nghiên cứu này ứng dụng học sâu vào vấn đề phân loại đặc điểm và dự đoán nhóm gen của khối u cấp thấp. Tập dữ liệu LGG (Lower-Grade Gliomas ) thu thập từ “The Cancer Genome Atlas” (TCGA) của 110 bệnh nhân được sử dụng để thực nghiệm. Trong nghiên cứu, tác giả đã thực hiện đánh giá chéo, chia 1 http://brainiac2.mit.edu/ isbi_challenge/ 2 Tập dữ liệu cung cấp bởi Dr. Sanjay Kumar. Department of Bioengineering University of California at Berkeley. Berkeley CA (USA) 3 Tập dữ liệu cung cấp bởi Dr. Gert van Cappellen Erasmus Medical Center. Rotterdam. The Netherlands
  2. Lê Minh Lợi, Trần Nguyễn Minh Thư, Hồ Trọng Nguyễn, Phạm Nguyên Khang 657 tập dữ liệu thành 22 phần nhỏ, mỗi phần chứa đúng 5 bệnh nhân và lặp lại 22 lần. Với ảnh MRI não thu được trong tập dữ liệu, các tác giả đã tiền xử lý (thu nhỏ ảnh, loại bỏ hộp sọ, chuẩn hóa cường độ mức xám giữa các mô), sử dụng mô hình U-net để khoanh vùng ảnh các khối u và đưa ra đặc điểm hình dạng của khối u trước khi đưa vào các cụm gen tương ứng. Dựa những kết quả khả quan của mô hình u-net trong phân vùng ảnh y sinh cũng như phân vùng trong ảnh y khoa, nghiên cứu này tập trung vào việc ứng dụng mô hình U-Net để hỗ trợ bác sĩ phát hiện vùng bất thường trên ảnh MRI não thu thập tại bệnh viện Đại học Y Dược Cần Thơ. Phần tiếp theo của bài viết được tổ chức như sau: phát hiện vùng bất thường trên ảnh MRI não bằng mô hình U-Net được trình bày trong phần 2; thực nghiệm và mô hình đề xuất được giới thiệu ở phần ba; và cuối cùng là kết luận và hướng phát triển của nghiên cứu. II. PHÁT HIỆN VÙNG BẤT THƯỜNG TRÊN ẢNH MRI NÃO BẰNG MÔ HÌNH U-NET A. Đặc điểm của dữ liệu ảnh MRI não Cộng hưởng từ (MRI: magnetic resonance imaging) là kỹ thuật tạo hình cắt lớp sử dụng từ trường và sóng radio dựa trên nguyên tử Hydrogen(H). Nguyên tử Hydrogen trong cơ thể dưới tác động từ trường và sóng radio, hấp thụ và phóng thích năng lượng sóng RF (Radio Frequency, tần số Radio hay còn gọi là tần số vô tuyến điện. Thường được dùng trong truyền hình. Năng lượng của RF thường dao động từ 3 kHz - 300 gHz). Các mô cơ thể khác nhau sẽ hấp thụ và phóng thích năng lượng khác nhau. Quá trình phóng thích năng lượng được máy thu nhận, xử lý, chuyển đổi thành các tín hiệu hình ảnh. Hình ảnh MRI có độ tương phản cao, chi tiết giải phẫu tốt, khả năng tái tạo 3D, không có tác dụng phụ như X quang nên ngày càng được chỉ định rộng rãi không chỉ cho thần kinh mà còn cho nhiều lĩnh vực khác: cơ xương khớp, tim mạch, bụng,… [1]. Bản chất của MRI là việc tạo ra một từ trường mạnh tác động lên các nguyên tử hydrogen trong cơ thể. Các momen từ hạt nhân trong nguyên tử sẽ di chuyển và sắp sếp theo chiều dọc hay chiều ngay theo xu hướng cân bằng từ trường bệnh trong và bên ngoài cơ thể. Sau khi đạt được trạng thái cân bằng, từ trường dùng để kích hoạt sẽ được tắt, các hạt nhân proton trong nguyên tử sẽ phóng thích năng lượng để về trạng thái ban đầu. Thời gian cần thiết cho 63 % vectơ từ hạt nhân khôi phục theo chiều dọc gọi là thời gian T1. Thời gian cần thiết để cho 63 % vectơ từ hạt nhân khôi phục theo chiều ngang gọi là thời gian T2. Dựa vào cường độ phát ra tính hiệu vô tuyến trên một đơn vị mô khi từ trường giải phóng năng lượng để xác định thang màu từ đen tới trắng (màu trắng là cường độ tín hiệu cao, màu đen là không có tín hiệu hoặc tính hiệu thấp). Cường độ tín hiệu của một loại mô phụ thuộc vào thời gian khôi phục lại từ tính T1 và T2, mật độ proton của nó. Bằng cách điều chỉnh thời gia chụp ảnh của T1 và T2, ta thu được các tương phản ảnh tương ứng với một đặc tính mô riêng biệt cũng như tạo ra các chuỗi xung khác nhau. Các chuỗi xung thườn sử dụng là DWI (Diffusion- weighted Imaging), FLAIR (Fluid Attenuated Inversion Recovery), STIR (Short Time Inversion Recovery). Trong nghiên cứu này, chuỗi xung FLAIR, chuỗi xung xóa tín hiệu các dịch được sử dụng. Hình thu được từ chuỗi xung FLAIR thuộc loại hình T2W nhưng thành phần nước không có tín hiệu (đen). Chuỗi xung FLAIR có thể phát hiện các tổn thương khác nhau như chảy máu, viêm não, xơ hóa mảng (MS). FLAIR, dịch não tủy bị xóa tín hiệu nên có màu đen, như vậy nếu có chảy máu màng não, tăng tín hiệu, sẽ dễ dàng nhận ra. Đối với nhồi máu não tối cấp (< 6 h), tín hiệu vùng nhồi máu trên FLAIR đa số bình thường hoặc tăng tín hiệu rất nhẹ [1]. Cho đến nay, chụp MRI được coi là phương pháp đánh giá sọ não không xâm lấn tối ưu nhất. Có giá trị đặc biệt trong việc chuẩn đoán các bệnh lý ở tuyến yên và thân não. Giúp phát hiện và đánh giá nhiều bệnh hay bất thường của sọ não, đặc biệt là u não do hình ảnh rõ nét, chi tiết, quan sát được cả mạch não mà không cần tiêm chất tương phản. Sự phức tạp trong cấu tạo não bộ và sự đa dạng về bệnh lý não bộ, việc áp dụng đúng kỹ thuật hỗ trợ chuỗi xung trong cộng hưởng từ sẽ giúp đánh giá bệnh lý sẽ tốt hơn. B. Tập dữ liệu LGG Hình 1. Một vài lát cắt của ảnh MRI và Mask một bệnh nhân
  3. 658 ỨNG DỤNG MÔ HÌNH U-NET PHÁT HIỆN VÙNG BẤT THƯỜNG TRÊN ẢNH MRI NÃO Tập dữ liệu LGG4 này chứa hình ảnh MRI não cùng với mặt nạ phân đoạn bất thường FLAIR thủ công tại kho lưu trữ hình ảnh ung thư). Chúng tương ứng với 110 bệnh nhân, mỗi bệnh nhân sẽ bao gồm một tập ảnh MRI màu được chụp cắt lát và sắp xếp theo trình tự. Ứng với mỗi ảnh MRI não là một ảnh dạng xám thể hiện vị trí khối u của ảnh MRI đó. Ảnh xám này chính là ảnh Mask của ảnh MRI. Tập dữ liệu hình ảnh này là tập dữ liệu có chất lượng cao với định dạng “.tif”. Tập dữ liệu chứa tổng cộng 3929 ảnh với 1373 ảnh có chứa vùng khối u, 2437 ảnh không chưa vùng khối u và 119 ảnh trống (không chứa thông tin). Hình 1 hiển thị một số lát cắt của ảnh MRI và mặt nạ phân đoạn tương ứng của cùng 1 bệnh nhân. C. Tập dữ liệu Dicom Tâp dữ liệu Dicom được cung cấp bởi bệnh viện Đại học Y Dược Cần Thơ bao gồm một thư mục chứa các tập tin Dicom (Hình 2) được lưu trữ theo từng bệnh nhân và một file excel mô tả tập dữ liệu như Bảng 1. Hình 2. Cây thư mục lưu trữ Dicom file Ví dụ, với bệnh nhân có mã là 190105 ta sẽ có hai chuỗi xung chụp được kí hiệu là SE000000 và SE000001 trong cây thư mục và các thông tin chuỗi xung mà bệnh nhân đã chụp như Bảng 1. Mã sử dụng cũng chính là tên thư mục lưu trữ tập Dicom của bệnh nhân. Với Flair, DWI, T2*, FSPGR, FSPGR + C là các chuỗi xung hỗ trợ trong xét nghiệm. Ứng với mỗi chuỗi xung bao gồm cá thông tin: FN (kí hiệu thư mục), ST (số lát cắt), [Sta, Sto] (tương ứng với khoảng lát cắt có khối u). Trường kết quả cho ta biết được kết quả xét nghiệm của bệnh nhân bao gồm: bệnh lí như: xuất huyết, u não, đa khối và một số bệnh lí khác; vùng bệnh theo chức năng của não (không phải tất cả bệnh nhân). Trong khoảng lát cắt có khối u có thể tồn tại một khoảng nhỏ không có vùng khối u khoảng cắt này được ghi nhận bằng [Start normal, Stop normal]. Bảng 1. Thông tin mô tả dữ liệu ảnh Dicom MRI Stt Ngày Họ tên người bệnh Mã sử dụng Flair Dwi T2* TH FN TS Sta Sto FN TS Sta Sto FN TS Sta Sto 1 x x 190105 1 20 9 17 0 42 20 35 FSPGR FSPGR C+ Kết Quả Yêu Start normal Stop normal FN TS Sta Sto FN TS Sta Sto cẩu Xuất huyết não ở vùng thái dương 25 28 Ứng với mỗi bệnh nhân, tuỳ vào yêu cầu của bác sĩ mà các chuỗi xung khác nhau được sử dụng để hỗ trợ chụp ảnh. Tuy nhiên, với mục đích chính của mô hình là dự đoán, phân loại và khoanh vùng khối u được huấn luyện bằng bộ dữ liệu ảnh MRI thuộc chuỗi xung Flair nên dữ liệu ảnh Dicom của các bệnh nhân dựa trên chuỗi xung FLAIR được lựa chọn. Bảng 2 mô tả tập dữ liệu hình ảnh MRI thu thập được có ghi nhận số lát cắt bình thường và bất thường, vị trí bắt đầu và kết thúc vùng bất thường của chuỗi xung FLAIR. Bảng 2. Bảng mô tả dữ liệu Dicom STT Mã bệnh nhân Flair FN FS Sta Sto Số lát cắt bình thường Số lát cắt bất thường 1 190701 0 20 11 20 10 10 2 190714 1 24 9 20 12 12 3 190731 1 21 12 19 13 8 4 190905 1 21 12 20 12 9 5 190916 1 21 9 20 9 12 6 191001 1 21 10 17 13 8 7 190724 1 21 8 17 11 10 8 190918 1 21 13 20 13 8 9 191004 1 21 8 19 9 12 10 191005 1 21 5 16 9 12 4 https://www.kaggle.com/mateuszbuda/lgg-MRI-segmentation.
  4. Lê Minh Lợi, Trần Nguyễn Minh Thư, Hồ Trọng Nguyễn, Phạm Nguyên Khang 659 D. Mô hình mạng U-Net hiệu chỉnh phát hiện vùng bất thường trên ảnh MRI não Mô hình U-net hiệu chỉnh để dự đoán vùng bất thường trên ảnh MRI não gồm các bước như Hình 3. Giai đoạn huấn luyện mô hình sử dụng tập dữ liệu LGG. Tập dữ liệu được tiền xử lý để đưa ảnh MRI màu (RGB) 256x256x3 về ảnh mức xám kích thước 256x256x1. Mô hình kiến trúc U-Net sẽ được huấn luyện và học tập bằng cách trích xuất đặc trưng của ảnh sau đó khôi phục kích thước gốc bằng ma trận đặc trưng tìm được. Mô hình kiến trúc U_Net sử dụng hàm phi tuyến Sigmoid để dự đoán đầu ra với kết quả là một ma trận đặt trưng có giá trị nằm trong khoảng [0, 1]. Để phù hợp với giá trị đầu ra của mô hình, ảnh Mask cần chuyển từ khoảng giá trị gốc là [0, 255] về khoảng [0, 1]. Giai đoạn đánh giá mô hình, dữ liệu Dicom sẽ được chuyển đổi về dạng ảnh “JPG” bằng công trụ hỗ trợ đọc tập tin Dicom (SonicDicom PACs). Dữ liệu sẽ tiếp tục được chuyển qua tiền xử lí để đưa về dạng ảnh xám có kích thước 256x256x1. Tiếp theo, ta đưa dữ liệu vào mô hình kiến trúc U-Net đã được huấn luyện để trích xuất đặc trưng của ảnh. Giá trị của các phần tử trong ma trận sẽ được đưa về khoảng giá trị [0, 255]. Hình ảnh MRI gắn liền với một bệnh nhân, để đánh giá độ chính xác ta sẽ gom nhóm ảnh dựa vào mã bệnh nhân. Hình ảnh dự đoán vùng bệnh và ảnh MRI của nó sẽ được tích hợp lại với nhau để tạo ra ảnh MRI có xác định vị trí vùng bệnh. Với kiến trúc chữ “U” như trên, ta có thể thấy sự đối xứng của hai thành phần “Contraction path” và “Expansion path”. Việc đối xứng giữa các tầng của hai thành phần trên sẽ giúp ta phục hồi lại thông tin đã mất tại các lớp “pooling”. “Contraction path”: Dữ liệu đầu vào sẽ được chuyển đổi qua hàng loạt các lớp tích chập, lớp lấy mẫu “Max pooling”. Tại mỗi tầng, mô hình sẽ xếp liên tiếp hai lớp “convolution layers” với bộ lọc (Kernals) 3x3, kích hoạt bởi hàm phi tuyến tính (ReLU) kết hợp với một lớp “Max Pooling”. Số lượng kênh chức năng tại mỗi tầng sẽ được nhân đôi (32, 64 ,128, 256, 512) đồng thời giảm số chiều (256, 128, 64, 32, 16). Giai đoạn “Expansion path”: mỗi tầng là sự kết hợp giữa một lớp tích chập nghịch đảo “Transpose Convolutional layer” 2x2 để lấy mẫu đầu vào cho 2 lớp tích chập 3x3 kế tiếp. Đồng thời phục hồi lại thông tin đã mất tại các lớp “pooling” qua sự đối xứng với giai đoạn “Contraction path”. Tầng cuối cùng áp dụng hàm chức năng phi tuyến “Sigmoid” có giá trị xác suất từ 0 đến 1 để xác định nhãn của ảnh có chứa khối u hay không. Thời gian huấn luyện của một epoch cho mô hình U-Net là 103-137 giây, mô hình sử dụng 1000 epochs với batch size là 32 và hàm tối ưu Adam. Kết quả sau khi đưa vào mô hình dự đoán là một ma trận kích thước 256x256x1 tương ứng với một ảnh MRI. Ma trận kết quả này có khoảng giá trị nằm trong đoạn [0, 1] cần được đưa về thang màu hệ thống là [0, 255]. Để có thể nhìn rõ vùng bệnh được dự đoán ta cần phải tích hợp ảnh dự đoán với ảnh MRI gốc. Nếu ảnh dự đoán cho thấy ảnh MRI có khối u thì việc tích hợp này sẽ tạo ra một ảnh có những đường khoanh chứa những vùng ta dự đoán đó là khối u. Ngược lại, ảnh ta nhân được sau khi tích hợp chính là ảnh MRI gốc. Hình 3. Mô hình U-Net hiệu chỉnh phát hiện bất thường trên ảnh MRI não III. KẾT QUẢ THỰC NGHIỆM A. Phương pháp đánh giá kết quả dự đoán vùng bất thường trên ảnh MRI não Các ảnh MRI trong bộ dữ liệu Dicom sẽ được cung cấp cho bác sĩ dưới dạng ảnh JPG. Các bác sĩ sẽ tiến hành khoanh vùng khối u thủ công và lưu lại 4 góc tọa độ của vùng khối u qua file XML. Dựa vào các tọa độ này để tiến hành đánh giá những hình ảnh dự đoán. Đối với một vùng khối u bác sĩ đã khoanh sẽ sinh ra 4 tọa độ tương ứng như hình 6.
  5. 660 ỨNG DỤNG MÔ HÌNH U-NET PHÁT HIỆN VÙNG BẤT THƯỜNG TRÊN ẢNH MRI NÃO Hình 4. Mô tả tọa độ khối u Để đánh giá sự chính xác của vùng ảnh dự đoán bởi mô hình so với chẩn đoán của bác sĩ, công cụ LabelImage được sử dụng để so khớp 2 vùng ảnh này. Nếu vùng ảnh chẩn đoán bởi bác sĩ và vùng ảnh dự đoán bởi mô hình trùng nhau khoảng trên 80 % thì mô hình được đánh giá là chính xác. Do ảnh dự đoán vùng có khối u là một vùng có hình dạng bất kỳ theo đặc trưng của khối u dự đoán được, còn vùng chẩn đoán của bác sĩ là vùng ảnh có hình chữ nhật nên có sự chênh lệch giữa vùng chẩn đoán và vùng dự đoán. Hình 5 bên dưới minh hoạ vùng bất thường dự đoán được bởi mô hình với đường viền màu đỏ bao quanh khối bất thường; vùng bất thường được chẩn đoán bởi bác sĩ là vùng hình chữ nhật màu xanh. Hình 5 (a), mô hình được đánh giá là dự đoán đúng vùng bất thường; Hình 5 (b), mô hình dự đoán sai vì bác sĩ không chẩn đoán vùng có chứa khối u giống như dự đoán của mô hình; Hình 5 (c), mô hình được đánh giá là dự đoán sai vì vùng bất thường và vùng dự đoán của bác sĩ trung nhau không quá 80 %. (a) (b) (c) Hình 5. Ảnh dự đoán vị trí vùng khối u (a) B. Kết quả đánh giá kết quả dự đoán vùng bất thường trên ảnh MRI não Như đã giới thiệu ở phần 2, mỗi bệnh nhân có số lát cắt không giống nhau và số lượng lát cắt chứa khối u cũng như không chưa khối u không giống nhau. Để đánh giá hiệu quả của mô hình, số lượng ảnh MRI có vùng bệnh bị đánh giá là bình thường và số ảnh đánh giá sai vị trí vùng bệnh được ghi nhận trong Bảng 3. Dự đoán ảnh có bệnh thành ảnh bình thường chiếm 0-10 %, trong khi số lượng ảnh dự đoán sai vùng bệnh từ 0-21 %. Bảng 3. Kết quả đánh giá theo bệnh nhân Số ảnh đoán sai Số ảnh đánh giá sai vị STT Mã bệnh nhân Số lát cắt quan sát thành ảnh bình thường trí vùng bệnh 1 190701 20 2 0 2 190714 24 1 5 3 190731 21 1 2 4 190905 21 0 0 5 190916 21 2 0 6 191001 21 0 1 7 190724 21 0 2 8 190918 21 1 1 9 191004 21 1 1 10 191005 21 1 1 Ngoài việc xác định ảnh có khối u bị đoán sai, nghiên cứu này còn tính toán giá trị F1 thay vì chỉ sử dụng tiêu chí độ chính xác. Kết quả dự đoán vùng bất tường được thực hiện trên từng lát cắt ảnh MRI não của bệnh nhân. Giá trị F1 và độ chính xác thu được tương đối phù hợp với nhau. Bảng 4. Kết quả đánh giá kết quả dự đoán vùng bất thường trên ảnh MRI não STT Mã bệnh nhân TN FN TP FP ACC (%) F1(%) 1 190701 10 2 8 0 90,00 88,89 2 190714 12 6 6 0 75,00 66,67 3 190731 8 3 5 5 61,90 55,56 4 190905 12 0 9 0 100,00 100,00
  6. Lê Minh Lợi, Trần Nguyễn Minh Thư, Hồ Trọng Nguyễn, Phạm Nguyên Khang 661 STT Mã bệnh nhân TN FN TP FP ACC (%) F1(%) 5 190916 8 2 10 1 85,71 86,96 6 191001 10 1 7 3 80,95 77,78 7 190724 11 2 8 0 90,47 88,89 8 190918 13 2 6 0 90,47 85,71 9 191004 9 2 10 0 90,48 90,91 10 191005 9 2 10 0 90,48 90,91 Trung bình 85.55 83,23 Bên cạnh đó, mô hình còn tiến hành so sánh và đánh giá kết quả dự đoán vùng bất thường với mô hình YOLOv4 [10]. Vùng ảnh chẩn đoán bởi bác sĩ và vùng ảnh dự đoán bởi mô hình trùng nhau khoảng trên 80 % thì mô hình được đánh giá là chính xác. Với cách đánh giá này, kết quả đánh giá độ chính xác dự đoán của 2 mô hình trên cùng tập dữ liệu chứa thông tin của 7 bệnh nhân được trình bày trong Bảng 5. Bảng 5. So sánh độ chính xác của mô hình Yolo và U-Net STT Mã bệnh nhân Độ chính xác YOLOV4 (%) Độ chính xác U-Net (%) 1 190701 (20 ảnh) 78 90 2 190731 (21 ảnh) 95 61,9 3 190905 (21 ảnh) 90 100 4 190916 (21 ảnh) 86 85,71 5 190918 (21 ảnh) 73 90,47 6 191001 (21 ảnh) 92 80,95 7 191004 (21 ảnh) 73,9 90,48 Trung bình 83,99 85,64 Mô hình U-Net có độ chỉnh xác cao hơn mô hình YOLO với 7 bệnh nhân, trung bình mỗi bệnh nhân có 21 ảnh. Bên cạnh đó, mô hình U-Net cũng cho thấy sự vượt trội hơn khi xét về khả năng dự đoán hình dạng thực của vùng bệnh. Hình 6 minh hoạ vùng dự đoán bởi mô hình U-net (đúng với hình dạng khối u) và bởi mô hình YOLO v4 (khung hình chữ nhật bao quanh khối u). Hình 6. Kết quả dự đoán của mô hình YOLO và U-Net IV. KẾT LUẬN Việc phát hiện kịp thời khối u hỗ trợ các bác sĩ trong quá trình chẩn đoán và điều trị cho bệnh nhân được thực hiện hiệu quả trong tình trạng các bệnh viện luôn quá tải là rất cần thiết.Trong nghiên cứu này, mô hình U-net được hiệu chỉnh và thực nghiệm để dự đoán và khoanh vùng khối u dựa trên ảnh MRI não. Mô hình U-Net được huấn luyện trên tập dữ liệu LGG của 110 bệnh nhân với 3929 ảnh MRI màu và 3929 ảnh mặt nạ phân đoạn bất thường thủ công. Mô hình sau khi huấn luyện được áp dụng để dự đoán vùng khối u trên dữ liệu DICOM ảnh xám thu thập từ bệnh viên Đại học Y Dược Cần Thơ. Tập dữ liệu DICOM được sử dụng đánh giá mô hình là 212 ảnh MRI xám chuỗi xung Flair bao gồm 101 lát cắt MRI có vùng khối u và 111 lát cắt bình thường thu thập của 10 bệnh nhân. Mô hình đã đạt được độ chính xác trung bình là 85,5 % khi so sánh kết quả dự đoán bởi mô hình và kết quả chẩn đoán của bác sĩ. Hiện tại tập dữ liệu sử dụng để huấn luyện là tập dữ liệu LGG vì chưa thu thập và gán nhãn được nhiều dữ liệu của bệnh nhân tại Đại học Y Dược. Trong tương lai, để tăng độ chính xác của mô hình, cần thu thập thêm dữ liệu để huấn luyện cũng như để kiểm tra đánh giá, bổ sung thêm các các chuỗi xung khác nhau thay vì chỉ sử dụng chuỗi xung FLAIR, bằng việc thu thập và xây dựng nhiều mặt nạ phân đoạn của nhiều chuỗi xung khác nhau để nâng cao khả năng
  7. 662 ỨNG DỤNG MÔ HÌNH U-NET PHÁT HIỆN VÙNG BẤT THƯỜNG TRÊN ẢNH MRI NÃO dự đoán của mô hình để xuất. Bên cạnh đó, mô hình có thể hướng tới việc xác định bệnh lý của não bộ thay vì chỉ xác định vùng bất thường. TÀI LIỆU THAM KHẢO [1] Trần Đức Quang, Nguyên lý và kỹ thuật cộng hưởng từ của, NXB Đại học Quốc gia Thành phố Hồ Chí Minh, Trang 71-73, 2008. [2] Barata C., Ruela M., Francisco M., Mendonça T., Marques J. S. “Two systems for the detection of melanomas in dermoscopy images using texture and color features”. IEEE Systems Journal. 8(3): pp. 965-979, 2014. [3] Stanley R. J., Stoecker W. V., Moss R. H. “A relative color approach to color discrimination for malignant melanoma detection in dermoscopy images”. Skin Research and Technology. 13(1): pp. 62-72, 2007. [4] Roth, H. R.; Shen, C.; Oda, H.; Oda, M.; Hayashi, Y.; Misawa, K.; Mori, K. “Deep learning and its application to medical image segmentation”. Med Imaging Technol. 36, pp. 63-71, 2018. [5] Litjens, G.; Kooi, T.; Bejnordi, B. E.; Setio, A.A.A.; Ciompi, F.; Ghafoorian, M.; Van Der Laak, J. A.; Van Ginneken, B.; Sánchez, C. I. “A survey on deep learning in medical image analysis”. Med Image Anal, 42, pp. 60- 88, 2017. [6] Iyatomi H., Oka H., Celebi M. E., et al. “An improved internet-based melanoma screening system with dermatologist-like tumor area extraction algorithm”. Computerized Medical Imaging and Graphics, 32(7): pp. 566- 579, 2008. [7] Chen, C.; Ozolek, J. A.; Wang, W.; Rohde, G. “A General System for Automatic Biomedical Image Segmentation Using Intensity Neighborhoods”. Int. J. Biomed. Imaging 2011, pp. 1-12, 2011. [8] O. Ronneberger, P. Fischer and T. Brox, “U-Net: Convolutional Networks for Biomedical Image Segmentation”, Medical Image Computing and Computer-Assisted Intervention (MICCAI), Springer, LNCS, Vol. 9351: pp. 234- 241, 2015. [9] A. S. M. A. M. Mateusz Buda, “Association of genomic subtypes of lower-grade gliomas with shape features automatically extracted by a deep learning algorithm”. Comp. in Bio. and Med. 109: pp. 218-225 2019. [10] Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao, YOLOv4: Optimal Speed and Accuracy of Object Detection, 23 Apr 2020. USING U-NET MODEL TO DETECT ABNORMAL AREAS ON BRAIN MRI IMAGES Le Minh Loi, Tran Nguyen Minh Thu, Ho Trong Nguyen, Pham Nguyen Khang ABSTRACT: Brain magnetic resonance imaging (MRI) is a CT scan that helps detect brain diseases such as cysts, hemorrhages, brain tumors and abnormalities of brain structure during development. In this article, the U-Net model is applied to predict and localize the abnormalities of brain on brain MRI images. the LGG data set (with 3929 color images of 110 patients) is used to train the U-Net model. The model is evaluated by Dicom data set of 10 patients of Can Tho University of Medicine and Pharmacy (with 212 gray images including 101 images of abnormal area and 111 images of normal area). The U-Net model was modified and supplemented to respond with the grayscale images. The model accuracy is about 85.5 % by comparing the predicted result of the model and evaluated result of the doctors at Can Tho University of Medicine and Pharmacy.
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2