intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Một phương pháp tra cứu ảnh hiệu quả kết hợp đặc trưng mức thấp và đặc trưng học sâu nhúng với đánh hạng đa tạp

Chia sẻ: Liễu Yêu Yêu | Ngày: | Loại File: PDF | Số trang:7

9
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết "Một phương pháp tra cứu ảnh hiệu quả kết hợp đặc trưng mức thấp và đặc trưng học sâu nhúng với đánh hạng đa tạp" đề xuất sử dụng đặc trưng kết hợp các đặc trưng mức thấp và DFE để tận dụng cả các đặc điểm của đặc trưng mức thấp và DFE. Các thử nghiệm đã được tiến hành đã chứng minh tính hiệu quả của các đặc trưng được đề xuất khi làm tăng đáng kể kết quả đánh hạng của EMR. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Một phương pháp tra cứu ảnh hiệu quả kết hợp đặc trưng mức thấp và đặc trưng học sâu nhúng với đánh hạng đa tạp

  1. Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022) MỘT PHƯƠNG PHÁP TRA CỨU ẢNH HIỆU QUẢ KẾT HỢP ĐẶC TRƯNG MỨC THẤP VÀ ĐẶC TRƯNG HỌC SÂU NHÚNG VỚI ĐÁNH HẠNG ĐA TẠP Hoàng Văn Quý*1, Nguyễn Thế Cường1, Ngô Hoàng Huy2, Trần Văn Huy1, Hoàng Xuân Trung3, Nguyễn Văn Đoàn4, Nguyễn Văn Quyền5 1 Trường Đại học Hồng Đức 2 Trường Đại học CMC 3 Trường Đại học Kinh doanh và công nghệ 4 Trường Đại học Điện Lực 5 Trường Đại học Hải Phòng Email: hoangvanquy@hdu.edu.vn, nguyenthecuong@hdu.edu.vn, tranlehuy@hdu.edu.vn, nhhuy@cmc-u.edu, trungvnit@gmail.com, doannv@epu.edu.vn, quyennv@dhhp.edu.vn Abstract — Trong CBIR, ảnh có thể biểu diễn bằng nhiều điểm có giá trị xếp hạng lớn nhất. Để tăng hiệu quả tính đặc trưng mức thấp mô tả các đặc điểm về màu sắc, kết cấu và hình dạng của hình ảnh. Sự thành công của đặc toán EMR đã sử dụng các điểm neo thay thế cho việc trưng học sâu được nhúng (DFE), dựa trên kiến trúc học xét toàn bộ tập dữ liệu ảnh. Các điểm neo được xác định sâu để trích xuất tính năng từ dữ liệu và có được các tính bằng tâm của các cụm thu được sau khi sử dụng thuật năng nhúng có tính phân biệt cao hơn đặc trưng mức thấp. Ưu điểm của các đặc trưng mức thấp là bất biến toán phân cụm K-means trên tập dữ liệu gốc. theo tỷ lệ và dễ tính toán mà không cần học, trong khi DFE cung cấp khả năng phân biệt cao hơn. Trong bài báo này chúng tôi đề xuất một phương Để nâng cao hiệu quả truy xuất ảnh dựa trên đánh pháp mới xác định các điểm neo để tăng hiệu quả của hạng đa tạp là EMR, trong bài báo này, chúng tôi đề xuất thuật toán đánh hạng đa tạp EMR bằng thuật toán phân sử dụng đặc trưng kết hợp các đặc trưng mức thấp và DFE để tận dụng cả các đặc điểm của đặc trưng mức thấp cụm mờ C- means (FCM) cải tiến. Thuật toán đề xuất và DFE. Các thử nghiệm đã được tiến hành đã chứng có thể phân cụm được hiệu quả khi số cụm rất lớn (có minh tính hiệu quả của các đặc trưng được đề xuất khi làm tăng đáng kể kết quả đánh hạng của EMR. thể lên đến 10% cho tới 20% của số phần từ của tập dữ Keywords — Big data, EMR, K-means, FCM, liệu). CBIR, Deep feature embedding (DFE), Resnet50. Phần còn lại của bài báo được tổ chức như sau. I. GIỚI THIỆU Phần 2, một số nghiên cứu liên. Phần 3 là đề xuất thuật Độ đo đánh hạng đa tạp [1,2,3,4,5] đo độ tương toán xác định các điểm neo theo tiếp cận phân cụm sử tự của các ảnh được sử dụng rộng rãi trong CBIR. Với dụng thuật toán FCM và các thuật toán EMR cải tiến một giả định rằng mỗi điểm dữ liệu trong một không trong CBIR. Các kết quả thực nghiệm đưa ra trong gian đặc trưng có một mối quan hệ với các điểm dữ liệu phần 4. Kết luận và hướng nghiên cứu tiếp theo được khác tương tự trong không gian, thuật toán trước hết trình bày trong phần 5. xây dựng một đồ thị có trọng số cho tất cả các điểm dữ II. NGHIÊN CỨU LIÊN QUAN liệu trong không gian đặc trưng ở đó mỗi cạnh được 2.1. Thuật toán đánh hạng đa tạp EMR gán một trọng số để biểu diễn mối liên quan dữ liệu Một bước quan trọng của thuật toán EMR [1] là giữa hai điểm. Đầu tiên, điểm dữ liệu truy vấn ban đầu xác định giá trị thứ hạng tương tự của ảnh trong CSDL được gán một giá trị nhất định, các điểm dữ liệu còn lại với ảnh truy vấn là sử dụng độ đo đa tạp chỉ cho các có liên quan được gán giá trị 0. Thứ hai, tất cả các điểm vector ảnh neo thay vì trên toàn bộ cơ sở dữ liệu ảnh. dữ liệu lan truyền xếp hạng của chúng đến các điểm dữ liệu bên cạnh thông qua các trọng số của cạnh. Quá Trong thuật toán EMR quan hệ kề nhau của hai trình lan truyền của các điểm số xếp hạng lặp đi lặp lại vector ảnh được xây dựng dựa trên các điểm neo cho đến khi hội tụ tới một tình trạng ổn định toàn cục. (anchor) thay vì dựa trên quan hệ s-láng giềng của từng Các điểm chính thức được xếp hạng đại diện cho việc vector ảnh, nghĩa là Ei gọi là được nối với Ej nếu i≠j và giống nhau giữa điểm dữ liệu và điểm truy vấn. Các tồn tại một điểm neo chung Ac nào đó sao cho Ac là s- điểm dữ liệu tương tự như các điểm truy vấn là những láng giềng của mỗi Ei và Ej; ISBN 978-604-80-7468-5 100
  2. Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022) Với mỗi vector ảnh Ei ký hiệu: điểm tâm cụm là điểm neo. Qua thực nghiệm chúng tôi thấy là khi số cụm C chọn không đủ lớn thì EMR cho N b ( i , s )  n b est ( E i , Al , s ); (1) kết quả sai lệch khá nhiều. Vì vậy chúng tôi đề xuất d s  m ax d ( E i , A i ) một thuật toán phân cụm dựa trên FCM thay thế cho i N b ( i , s ) thuật toán K-means để chọn các điểm neo. 3 2  (1  t ) if t  1 2.2 Đặc trưng học sâu nhúng (DFE) của ảnh và K (t )   4 0 otherwise Các đặc trưng ảnh có thể được chia thành đặc trưng mức thấp và mức cao, trong đó các đặc trưng mức Với Nbest(i) là vector thứ i trong Nbest vector thấp chứa các đặc điểm của hình ảnh, như màu sắc, kết gần Ac nhất và d(Ei, Ai) – khoảng cách giữa 2 vector A, cấu, hình dạng, trong khi các đặc trưng mức cao của B có cùng kích thước. hình ảnh có thể mang nhiều ngữ nghĩa hơn nhưng lại Độ đo đa tạp được xây dựng nhờ giải hàm mục làm giảm chi tiết màu sắc và kết cấu. Để cải thiện độ tiêu sau: chính xác, tác giả trong [16, 17] đã đề xuất phương  2  pháp tổng hợp tuyến tính có trọng số giữa các đặc trưng ri rj   (2) mức cao và mức thấp. Phương pháp tổng hợp này chỉ 1  1i wij  Dii D jj  EMR(r ; Q)   , j n1   min nhằm mục đích lấy điểm trung bình nhưng không tập 2  n1      ri  r0,i 2  trung vào phân tích điểm yếu của từng loại đặc trưng  i 1  để chọn thứ hạng phù hợp. Do đó, mặc dù độ chính xác , trong đó Q là tập ảnh truy vấn, (để thuận tiện trung bình tăng, vẫn có kết quả rất kém so với việc sử gán: En+1 = Q) và r0,n+1 = 1, r0,i =0, = 1, . dụng một loại đặc trưng duy nhất cho cùng một truy vấn. Z=  zki 1 k C ,1i  n 1 Đối với các đặc trưng học sâu nhúng (DFE) [16,  E ,A  (3) 17, 18, 19] đã trình bày một phân tích và thử nghiệm K i k   ds  về bộ dữ liệu ImageNet, từ đó các tác giả chỉ ra rằng zki   E ,A  hai biểu diễn đặc trưng fc4096a và fc4096b, được trích  K i l  xuất từ mạng Resnet50, có tính khái quát tốt hơn khả lNB ( i , s )  ds  năng hơn các đặc trưng khác của CNN và mang lại hiệu k  Nb(i,s), z ki  0k  Nb(i,s) suất cao. Tuy nhiên, các đặc trưng học sâu nhúng DFE (4) không được sử dụng rộng rãi vì mô hình được đào tạo ,W  Z Z , def W=  w ij  T 1 i , j  n 1 trước đã phân loại hình ảnh trong các lớp cuối cùng, wij   zki * zkj , 1  i, j  n  1 các đối tượng được xác định trước sẽ được xác định. kNb ( i , s )  Nb (j, s ) ResNet (Residual Network) được sử dụng có def n 1 (5) hiệu quả trong việc tra cứu ảnh. Có nhiều biến thể của Dii   wij j 1 kiến trúc ResNet với số lớp khác nhau như ResNet-18, ResNet-34, ResNet-50, ResNet-101, ResNet-152, với Như trình bày ở trên, kết quả đánh hạng của mạng ResNet50 được đào tạo trước, chúng tôi loại bỏ thuật toán EMR phụ thuộc vào việc chọn số lượng điểm lớp phân lớp (Classifier – lớp cuối cùng) của mạng neo C và tập điểm neo {A c }Cc1 . Trong [1] các tác giả ResNet50 trở thành một mạng chỉ trích xuất đặc trưng đã sử dụng thuật toán phân cụm K-means để chọn các của ảnh [15, 17]. (Hình 1) ISBN 978-604-80-7468-5 101
  3. Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022) Hình 1: Mô hình mạng trích chọn đặc trưng Resnet50 [17] III. KỸ THUẬT ĐỀ XUẤT n p 3.1. Xác định các điểm neo bằng thuật toán FCM.  c ,i Ei Cho trrước một cơ sở dữ liệu (CSDL) đặc c  1, C , A c  i 1 n (10) trưng mức thấp E   Ei 1i  n , sử dụng FCM (về  cp,i i 1 FCM, xem [7,8,9,10,11]) ta phân cụm E thành C cụm, Trong công thức (9) và (10) ở trên, tất cả các thuật toán lặp FCM cực tiểu hóa hàm mục tiêu sau: vector đặc trưng của CSDL ảnh đều tham gia. Nhưng n C 2 tế là không phải tất cả các phần tử điểm ảnh đều có J (A, )   cp Ei  Ac  min (6) ảnh hưởng đến quá trình hiệu chỉnh tâm cụm, như i 1 c 1 trong các thuật toán K-means [6] thì chỉ có các phần , trong đó các hằng số p > 1, C  N  ,C  2 , tử gần Ac nhất mới tham gia vào việc hiệu chỉnh tâm. m  dim( Ei ) , 1  i  n và độ đo khoảng cách Do các đặc điểm trên, chúng tôi đề xuất cải tiến các công thức (9) và (10) như sau: m 2 2 Euclid, Ei  Ac   E j 1 i, j  Ac, j  và các ràng buộc            1 ,  for i  Nbest ( Ac ; nb) (11) cho ma trận độ thuộc {µc,i} không âm được cho như   c ,i   max  2     || Ei  Ac ||  m 1  sau :      || E  A ||    1iNbest c ' C ( Ac ' )  i c'   C     0 for i  Nbest ( Ac ; nb) i  1, n,  c ,i  1.0 (7)  c 1 Chuẩn hóa lại { c ,i } theo ràng buộc: n (8) c  1, C,  c ,i  0.   c ,i  C , c=1, C , i  Nbest ( Ac ; nb) i 1  c ,i    c ',i Công thức lặp giải hàm mục tiêu (6) được cho như  c '1 (12) sau: 0 for i  Nbest ( Ac ; nb) 1 c  1, C , i  1, n, c,i  nb 2 (9)  p c , Nbest (i') ENbest (i') (13) p 1  n Ei  Ac  Ac  i '1 , c  1, C   nb  i '1 Ei '  Ac  p  i '1 c , Nbest (i') , trong đó µɛ là một hằng số dương đủ nhỏ và nb là tham số chỉ số các vector đặc trưng của CSDL ISBN 978-604-80-7468-5 102
  4. Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022) ảnh E gần Vc nhất và Nbest(i) là vector thứ i trong Input: Tập dữ liệu ảnh I i 1in , Tập ảnh truy vấn nbest vector gần Ac nhất. IQ, Chúng ta có thuật toán FCM cải tiến để xác định các điểm neo như sau:  Ac1cC : Điểm neo (Anchor point) được Thuật toán 1. Xác định các điểm neo bằng tìm bởi thuật toán 1. FCM (Anchor point using FCM - AuFCM) Output: r  ri 1i n , ri  [0,1]i  1, n là thứ Input: E   Ei 1i n dữ liệu đặc trưng mức hạng tương tự với ảnh Q của ảnh Ii trong cơ sở dữ liệu thấp, hằng số p > 1, C số điểm neo (C có thể rất lớn ảnh I từ 10% đến 20% của số các ảnh của E), Bước 1: (offline) m  dim( Ei ), i  1, n , nb số nbest các điểm gần 1.1 Tính đặc trưng mức thấp của I i 1in một điểm neo Ac, c  1, C , µɛ > 0 và L là số vòng được tập các vector đặc trưng mức thấp lặp tối đa. I t ,i 1 t T ,1 i  n Output: Tập các điểm neo  Ac 1cC 1.2 Chuẩn hóa vector đặc trưng mức thấp Bước 1: Khởi tạo các tâm cụm bằng thuật toán K- I  theo thuật toán 3δ-opt [14], được t ,i 1 t T ,1 i  n means: 1.1: Gọi K-means(E, C) để phân cụm E thành tập vector I  norm t ,i 1 t T ,1 i  n đã chuẩn hóa. C cụm, thu được  Ac 1cC . 1.3 Trích chọn đặc trưng CNN của I i 1in 1.2: Tính J0(A, µ) theo công thức (6). được tập vector đặc trưng CNN IEi 1in bằng Bước 2: Lặp l  1, L : model Resnet50. 2.1: Tính ma trận độ thuộc  c ,i 1 c  C ,1 i  n 1.4 Kết hợp (concatenate) các vector đặc theo công thức (11). trưng : I  norm t ,i 1 t T ,1 i  n và IEi 1in được tập 2.2: Chuẩn hóa các trọng số  c ,i 1 c  C ,1 i  n vector đặc trưng  ICi 1in theo ràng buộc (12) Bước 2: (offline): Tìm các điểm neo (Anchor point) 2.3: Tính lại tâm các cụm  Ac1cC theo công thức (13). C=  Ac1cC theo thuật toán 1 và xây dựng đồ thị 2.3: Tính Jl(A, µ) theo công thức (6). neo với trọng số wi,j theo thuật toán EMR[1]. 2.4. Ra khỏi vòng lặp nếu Bước 3: (online): Đặt J l ( A ,  )  J l  1 ( A ,  ) (sai số dưới ngưỡng). rQ  ri 1i n1 , ri  0i  1, n, rn1  1.0 và Bước 3: Trả về  Ac1cC . xác định thứ hạng rQ  (rQi )1in trên tập vector Độ phức tạp của thuật toán là: O(n*m*C*L + n*m*C2*L*N_best). ICi 1in1 bằng thuật toán EMR[1] . 3.2 Truy vấn ảnh với EMR dựa trên AuFCM (EMR- Bước 4: Trả về rQ (AuFCM) Độ phức tạp của thuật toán EMR-(AuFCM) là tương Thuật toán 2. CBIR dựa trên EMR – (AuFCM) với độ phức tạp của thuật toán EMR gốc – Kết hợp đặc trưng mức thấp và đặc trưng học sâu nhúng DFE ISBN 978-604-80-7468-5 103
  5. Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022) IV. THỰC NGHIỆM Hệ thống truy vấn ảnh đề xuất của chúng tôi như sau (Hình 2) Hình 4: Một số mẫu trong tập dữ liệu ảnh VGGFACE2-S. Hình 2: Hệ thống CBIR đề xuất 4.1. Trích chọn đặc trưng Chúng tôi tiến hành các thực nghiệm trên hai Trong các thử nghiệm, chúng tôi đã chọn và tập dữ liệu logo-2K+ [12] and VGGFACE2-S [13]. trích xuất toàn bộ 5 đặc trưng mức thấp để mô tả một Các tập dữ liệu này được tổ chức thành các lớp ngữ hình ảnh: Color Moments, LBP, Gabor Wavelets nghĩa theo cách con người nhận thức về độ tương tự. Texture, Edge và GIST. Tất cả các đặc trưng mức Mỗi lớp biểu diễn một chủ đề ngữ nghĩa khác nhau, thấp được chuẩn hóa bằng phương pháp 3-opt để các ảnh trong cùng một lớp được xem là liên quan. mỗi thành phần vector của mỗi ảnh nằm trong phạm Bảng 1. Các tập dữ liệu ảnh vi [-1, 1] vetor với số chiều là = 809 ([14]). Đồng Tập ảnh Số lượng ảnh Số lớp ảnh thời mỗi ảnh đã đào tạo trước trên tập ImageNet, mỗi 303 hình ảnh trong bộ dữ liệu này được chạy qua mô hình Logo-2K+ 22725 học sâu Resnet50 [15] được cắt bỏ đi lớp cuối cùng, VGGFACE2-S 60000 500 được vector đặc trưng với số chiều drf = 4096. (Bảng 2) Tập dữ liệu thứ nhất Logo-2K+[12], gồm Bảng 2. Các vector đặc trưng và số chiều vector 22725 hình ảnh logo của 303 thương hiệu khác nhau được sử dụng: và được đặt trong 303 nhóm, với mỗi nhóm gồm 75 Description Type of Size of feature ảnh của mỗi thương hiệu. Hình 3 chỉ ra một số mẫu feature vectors ảnh trong tập dữ liệu này. Tập dữ liệu thứ 2 VGGFACE2-S là tập con của tập dữ liệu hình ảnh để GCM Color 81 nhận dạng khuôn mặt VGGFACE2. Nó bao gồm LBP Texture 59 60000 ảnh chia thành 500 nhóm với mỗi nhóm 120 GWT Texture 120 ảnh của mỗi người (tập dữ liệu này được lấy ngẫu nhiên từ tập dữ liệu VGGFACE2 với 169396 ảnh EDH Shape 37 trong 500 lớp [13]) – Hình 4 chỉ ra một số mẫu ảnh GIST Shape 512 trong tập này. Ảnh trong các tập dữ liệu có kích From Feature DFE 4096 thước, độ phân giải và mầu sắc khác nhau. Resnet50 Khoảng cách Euclid sẽ được sử dụng để tính khoảng cách giữa các đặc trưng và được sử dụng để so sánh đặc trưng của ảnh truy vấn với đặc trưng ảnh trong cơ sở dữ liệu. 4.2. Các kết quả và luận giải Trong thực ngiệm này, chúng tôi chọn µɛ =10-6, nb = 500 đối với thuật toán FCM đề xuất. Để đánh giá khách quan hiệu quả của thuật toán EMR (gốc) và EMR-AuFCM đề xuất, chúng tôi sử dụng một chỉ số tương tự độ đo Average Precision Hình 3: Một số mẫu trong tập dữ liệu ảnh Logo-2K+ (chúng tôi vẫn gọi là AP) được đề xuất bởi NISTTREC video (TRECVID) [14], AP được định nghĩa trung bình của giá trị độ chính xác thu được sau ISBN 978-604-80-7468-5 104
  6. Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022) mỗi ảnh liên quan được tra cứu. Tập ảnh truy vấn Q với cơ sở dữ liệu hình ảnh lớn, các hệ thống CBIR được chọn ngẫu nhiên với số lượng 10% theo từng trích xuất các đặc trưng thấp của ảnh trong pha ngoại chủ đề của tập ảnh thử nghiệm Logo-2k+ và tuyến và xếp hạng các vectơ đặc trưng hình ảnh theo VGGFACE2-S. Với mỗi ảnh truy vấn q  Q , sử mức độ tương đương với vectơ đặc trưng hình ảnh dụng các độ đo tương tự cho bởi EMR và EMR- truy vấn đã được xây dựng bằng cách sử dụng EMR- AuFCM đề xuất, chúng ta chọn N = 100 ảnh có độ AuFCM trong pha trực tuyến, do đó thời gian tính tương tự cao nhất. Giá trị độ chính xác là trung bình toán không bị ảnh hưởng vì hầu hết các mô-đun tính tỷ lệ giữa số ảnh liên quan trong N ảnh được trả lại toán như trích xuất đặc trưng cấp thấp, các mô-đun bởi các giá trị tương tự với từng ảnh q. Gọi tập các liên quan FCM cải tiến áp dụng cho toàn bộ cơ sở dữ liệu đã được giải quyết trong giai đoạn ngoại tuyến. phần tử liên quan đến truy vấn q  Q là EMR-AuFCM với đặc trưng mức thấp kết hợp đặc d 1 , d 2 , ..., d m j  , giá trị AP trên toàn bộ các truy vấn trưng học sâu nhúng DFE cho kết quả truy vấn tốt được tính toán như sau: hơn so với EMR gốc và EMR-AuFCM chỉ sử dụng đặc trưng mức thấp.  1 Q mj  AP(Q)   Kết quả thực nghiệm là thách thức thúc đẩy  N  *100 (16) chúng tôi thử nghiệm trên hình ảnh y tế lớn với hàng Q j 1  ngàn hình ảnh được thêm vào cơ sở dữ liệu được lưu Từ các thử nghiệm trên các tập dữ liệu khác nhau trữ bằng nhiều cách khác nhau. (Logo-2k+ và VGGFACE2-S), tùy thuộc vào số hình VI. TÀI LIỆU THAM KHẢO ảnh, lớp hình ảnh và hình ảnh trong mỗi lớp việc lựa chọn các tham số C (điểm neo – anchor point) khác [1] Bin Xu, Jiajun Bu, Chun Chen, Can Wang, nhau sẽ cho kết quả khác nhau. Và thuật toán đề xuất Deng Cai and Xiaofei He. EMR: A Scalable Graph- EMR-AuFCM (EMR sử dụng FCM để chọn các based Ranking Model for Content-based Image điểm neo chính là tâm của các cụm thu nhận được) Retrieval, IEEE transactions on knowledge and data cho kết quả tốt hơn so với thuật toán EMR gốc sử engineering. 27, no.1, 102-114 (2015). dụng K-means. [2] Wang, M., Fu, W., Hao, S., Tao, D., & Wu, Bảng 3. Kết quả thực nghiệm trên các tập dữ liệu X. Scalable Semi-Supervised Learning by Efficient Anchor Graph Regularization. IEEE Transactions on Logo-2K+ VGGFACE2-S Knowledge and Data Engineering. 28 (7), 1864–1877 Số EMR EMR- EMR EMR – điểm (2016). (với đặc AuFCM (với đặc AuFCM neo trưng Kết (với đặc trưng Kết (với đặc [3] Liang, S., Markov, I., Ren, Z., & de Rijke. hợp LF trưng Kết hợp LF trưng Kết M. Manifold Learning for Rank Aggregation. và DFE) hợp LF và và DFE) hợp LF và Proceedings of the 2018 World Wide Web. DFE) DFE) Conference on World Wide Web - WWW ’18. 2018. 4000 60,2% 86.6 % 63,2% 91.3 % [4] Wu, Y., Wang, X., & Zhang, T. Crime 4500 61,3% 87.4 % 64,2% 91.9 % Scene Shoeprint Retrieval Using Hybrid Features and 5000 62,4% 88.7 % 65,5% 92.6 % Neighboring Images. Information, 10 (2), 45 (2019). 5500 63,1% 89.6 % (*) 66,8% 92.6 % [5] Shaoyan Sun, Ying Li, Wengang Zhou, Qi 6000 63,2%(*) 88.7 % 68,6% 93.1% Tian c, Houqiang Li. Local residual similarity for 7000 60,9% 88.4% 68,7%(*) 93.5% (*) image re-ranking, Information Sciences. 417, 143– 153 (2017). Hiệu quả truy vấn tốt nhất của EMR-AuFCM trên 2 tập dataset (Logo-2k+ và VGGFACE2-S) với [6] Anil K. Jain. Data clustering: 50 years đặc trưng mức thấp (LF-Low level Feature) là 63.2%; beyond K-means, Pattern Recognition Letters. 31, 68.7%. Hiệu quả truy vấn trung bình của EMR- 651–666 (2010). AuFCM trên 2 tập dataset (Logo-2k+ và [7] J.C. Bezdek, Pattern Recognition with VGGFACE2-S) với đặc trưng kết hợp mức thấp và Fuzzy Objective Function Algorithm, Plenum Press, đặc trưng học sâu nhúng DFE là 89.6%; 93.5% (với 1981. số cụm C=7000). [8] Yang, Miin-Shen, Pei-Yuan Hwang, and V. KẾT LUẬN De-Hua Chen. Fuzzy clusterinsg algorithms for Trong bài báo này, thuật toán FCM đã được mixed feature variables. Fuzzy Sets and Systems. cải tiến đề xuất để phân cụm một cơ sở dữ liệu lớn 141, no. 2. 301-317 (2004). cho các vectơ nhiều chiều thành nhiều cụm. Sau đó, [9] Hanuman Verma, Akshansh Gupta, thay vì sử dụng K-means như thông thường, FCM Dhirendra Kumar. A modified intuitionistic fuzzy c- được áp dụng cho bước chọn điểm neo của EMR. Đối means algorithm incorporating hesitation degree, Pattern Recognition Letters. 122, 45–52. (2019). ISBN 978-604-80-7468-5 105
  7. Hội nghị Quốc gia lần thứ 25 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2022) [10] Timothy C. Havens, James C. Bezdek, Learning for Image Recognition. Christopher Leckie, Lawrence O. Hall, and arXiv:1512.03385v1 [cs.CV] 10 Dec 2015. Marimuthu Palaniswami. Fuzzy c-Means Algorithms [16] M. Tzelepi and A. Tefas, Deep for Very Large Data, IEEE Transactions on Fuzzy convolutional learning for content based image systems. 20, no.6, December 2012. retrieval, Neurocomputing, vol. 275, pp. 2467-2478, [11] Kuo-Lung Wu. Analysis of parameter 2018. selections for fuzzy c-means, Pattern Recognition. [17] Agnel Lazar Alappat, Prajwal Nakhate, 45, 407–415 (2012). Sagar Suman, Ambarish Chandurkar, Varad [12] Dataset. [Online]. Available: Pimpalkhutea, Tapan Jain,"CBIR using Pre-Trained https://drive.google.com/drive/folders/1PTA24UTZ Neural Networks", arXiv:2110.14455v1 [cs.CV] 27 csnzXPN1gmV0_lRg3lMHqwp6 Oct 202. [13] Dataset. [Online] [18] Chen Huang, Chen Change Loy, Xiaoou http://zeus.robots.ox.ac.uk/vgg_face2/ Tang, “Local Similarity-Aware Deep Feature [14] Trung Hoang Xuan, Tuyet Dao Van, Huy Embedding”, arXiv:1610.08904 [cs.CV], NIPS Ngo Hoang, Sergey Ablameyko, Cuong Nguyen 2016. Quoc, Quy Hoang Van. A Novel Non-Gaussian [19] Wei Chen, Yu Liu, Weiping Wang, Erwin Feature Normalization Method and its Application in M. Bakker, Theodoros Georgiou,Paul Fieguth, Li Content Based Image Retrieval. Nonlinear Liu, and Michael S. Lew, “Deep Learning for Phenomena in Complex Systems. 22, no. 1, pp. 1 – Instance Retrieval: A Survey”, arXiv:2101.11282v3 17 (2019). [cs.CV] 8 Jan 2022. [15] Kaiming He Xiangyu Zhang Shaoqing Ren Jian Sun Microsoft Research. Deep Residual ISBN 978-604-80-7468-5 106
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2