Cải thiện tốc độ tìm kiếm của mô hình đồ thị BT-Graph dựa trên nền tảng CUDA

Chia sẻ: Lavie Lavie | Ngày: | Loại File: PDF | Số trang:8

Thêm vào BST

Báo xấu

32
lượt xem 3
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết Cải thiện tốc độ tìm kiếm của mô hình đồ thị BT-Graph dựa trên nền tảng CUDA đề xuất một hướng tiếp cận mới trong việc cải thiện tốc độ tìm kiếm của mô hình đồ thị BT-Graph bằng phương pháp song song hóa tìm kiếm dựa trên nền tảng CUDA.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Cải thiện tốc độ tìm kiếm của mô hình đồ thị BT-Graph dựa trên nền tảng CUDA

Kỷ yếu Hội nghị Q K Quốc gia lần thứ VIII về Nghiên cứ cơ bản và ứng dụng Công nghệ thông tin (FAIR) Hà Nội, ngày 9 ứu ệ ); 9-10/7/2015 CẢI T THIỆN TỐ ĐỘ T KIẾM CỦA MÔ HÌNH Đ THỊ B T-GRAP ỐC TÌM M Ô ĐỒ PH DỰA TRÊN NỀN TẢN CUDA A NG A Lư ương Hoàng Hướng1, Ngu uyễn Hải Tha 2, Huỳnh X anh Xuân Hiệp3 1 Trung tâm Công ngh phần mềm, Đại học Cần Thơ hệ 2 Vụ K Khoa học, Công nghệ và Môi trường, Bộ Giáo dục và Đ tạo Việt N g G Đào Nam 3 Khoa Công nghệ thông tin và Truyền thông, Nhóm nghiên cứu li ngành DR g n m iên REAM-CTU/IR Đại học Cần Thơ RD, C lhhuong g@ctu.edu.vn, nhthanh@{moet.gov.vn, mo oet.edu.vn}, h hxhiep@ctu.ed du.vn TÓM TẮ - BT-Graph (Graph Model based on Ball Tree Structure) là một mô hìn đồ thị được x dựng dựa tr cấu trúc ẮT h l ) nh xây rên balltree, giúp mô hình hóa hệ t b thống mạng giá sát các bẫy đèn tự động và hỗ trợ tìm kiếm vị trí địa lý. K số lượng vị trí địa lý lớn ám đ m Khi t và không gian đ lý tìm kiếm mở rộng thì cần phải cải thi tốc độ tìm kiếm của mô hì đồ thị BT-G v địa iện k ình Graph. Trong bài viết này, b chúng tôi đề xuấ một hướng tiế cận mới tron việc cải thiện tốc độ tìm kiếm của mô hình đồ thị BT-Grap bằng phương pháp song c ất ếp ng n ếm ph g song hóa thuật toán tìm kiếm dựa trên nền t s tảng CUDA NV VIDIA. Các thự nghiệm được triển khai trê hai thuật toá tìm kiếm ực ợc ên án k-láng giềng gần nhất và tìm k k kiếm đường đi n ngắn nhất dựa trên mô hình đồ thị BT-Graph và cho thấy sự cải thiện tốt về thời gian đ h ự tì kiếm. ìm Từ khóa - CUDA, BT-G a Graph, vị trí địa lý, mạng giám sát bẫy đèn tự động, song son a m ự ng. I. GIỚI THIỆU G U BT-Gra (Graph M aph Model based on Ball Tree St n tructure) [11] là một mô hìn đồ thị được xây dựng dự trên cấu nh c ựa tr balltree [2 [11]. BT-G rúc 21] Graph không c giúp mô hình hóa hệ th chỉ h hống mạng giá sát các bẫy đèn tự động bằng cách ám y đề xuất bán kín hoạt động cho các cảm b tự động, mà còn hỗ trợ tìm kiếm vị tr địa lý [11]. Tuy nhiên, kh số lượng đ nh biến m ợ trí hi tốc vị trí địa lý lớ và không gian địa lý tì kiếm mở rộng thì cần phải cải tiến t độ tìm ki v ớn ìm r p iếm của mô hình đồ thị h BT-Graph. B A) C) B) Hình 1. A) Tậ hợp điểm, B) Cấu trúc Balltr C) Mô hình đồ thị BT-Gra ập ) ree, h aph Ngày n nay, việc sử d dụng Graphic Processing Units (GPUs) [28] đóng vai trò quan trọ trong xử lý các ứng U i ọng l dụng đòi hỏi c phải xử lý song song. N d cần ý Ngoài ra GPUs cũng hỗ trợ tốt trong việc xử lý đồ thị m không cần phải giảm s t mà độ phức tạp củ mô hình đồ thị. Đã có nh nghiên cứ về việc cho thấy hiệu suấ cao giữa xử lý song song trên GPUs đ ủa ồ hiều ứu ất và xử lý tuần t trên CPU [1 [2] [3] [7] [10]. v tự 1] Trong b viết này, c bài chúng tôi đề x xuất một hướn tiếp cận mớ trong việc c thiện tốc đ tìm kiếm củ mô hình ng ới cải độ ủa đồ thị BT-Gra bằng phươ pháp song song hóa th toán tìm kiếm dựa trên nền tảng GP CUDA NVIDIA [6] đ aph ơng g huật k n PUs [15] [16] [26]. Các thực ngh . hiệm được tri khai dựa trên hai thuật toán: tìm kiếm k-láng giền gần nhất [8] [13] [19] iển m ng [23] [24] [25] và tìm kiếm đ đường đi ngắn nhất [5] [9] [17] [18] [27] [29]. n Bài viết được chia th hành năm phần Phần thứ nh giới thiệu về mô hình B n. hất BT-Graph và tì kiếm vị trí địa lý dựa ìm tr mô hình. Phần thứ hai trình bày về CUDA NVID rên DIA. Phần thứ ba trình bày về cải thiện t độ tìm kiế của mô ứ tốc ếm hình đồ thị BT h T-Graph dựa tr nền tảng C rên CUDA. Phần thứ tư trình bày về các thực nghiệm. Phầ cuối cùng là phần kết c ần l lu uận. A II. CUDA NVIDIA CUDA [26] là một mô hình lập trình và là một nền tảng tính toán son song được phát triển bở Công ty m ng ởi NVIDIA. CUD cung cấp k năng kết h giữa kiến trúc phần cứn và phần m N DA khả hợp n ng mềm. CUDA có khả năng tăn đáng kể ó ng hiệu suất tính t h toán bằng cách khai thác sứ mạnh của đơn vị xử lý đồ họa – Graph Processing Units (GPUs) ức đ ồ his ). GPUs [ [16] [28] h trợ đa luồng khổng lồ - nhiều lõi, với số lượng lên đ hàng trăm lõi và hàng ngàn luồng. [6] hỗ g n s đến m n Với số lượng l các lõi GP cung cấp một khả năng xử lý dữ liệu song song, chính vì điều đó GPUs đượ sử dụng V lớn PUs g ợc rộng rãi trong xử lý song s r song. GPUs đ được sử dụng để giải quyết nhiều vấn đề phức tạp tro mô hình hóa và mô t ề ong h phỏng như: mô phỏng khí hậu, dịch bệnh,… p ô Lương Hoàng Hướ L ớng, Nguyễn Hải Thanh, Huỳnh X i Xuân Hiệp 73 Hình 2. Lưu đồ xử lý của CUDA CUDA cung cấp một tập hợp các t viện mở rộ hỗ trợ lập trình viên tro việc phát t t thư ộng p ong triển các thuật toán song t song. Cả CPU và GPU đều tham gia vào quá trình tính toán. Các tín toàn tuần tự sẽ được thực thi trên CPU trong khi s h nh ự c U, các tính toán song song sẽ d GPU xử lý với bộ nhớ riê biệt. c do êng 3. UDA giao tiếp với bộ cấp ph bộ nhớ hát Hình 3 GPU và CU ẢI ỐC Đ GRAPH DỰA TRÊN CUD A DA III. CẢ THIỆN TỐ ĐỘ TÌM KIẾM CỦA MÔ HÌNH ĐỒ THỊ BT-G A. Thuật toán tìm kiếm k-l A n láng giềng gần nhất của mô hình đồ thị BT-Graph dự trên CUDA ựa A Tìm kiế k-láng giề gần nhất trên mô hình đồ thị BT-Gr ếm ềng raph (Search b based on BT-Graph, viết tắt là BTS) [11] được thể hiện như là ph hương pháp tì kiếm k vị trí địa lý gần nhất được áp d ìm t n dụng trên hệ t thống mạng các bẫy đèn tự động tại mộ không gian đ lý xác địn Với V là tậ hợp các vị trí địa lý (bẫy đèn), Q chứa các điểm láng giềng của ự ột địa nh. ập t g tr vấn q tron V, k là số đ ruy ng điểm gần nhất cần tìm. Quá trình tìm kiếm được bắt đầ từ nút gốc, trong suốt qu trình tìm t á m ầu uá kiếm giải thuậ sẽ tính toán lại Q. Tại mỗ nút B đang xét, giải thuậ thực hiện m trong ba trư k ật ỗi ật một rường hợp, cuối cùng trả nhất của truy vấn q. Trường hợp một nếu khoảng cách từ điểm truy vấn q đến về Q chứa k vị trí có cùng đ v ị điều kiện gần n g u h y nút đang xét B lớn hơn D, b qua B và trả kết quả là Q. Trường hợp hai nếu B là n lá, duyệt q tất cả các điểm x ∈ B n bỏ ả nút qua đ và cập nhật lại Q. Trường h ba nếu B l một nút trong, gọi đệ quy thuật toán tì kiếm cho h nút con củ B là con v i hợp là y ìm hai ủa tr và con phả Chi tiết giả thuật được m tả như tron [11]. rái ải. ải mô ng Tuy nh hiên, khi số lượ vị trí địa lý lớn và khô gian tìm kiếm mở rộng thì cần cải th ợng ông k hiện tốc độ tìm kiếm của m BTS. Ngoài ra khi số lượng điểm truy vấ lớn cũng cần phải cải th B a g ấn hiện tốc độ tìm kiếm. Vì vậ chúng tôi đề xuất hai m ậy, đ tr rường hợp giả quyết bài to tìm kiếm k ải oán k-láng giềng gần nhất bằng phương pháp song song hóa p a. Trường hợp một chú tôi đề xuấ sử dụng thu toán vét cạ áp dụng cho tìm kiếm kg úng ất uật ạn o -láng giềng dự trên nền ựa tảng CUDA (g tắt là BF-k gọi kNNCUDA) [2] [3] [8] [10 [19] [23] [2 và được c đặt với hai module chín Module 0] 25] cài i nh. một thực hiện tính toán son song khoản cách từ điểm truy vấn đế tất cả các đ m ng ng m ến điểm trong tập dữ liệu – Thực hiện tại p GPU. Module hai thực hiện sắp xếp các k G khoảng cách tí toán được theo thứ tự tă dần và chọ ra k-khoảng cách nhỏ ính ăng ọn nhất (gần nhất – Thực hiện tại CPU. n t) 74 7 CẢI THIỆN TỐC ĐỘ TÌM KIẾM CỦA MÔ HÌNH ĐỒ THỊ B N Ô BT-GRAPH DỰA TRÊN NỀN TẢ ỰA ẢNG CUDA Giải th huật 1: BF-kN NNCUDA //Xử lý tại CPU 1. u d Nạp dữ liệu vào bộ nhớ dùng chung 2. Thiết lập ch số k hỉ 3. Sao chép dữ liệu từ CPU vào GPU ữ U //Xử lý tại G GPU 4. Tính toán k khoảng cách từ điểm truy vấ q đến tất cả điểm v ∈ V ừ ấn ả 5. Sao chép dữ liệu từ GPU về CPU ữ U //Xử lý tại C CPU 6. Sắp xếp các khoảng cách tính được the thứ tự tăng dần c h eo 7. Lấy ‘k’ kho oảng cách đầu tiên thể hiện cho các điểm gần nhất u 8. Giải phóng bộ nhớ CUDA g Trường hợp hai chún tôi đề xuất với mỗi lần thực hiện BTS trên một điể truy vấn th sẽ do một lu g ng t t S ểm hì uồng trong CUDA xử lý [ Phương ph này chúng tôi gọi là BT C [4]. háp g TSCUDA. Ý tưởng thuật to được thể h t oán hiện trong hình 4 và giải th 2. huật Hình 4. BTSCUD với mỗi đi truy vấn sẽ do một luồn trong CUD A xử lý DA iểm ng 2: A Giải thuật 2 BTSCUDA / //Xử lý tại CP PU 1. T cấu trúc c T Tạo cây 2. T mảng chứ các điểm tru vấn qArrra Tạo ứa uy ay 3. S chép cây T và mảng qA Sao Arrray từ CPU vào GPU U / //Xử lý tại GP PU 4. V mỗi điểm truy vấn Với m 5. 6. 7. T kiếm trên cây T với ph Tìm n hương pháp BF FS T kết quả là danh sách k-l Trả à láng giềng gần nhất của mỗ điểm truy vấ n ỗi ấn S chép kết q tất cả danh sách k-láng giềng tìm đượ từ GPU về CPU Sao quả h ợc B. Thuật toán tìm kiếm đư B n ường đi ngắn n nhất của mô hình đồ thị BT-Graph dựa trên CUDA h Thuật t toán Dijkstra [ [26] là thu toán tìm kiếm đường đi ngắn nhất bằ phương p [5] uật k i ằng pháp duyệt qua đồ thị và tìm kiếm đườn đi sao cho c phí duyệt t đỉnh bắt đầu đến đỉnh kết thúc là nhỏ n ng chi từ t nhất. Thuật to án Dijkstra tuần tự được xây dựng trên cơ sở gán cho các đỉnh của đồ thị các nh tạm thời. Các nhãn này được thay đổ theo mỗi bước lặp tính x o a hãn C ổi toán. Có hai n nhãn là cố định và tạm thời. Ở mỗi bước lặp sẽ thay đổi một nhãn t h đ tạm thời thành nhãn cố định. Một nút h được đánh dấu là nhãn cố đị sẽ cho kết quả là đường đi ngắn nhất từ đỉnh tới nú đó. Thuật to bao gồm ba bước cơ đ u ịnh t g út oán b bản: khởi tạo ( b (Initialization) tìm giá trị nh nhất (Extra ), hỏ act_Min) và cậ nhật giá trị (UpdateCost) ập ị ). Lương Hoàng Hướ L ớng, Nguyễn Hải Thanh, Huỳnh X i Xuân Hiệp 75 Giải thuậ 3: Thuật toán Dijkstra ật //Initial 1. foreach v ∈ V do v] d[v ← ∞ 2. 3. end 4. d[S] ← 0 5. Q←V 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. while Q ≠ ∅ do //Extract_ _Min u ← { v: v ∈ Q ^ ∀w ∈ Q, d[v] ≤ d[w } w] if (d[u] = ∞) then break; Remove u from Q //UpdateC Cost foreach (u v) ∈ V do u, if ((d[u] + c(u, v)) < d[v]) then d d[v] ← d[u] + c(u, v) , end end Để song song hóa th huật toán Dijk kstra, chúng tô đề xuất mỗi cạnh của đồ thị BT-Grap sẽ tương ứn với một ôi ồ ph ng lu uồng trong CU UDA. Quá trì xử lý song song được th hiện như lư đồ ở hình 5 Trong đó, h bước Extra ình g hể ưu 5. hai act_Min và UpdateCost đư cài đặt bằn CUDA. U ược ng Hình 5. Lưu đ song song t H đồ thuật toán Dijk kstra trên mô hình đồ thị BT h T-Graph sử dụ CUDA ụng ình Quá trìn cấp phát bộ nhớ GPUs c các cạnh của đồ thị BT-Graph được th hiện như hì 6. nh ộ cho c hể Hình 6. Cấp phát bộ nhớ lưu trữ cho mô hình đồ thị B ô BT-Graph 76 CẢI THIỆN TỐC ĐỘ TÌM KIẾM CỦA MÔ HÌNH ĐỒ THỊ BT-GRAPH DỰA TRÊN NỀN TẢNG CUDA Thuật toán Dijkstra cài đặt với CUDA (gọi tắt là DijkstraCUDA) được thể hiện như sau: Giải thuật 4: Thuật toán DijkstraCUDA Bước 1: 1. Khởi tạo ma trận trọng số, điểm bắt đầu và kết thúc Bước 2: 2. Cấp phát bộ nhớ trong CUDA tương ứng với số cạnh của mô hình đồ thị BT-Graph Bước 3: 3. Sao chép dữ liệu từ CPU sang GPU Bước 4: 4. Tìm kiếm đỉnh u tự do sao cho chi phí đi từ đỉnh xuất phát S đến u là nhỏ nhất 5. Nếu không tìm thấy u thỏa điều kiện trên thì thoát: + Hoặc là tìm thấy đường đi. + Hoặc không tìm thấy đường đi. 6. Nếu tìm thấy đỉnh u thỏa điều kiện, dùng đỉnh u xét các đỉnh tự do khác. 7. Dùng CUDA để cấp các luồng cho việc thực hiện tính toán giữa đỉnh u và các đỉnh còn lại. Bước 5: 8. Sao chép dữ liệu từ GPU về CPU Bước 6: 9. Giải phóng CUDA IV. THỰC NGHIỆM Trong phần thực nghiệm này chúng tôi tiến hành so sánh tốc độ tìm kiếm trên mô hình đồ thị BT-Graph giữa thuật toán tuần tự trên CPU và thuật toán song song trên CUDA. Máy tính được sử dụng cho phần thực nghiệm này là Desktop (Intel Core i3-3220 3.3 GHz, bộ nhớ 4GB DDR3, card đồ họa NVIDIA GeForce GTX 660 với bộ nhớ 2GB GDDR5) chạy hệ điều hành Ubuntu 14.04 64 bits. A. Dữ liệu thực nghiệm Dữ liệu sử dụng cho thực nghiệm được chia làm hai loại, loại một dùng cho thực nghiệm tìm kiếm k-láng giềng và loại hai dùng cho tìm kiếm đường đi ngắn nhất Dijkstra. Các dữ liệu được sinh ra ngẫu nhiên từ chương trình thực nghiệm. Cấu trúc thông tin của dữ liệu loại một bao gồm hai danh sách. Danh sách thứ nhất chứa các điểm dữ liệu ban đầu gồm ba cột và số dòng là tùy chọn. Mỗi dòng mô tả thông tin một điểm dữ liệu. Cột một chứa tên của điểm dữ liệu, cột hai chứa giá trị x trong không gian hai chiều và cột ba chứa giá trị y trong không gian hai chiều. Danh sách thứ hai chứa các điểm truy vấn cũng gồm ba cột và số dòng là tùy chọn. Mỗi dòng mô tả thông tin một điểm truy vấn. Cột một chứa tên của điểm dữ liệu, cột hai và cột ba chứa giá trị x và y trong không gian hai chiều. Cấu trúc thông tin của dữ liệu loại hai dùng để mô tả số đỉnh, cạnh và thông tin các cạnh của mô hình đồ thị BTGraph. Dòng thứ nhất chứa hai giá trị, số đỉnh và số cạnh của mô hình đồ thị BT-Graph. Các dòng còn lại, mỗi dòng chứa ba giá trị - đỉnh đầu, đỉnh cuối và trọng số của cạnh được tạo bởi hai đỉnh đó. B. Công cụ thực nghiệm và phương pháp thực nghiệm Trong thực nghiệm này, chúng tôi đã xây dựng một công cụ dựa trên nền tảng NetGen [14] với tên gọi là: GLS (Geographical Location Search) [11], cho phép xây dựng mô hình đồ thị BT-Graph [28] dựa trên tập dữ liệu cho trước. Ngoài ra, chương trình còn cho phép tính toán, thực thi chương trình CUDA thông qua thư viện DLL&C của Smalltalk và so sánh thời gian thực thi của các thuật toán. Trong cùng một thuật toán và một tập dữ liệu, chúng tôi tiến hành thực thi chương trình nhiều lần và lấy kết quả trung bình về thời gian thực thi của thuật toán đó nhằm mục đích để thu được kết quả tương đối chính xác. C. So sánh hiệu suất của thuật toán tìm kiếm k-láng giềng Yêu cầu đặt ra cho phần thực nghiệm này là so sánh được tốc độ tìm kiếm của thuật toán kNN truyền thống [11] trên mô hình đồ thị BT-Graph và thuật toán kNN dựa trên CUDA [26]. Thực nghiệm được tiến hành trên tập dữ liệu được mô tả như trong phần dữ liệu thực nghiệm. Chúng tôi tiến hành thực thi chương trình 10 lần trên mỗi thuật toán và lấy giá trị trung bình theo thời gian thực thi. Kết quả thực nghiệm của chương trình sau khi đã lấy trung bình được thể hiện như trong bảng 1. Trong đó, N là số lượng điểm dữ liệu ban đầu, Q là số lượng điểm truy vấn.