intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn thạc sĩ: Ứng dụng semantic web để xây dựng hệ thống tra cứu thông tin về văn hóa tây nguyên

Chia sẻ: Sdfas Vfdtg | Ngày: | Loại File: PDF | Số trang:13

203
lượt xem
70
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Semantic Web không là Web riêng biệt mà là một sự mở rộng của Web hiện tại, theo cách thông tin được xác định ý nghĩa tốt hơn, nó cho phép máy tính và người cộng tác với nhau tốt hơn.

Chủ đề:
Lưu

Nội dung Text: Luận văn thạc sĩ: Ứng dụng semantic web để xây dựng hệ thống tra cứu thông tin về văn hóa tây nguyên

  1. 1 2 B GIÁO D C VÀ ĐÀO T O Công trình ñư c hoàn thành t i Đ I H C ĐÀ N NG Đ I H C ĐÀ N NG PH M KHÁNH THI N Ngư i hư ng d n khoa h c: PGS.TS Võ Trung Hùng Ph n bi n 1 : .................................................................. NG D NG SEMANTIC WEB Ph n bi n 2 : ................................................................... Đ XÂY D NG H TH NG TRA C U THÔNG TIN V VĂN HÓA TÂY NGUYÊN Lu n văn s ñư c b o v trư c H i ñ ng ch m Lu n văn t t nghi p th c sĩ k thu t h p t i Đ i h c Đà N ng vào Chuyên ngành: KHOA H C MÁY TÍNH Mã s : 60.48.01 ngày …. tháng … năm ……. TÓM T T LU N VĂN TH C SĨ K THU T Có th tìm hi u lu n văn t i: • Trung tâm Thông tin-H c li u, Đ i h c Đà N ng • Trung tâm h c li u Đ i h c Đà N ng Đà N ng - Năm 2011
  2. 3 4 l n c a ñ t nư c cũng ñang ngày càng ñư c quan tâm. Song, hi n nay VHTN h u h t ñư c lưu gi trong b o tàng, trong sách, tài li u, không M Đ U ñư c nhi u ngư i bi t ñ n, trong khi nhu c u giao lưu văn hóa, kinh t , 1. Lý do ch n ñ tài xã h i gi a các dân t c, vùng mi n là nhu c u thư ng xuyên, lâu dài. Web 2.0 là m t bư c ñ t phá v công ngh và ñã ñ t ñư c nh ng Ngày nay, v i s phát tri n c a CNTT, các d ch v web ngày càng thành t u r t ñáng k trong vi c nâng cao tính tương tác cũng như tr nên ph bi n thì vi c xây d ng h th ng tra c u thông tin v VHTN ñ y nhanh t c ñ x lý ñáp ng yêu c u c a ngư i dùng. Tuy nhiên là ñi u c n làm và c n có m t h th ng web thông minh hơn nh m ph c trong xã h i thông tin ñương ñ i nhu c u c a ngư i dùng không v cho vi c tìm hi u v VHTN, rút ng n kho ng cách thông tin gi a d ng l i vi c c i thi n t c ñ mà còn ph i c i thi n ch t lư ng x ñ ng b ng và mi n núi, gi a các dân t c, ñ ng th i gi i thi u b n s c lý c a trang web theo yêu c u ngày càng nâng cao. Web 3.0 văn hóa vùng Tây nguyên ñ n v i ñông ñ o ngư i dân trên m i mi n t (Semantic web) ra ñ i nh m ñáp ng nh ng yêu c u v ch t lư ng qu c và c th gi i. ñó. V i nh ng lí do trên tôi ch n ñ tài “ ng d ng Semantic web ñ V i ñ c ñi m chính là nâng cao kh năng chia s tài nguyên và tăng xây d ng h th ng tra c u thông tin v VHTN”. “s hi u bi t” trong quá trình x lý d li u c a máy tính. Vì v y 2. M c ñích nghiên c u Semantic web ñã ñi sâu vào phân tích và ñ nh hư ng d li u ñ ng th i M c ñích chính c a ñ tài là k t h p gi a vi c nghiên c u công h tr phát tri n ng d ng Semantic web m r ng trên nhi u lĩnh v c ngh Semantic web v i nhu c u khai thác nh ng thông tin v văn hóa khác nhau. khu v c Tây Nguyên c a ngư i dùng. Đ tài phát tri n theo hư ng nâng M t trong nh ng lĩnh v c th m nh c a Semantic web là x lý và cao ch t lư ng tìm ki m tra c u thông tin v văn hóa c a các dân t c tìm ki m thông tin. Vi c phân tích và ñ nh hư ng n i dung lưu tr cho Tây Nguyên. Xác ñ nh nh ng yêu c u c a công vi c là th c hi n ñ xây phép ta chúng ta xây d ng nh ng cơ s d li u ph c v tìm ki m chính d ng m t trang Semantic web ta th y c n ph i nghiên c u và th c hi n xác hơn. M c khác, vi c máy tính có th “hi u” ñư c d li u s giúp các công vi c sau: V m t thuy t, trư c tiên ta c n tìm hi u Semantic tìm ñư c nhi u thông tin có liên quan ñ n n i dung c n tìm. web. Tìm hi u và ch n nh ng công c ñ phát tri n m t cách hi u qu Khu v c Tây Nguyên hi n nay có nhi u dân t c cùng chung s ng. nh t. Sau ñó ta c n ph i ñưa ra ñư c nh ng ñi m m và phân tích gi i Đây không ch là ñ a bàn chi n lư c v kinh t , chính tr , an ninh qu c quy t nó ñ khi ti n hành xây d ng s không g p ph i s c không phòng mà còn là khu v c có h th ng di s n văn hóa v t th và phi v t mong ñ i. V m t phát tri n ng d ng ta c n xây d ng m t trang web th phong phú, ñ c ñáo mang ñ m b n s c văn hóa c a các t c ngư i ñ ng d ng tra c u v văn hóa c a các dân t c Tây Nguyên. Chương thi u s . Cùng v i vi c ñ u tư phát tri n kinh t - xã h i, nâng cao ñ i trình ph i ñáp ng ñúng hai yêu c u c t lõi ñó là tìm ki m chính xác s ng cho ñ ng bào các dân t c, công tác b o t n và phát huy nh ng giá hơn và tùy ch n tìm ki m nhi u d li u liên quan hơn. tr văn hóa c a các dân t c Tây nguyên, m t trong b y vùng văn hóa 3. Đ i tư ng và ph m vi nghiên c u
  3. 5 6 - Tìm hi u các lý thuy t v Semantic Web và VHTN. CHƯƠNG 1: T NG QUAN V SEMANTIC WEB - Tìm hi u, nghiên c u các phương pháp xây d ng và lưu tr d Trong chương này chúng tôi gi i thi u t ng quan nh t v Web và li u trong Semantic Web, các công c dùng ñ th c hi n tri n khai h Semantic web. Quy trình xây d ng m t trang Semantic web, trong th ng thành chương trình như Visual Studio, các ngôn ng l p trình, chương này chúng tôi cũng ñ c p ñ n các công c h tr t t nh t cho các gói thư vi n m r ng. lĩnh v c Semantic web hi n nay cũng như các khái ni m v văn hóa, - Đ tài t p trung vào nghiên c u và ng d ng Semantic web vào th c tr ng và nhu c u tra c u v VHTN. lĩnh v c qu n lý các thông tin v VHTN. Đ ng th i xây d ng m t 1.1. Semantic web chương trình minh h a dùng ñ tìm ki m các thông tin v VHTN. 1.1.1. Gi i thi u v Semantic web 4. Phương pháp nghiên c u 1.1.1.1. World wide web và nh ng h n ch c a nó Đ th c hi n ñ tài này chúng tôi k t h p hai nhóm phương pháp 1.1.1.2. S ra ñ i c a Semantic web nghiên c u chính, ñó là: - Phương pháp nghiên c u lý thuy t. 1.1.2. Quy trình xây d ng Semantic web - Phương pháp nghiên c u th c t . Ph n này tôi trình bày mô hình c i ti n c a mô hình Noy và 5. Ý nghĩa khoa h c và th c ti n c a ñ tài McGuinness : - V m t khoa h c, ñ tài nghiên c u ti p c n v i công ngh m i (1) Xác ñ nh m c ñích phát tri n ontology. v x lý thông tin c a Semantic Web. Nghiên c u ñ xu t hư ng phát (2) K thu t n m b t ontology (ontology capture). tri n m t ng d ng ñ m b o tính chính xác thông tin. (3) Xem xét s d ng l i các ontology ñang t n t i. - V m t th c ti n, ng d ng thành qu c a công ngh thông tin (4) Mã hoá ontology (ontology coding). vào lĩnh v c văn hóa. Vi c xây d ng h th ng tra c u thông tin v (5) C i ti n ontology. VHTN có ý nghĩa h t s c thi t th c trong vi c tìm hi u, nghiên c u và (6) Tích h p các ontology thành ph n. gìn gi b n s c văn hóa các dân t c vùng Tây Nguyên. (7) Ki m th . 6. C u trúc c a lu n văn (8) Duy trì. N i dung c a lu n văn ñư c chia thành 3 chương: 1.1.3. M t s ng d ng có s n c a Semantic web Chương 1: T ng quan v Semantic Web. 1.1.3.1. Công c tìm ki m Kngine Chương 2: Gi i pháp xây d ng ng d ng Semantic Web. Công c tìm ki m Kngine dùng ñ tìm ki m theo yêu c u v i vi c Chương 3: Phát tri n ng d ng. phân tích ng nghĩa. Trang web này ñư c chia thành các m c ñ ngư i dùng có th tìm ki m trong mi n nh hơn, cho k t qu chính xác hơn. 1.1.3.2. Công c tìm ki m Swoogle
  4. 7 8 Đây là công c tìm ki m k t h p gi a vi c thu th p văn b n theo Văn hóa là t thư ng ñư c hi u theo nghĩa r ng h p khác nhau. ng nghĩa (SWDs). ng d ng này khai thác thu t toán PageRank nên Trong ho t ñ ng giao ti p hàng ngày, văn hóa ñư c dùng theo nghĩa m c dù ph i truy xu t trên nhi u mi n d li u khác nhau nhưng v n có h p ñ ch h c th c, l i s ng. Văn hóa trong ñ tài này ñư c hi u theo t c ñ tương ñ i nhanh. nghĩa r ng, ñó là toàn b nh ng gì do con ngư i sáng t o ra có tính giá 1.1.3.3. Công c tìm ki m Hakia tr , có th là văn hoá v t th , phi v t th . Hakia là công ty công ngh tìm ki m ng nghĩa. Nhi m v c a 1.3.1.2. Đ c trưng VHTN Hakia là tri n khai các gi i pháp tìm ki m ng nghĩa ñ ñáp ng nh ng Đ c trưng văn hóa c a m t dân t c là nh ng giá tr tiêu bi u v tinh thách th c c a ngư i dùng v i hi u qu kinh doanh cao và chi phí th p. th n và v t ch t mà dân t c ñó ñã tích lũy trong quá trình l ch s , nó có 1.1.3.4. Trang web microformats. tính b n v ng, có ý nghĩa lâu dài, có giá tr khu bi t. Microformats t p h p d li u trên các ñ nh d ng s n có hi n nay ñ Tây nguyên có nhi u thành ph n dân t c ñang sinh s ng, ngu n g c phân tích và tái s d ng. là các dân t c thi u s g m: Ba Na, Xê ñăng, Gia Rai, Êñê, Gi -Triêng, 1.2. Công c và công ngh liên quan ñ n Semantic web BRâu, Rơ Mâm, K'Ho…, ñ i s ng c a các dân t c Tây Nguyên g n v i Trong ph n này, chúng tôi trình bày sơ lư c v các công c , công nương r y, t c p t túc, ph thu c nhi u vào thiên nhiên cho nên h ngh liên quan ñ n Semantic web. sùng bái các l c lư ng thiên nhiên, h quan ni m nh ng gì liên quan 1.2.1. Công c xây d ng ontology Protégé cu c s ng cũng có th n. T ñ c ñi m ñó mà VHTN r t ña d ng và 1.2.1.1. B công c WebODE phong phú, v i nh ng ñ c trưng ñư c chia t ng lo i như sau: Văn hóa l h i, lu t t c, ki n trúc, nh c c dân t c, trang ph c, m th c, ngôn 1.2.1.2. B công c OilED ng ... 1.2.1.3. B công c Protégé 1.3.2. Nhu c u vi c tra c u VHTN 1.2.2. Truy v n trên d li u Semantic web 1.3.3. Hi n tr ng h th ng ph c v tra c u VHTN 1.2.3. Thư vi n phát tri n ng d ng Đ có cơ s xây d ng h th ng m i, tôi ti n hành kh o sát hi n 1.2.3.1. Jena – M t Framework c a Semantic web tr ng h th ng ph c v tra c u hi n t i theo 2 ngu n thông tin, ñó là 1.2.3.2. Công c h tr l p trình phát tri n Semantic web trên n n ngu n thông tin tr c ti p các s VH-TT&DL và qua m ng Google. K t t ng .NET qu sau khi ti n hành kh o sát th c t có th nói chưa có 1 h th ng 1.3. Văn hóa Tây Nguyên ph c v tra c u thông tin VHTN hoàn h o và ñ y ñ thông tin ñ giúp 1.3.1. Văn hóa và ñ c trưng VHTN ngư i s d ng có th tra c u m i lúc m i nơi m t cách nhanh chóng, 1.3.1.1. Khái ni m văn hóa ti t ki m chi phí.
  5. 9 10 CHƯƠNG 2: GI I PHÁP XÂY D NG NG D NG 2.1.1.2. Phân tích v n ñ SEMANTIC WEB N u theo cách l p trình v i web 2.0 thì các thông tin liên quan ñ n m t dân t c có th bao g m nh ng thông tin như “l h i”, “trang ph c”, Trong chương này chúng tôi trình bày các bư c tìm hi u v các yêu “ki n trúc”,…Nhìn t ng quát ta th y cách này tương ñ i n nhưng xét c u c a bài toán, phân tích và ch n gi i pháp cũng như công ngh ñ chi ti t hơn ta th y r ng d li u c a các b ng thông tin liên quan r t khó th c hi n bài toán t ñó ñ nh hư ng xây d ng m t ng d ng Semantic có th thay ñ i. web ti n l i nh t. D li u quan h gi a các dân t c cũng là m t v n ñ . V i yêu c u 2.1. Gi i thi u bài toán phép ngư i dùng thêm b t các quan h , ñi u này cũng l i r t khó th c Vi c xây d ng m t chương trình ng d ng gi i quy t m t bài toán thi v i các h qu n tr cơ s d li u trư c ñây. th c t c n th c hi n r t nhi u công vi c khác nhau, ta ñi vào công vi c T nh ng khó khăn trên tôi ñưa ra gi i pháp ñó là s d ng công ñ u tiên là xác ñ nh các yêu c u c a bài toán. ngh Semantic web ñ gi i quy t bài toán. 2.1.1. Yêu c u bài toán Công ngh Semantic web v i ñ c ñi m lưu tr d li u dư i ñ nh 2.1.1.1. Đ t v n ñ d ng XML và mô hình d li u thông minh nên vi c lưu tr d li u có Đ i tư ng s d ng tính tùy bi n cao và h tr tìm ki m nhanh, thông tin ch t lư ng hơn. V i n i dung c a bài toán này ta th y ñ i tư ng s d ng là nh ng V i công vi c xác ñ nh là phát tri n m t trang Semantic web tôi xây ngư i nghiên c u, sinh viên các trư ng ñ i h c, cao ñ ng, h c sinh các d ng ng d ng g m 2 ph n chính ñó là xây d ng ontology và thi t k trư ng ph thông và du khách…Trang web này mong mu n phát tri n xây d ng trình duy t thông minh ñ hi n th k t qu . ñ liên k t v i website c a b VH-TT & DL cũng như website c a các Ontology t nh, S VH-TT & DL c a các t nh trong khu v c Tây Nguyên. Trong ph n này chúng ta xây d ng các l p, các thu c tính t o Yêu c u bài toán nh ng m i quan h ñ ng c p và phân c p theo nh ng chu n ñã ñư c Bài toán ñ t ra nh ng yêu c u xây d ng m t trang web có ch c ñ nh nghĩa b i t ch c W3C và c nh ng ñ nh nghĩa m i riêng bi t cho năng h tr tìm ki m thông tin v VHTN ñáp ng các yêu c u như: chương trình. - Cho phép ngư i dùng nh p d li u ñ ng. Trình duy t web - Cho phéo ngư i dùng có th tùy ch n hư ng truy xu t d Ph n trình duy t ta không xây d ng m t trình duy t m i hoàn toàn li u t dân t c, l l i, nh c c ,… ñáp ng ñ y ñ các yêu c u truy c p d li u b t kỳ ontology nào mà - Trang tìm ki m ph i ñáp ng hai ch c năng chính ñó là tìm ta xây d ng trình duy t tương t các ng d ng web nh m hi n th thông ki m theo tên dân t c và tìm ki m theo tùy bi n. tin cơ s d li u ñã xây d ng. - T o các trang web thông tin v các dân t c, ki n trúc, l h i, 2.1.2. Gi i pháp nh c c ,…
  6. 11 12 C u trúc c a m t máy tìm ki m theo công ngh Semantic web, v Semantic web h tr suy lu n d li u thông minh nh m h tr vi c cơ b n cũng có c u trúc tương t v i m t máy tìm ki m thông thư ng, suy lu n d li u theo quy t c c a ontology. Ngôn ng Ontology h tr bao g m 2 thành ph n chính là giao di n truy v n và ki n trúc bên r t nhi u các suy lu n khác nhau. Tuy nhiên, trong gi i h n c a ñ án trong. này chúng tôi ch ñưa ra hai lo i hình suy lu n d li u sau: Giao di n truy v n: Suy lu n ngang c p là suy lu n d a trên cùng m t thu c tính - Cho phép ngư i dùng nh p yêu c u tìm ki m c a hai ñ i tư ng quan h . Ví d A là b n c a B thì B cũng là - Hi n th k t qu tìm ki m b n c a A. Thu c tính là b n là thu c tính hai chi u. Ph n ki n trúc bên trong: là ph n c t lõi c a máy tìm ki m Suy lu n t d li u Khai báo bao g m các thành ph n: Ngư i A khai báo v i thu c thu c tính là b n c a A và tính là b n c a B - Phân tích yêu c u và A B - Tìm ki m k t qu cho yêu c u - D li u tìm ki m, m ng ng nghĩa S khác bi t trong c u trúc c a máy tìm ki m ng nghĩa so v i tìm Ngư i B ki m thông thư ng n m ph n ki n trúc bên trong, c th 2 ph n: Hình 2.2. Mô t suy lu n ngang c p trong Semantic web phân tích câu h i và t p d li u tìm ki m. Suy lu n ngư c là cách suy lu n d a trên các thu c tính khác Mô hình ñư c ñ xu t trong lu n văn cho ng d ng tìm ki m ng nhau c a hai ñ i tư ng. Ví d A là b c a B thì B là con c a A. nghĩa như sau: Thu c tính là b và thu c là con là hai thu c tính ngư c nhau. OWLDotNetAPI/SPARQ Khai báo Suy lu n t d li u Ngư i A khai báo v i thu c thu c tính là b c a A và B tính là con c a B và Metadata A Web Browser Search Engine Ontology Ngư i B Hình 2.1. Mô hình ng d ng tìm ki m thông tin Hình 2.3. Mô t suy lu n ngư c trong Semantic web 2.1.3. Gi i quy t yêu c u Chương trình h tr hai Properties cơ b n là Properties ñ o ngư c 2.1.3.1. Suy lu n d li u và Properties tương ñương. Thu t toán Filling s tìm ki m t t c các
  7. 13 14 thông tin chưa ñư c khai báo ñ ñi n ñ y ñ thông tin ph c v yêu c u 2.2.1.2. Protégé s d ng giao di n ñ h a tìm ki m. Ph n m m h tr ngư i s d ng l p trình tương tác b ng giao di n 2.1.3.2. Các ch c năng chính m t cách nhanh chóng, phù h p gi a suy nghĩ c a ngư i l p trình và Ch c năng cơ b n c a ng d ng là tìm ki m, vi c áp d ng k thu t n i dung mà các l p Protégé t o ra. tìm ki m trên Ontology s tr v nh ng k t qu chính xác hơn nh 2.2.1.3. Protégé phát tri n ñ tích h p các công c nh ng ưu ñi m v lưu tr d li u RDF so v i d li u truy n th ng, có Protégé cung c p m t s ñi m m r ng nơi các nhà phát tri n có th cách t ch c d li u ñơn gi n, ñ ng nh t, c u trúc b ba giúp d truy ch ñ ng thêm các thành ph n mà ta thư ng g i là plug-ins. xu t thông tin b i các h th ng suy lu n. 2.2.2. B Visual Studio.Net Duy t theo ng nghĩa Visual Studio.NET là m t môi trư ng tích h p tri n khai ph n Duy t cây phân c p, theo lo i hình d ch v : cung c p cách tìm ki m m m. Nó ñư c thi t k ñ l p ra m t ti n trình vi t mã, g r i và biên ñ a ñi m theo phân c p trên cây Ontology. Ngư i dùng không c n nh p d ch thành m t assembly d dàng. Visual Studio.NET có m t ng d ng thông tin tìm ki m mà v n có th tìm ki m ñư c tài li u c n thi t b ng multiple-document-interface r t tinh vi, qua ñó ngư i dùng có th liên cách duy t cây theo lo i hình d ch v . k t m i th ñ phát tri n ño n mã c a mình, bao g m: Tìm ki m theo t khóa Text Editor: cho phép vi t ño n mã C#. Cách tìm ki m ph bi n và có nhu c u nhi u nh t là tìm ki m theo Design view editor: nó cho phép ñ t giao di n ngư i dùng và các t khóa. T khóa chính là t g i ý ñ so sánh nó v i các thông tin c a control d li u truy c p trong d án. d li u qua ñó s tìm ra k t qu c n thi t. Các c a s h tr : cho phép xem và s a ñ i nh ng khía c nh khác Tìm ki m nâng cao nhau trên d án. H th ng ñưa ra m t s tùy ch n làm ñi u ki n ngư i dùng d a vào Biên d ch trong lòng môi trư ng: ñ thay cho vi c ch y trình biên m t s g i ý ñó ñ ñưa ra ñi u ki n phù h p v i yêu c u c a mình. S d ch C# t dòng l nh. d ng cách tìm ki m nâng cao s có k t qu chính xác hơn. Intergated MSDN help: Visual studio.NET có th g i tài li u 2.2. Các công c h tr MSDN. 2.2.1. Công c xây d ng ng d ng Protégé 2.2.3. Thư vi n phát tri n ng d ng 2.2.1.1. Đ c ñi m c a Protégé Trong ph n này s trình bày v hai công c h tr ngư i l p trình Đây là ph n m m mi n phí và ñư c phát tri n b i trư ng Đ i h c phát tri n Semantic web d a trên n n t ng .NET mà tôi ñã l a ch n ñ Stanford và Mark Musen. Ch c năng n i b t nh t c a ph n m m này là th c hi n ñ tài. cho phép ngư i dùng s d ng t o ra các ontology ñ phát tri n 2.2.3.1. SemWeb Semantic web theo ñúng chu n c a ngôn ng W3C OWL.
  8. 15 16 SemWeb v i các tính năng c t lõi như ñ c/ghi d li u XML v i b CHƯƠNG 3: PHÁT TRI N NG D NG ba RDF, liên t c lưu tr d li u v i n n t ng SQL và các truy v n Đây là chương t ng h p và là câu tr l i chính xác nh t ñ y ñ nh t SPARQL cơ b n ñã ñư c ki m nghi m nhi u l n. cho nh ng gì chúng tôi ñã trình bày 2 chương trư c. Gi y phép 3.1. Mô hình ho t ñ ng c a h th ng Đây là b n mã ngu n m , ñư c s d ng mi n phí. ng d ng ñư c vi t trên n n web nên vi c qu n lý c p nh t, hi u Đ c ñi m c a Semweb ch nh thông tin c a ngư i qu n tr cũng như vi c truy xu t và tìm ki m M t s ñ c ñi m n i tr i ñó là t c ñ x lý và kh năng giao ti p d li u c a ngư i dùng ñ u cu i ñ u thông qua m ng internet. ñây v i các cơ s d li u liên k t ñ truy c p d li u. ngư i duy t web ñóng vai trò trung gian theo sơ ñ x lý sau: 2.2.3.2. OwlDotNetApi OwlDotNetApi là m t OWL API v i b phân tích cú pháp vi t b ng C# theo công ngh .NET d a trên phân tích cú pháp RDF Drive. Hoàn toàn phù h p v i ñ c ñi m k thu t c a W3C. Ch c năng G i yêu c u Nh n k t qu M c tiêu c a OwlDotNetApi là ñ c/ghi d li u c a XML d a trên ñ th v i các c nh tương ng v i thu c tính liên k t và các ñ nh tương Nh n câu truy v n Hi n th k t qu ng v i các nút hay còn g i là các l p. Xu t phát t vi c ñ th hoá n i dung c a d li u nên OwlDotNetApi ñáp ng ñư c h u h t t t c các chu n mà W3C ñưa ra. Tuy nhiên vi c truy c p d li u không thông qua câu l nh truy v n nên Câu truy v n Thông tin tr v vi c l p trình v i thư vi n này chưa thu n l i v th i gian x lý. OwlDotNetApi có hai ph n chính là l p ch c năng và l p giao ti p. X lý truy v n Ontology 2.2.3.3. Ví d Ph n này s gi i thi u s l nh cơ b n trong thư vi n này. Hình 3.1. Quy trình truy xu t d li u 3.2. Quy trình xây d ng ng d ng Đ thi t k công c tìm ki m ng nghĩa ng d ng trên, lu n văn ñ xu t mô hình h tr vi c tìm g m các công ño n sau: - Giai ño n 1 : Thi t k Ontology - Giai ño n 2: Xây d ng ng d ng
  9. 17 18 3.3. Xây d ng ontology 3.3.2.1. L p Ontology là n n t ng ñ xây d ng d li u cho ng d ng. D li u - L p DanToc trong HignOnt dùng ñ lưu các cá th là các dân trên ontology có th là n i dung thông tin cũng có th là liên k t ñ n t c thu c VHTN. Các cá th dân t c ñ u là con c a l p này. L p các ontology khác có chung k t n i. Trong n i dung c a ñ tài này này là l p nh nh t và không ñư c chia thành các l p con. chúng tôi ch ñ c p ñ n v n ñ xây d ng thông tin và s d ng l i thông - L p VanHoa: th hi n thông tin các lo i hình văn hóa c a các tin ñó theo mô hình Semantic web mà chưa m r ng ra các thông tin dân t c tây nguyên. L p này có th ch a các cá th ho c các l p trên nh ng ontology có s n trên internet. con tương ng v i d li u thành ph n c a VHTN. 3.3.1. Mô hình bi u di n Ontology Trong ñ tài này chúng tôi chia thành các lo i hình văn hóa tương V i m c ñích chia nh thông tin ñ qu n lý chúng tôi ti n hành xây ng v i các l p con như sau: L p KienTruc, L p NhacCu, L p LeHoi. d ng các ñ i tư ng ñư c phân chia thành các l p, các cá th và các m i - L p NgonNgu th hi n thông tin các lo i hình ngôn ng mà quan h . Trong ontology này t t c các thông tin v VHTN s ñư c các dân t c s d ng ho c ngôn ng c a các công trình nghiên phân rã và lưu tr dư i các d ng khác nhau. c u v VHTN. L p này không ñư c chia nh thành các l p con. 3.3.2. Th c hi n xây d ng HignOnt - L p nghienCuu mô t thông tin c a các công trình nghiên Vi c xây d ng ontology tương t như cách nh p d li u vào cơ s c u v VHTN. d li u. 3.3.2.2. Thu c tính Phân tích các ñ i tư ng c a ng d ng tôi chia thành các ñ i tư ng: Các thu c tính th hi n m i quan h gi a các ñ i tư ng d li u - L p : DanToc, VanHoa, NgonNgu, NghienCuu (individual) v i nhau ho c quan h v i d li u. Ngôn ng ontology chia - Thu c tính: CuaDanToc, … thu c tính ra thành hai lo i khác nhau là thu c tính quan h và thu c - Cá th : Kinh, BaNa… tính d li u. Trong ng d ng này ta phát tri n ng d ng v i các thu c tính sau: Thu c tính d li u Đây là m t s thu c tính d li u cơ b n có trong chương trình. - Thu c tính coTieuDe th hi n m t công trình nghiên c u tiêu ñ c th là gì và ñư c quy ñ nh là ki u d li u chu i. - Thu c tính coNoiDung th hi n m t công trình có thông tin n i dung xác ñ nh và ñư c quy ñ nh ki u d li u văn b n. - Thu c tính namXuatBan th hi n năm xu t b n c a công trình Hình 3.2. Các phân c p l p trong HighlandResource Ontology nghiên c u c th . Thu c tính này ki u s .
  10. 19 20 - Thu c tính coTen th hi n thông tin tên c a m t dân t c, lo i nh c c , lo i hình ki n trúc…và tên có ki u d li u là chu i. - Thu c tính diaDiem th hi n nơi lưu tr c a m t công trình nghiên c u ho c thông tin cư trú c a m t dân t c. Hình 3.4. Các thu c tính quan h trong ng d ng 3.3.2.3. Cá th Các cá th là các thông tin chính th hi n n i dung d li u c a ng d ng. Trong ng d ng này tôi ch ñưa ra m t s cá th tiêu bi u cho t ng nhóm l p và th hi n ñư c m i quan h gi a các ñ i tư ng. Hình 3.3. Các thu c tính d li u trong ng d ng - Cá th DT_Kinh lưu thông tin v dân t c kinh mà ng d ng c n Thu c tính quan h có liên quan ñ n dân t c này. Ngư i qu n tr có th thêm vào các Đây là m t s thu c tính quan h cơ b n có trong chương trình. thông tin chưa ñư c khai báo mà ngư i dùng yêu c u. - Thu c tính veDanToc khai báo công trình nghiên c u v tây nguyên c th ñang xét có liên quan ñ n dân t c nào. Thu c tính Dân t c kinh lưu thông tin v dân t c này th hi n m i quan h gi a m t nghiên c u c th và các dân kinh như tên g i là kinh… t c. T t c vùng mi n thu c ñ t nư c Vi t Nam - Thu c tính duaTrenNgonNgu th hi n m i liên quan gi a công trình nghiên c u ñó v i các ngôn ng th hi n trên các báo - Cá th NN_Viet lưu thông tin v ngôn ng Ti ng Vi t. Đây là cá cáo, các bài báo liên quan… th ch a thông tin và th hi n m i quan h v i các cá th khác s - Thu c tính veLoaiHinhVanHoa th hi n m i quan h gi a ñư c gi i thi u bên dư i. công trình nghiên c u ñó v lo i hình văn hóa nào. - Cá th VH_KT_NhaRong lưu thông tin v lo i hình văn hóa nhà rông c a tây nguyên. Cá th này là con c a l p Ki n trúc thu c l p Văn Hóa.
  11. 21 22 - Cá th VH_NC_CongChieng lưu thông tin v lo i hình văn hóa o N u m t ñ nh có ch a quan h c n ñi n ñ y theo C ng Chiêng tây nguyên. Cá th này là con c a l p Nh c c thu c danh sách ñ i chi u trên (B1) l p Văn Hóa. Đi n thông tin quan h ngư c l i ñ ng - Cá th NC_BB_0001 th hi n bài báo vi t v VHTN c a tác gi Quay l i xét cho ñ nh v a ñi n như B1 Bích H ng. Bài vi t này nghiên c u sâu v nh c c c ng chiêng tây o Ngư c l i b qua bư c này nguyên c a dân t c BaNa và ñư c vi t b ng ngôn ng ti ng Vi t - Đóng truy c p vào ontology v i ñ a ch tìm ki m là trên m ng. 3.4.2. Duy t theo ng nghĩa - Cá th NC_CTNC_0002 th hi n công trình ngiên c u c p nhà Duy t theo cây phân c p c a thông tin: ch c năng này th c hi n ñ c nư c v tây nguyên có tên S thi Ba Na ñư c Nguy n Quang d li u t Ontology b ng cách duy t theo phân c p c a các l p cao nh t Tuyên nghiên c u năm 2010 và ñã ñư c công nh n. như ngôn ng , dân t c… ñ truy c p ñ n thông tin v m t công trình 3.4. Thi t k chương trình nghiên c u nào ñó. Ví d , ngư i dùng c n tìm nh ng ngư i thu c ngôn T ngu n d li u t ng h p như trên, chúng tôi ti n hành xây d ng ng Ti ng Anh (NN_Anh) thì ngư i dùng có th th c hi n b ng cách ng d ng ñ khai thác m t cách có hi u qu nh t. Đ u tiên ñ công vi c ch n Ngôn Ng (t t c các công trình nghiên c u vi t b ng ngôn ng ti n hành thu n l i hơn chúng tôi ñã khai thác thư vi n mã ngu n m ñang ch n). Ti p theo ch n Ti ng Anh v i ý nghĩa là ch n t t c các OwlDotNetApi. Trong quá trình xây d ng chúng tôi s d ng m t s công trình nghiên c u vi t b ng ti ng Anh. Ch c năng này ñư c th c thu t toán sau ñây ñ khai thác d li u. hi n d a trên tính phân c p cha - con gi a các l p. Các bư c ñư c th c 3.4.1. Đi n d li u hi n như sau: Thu t toán này dùng ñ ñi n ñ y các quan h c a ng d ng và t o B1: Th c hi n ñ c,hi n th n i dung t ng l p d a trên Properties cho ng d ng có thông tin hai chi u. Ví d khi ngư i dùng khai báo phân c p trong l p NgonNgu ñ ngư i dùng l a ch n. công trình có mã s NC_CTNC_0002 c a tác gi Nguy n Quang B2: Li t kê t t c các individual thu c l p NgonNgu mà ngư i dùng Tuyên thì ng d ng t ñ ng hi u tác gi Nguy n Quang Tuyên có ñã l a ch n. nghiên c u ñ tài ñó. B3: Truy c p thông tin chi ti t (d a trên Properties) c a các Thu t toán ñư c ti n hành như sau: individual và hi n th k t qu . - M t p tin ch a ontology 3.4.3. Tìm ki m cơ b n - Đ c t t c các Properties có khai báo SymmetricProperty ho c Ch c năng c a tìm ki m cơ b n là d a vào t khóa ch tên ho c ñưa vào danh sách ñ i chi u. các thông tin c a m t công trình nghiên c u v tây nguyên. Vi c tìm - Duy t qua t t c các ñ nh c a ontology ki m d a trên s ñ i chi u v thông tin mà ngư i dùng nh p vào tùy thu c vào các thu c tính mà ngư i qu n tr cung c p.
  12. 23 24 Các bư c th c hi n 3.5.1. K t qu tìm ki m cơ b n B1: Duy t tìm t t c các ñ a ch liên quan ñ n t khóa ñ a ñi m ñư c yêu c u truy v n. B2: N u có ít nh t 1 ñ a ñi m th a mãn B1 thì th c hi n: - Đ c các Object Properties th a B1. B3: Xác ñ nh các l p có Properties n m trong B2, - Duy t qua các individual c a l p v a xác ñ nh. - Ki m tra các tính quan h gi a các các th ñ ñưa ra các giá tr liên quan. Hình 3.10. K t qu tìm ki m cơ b n B4: Hi n th k t qu . 3.5.2. K t qu tìm ki m nâng cao 3.4.4. Tìm ki m nâng cao Dù mu n hay không thì các k t qu c a tìm ki m ñơn gi n (v i t khóa) thư ng quá nhi u khi d li u l n. Đ tìm ki m ñư c th a ñáng hơn thì vi c cung c p thêm thông tin ng nghĩa cho quá trình tìm ki m ñư c chính xác là h t s c c n thi t. Nhưng khi ph i cung c p thêm thông tin thì tìm ki m l i ‘ch t’ và có th không tr ra k t qu tìm ki m dù yêu c u mà ngư i dùng c n tìm là có th t. Cũng b i chính ngư i s d ng cũng không bi t ch c thông tin mình cung c p là chính xác ho c Hình 3.11. K t qu tìm ki m nâng cao h chưa th c s bi t v ñ a ñi m mình c n tìm có th tìm th y ñâu. 3.5.3. Chi ti t thông tin m t cá th 3.5. K t qu th nghi m Sau khi ch y chương trình ng d ng ta có nh ng k t qu như sau Hình 3.12. K t qu xem chi ti t các cá th
  13. 25 26 K T LU N V m t ng d ng cũng m i ñưa ra ñư c nh ng ch c năng có tính V i vi c phát tri n ngày càng nhanh c a d li u văn b n thì xây ch t ch ng minh cho lý thuy t mà chưa có s ñ u tư nhi u v ch t d ng nh ng ontology theo t ng lĩnh v c là v n ñ t t y u. Nghiên c u lư ng hình nh giao ti p v i ngư i s d ng. xây d ng ng d ng Semantic web trong vi c tìm ki m v VHTN ñã có Tuy nhiên, trong tương lai ñ tài này có th phát tri n ti p t c ng ñư c nh ng k t qu ban ñ u. d ng ñư c vào các v n ñ th c ti n. Đ ñ t ñư c ñi u ñó c n phát tri n Trư c tiên ñó là k t qu v ph n lý thuy t, nghiên c u này ñã nêu ra theo các hư ng như: Trư c tiên ñó là nghiên c u v m t lý thuy t và ñư c nh ng nét ñ c trưng c a Semantic web. Hơn n a, vi c ñi sâu vào xây d ng thêm nhi u suy lu n m i. Sau ñó c n nghiên c u m r ng nghiên c u RDF và ontology – nh ng thành ph n quan tr ng nh t c a trình duy t web sao cho có th ñáp ng v n ñ truy xu t d li u t Semantic web, ñã cho th y ñư c kh năng và hi u qu s d ng cao c a nh ng tài nguyên có s n trên m ng. th h web này. Trên ñây là nh ng nghiên c u v lý thuy t và ng d ng v Semantic Ti p theo, nghiên c u còn ñưa ra ñư c nh ng công c nào là t i c n web. Nghiên c u này d a trên lý thuy t v Semantic web do t ch c thi t ñ phát tri n m t ng d ng Semantic web hi u qu nh t. Song W3C ñưa ra và ñã phát tri n thành công ng d ng cho lĩnh v c tra c u song v i nó là vi c gi i quy t v n ñ giao ti p gi a ngư i và máy nh t thông tin v VHTN. là v n ñ ña ngôn ng trong th h web này. Sau cùng là k t qu th c nghi m v i h th ng tra c u v VHTN, ñ tài ñã khai thác hai thu c tính ñ o ngư ng và thu c tính tương ñương ñ xây d ng hai lo i hình suy lu n ngư c và suy lu n ngang c p b ng cách dùng thu t toán Filling s tìm ki m t t c các thông tin chưa ñư c khai báo ñ ñi n ñ y ñ thông tin ph c v yêu c u tìm ki m. Trang web ñã ch ng minh v i n n t ng lý thuy t ñã nghiên c u k t h p v i mô hình phát tri n và nh ng công c h tr phát tri n v i công ngh .NET, hoàn toàn có th xây d ng thành công m t ng d ng web 3.0. ng d ng này còn ch ng minh tính vư t tr i c a công ngh web 3.0 v i nh ng web ñã xây d ng trư c ñây. Bên c nh nh ng thành công ñã ñ t ñư c thì nghiên c u này còn h n ch ñó là ngôn ng Ontology h tr r t nhi u các suy lu n khác nhau nhưng vi c khai thác các suy lu n vào ng d ng còn ít m i ch có hai suy lu n.
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2