intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn thạc sĩ: Tìm hiểu cấu trúc ngữ nghĩa Hán-Việt, xây dựng kho ngữ vựng dựa nghĩa Hán-Việt trong xử lý tiếng Việt

Chia sẻ: Sdfas Vfdtg | Ngày: | Loại File: PDF | Số trang:26

95
lượt xem
14
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tìm hiểu cấu trúc ngữ nghĩa Hán-Việt, xây dựng kho ngữ vựng dựa nghĩa Hán-Việt trong xử lý tiếng Việt nhằm hỗ trợ cho việc xây ựng từ điển đơn, soang hoặc đa ngữ hay chương trình ứng dụng khác.

Chủ đề:
Lưu

Nội dung Text: Luận văn thạc sĩ: Tìm hiểu cấu trúc ngữ nghĩa Hán-Việt, xây dựng kho ngữ vựng dựa nghĩa Hán-Việt trong xử lý tiếng Việt

  1. -1- B GIÁO D C VÀ ĐÀO T O Đ I H C ĐÀ N NG ĐOÀN NG C DI M MY TÌM HI U C U TRÚC NG NGHĨA HÁN-VI T, XÂY D NG KHO NG V NG D A NGHĨA HÁN-VI T TRONG X LÝ TI NG VI T Chuyên ngành: KHOA H C MÁY TÍNH Mã s : 60.48.01 TÓM T T LU N VĂN TH C SĨ K THU T Đà N ng - Năm 2011
  2. -2- Công trình ñư c hoàn thành t i Đ I H C ĐÀ N NG Ngư i hư ng d n khoa h c: PGS. TS. Phan Huy Khánh Ph n bi n 1: Ph n bi n 2: Lu n văn s ñư c b o v trư c H i ñ ng ch m Lu n văn t t nghi p th c sĩ k thu t h p t i Đ i h c Đà N ng vào ngày tháng năm 2011. * Có th tìm hi u lu n văn t i: - Trung tâm Thông tin - H c li u, Đ i h c Đà N ng. - Trung tâm H c li u, Đ i h c Đà N ng.
  3. -3- M Đ U 1. Lý do ch n ñ tài nư c ta, t Hán Vi t, hay t Vi t g c Hán chi m m t t l r t l n trong kho t v ng ti ng Vi t. Do ñó hi n nay ñã có r t nhi u công trình nghiên c u v x lý t Hán Vi t trong văn b n ti ng Vi t như xây d ng b t ñi n Hán Vi t, công c chuy n ñ i nhanh gi a văn b n Hán Vi t và văn b n ch Hán… Nhưng nh ng ng d ng này v n còn m t s h n ch , c th như: - T t c ñ u chưa có kho ng li u t v ng dùng chung. M i ng d ng t xây d ng cho mình m t kho ng v ng riêng. Thi u tính nh t quán vì các kho ng li u này không có kh năng k t h p ñư c v i nhau. - Đây là các kho ng li u không có c u trúc, không có tính m vì th s t o ra m t s khó khăn nh t ñ nh trong vi c khai thác, c p nh t cũng như chia s ngu n ng li u dùng chung. Đư c s g i ý c a PGS.TS Phan Huy Khánh tôi ñã ch n ñ tài: ”Tìm hi u c u trúc ng nghĩa Hán-Vi t, xây d ng kho ng v ng d a nghĩa Hán-Vi t trong x lý ti ng Vi t” nh m ñưa ra gi i pháp xác ñ nh nghĩa c a các c m t hay câu và xây d ng m t kho ng v ng kh c ph c ñư c m t s như c ñi m trên. 2. M c tiêu và nhi m v nghiên c u M c ñích chính c a ñ tài là xây d ng kho ng v ng ti ng Hán Vi t d a nghĩa bao g m các t , c m t , th m chí c câu và nghĩa c a chúng mà các kho ng v ng hi n nay chưa có. Mu n làm ñư c ñi u ñó, ñ tài c n ñưa ra m t phương pháp thích h p ñ xây d ng nghĩa cho các t , các c m t , các câu trong kho ng v ng c n xây d ng. Các t , các c m t , các câu này ñư c ghép l i t các t ñơn và t ghép. Vì v y, mu n xây d ng nghĩa cho các t , các c m t và các
  4. -4- câu trong kho ng v ng ph i d a vào nghĩa c a các t trong các kho t ñơn và t ghép. Đ ñ t ñư c m c tiêu trên, ñ tài c n th c hi n các nhi m v sau: - Tìm hi u ti ng Hán Vi t, cú pháp t Hán Vi t, các kho ng v ng t Hán Vi t, các ng d ng x lý t Hán Vi t trong CNTT. - Tìm ra phương pháp xác ñ nh nghĩa cho kho ng v ng d a nghĩa. - Tìm hi u mô hình, c u trúc c a các kho ng v ng t Hán Vi t hi n có, t ñó xác ñ nh mô hình c u trúc c a kho ng v ng d a nghĩa. - Xây d ng kho ng v ng theo mô hình và thu c m t lĩnh v c nh t ñ nh. 3. Đ i tư ng và ph m vi nghiên c u Nghiên c u lý thuy t. Đưa ra các mô hình v x lý và c p nh t d li u ñ t o ra kho ng v ng d a nghĩa. Nghiên c u tri n khai các thu t toán, các ngôn ng l p trình thích h p, các công c h tr ñ xây d ng ng d ng th nghi m. 4. Gi thi t nghiên c u Nghiên c u lý thuy t v T Hán Vi t, b n ch t ng pháp, ng nghĩa c a t Hán Vi t, ñ c bi t là ki n th c v ng nghĩa c a t ghép Hán Vi t. Nghiên c u c u trúc kho ng v ng Hán Vi t, các gi i pháp c p nh t CSDL cho kho ng v ng Hán Vi t. 5. Phương pháp nghiên c u - Thu th p, tìm hi u, phân tích các tài li u và thông tin có liên quan ñ n lu n văn. - Phân tích thi t k h th ng chương trình.
  5. -5- - Tri n khai xây d ng chương trình. - Ki m th , ñưa ra nh n xét và ñánh giá k t qu . 6. Ý nghĩa khoa h c và th c ti n c a ñ tài Ý nghĩa khoa h c : H tr cho vi c xây d ng t ñi n ñơn, song ho c ña ng hay các chương trình ng d ng khác. Ý nghĩa th c ti n : Kh năng ng d ng kho ng v ng ñ x lý ngôn ng t Hán Vi t như: tìm ki m văn b n, phân tích văn b n, d ch thu t… 7. B c c c a lu n văn Lu n văn ñư c t ch c thành 4 chương Chương 1: T ng quan v t Hán Vi t Trong chương này, tôi nghiên c u các v n ñ v t Hán Vi t như khái ni m, ñ c ñi m, l i ích c a t Hán Vi t; cách dùng t Hán Vi t cho ñúng và m i quan h gi a t Hán Vi t và CNTT hi n nay. Chương 2: Nghiên c u các công c , môi trư ng và k thu t xây d ng kho ng v ng d a nghĩa t Hán Vi t Trong chương này, tôi nghiên c u v các v n ñ liên quan ñ xây d ng ñư c ng d ng như v n ñ x lý ngôn ng t nhiên: các công c , môi trư ng và các ngôn ng l p trình, các ñ án xây d ng kho ng v ng t Hán Vi t ñ rút ra k thu t xây d ng kho ng v ng d a nghĩa t Hán Vi t. Chương 3: Gi i pháp xây d ng kho ng v ng d a nghĩa trong x lý t Hán Vi t Trong chương này, tôi trình bày các giai ño n thi t k , xây d ng và tri n khai ng d ng, mô t ho t ñ ng c a ng d ng, trình bày các k t qu mà ng d ng ñã ñ t ñư c.
  6. -6- CHƯƠNG 1 - T NG QUAN V T HÁN VI T 1.1. Ch Hán là gì? 1.2. Ngu n g c ch Hán Vi t Vào th k th nh t trư c Công nguyên, cùng v i vi c phong ki n phương B c xâm lư c Vi t Nam, thì ngôn ng văn t Hán cũng ñư c ñưa vào Vi t Nam. Do s du nh p văn hoá quá m nh m nên nư c ta th i c trung ñ i s d ng ti ng Hán như m t văn b n chính th c cũng như hai nư c Tri u Tiên và Nh t B n. Ch Hán qua Vi t Nam chưa có âm Vi t, nên ngư i Vi t Nam ph i ñ t âm Vi t cho t ñó theo cách phát âm sai l ch c a mình. Theo dòng l ch s , nhi u ch Hán ñã ñư c ngư i Vi t Nam ti p thu tr thành t Hán Vi t, ñư c s d ng thông d ng như v n t ti ng Vi t. Chính s phong phú c a kho t v ng ti ng Vi t và nhu c u s lý các văn b n Hán Vi t mà vi c nghiên c u làm sao s d ng ñúng v n t Hán Vi t ñã ñư c nhi u nhà văn hoá và giáo d c quan tâm. 1.3. Đ c ñi m t Hán Vi t T Hán Vi t r t phong phú c v s lư ng và ng nghĩa. T Hán Vi t có th k t h p l i v i nhau ñ t o thành t m i. T Hán Vi t không bao gi gây mâu thu n trong cách hi u trong khi ñó t thu n Vi t nhi u khi r t hay gây nhi u hi u l m. T Hán Vi t nghe kêu và vang d i. T Hán Vi t thư ng mang nhi u nghĩa, hàm nghĩa c a âm ti t Hán Vi t r ng hơn hàm nghĩa c a âm ti t thu n Vi t. M t s ch Hán Vi t tr nên t i nghĩa ho c vô nghĩa khi ñ o tr t t các t . Ví d : tương quan, cơ quan, cơ th … M t s ch Hán Vi t khi ñ o tr t t thì sinh ra nghĩa khác, Ví d : qu nhân, ph m t i khi ñ o tr t t thành nhân qu , t i ph m thì mang nghĩa khác hoàn toàn.
  7. -7- Ch Hán Vi t v n gi nghĩa. Ví d : Đông phương, Tây phương,… 1.4. L i ích c a t Hán Vi t - Làm giàu thêm kho t ti ng Vi t. - T Hán Vi t làm tăng giá tr cho ngôn ng Vi t Nam. - T Hán Vi t giúp ích r t nhi u trong vi c so n th o nh ng danh t khoa h c. 1.5. C u trúc t Hán Vi t V i t Hán Vi t, c u trúc danh t Hán Vi t thư ng ngh ch v i c u trúc danh t thu n Vi t. N u t thu n Vi t trong câu ñư c c u trúc v i thành ph n chính ñ ng trư c, thành ph n ph ñ ng sau thì c u trúc câu t Hán Vi t thư ng ngư c l i, thành ph n ph ñ ng trư c, thành ph n chính ñ ng sau. Đây là ñi m khác bi t rõ r t gi a c u trúc câu t thu n Vi t và Hán Vi t. B ng 1.1. S khác bi t v c u trúc gi a t Hán Vi t và thu n Vi t T thu n Vi t (chính + ph ) T Hán Vi t (ph + chính) Hoa h ng H ng hoa M t tr ng B ch di n Lá r ng L c di p Ch Hán ñư c c u t o theo sáu nguyên t c g i là L c thư: Tư ng hình,Ch s , Hình thanh, H i ý, Chuy n chú, Gi tá. Nhưng tóm l i, có 3 cách chính t o ch , chuyên v hình th c và thư ng dùng: Tư ng hình, H i ý và Hình thanh. Còn ba cách kia: Ch s , Chuy n chú và Gi Tá không chính th c là cách t o ch mà ch thêm y u t v âm thanh.
  8. -8- 1.5.1. T ñơn Hán Vi t 1.5.1.1. T ñơn Hán Vi t nhìn t tiêu chí ng âm a. T ñơn Hán Vi t thu n âm Hán Vi t Nh ng t ñơn Hán Vi t lo i này thư ng mang âm Hán Vi t ph thông theo phiên thi t, ví d : ñ nh (ñ ninh thi t 弟 寧 切), như (nh c dư thi t 辱 余 切), tư ng (t y dư ng thi t 洗 養 切), sương (sư ương thi t 師 央 切). b. T ñơn Hán Vi t bi n âm Hán Vi t Đây là nh ng t ñơn Hán Vi t mang âm Hán Vi t ph thông nhưng l i mô ph ng phiên thi t ti ng Hán. Đó là: sinh (sư hanh thi t 師 亨 切), dung (dư long thi t 余 龍 切), hòe (h quai thi t), v.v.. 1.5.1.2. T ñơn Hán Vi t nhìn t tiêu chí ng nghĩa Thư ng thì nghĩa c a t Hán Vi t ña ph n là nghĩa vay mư n. Tuy nhiên, ñây có th chia nh ng t ñơn Hán Vi t tùy theo ng nghĩa thành hai lo i sau: a. T ñơn Hán Vi t nguyên nghĩa Hán Nguyên nghĩa c a m t t ñơn Hán Vi t là ch chung nh ng nét nghĩa v n có trong ti ng Hán văn ngôn. b. T ñơn Hán Vi t bi n nghĩa Vi t S bi n nghĩa m t s t ñơn Hán Vi t là nói v nh ng nét nghĩa ñư c hình thành trong ti ng Vi t. Chúng cùng t n t i v i nh ng nét nghĩa ti ng Hán và ch b c l rõ nét trong m t ng c nh nh t ñ nh. Đ c p nh t nghĩa c a t ñơn vào kho ng v ng, ta ch y u d a vào các t ñi n. 1.5.1.3. T ñơn Hán Vi t nhìn t tiêu chí ng pháp
  9. -9- Theo s ho t ñ ng t ng ng c nh, l p t ñơn Hán Vi t cũng có th chia thành danh t , ñ ng t và tính t . a. T ñơn Hán Vi t là danh t Danh t ñơn Hán Vi t bao g m danh t c th và danh t tr u tư ng ví d các t : Khách 客 chí 志 b c 幅 b 步 th y 水 thuy n 船 b. T ñơn Hán Vi t là ñ ng t M t s ñ ng t ñơn Hán Vi t như ti n, h c, phong v.v. ch v s ho t ñ ng c a ch th ; tư ng, s u, mu n, thương v.v. ch c m nghĩ, tâm tư, tình c m c a ch th ; ho c các ñ ng t ch quá trình bi n ñ i, như: hóa, tàn, gi i v.v… c. T ñơn Hán Vi t là tính t M t s tính t : tr ng 重 ti n 便 dư 餘 cao 高 Như v y r t khó có th xác ñ nh nghĩa c a t ñơn Hán Vi t, do ñó ta c p nh t nghĩa c a t ñơn Hán Vi t ch y u là d a vào các t ñi n ñã có. 1.5.2. T ghép Hán Vi t 1.5.2.1. T ghép Hán Vi t nhìn t tiêu chí ng âm a. T ghép Hán Vi t thu n âm Hán Vi t Đây là nh ng t ghép Hán Vi t mà hai y u t trong m t t ñ u ñ c âm Hán Vi t ph thông tương ng phiên thi t, ho c m t y u t ñ c âm Hán Vi t ph thông mô ph ng phiên thi t. Vì v y, có th nh n xét lo i t ghép này qua cách phân lo i sau: (1) T ghép thu n âm Hán Vi t ph thông tương ng v i phiên thi t, ví d 清 : thanh bình (清 thanh : th t anh thi t 室 嬰 切; 平 bình: bì nghinh thi t 皮 迎 切. (2) T ghép Hán Vi t thu n âm Hán Vi t ph thông.
  10. - 10 - b. T ghép Hán Vi t bi n âm Hán Vi t Bi n âm c c b thanh ñi u c a t ghép Hán Vi t là hi n tư ng khá ph bi n trong văn v n v i m c ñích hi p v n thơ, hay lu t thơ v n b ng. 1.5.2.2. T ghép Hán Vi t nhìn t tiêu chí ng nghĩa a. T ghép Hán Vi t nguyên nghĩa Hán Đa s t ghép Hán Vi t ñ u ñư c d n d ng b ng nét nghĩa v n có trong ti ng Hán văn ngôn. b. T ghép Hán Vi t bi n nghĩa Vi t Đây là lo i t ghép cũng ñư c vay mư n t ti ng Hán văn ngôn nhưng l i mang nét nghĩa ñư c hình thành trong ti ng Vi t thu c ph m vi d ch ph m. Ví d , t ghép hư không. Trong ti ng Hán hư không có nghĩa là kho ng không tr ng r ng, không có gì, nhưng trong ti ng Vi t thì hư không còn có nghĩa là không có th t, là tr ng thái l ng lơ, h t h ng trong mong ch . 1.5.2.3. T ghép Hán Vi t nhìn t tiêu chí ng pháp a. T ghép Hán Vi t ñ ng l p Lo i t ghép ñ ng l p này cũng có th x p vào các t lo i, như danh t , ñ ng t , tính t . a.1 T ghép ñ ng l p Hán Vi t là danh t Nh ng t ghép ñ ng l p ñây ñ u b ng hai danh t ñơn Hán Vi t, ho c bán t do ho c t do, ví d : th i ti t 時節 xuân thu 春秋 nhan s c 顏色 a.2. T ghép ñ ng l p Hán Vi t là ñ ng t Trong s ñ ng t ghép ñ ng l p Hán Vi t ñây cũng có hi n tư ng rút g n nguyên m t c m t và t hóa thành ñ ng t ghép. Ví d : ti n th o là t hóa t c m t ti n binh th o ngh ch, xu t chinh là xu t sư chinh thú . Riêng t trang ñi m là s t hóa t c m
  11. - 11 - t trang hoàng ñi m xuy t v n thư ng dùng trong các ho t ñ ng ngh thu t. b. T ghép Hán Vi t chính ph T ghép chính ph Hán Vi t ñây g m có hai lo i, ñó là t ghép chính ph Hán Vi t ph trư c chính sau v i quan h h n ñ nh và t ghép chính ph Hán Vi t chính trư c ph sau v i quan h chi ph i. b.1. T ghép chính ph Hán Vi t ph trư c chính sau Đa s các t ghép Hán Vi t có tr t t là y u t ph trư c còn y u t chính sau. h ng mao 鴻毛 chi n bào 戰袍 hà lương 河樑 b.2. T ghép chính ph Hán Vi t chính trư c ph sau: M t s t ghép Hán Vi t chính trư c ph sau có quan h chi ph i, ñó là: ñăng ñ 登途 xu t giá 出嫁 hư ng dương 向陽 1.5.3. Nghĩa c a các c m t Hán Vi t Ng Sơ ñ chung c a ng : Pt – T – (q) – Ps Nghĩa = Nghĩa Pt + Nghĩa T + Nghĩa Ps Trong ñó: Pt là ph n ph trư c T là ph n trung tâm Q là ph n liên t Ps là ph n ph sau Liên h p Liên h p bao g m hai ho c trên hai thành t . Các thành t ph i cùng b n ch t t lo i. như v y: Nghĩa = Nghĩa c a thành t 1 + Nghĩa c a thành t 2 +…. D ng láy D ng l y là c m t có quan h ng âm v i nhau, vì v y:
  12. - 12 - Nghĩa = Nghĩa c a t g c sau ñó nâng cao hay gi m nh m c ñ c a nghĩa 1.5.4. Nghĩa c a câu Hán Vi t -Câu ñơn bình thư ng: Nghĩa = Nghĩa c m t - ch ng + Nghĩa c m t - v ng -Câu ñ c bi t: Nghĩa = Nghĩa c a ng hay Nghĩa c a liên h p -Câu ñơn t nh lư c: Nghĩa = nghĩa c a c m t -ch ng (Câu t nh lư c v ng ) Ho c Nghĩa = nghĩa c a c m t -v ng (Câu tĩnh lư c ch ng ) Ho c Nghĩa = nghĩa ph n ph (Câu t nh lư c nòng c t) 1.6. Cách dùng t Hán Vi t 1.6.1. Dùng t ñúng âm 1.6.2. Dùng t ñúng nghĩa
  13. - 13 - CHƯƠNG 2 - CÔNG C , MÔI TRƯ NG VÀ K THU T XÂY D NG KHO NG V NG TI NG HÁN VI T D A NGHĨA 2.1. Cơ s lý thuy t 2.1.1. V n ñ x lý ngôn ng t nhiên 2.1.1.1. Khái ni m X lý ngôn ng t nhiên là m t nhánh trong lĩnh v c ng d ng trí tu nhân t o nh m m c ñích: phân tích, nh n bi t, t ng h p ngôn ng t nhiên. Nó là cơ s chính ñ ñi vào các hư ng: hi u ngôn ng , d ch ngôn ng , x lý ti ng nói, x lý văn b n,… 2.1.2. Sơ lư c bài toán tách t ti ng Vi t 2.1.2.1. Khó khăn trong bài toán tách t ti ng Vi t 2.1.2.2. Các v n ñ trong bài toán tách t ti ng Vi t *. X lý nh p nh ng *. Nh n di n t chưa bi t 2.1.2.3. Phương pháp tách t dùng trong lu n văn - Phương pháp Maximum Matching (forward/backward) 2.1.3. T ñi n h c 2.1.3.1. M t s t ñi n thông d ng - T ñi n gi y - T ñi n ñi n t - T ñi n máy tính 2.1.3.2. M t vài nh n xét v hình th c lưu tr t ñi n 2.1.3.3. Bách khoa toàn thư m Wikipedia - Gi i thi u - Ho t ñ ng Cách th c thu th p d li u Ch n l c d li u
  14. - 14 - - Đánh giá Ưu ñi m Như c ñi m 2.1.4. Kho ng v ng d a nghĩa ti ng Hán Vi t 2.1.4.1. Vai trò c a kho ng v ng ti ng Hán Vi t d a nghĩa Kho ng v ng ti ng Hán Vi t d a nghĩa dùng ñ lưu tr t t c các t v ng ( t ñơn, t ghép), các ng , các c m t , các câu dài nh t có th và gi i thích nghĩa c a c a chúng. V i kho ng v ng ti ng Hán Vi t d a nghĩa, chúng ta có th xây d ng các công c khai thác giúp ích cho vi c d y - h c ti ng Hán Vi t cũng như phát tri n thêm các ng d ng khác như: Xây d ng t ñi n, b t l i chính t trong x lý văn b n ti ng Hán Vi t, nh n d ng ti ng Hán Vi t… ñ c bi t là dùng ñ gi i quy t bài toán d ch t ñ ng - m t trong nh ng bài toán khó ñ i v i ngành CNTT hi n nay. 2.1.4.2. N i dung c a kho ng v ng ti ng Hán Vi t d a nghĩa Kho ng v ng ti ng Hán Vi t d a nghĩa ch a m t s lư ng t ñáng k . V i kho ng v ng ñu c xây d ng hoàn toàn m , t t c m i ngư i có th s d ng, khai thác t v ng trong kho m t cách d dàng, thu n ti n. Bên c nh ñó, ngư i s d ng có th c p nh t thêm v n t v ng cho kho ng li u, sao chép toàn b kho ng li u ñ tri n khai trên nhi u ng d ng nh m ph c v cho nh ng m c ñích khác nhau. 2.1.4.3. Tình tr ng c a kho ng v ng ti ng Hán Vi t d a nghĩa Kho ng v ng luôn ñ t trong tr ng thái m . D li u trong kho ñư c c p nh t thư ng xuyên, ngày càng phong phú, ña d ng, d ti p c n, d khai thác. Bên c nh ñó, do thu c tính m c a kho nên m i ngư i ñ u có th c p nh t tài nguyên trong kho. 2.2. Môi trư ng, công c xây d ng ng d ng 2.2.1. Ngôn ng s d ng
  15. - 15 - 2.2.1.1. Ngôn ng XML 2.2.1.2. Ngôn ng MySQL 2.2.1.3. Ngôn ng PHP 2.2.1.4. Ngôn ng CSHARP (C#) 2.2.2. Chu n b ng li u 2.2.3. Môi trư ng, công c th c hi n ng d ng ñư c xây d ng trên môi trư ng Windows, s d ng ngôn ng l p trình C# ñ cài ñ t. Môi trư ng cài ñ t Microsoft Visual Studio.Net 2005 truy xu t d li u t XML.
  16. - 16 - CHƯƠNG 3 - GI I PHÁP XÂY D NG KHO NG V NG D A NGHĨA T HÁN VI T 3.1. Phương pháp xây d ng kho ng v ng d a nghĩa t Hán Vi t 3.1.1. Quy mô Chúng ta xác ñ nh trong ñ tài này, ta ch d ng l i vi c làm th nào ñ t o ra ñư c kho ng v ng d a nghĩa. Đ thu th p d li u cho kho ng v ng này, th c hi n các công vi c sau: - Xây d ng c u trúc c a kho. - Thêm t v ng m i vào kho. - Gi i thích t v ng. 3.1.2. Ho t ñ ng Ta s xây d ng m t kho ng v ng ti ng Hán Vi t ho t ñ ng theo hư ng m ñ i v i d li u. Đ làm ñư c ñi u này, ta s xây d ng m t Website ñ thu th p d li u cho kho ng v ng, m i thành viên c a Website ñ u có th c p nh t, s a ñ i và góp ý ki n v i d li u c a kho ng v ng ti ng Vi t d a nghĩa. 3.1.3. Ch n l c d li u 3.1.3.1. Cách th c l a ch n chuyên gia Như ñã trình bày trên, d li u trong kho ng v ng ti ng Hán Vi t d a nghĩa s ñư c l y ý ki n t các thành viên và quy t ñ nh b i các chuyên gia, chuyên gia c a Website là nh ng thành viên có m t s ñóng góp nh t ñ nh, ñư c ñ xu t và quy t ñ nh ch n hay không ph thu c vào ngư i qu n lý Website. 3.1.3.2. Ch n l c d li u D li u c a Website ñư c t p h p t hai ph n Ph n g c
  17. - 17 - Đư c t p h p lúc tri n khai ñ tài, d li u này do ngư i qu n lý Website nh p tay, trích xu t t các b t ñi n ho c l y d li u t Internet. D li u này v n ñư c s a ñ i t các thành viên trong quá trình tri n khai ñ tài. Ph n b sung Trong m i th i ñi m, d li u s ñư c c p nh t, b sung b i các thành viên tham gia Website (ngư i dùng). D li u s ñư c chính th c c p nh t vào kho ng v ng ti ng Hán Vi t d a nghĩa theo quy ñ nh như sau: - Ngư i dùng nh p d li u b sung ho c thay ñ i d li u có s n. - Các d li u m i s ñư c n d u b i chương trình. - Sau m t th i gian các chuyên gia ph i xác ñ nh ñ ơc d li u c p nh t ho c thay ñ i có h p l hay không? Sau ñó s ñánh d u vào d li u. - Căn c vào ñánh d u c a chuyên gia chương trình s t ñ ng hi n th ho c xoá các d li u. 3.1.4. Mô hình Chương trình thu th p t v ng cho kho ng v ng ti ng Hán Vi t d a nghĩa ñư c ñ xu t trong ñ tài này là: Thi t l p m t trang Web m mi n phí trên Internet. Ngư i s d ng có th tra c u thông tin v t v ng ti ng Hán Vi t cũng như c p nh t và s a ñ i ñư c n i dung d li u t v ng. Các ch c năng chính c a Website bao g m: - Tra c u t ñi n ti ng Hán Vi t Online. - C p nh t và s a ñ i n i dung t ñi n. - Quy t ñ nh c a chuyên gia v tính ñúng ñ n c a d li u. - Sân chơi nh m nâng cao các ki n th c v ti ng Hán Vi t. 3.2. Phân tích và thi t k h th ng chương trình
  18. - 18 - 3.2.1. Mô hình t ng quát h th ng D li u l y t internet ho c ngư i dùng Thu th p d li u cho trò chơi CSDL thô C p nh t d li u vào kho d li u thô Thu th p d li u t Ngư i s d ng website trò chơi CSDL trung gian C p nh t d li u vào kho trung gian Tinh l c d a vào k t qu ñánh giá c a ngư i s d ng C p nh t vào CSDL chính th c C p nh t vào CSDL chính th c CSDL chính th c Hình 3.1. Mô hình t ng quát h th ng 3.2.2. Mô hình Use case h th ng System Dang ky Choi tro choi Guest Tra cuu Dang nhap Danh gia User Quan ly ngan hang tu Administrator Quan ly dang nhap Hình 3.2. Mô hình Use case h th ng
  19. - 19 - 3.3. Chương trình thu th p d li u cho kho ti ng Hán Vi t d a nghĩa 3.3.1. Sơ ñ ho t ñ ng c a chương trình H TH NG CH C NĂNG Ch c năng hi n Ch c năng t o Ch c năng Tra c u th qu n tr thông Sân Chơi Th ng kê qu n tr tin Hi n th Bài Th ng kê Tìm ki m t t c chung 1 ngư i chơi Hán vi t qu n tr Hi n th Bài Th ng kê t ngư i dùng 2 Hán Vi t C p nh t Hi n th Bài Đánh giá vào kho DN 3 chuyên gia qu n tr hình nh Hình 8. Sơ ñ ho t ñ ng c a chương trình Hình 3.3. Sơ ñ ch c năng h th ng 3.3.2. Gi i thích sơ ñ Khi vào website, ngư i s d ng có th làm m t s công vi c sau: Tra c u t v ng -N u t v ng có trong kho thì hi n th thông tin t v ng -N u không có t v ng này thì màn hình s báo không có t v ng này trong kho Đăng nh p -N u ngư i dùng chưa có tài kho n: T o m t tài kho n m i -N u ngư i dùng ñã có tài kho n: Sau khi ñăng nh p thành công, ngư i dùng có th s a ñ i l i các thông tin v tài kho n.
  20. - 20 - Thêm ho c thay ñ i thông tin t -Ngư i dùng ph i ti n hành ñăng nh p, ch ngư i nào là thành viên c a Website m i có th th c hi n m c này. -Sau khi t ñư c thêm ho c s a ñ i l i s ñư c ñưa vào CSDL t m th i, ñư c các chuyên gia x lý và quy t ñ nh ñưa vào kho ng v ng ti ng Vi t d a nghĩa hay không? Sân chơi -Đ chơi ñư c, ngư i s d ng ph i có tài kho n t i Website và ñăng nh p thành công. -Chương trình s hi n th lu t chơi và m t s liên k t, ngư i chơi có th : +Xem thông tin v tài kho n: Thông tin v tài kho n g m các thông tin như: H tên, vòng chơi, ñi m s m i vòng chơi, th i gian m i vòng chơi, c p b c… +Vào chơi: M i vòng chơi, ngư i chơi ph i ti n hành 3 bài t p Bài t p 1: -H th ng s ñưa ra 1 câu ti ng Hán Vi t b t kỳ ( câu ti ng Hán Vi t này ñư c l y t kho d li u trung gian). -Ngư i chơi ph i tách ra thành nh ng t có nghĩa. -Các t này s ñư c ñưa vào kho d li u thô Bài t p 2: -H th ng s hi n th lên các t ñư c tách bài t p 1. -Ngư i chơi s ghép các t ñó thành các t , c m t , câu có nghĩa trong ti ng Hán Vi t -Các t và c m t này s ñư c c p nh t vào kho d li u thô. Bài t p 3:
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2