Áp dụng lý thuyết tập mờ để mở rộng CSDL quan hệ

Chia sẻ: ViTomato2711 ViTomato2711 | Ngày: | Loại File: PDF | Số trang:11

Thêm vào BST

Báo xấu

44
lượt xem 3
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết này giới thiệu một mô hình cơ sở dữ liệu quan hệ mờ là mở rộng của mô hình cơ sở dữ liệu quan hệ truyền thống với hai đặc tính chính: Các quan hệ biểu diễn tập các bộ dữ liệu là quan hệ mờ, các điều kiện chọn được kết hợp với giá trị tập mờ để có thể truy vấn thông tin mờ, không chính xác của các đối tượng trong các quan hệ.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Áp dụng lý thuyết tập mờ để mở rộng CSDL quan hệ

TAÏP CHÍ KHOA HOÏC ÑAÏI HOÏC SAØI GOØN Soá 1 (26) - Thaùng 1/2015 ÁP DỤNG LÝ THUYẾT TẬP M ĐỂ MỞ RỘNG CSDL QUAN HỆ NGUYỄN HÒA(*) NGUYỄN THỊ UYÊN NHI (**) T M TẮT -Fuzzy Relational eM e) r ủ r ) ) r r ủ r M ủ r r ủ M ủ r ủ r r . óa: tậ ờ, qu ờ, sở d u qu ờ é o ạ s qu ờ. ABSTRACT This paper introduces a fuzzy relational data base model (FRDB) that extends the conventional relational data base model with two key features: (1) the relations represent the set of data tuples to be the fuzzy relations; (2) selection conditions are associated with fuzzy set values to be able to query the fuzzy, imprecise information of objects in relations. An interpretation of the membership degree of tuples for fuzzy relations is proposed on the foundation of the fuzzy set theory as the basis to develop the data and data manipulating model of FRDB including schemas, fuzzy relations and algebraic operations. Some properties of the fuzzy relational algebraic operations also are formulated and proven as those that are extended of the properties of relational algebraic operations in the conventional relational data base model. Keywords: fuzzy set, fuzzy relation, fuzzy relational data base, fuzzy relational algebraic operation. 1. GIỚI THIỆU(*)(**) từ phần mềm cho đến cơ sở dữ liệu Như chúng ta đã biết, mô hình sở (CSDL). Tuy nhiên, các ứng dụng dựa trên d u qu uyề (conventional mô hình CSDL quan hệ truyền thống relational data base), được đề nghị bởi không biểu diễn được các đối tượng mà Codd E.F năm 1 70 ([2]), đã chứng tỏ thông tin về chúng không được xác định nhiều ưu điểm trong các vấn đề mô hình một cách rõ ràng và chính xác. Điều đó hóa, thiết kế và hiện thực các hệ thống lớn, làm hạn chế khả năng mô hình hóa và giải quyết các bài toán áp dụng trong thế giới (*) TS, Trường Đại học Sài Gòn thực. Chẳng hạn, các ứng dụng mô hình (**) ThS, Trường Đại học Sài Gòn 108 CSDL truyền thống không thể trả lời được Trong cách tiếp cận thứ nhất, giá trị các truy vấn kiểu như “tìm tất cả những thuộc tính quan hệ được biểu diễn bằng bệnh nhân ẻ có tiền sử bệnh viêm thanh một tập mờ và được diễn dịch bởi hàm quản”; hoặc “tìm tất cả các gói bưu kiện có thành viên của nó ([4], [7], [ ], [11]). trọng lượng k oả 10 kg và được vận Trong các mô hình được xây dựng bằng chuyển trong thời gian k oả 36 giờ từ cách tiếp cận này, các quan hệ hai ngôi cổ Hà Nội đến Sài Gòn”, v.v. Trong đó ẻ, điển giữa các thuộc tính được mở rộng k oả 10 kg và k oả 36 giờ là những thành các quan hệ mờ. Mức độ thành viên khái niệm và giá trị không chính xác. Để của các bộ được ẩn trong mức độ thành khắc phục được các hạn chế như vậy, cần viên của các giá trị thuộc tính. Trong cách phải xây dựng các mô hình dữ liệu có khả tiếp cận thứ hai, giá trị thuộc tính quan hệ năng biểu diễn và xử lý được các đối tượng được biểu diễn bằng một giá trị đơn rõ mà các thông tin về chúng có thể không rõ trong một quan hệ mờ trên các miền giá trị ràng (mờ) và không chính xác. của các thuộc tính đó ([ ], [ ], [10]). Trong Trong những năm qua đã có nhiều mô các mô hình được xây dựng bằng cách tiếp hình cơ sở dữ liệu quan hệ dựa trên lý cận này, các quan hệ nhiều ngôi cổ điển thuyết ậ ờ (fuzzy set) được nghiên cứu (quan hệ trên các lược đồ CSDL) được mở và xây dựng nhằm mô hình hóa các đối rộng thành các quan hệ nhiều ngôi mờ và tượng mà thông tin về chúng mờ, không mức độ thành viên của các giá trị thuộc chính xác [1], [3], [7], [9], [10]. Các mô tính được ẩn trong mức độ thành viên của hình như vậy gọi là ô ì sở d u các bộ trong các quan hệ mờ này. qu ờ (fuzzy relational data base Trong bài báo này, chúng tôi đề nghị model). Tuy nhiên, do tính đa dạng và một mô hình CSDL quan hệ mờ (FRDB) phức tạp về sự tồn tại của các đối tượng dựa trên cách tiếp cận thứ hai. Để xây dựng cũng như các mối quan hệ của chúng nên FRDB, chúng tôi áp dụng lý thuyết tập mờ khó có mô hình nào có thể biểu diễn và xử ([6], [12]), mở rộng quan hệ và các phép lý hết mọi khía cạnh không chắc chắn và toán đại số quan hệ truyền thống ([5]) không chính xác về thông tin của các đối thành quan hệ mờ và các phép toán đại số tượng trong thế giới thực. Vì vậy, các mô quan hệ mờ. Chúng tôi cũng đề nghị một hình CSDL mờ vẫn được tiếp tục nghiên diễn dịch mức độ thành viên của các bộ đối cứu và phát triển để đáp ứng các mục tiêu với một quan hệ cho các điều kiện chọn ứng dụng khác nhau. làm cơ sở để truy vấn với thông tin mờ, Có hai cách tiếp cận chính để biểu diễn không chính xác trong FRDB. dữ liệu mờ trong mô hình CSDL mờ: (1) Cơ sở toán học để phát triển FRDB biểu diễn giá trị thuộc tính bằng các giá trị được trình bày trong Phần 2, lược đồ và thể tập mờ trong quan hệ mờ; (2) biểu diễn giá hiện FRDB được giới thiệu trong Phần 3. trị thuộc tính bằng các giá trị rõ trong quan Phần 4 trình bày các phép toán đại số trên hệ mờ. FRDB và cuối cùng, Phần là một số kết 109 luận và hướng nghiên cứu trong tương lai. 2.2. Bi u diễn tập mờ 2. CƠ SỞ TOÁN HỌC CỦA FRDB Trong các ứng dụng, ngoài cách biểu Phần này giới thiệu tập mờ và quan hệ diễn tập mờ A như một hàm thành viên A: mờ như là cơ sở toán để phát triển FRDB. X → [0, 1], còn có một số cách biểu diễn Tập mờ được sử dụng để biểu diễn các truy tập mờ như sau: vấn với thông tin không rõ ràng, quan hệ 1. Đối với tập X hữu hạn, một tập mờ mờ được sử dụng để mở rộng các quan hệ A trên X thường được biểu diễn bởi một hệ trong FRDB. thức có dạng A = , trong đó ai = 2.1. ập mờ A(xi) ≠ 0. Tập mờ là khái niệm mở rộng của tập 2. Đối với tập X vô hạn không đếm cổ điển và được định nghĩa như sau. được, thường là tập số thực, một tập mờ A Định nghĩa 2.1.1 Giả sử X là một tập trên X có thể được biểu diễn bởi khác rỗng, một ánh xạ từ X đến khoảng A = ∫x A(x)/x. đóng [0, 1], A: X [0, 1], xác định ộ Chúng tôi lưu ý dấu tích phân ở đây ậ ờ (fuzzy set) A trên X. Ánh xạ A chỉ có ý nghĩa thể hiện một tập vô hạn được gọi là hàm thành viên (membership không đếm được các cặp x và A(x) trong X function) của tập mờ A. Với mỗi x  X, định nghĩa cho A. A(x) là ộ (membership 2.3. C c p ép t n trên tập mờ degree) của x đối với A. Các phép toán trên các tập mờ được Để đơn giản, ký hiệu A: X [0, 1] có định nghĩa một cách tổng quát dựa trên các thể được sử dụng để biểu diễn tập mờ A. ánh xạ từ tập tích Descartes của các khoảng Ví dụ 2.1.1 Một ví dụ đơn giản về tập đóng [0,1] đến khoảng đóng [0,1]. Tuy mờ là tập các số gần số 2, about_2, được nhiên, phần này chỉ giới thiệu các phép cho bởi hàm thành viên của nó như sau: o uẩ (standard operation) trên các  x  1 x  [1, 2] tập mờ ([6], [12]) được ứng dụng trong  FRDB. about _ 2  3  x x  (2, 3] 0 x  [1,3] Định nghĩa 2.3.1 Giả sử A, B là hai tập  mờ trên tập X và có các hàm thành viên lần và đồ thị hàm thành viên của about_2 lượt là A, B. Phép toán lấy phần bù của như trong Hình 2.2.1. A, hợp, giao và hiệu của A và B được định nghĩa theo hàm thành viên của chúng như sau. 1. Ac(x) = 1-A(x), x X 2. AB(x) = max( A(x), B(x)), x  X 3. AB(x) = min( A(x), B(x)), x X 4. A-B(x) = min( A(x), 1-B(x)), x X. Hì 2.1.1: Tậ ờ s ầ 2 110 2.4. Quan ệ mờ Chúng tôi lưu ý rằng, như trong CSDL Khái niệm quan hệ mờ là cơ sở để xây quan hệ truyền thống, để đơn giản, có thể dựng CSDL quan hệ mờ. Quan hệ mờ được viết R(U, ) thay cho cách viết R = (U, ). định nghĩa bằng cách mở rộng quan hệ cổ Ngoài ra, mỗi t = (v1, v2, …, vk) được gọi là điển như sau. một bộ trên tập thuộc tính {A1, A2, …, Ak}. Định nghĩa 2.4.1 Giả sử A1, A2,…, Ak Ví dụ 3.1.1 Một lược đồ quan hệ mờ là các tập khác rỗng, một quan hệ mờ k- PATIENT trong FRDB mô tả về các bệnh ngôi R giữa k tập A1, A2,…, Ak là một tập nhân có thể như sau: con mờ của tập tích Descartes A1A2 PATIENT(PATIENT_ID, …Ak. PATIENT_NAME, AGE, SEX, ), với  Như vậy, một quan hệ mờ k-ngôi R là ánh xạ được kết hợp với một hàm thành viên R: : string  string real  binary[0, A1A2 …Ak [0,1]. Trường hợp quan hệ 1], trong đó string, real và binary là các mờ 2-ngôi R giữa X, Y (là cơ sở để xây miền giá trị của các thuộc tính dựng các phép toán mờ 2-ngôi), là một tập PATIENT_ID, PATIENT_NAME, AGE mờ R = {(x,y): R(x,y) | (x, y)  X×Y } với và SEX hàm thành viên R(x,y): X×Y → [0,1]. 3.2. Quan ệ FRDB 3. LƯỢC ĐỒ VÀ QUAN HỆ FRDB Quan hệ mờ được mở rộng từ quan hệ Lược đồ và quan hệ FRDB được mở truyền thống với mức độ thuộc được gán rộng từ lược đồ và quan hệ CSDL quan hệ cho mỗi bộ như định nghĩa dưới đây. truyền thống để biểu diễn khả năng các bộ Định nghĩa 3.2.1 Giả sử U = {A1, A2, thuộc về một quan hệ mờ. … Ak} là một tập thuộc tính đôi một khác 3.1. ược đồ FRDB nhau, một quan h mờ (fuzzy relation) r Một lược đồ FRDB gồm một tập thuộc trên lược đồ R(U, ) là một tập hữu hạn tính kết hợp với một hàm thành viên làm các bộ {t1, t2,…, tn} trên tập các thuộc tính cơ sở để xác định các quan hệ mờ, được {A1, A2, …, Ak}, được kết hợp tương ứng định nghĩa như sau: với các giá trị (ti) biểu diễn mức độ thuộc Định nghĩa 3.1.1 Một ượ ồ quan h của ti trong r. Các ký hiệu t.A hoặc t[A] mờ (fuzzy relational schema) là một bộ đôi biểu thị giá trị thuộc tính A của bộ t trong r. R = (U, ) trong đó Mức độ thuộc của ti trong r được ký hiệu là 1. U = {A1, A2, …, Ak} là một tập các r(ti). thuộc tính đôi một khác nhau (biểu diễn Chúng tôi cũng dùng ký hiệu t[X] để thông tin về giá trị các đối tượng trong biểu thị giá trị thu hẹp của bộ t trên tập quan hệ). thuộc tính X  {A1, A2 … Ak}. 2.  là một ánh xạ đặt tương ứng mỗi Ví dụ 3.2.1 Một quan hệ mờ r (v1, v2, …, vk)  D1D2…Dk với một số trên lược đồ PATIENT(PATIENT_ID, thực thuộc [0, 1], trong đó Di là miền giá PATIENT_NAME, SEX, trị của thuộc tính Ai (i = 1, …, k). MEDICAL_HISTORY, ) có thể như 111 Bảng 3.2.1. mở rộng từ phụ thuộc hàm trong CSDL Phụ thuộc hàm mờ trong FRDB được truyền thống như định nghĩa 3.2.2. Bảng 3.2.1: M t quan hệ mờ trên lược đồ PATIENT PATIENT_ID PATIENT_NAME SEX MEDICAL_HISTORY  PT001 P.V. Ba male Bronchitis 0.8 PT002 T.T. Mai female Cholecystitis 0.5 PT003 N. Tuan male Gall-stone 0.4 Định nghĩa 3.2.2 Cho một lược đồ Định nghĩa 3.2.3 Một sở d li u quan hệ mờ R(U, ), r là một quan hệ mờ quan h mờ (fuzzy relational database) trên bất kì trên R, X và Y là hai tập con các một tập các thuộc tính A là một tập các thuộc tính của U. Một ph thuộc hàm mờ quan hệ mờ tương ứng với tập các lược đồ (fuzzy function dependence) của Y đối với quan hệ mờ của chúng. X trên lược đồ quan hệ R, ký hiệu là X ⇝ Lưu ý rằng, nếu chỉ quan tâm đến một Y, nếu quan hệ duy nhất trên một lược đồ thì có t1, t2  r (r(t1)  r(t2)  t1[X] = thể đồng nhất ký hiệu tên quan hệ và lược t2[X]) f (t1[Y] = t2[Y]), trong đó đồ của chúng. 1, khi a  b Ví dụ 3.2.3 Một CSDL quan hệ mờ a f b =  đơn giản các bệnh nhân tại phòng khám 1  (a  b), khi a  b của một bệnh viện có thể được tổ chức như Phụ thuộc hàm X ⇝ Y còn được gọi là các Bảng 3.2.2, 3.2.3, 3.2.4. Ở đây, quy “X xác định hàm Y” hoặc “Y phụ thuộc ước đơn vị thời gian điều trị, chi phí điều hàm vào X”. trị tương ứng là ngày và 1000 (đồng VN). Lưu ý rằng, khi giá trị hàm r bằng 1 Kinh nghiệm điều trị của bác sĩ được tính với mọi r trên R, phụ thuộc hàm mờ trong theo năm. Chúng tôi lưu ý rằng, một số định nghĩa này sẽ đồng nhất với phụ thuộc thuộc tính đã bị lược bỏ bớt (cho đơn giản) hàm trong CSDL truyền thống. và chúng cũng không ảnh hưởng đến việc Bây giờ CSDL quan hệ mờ là mở rộng minh họa cho mô hình CSDL quan hệ mờ. của CSDL quan hệ truyền thống và được định nghĩa như sau. Bảng 3.2.2: Quan hệ PATIENT PATIENT_ID PATIENT_NAME AGE WEIGHT MEDICAL_HISTORY  PT005 L.V. Tam 53 70 Bronchitis 0.9 PT006 N..T. Trang 29 49 Gall-stone 0.5 PT007 T. T. Tu 21 65 Hepatitis 1.0 112 Bảng 3.2.3: Quan hệ DIAGNOSE PATIENT_ID PHYSICIAN_ID DISEASE DURATION COST  PT005 DT001 Tuberculosis 400 300 0.7 PT006 DT002 Hepatitis 40 30 0.5 PT007 DT003 Lung cancer 500 350 0.4 Bảng 3.2.4: Quan hệ PHYSICIAN PHYSICIAN_ID PHYSICIAN_NAME EXPERIENCE  DT001 N. T. Son 30 0.6 DT002 H. V. Tuan 25 0.8 DT003 T. T. T. Nhan 6 0.9 4. CÁC PH P TOÁN ĐẠI SỐ FRDB hai ngôi mờ và v là một giá tr tập mờ. Các phép toán đại số quan hệ mờ như 3. x.A1  x.A2, trong đó x  X, A1 và A2 là phép chọn, phép giao, phép hợp và phép hai thuộc tính phân biệt trong R. trừ là cơ sở để truy vấn và thao tác dữ liệu 4. E nếu E là một điều kiện chọn mờ. mờ, không chính xác trong FRDB. Các 5. E1  E2 nếu E1 và E2 là các điều kiện phép toán này được mở rộng từ các phép chọn mờ trên cùng một biến quan hệ. toán đại số quan hệ truyền thống, trong đó 6. E1  E2 nếu E1 và E2 là các điều kiện mức độ thành viên của các bộ là một giá trị chọn mờ trên cùng một biến quan hệ. trong khoảng [0, 1]. Ba dạng đầu của điều kiện chọn mờ 4.1. P ép c n được gọi là các ều k sở Phép chọn trên một quan hệ FRDB là (atomic selection condition). Ba dạng sau cơ sở để thực hiện các truy vấn tìm kiếm của điều kiện chọn mờ được suy dẫn từ các thông tin trong CSDL. Trước khi định dạng cơ sở bằng đệ quy. Chúng tôi lưu ý có nghĩa phép chọn, chúng tôi giới thiệu cú thể coi mỗi giá trị rõ, chính xác cũng là pháp và ngữ nghĩa của các điều kiện chọn một giá trị tập mờ với hàm thành viên của như dưới đây. nó bằng 1. Định nghĩa 4.1.1 Giả sử R là một lược Ví dụ 4.1.1 Với lược đồ quan hệ đồ FRDB, X là một tập các biến bộ quan PATIENT trong CSDL các bệnh nhân ở hệ,  là một quan hệ hai ngôi trong =, , Ví dụ 3.2.3, một số điều kiện chọn mờ có , , , ≥. Các ều k n mờ (fuzzy thể như sau (x là biến bộ): selection condition) được định nghĩa một 1. Tìm những bệnh nhân trẻ tuổi (young). cách đệ quy và có một trong các dạng sau: Yêu cầu này có thể được biểu diễn bởi 1. x.A  v, trong đó x  X, A là một thuộc điều kiện chọn cơ sở x.AGE  tính trong R và v là một giá trị. young. 2. x.A  v, trong đó x  X, A là một 2. Tìm tất cả bệnh nhân trẻ tuổi và có thuộc tính trong R,  là một quan hệ tiền sử bệnh viêm gan (hepatitis). Yêu 113 cầu này có thể được biểu diễn bởi điều (t) = v(t.A). kiện chọn x.AGE  young Về trực giác, intR,r,t(x.A  v) và intR,r,t(x.A x.MEDICAL_HISTORY=hepatitis.  v) tương ứng cho biết mức độ thỏa mãn 3. Tìm tất cả bệnh nhân cao tuổi (old) các điều kiện (quan hệ) t.A  v và t.A  v hoặc có cân nặng dưới 50 kg. Yêu cầu (ở đây v là tập mờ) của bộ t trong r còn này có thể được biểu diễn bởi điều intR,r,t(x.A1  x.A2) cho biết mức độ thỏa kiện chọn x.AGE  old  x.WEIGHT mãn điều kiện t.A1  t.A2 của bộ t trong r.  50. Ví dụ 4.1.2 Giả sử các tập mờ young, Định nghĩa 4.1.2 Giả sử R(U, ) là một middle_aged, old tương ứng biểu diễn tuổi lược đồ quan hệ FRDB, r là một quan hệ ẻ, trung niên và của các bệnh nhân trên R, x là một biến bộ quan hệ và t là một với các hàm thành viên như dưới đây: bộ trong r. Di n d ch (interpretation) của các điều kiện chọn mờ theo R, r và t, được 1 x  [0, 20]  biểu thị bởi intR,r,t, là một ánh xạ bộ phận young  (35  x) / 15 x  (20, 35), từ tập tất cả các điều kiện chọn mờ đến 0 x  35  khoảng [0, 1] và được định nghĩa đệ qui ( x  20) / 15 x  [20, 35) như sau: 1 x  [ 35, 45)  1. intR,r,t(x.A  v) = r(t) nếu t.A  v và middle_ aged   (60  x) / 15 x  [45, 60) intR,r,t(x.A  v) = 0 nếu ngược lại.  0 x  (20, 60) 2. intR,r,t(x.A v) = min(r(t), (t)), với ( x  60) / 15 x  [45, 60)  = t.A  v  old  1 x  [60, 120] 3. intR,r,t(x.A1  x.A2) = r(t) nếu t.A1  t.A2 0 x  [45, 120]  và intR,r,t(x.A1  x.A2) = 0 nếu ngược lại. Thì diễn dịch của các điều kiện chọn mờ E1 4. intR,r,t(E) = 1 − intR,r,t(E) = “x.AGE  young” và E2= “x.AGE  5. intR,r,t(E1  E2) = min(intR,r,t(E1), young  x.MEDICAL_HISTORY = intR,r,t(E2)) hepatitis” theo quan hệ r = PATIENT trong 6. intR,r,t(E1  E2) = max(intR,r,t(E1), CSDL các bệnh nhân ở Ví dụ 3.2.3 được intR,r,t(E2)) tính toán như trong Bảng 5.2.1. Lưu ý rằng, Chúng tôi lưu ý rằng, v là một tập mờ để tiện theo dõi kết quả tính toán, các bộ trong t.A  v nên  = t.A  v là một quan trong quan hệ PATIENT được đánh số hệ mờ. Vì vậy  cũng là một tập mờ. Cụ theo thứ tự xuất hiện của chúng trong Bảng thể  là tập mờ mà hàm thành viên của nó 4.1.1. có đối số là các bộ t của R. Với mỗi t  R, 114 Bảng 4.1.1. Di n dịch biểu thức chọn mờ trên uan hệ PATIENT t intR,r,t(E1) intR,r,t (E2) t1 min(0.9, 0.0) = min(min(0.9, 0.0), )=0 t2 min(0.5, 0.4) = 0.4 min(min(0.5, 0.4), )=0 t3 min(1.0, 0.93) = 0.93 min(min(1.0, 0.93), 1.0 ) = 0.93 Bây giờ, phép chọn trong FRDB được Ví dụ 4.1.3 Xét quan hệ r = PATIENT mở rộng từ phép chọn trong CSDL quan hệ trong cơ sở dữ liệu các bệnh nhân ở Ví dụ truyền thống như sau. 3.2.3, truy vấn “Tìm tất cả bệnh nhân trẻ và Định nghĩa 4.1.3 Giả sử R(U, ) là một có tiền sử bệnh viêm gan” có thể được thực lược đồ quan hệ mờ FRDB, r là một quan hiện bởi phép chọn = (PATIENT) với  = “x.AGE  young  hệ trên R và  là một điều kiện chọn trên x.MEDICAL_HISTORY= hepatitis”. biến bộ x. Phép ch n trên r theo , được ký Phép chọn được thực hiện bằng cách hiệu (r), là một quan hệ mờ trên R, kiểm tra sự thỏa mãn của tất cả các bộ bao gồm tất cả các bộ t được định nghĩa trong PATIENT đối với điều kiện chọn . Từ Ví dụ 4.1.2 ta dễ dàng thấy chỉ có bộ t3 bởi: thỏa mãn  với giá trị hàm thành viên là r’=t  r | intR,r,t() 0  r’(t)=intR,r,t() 0.93. Vì vậy kết quả phép chọn là quan hệ Một cách đơn giản hơn, (r) = {t  r | r’ như trong Bảng 4.1.2. intR,r,t() 0}. Bảng 4.1.2. Quan hệ r’= (PATIENT) PATIENT_ID PATIENT_NAME AGE WEIGHT MEDICAL_HISTORY  PT007 T. T. Tu 21 65 Hepatitis 0.93 4.2. Phép hợp, giao và tr r và s, kí hiệu là r  s, là một quan hệ mờ Sử dụng các phép toán trên các tập hợp trên R bao gồm các bộ t được định nghĩa mờ trong Định nghĩa 2.3.1 chúng tôi mở bởi rộng các phép toán hợp, giao và trừ các r  s = {t | rs(t)=max(r(t), s(t))}. quan hệ trong CSDL truyền thống thành Ví dụ 4.2.1 Giả sử hai quan hệ các phép toán hợp, giao và trừ các quan hệ DIAGNOSE1 và DIAGNOSE2 trên lược đồ trong FRDB như các định nghĩa dưới đây. quan hệ DIAGNOSE(PATIENT_ID, Định nghĩa 4.2.1 Giả sử r và s là hai quan DISEASE, COST, ) như trong các Bảng hệ mờ trên cùng một lược đồ R(U,). Phép 4.2.1, 4.2.2. Khi đó hợp của chúng là quan hợp (union) của hai quan hệ hệ DIAGNOSE được tính toán như trong Bảng 4.2.3. 115 Bảng 4.2.1: Quan hệ DIAGNOSE1 PATIENT_ID DISEASE COST  PT005 Tuberculosis 300 0.7 PT006 Hepatitis 30 0.5 Bảng 4.2.2: Quan hệ DIAGNOSE2 PATIENT_ID DISEASE COST  PT005 Tuberculosis 300 0.3 PT006 Hepatitis 30 0.8 PT017 Cirrhosis 70 0.4 Bảng 4.2.3: DIAGNOSE = DIAGNOSE1  DIAGNOSE2 PATIENT_ID DISEASE COST  PT005 tuberculosis 300 0.7 PT006 hepatitis 30 0.8 PT017 cirrhosis 70 0.4 các tính chất của các phép toán đại số quan Định nghĩa 4.2.2 Giả sử r và s là hai quan hệ truyền thống. hệ trên cùng một lược đồ R(U, ). Phép Sau đây là các định lý về các tính chất giao (intersection) của hai quan hệ r và s, của các phép toán đại số trên FRDB được kí hiệu là r  s, là một quan hệ trên R bao chúng tôi mở rộng từ các tính chất của các gồm các bộ t được định nghĩa bởi phép toán đại số quan hệ truyền thống. r  s = {t | rs(t) = min(r(t), s(t))}. Định lý 4.3.1 Giả sử r là một quan hệ mờ Định nghĩa 4.2.3 Giả sử r và s là hai quan trên lược đồ R(U, ) trong FRDB. Gọi 1 hệ mờ trên cùng một lược đồ R(U,). Phép và 2 là hai điều kiện chọn. Khi đó trừ (difference) của quan hệ r cho s, kí hiệu 1(2(r)) = 2(1(r)) = 12(r) (1) là r – s, là một quan hệ trên R bao gồm các bộ t được định nghĩa bởi Với giả thiết trong 12(r) các điều r–s = {t | rs(t) = min(r(t), 1-s(t))}. kiện chọn 1 và 2 là có cùng một biến bộ. 4.3. n c ất của c c p ép t n đại s Chứng minh Đặt s = 2(r), ta có Như đã thấy ở các phần trên, mô hình 1(2(r))=ts  intR,s,t(1)0 FRDB được mở rộng từ mô hình CSDL (Định nghĩa 4.1.3) quan hệ truyền thống cả về biểu diễn dữ =tr intR,r,t(2)0 intR,s,t(1)0} liệu và các phép toán đại số quan hệ. Hệ =tr intR,r,t(2)0  intR,r,t(1)0) quả logic là các tính chất của các phép toán (do sr) đại số trong FRDB cũng được mở rộng từ =trmin(intR,r,t(2), intR,r,t(1))0) (Định nghĩa 4.1.2) 116 =trintR,r,t(21)> 0) = 12(r). . KẾT LUẬN Từ đó hệ thức 1(2(r)) = 1 2(r) Trong bài báo này, chúng tôi đã giới được chứng minh. Hệ thức 2(1(r)) = thiệu một mô hình cơ sở dữ liệu quan hệ 2 1(r) được chứng minh tương tự. Vì 1 mờ, được gọi là FRDB, cùng với các phép toán đại số cơ bản như chọn, hợp, giao và  2  2  1 (phép hội trên tập các điều trừ để cho phép thao tác và truy vấn thông kiện chọn mờ cũng như trên mệnh đề có tin không rõ ràng, không chính xác. Mỗi tính giao hoán), nên 1  2(r) = 21(r). quan hệ FRDB là một tập mờ với mức độ Từ đó suy ra hệ thức 1(2(r)) = thành viên bộ trong khoảng [0,1], các uy 2(1(r)) và do đó 1(2(r)) = ấ ề (soft query) có thể được thực hiện 2(1(r)) = 12(r) bằng cách sử dụng các điều kiện chọn kết hợp với các giá trị tập mờ. Một số các tính Định lý 4.3.2 Nếu r1, r2 và r3 là các quan chất của các phép toán đại số trên FRDB hệ mờ trên cùng một lược đồ R(U, ) thì cũng được đề nghị và chứng minh. r1  r2 = r2  r1 (2) Trong các bước tiếp theo, chúng tôi (r1  r2)  r3 = r1  (r2  r3) (3) sẽ xây dựng các phép toán đại số khác như r1  r2 = r2  r1 (4) phép u (projection), phép tích (r1  r2)  r3 = r1  (r2  r3) (5) Descartes và phép k (join) các quan hệ để Chứng minh Các hệ thức trong định lý hoàn thiện mô hình FRDB. Ngoài ra, việc này được chứng minh như sau: phát triển một hệ quản trị cho FRDB với Do các phép toán giao và hợp các tập hợp, phép lấy min và max có tính giao hoán ngôn ngữ thao tác và truy vấn tựa SQL để và kết hợp nên từ các Định nghĩa 4.2.1 và hỗ trợ ườ sử d ầu u (end-user) 4.2.2 ta suy các hệ thức (2), (3), (4) và ( ). cũng là một nghiên cứu có nhiều ý nghĩa. TÀI LIỆU THAM KHẢO 1. Dubois, D., and Prade, (2009) H. Using fuzzy sets in flexible querying: why and how?. In Proceedings of the workshop on flexible query-answering systems (FQAS’1 ), Denmark, 89-103. 2. Codd, E.F. (1970) A Relational model of data for large shared data banks. Communications of the ACM, 13(6), 377-387. 3. Cubero, J.C., Medina, J.M., Pons, O., and Vila, M.A. (1999) Data summarization in relational databases through fuzzy dependencies. International Journal of Information Sciences, 121, 22-43. 4. Chakraborty, S. (2012) Codd s e o d ode d fuzzy o : approach to find the computer solution. International Journal of Advanced Technology & Engineering Research (IJATER), 2(4), 21-27. 117 5. Date C.J. (2008) An introduction to database systems. Addision–Wesley. 8th Edition. 6. Klir, G.J. and Yuan, B. (1994) Fuzzy sets and fuzzy logic -Theory and applications. Prentice Hall PTR. 7. Meng, X., Ma, Z.M., and Zhu, X. (2010) A Knowledge-based fuzzy query and results ranking approach for relational databases. Journal of Computational Information Systems, 6, 2037-2044. 8. Mishra, J., and Ghosh, S. (2012) A new functional dependency in a vague relational database Model. International Journal of Computer Applications, 39(8), 29-36. 9. Nguyen Cat Ho. (2006) A model of relational with linguistic data of hedge algebras- based semantics. In Proceedings of the 3rd National Symposium on Research, Development and Application of Information and Communication Technology (ICTrda’0 ) Hanoi-Vietnam, 145-156. 10. Petry, F.E. (1996) Fuzzy databases: Principles and applications. Kluwer Academic Publishers. 11. Yan, L., and Ma, Z.M. (2013) A Fuzzy probabilistic relational database model and algebra. International Journal of Fuzzy Systems, 15(1), 244-253. 12. Zadeh, L.A. (1965) Fuzzy sets. Information and Control, 8, 338-353. * Ngày nhận bài: 13/10/2014. Biên tập xong: /1/201 . Duyệt đăng: 10/1/201 . 118