BÁO CÁO "TÌM HIỂU MỘT SỐ PHƯƠNG PHÁP XÂY DỰNG MÔ HÌNH MỜ DỰA TRÊN TẬP DỮ LIỆU VÀO - RA VÀ VIỆC SỬ DỤNG TẬP MỜ LOẠI 2 RỜI RẠC "

Chia sẻ: Phạm Huy | Ngày: | Loại File: PDF | Số trang:11

Thêm vào BST

Báo xấu

48
lượt xem 5
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Trong những năm gần đây, mô hình hóa hệ thống mờ là một trong những công cụ mô hình hóa hệ thống nổi bật được sử dụng trong việc phân tích các dữ liệu theo dạng không chắc chắn, không rõ ràng. Khi sử dụng mô hình mờ để biểu diễn tri thức của con người, không phải lúc nào tri thức cũng có thể biểu diễn một cách tường minh bằng các luật mờ để đặt vào mô hình mờ mà nhiều khi chỉ có thể xem xét chúng qua việc đo lường các giá trị đầu vào-đầu...

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: BÁO CÁO "TÌM HIỂU MỘT SỐ PHƯƠNG PHÁP XÂY DỰNG MÔ HÌNH MỜ DỰA TRÊN TẬP DỮ LIỆU VÀO - RA VÀ VIỆC SỬ DỤNG TẬP MỜ LOẠI 2 RỜI RẠC "

J. Sci. & Devel., Vol. 11, No. 1: 75-84 Tạp chí Khoa học và Phát triển 2013, tập 11, số 1: 75-84 www.hua.edu.vn TÌM HIỂU MỘT SỐ PHƯƠNG PHÁP XÂY DỰNG MÔ HÌNH MỜ DỰA TRÊN TẬP DỮ LIỆU VÀO - RA VÀ VIỆC SỬ DỤNG TẬP MỜ LOẠI 2 RỜI RẠC Lê Thị Nhung*, Ngô Công Thắng* Khoa Công nghệ thông tin - Trường Đại học Nông nghiệp Hà Nội Email*: ltnhung@hua.edu.vn/ncthang@hua.edu.vn Ngày gửi bài: 20.12.2012 Ngày chấp nhận: 26.02.2013 TÓM TẮT Trong những năm gần đây, mô hình hóa hệ thống mờ là một trong những công cụ mô hình hóa hệ thống nổi bật được sử dụng trong việc phân tích các dữ liệu theo dạng không chắc chắn, không rõ ràng. Khi sử dụng mô hình mờ để biểu diễn tri thức của con người, không phải lúc nào tri thức cũng có thể biểu diễn một cách tường minh bằng các luật mờ để đặt vào mô hình mờ mà nhiều khi chỉ có thể xem xét chúng qua việc đo lường các giá trị đầu vào-đầu ra của hệ thống. Bài báo này sẽ trình bày về một số phương pháp xây dựng mô hình mờ dựa trên các tập dữ liệu vào - ra sử dụng tập mờ loại 1, sau đó xem xét phương pháp sử dụng tập mờ loại 2 rời rạc và ứng dụng của chúng. Từ khóa: Mô hình mờ, mô hình hóa hệ thống mờ, tập mờ loại 2 rời rạc. Exploring Some Fuzzy Modeling Methods Based on Input - Output Data Sets and Using Discrete Type 2 Fuzzy Sets ABSTRACT In recently years, fuzzy system modeling is one of the most prominent system modeling tools in analyzing the data in the form of uncertainty. When using fuzzy models to present human knowledge, the knowledge is not always be represented explicitly in the form of fuzzy IF-THEN rules placed in a fuzzy model. In various circumstances, it can only be seen through input-output data pairs of the system. This paper presents some methods of fuzzy system modeling based on input-output data sets and using discrete type 2 fuzzy sets. Keywords: Fuzzy Model, Fuzzy System Modeling, Discrete Type 2 Fuzzy Sets. tiềm thức (liên quan tới các tình huống mà các 1. ĐẶT VẤN ĐỀ chuyên gia biết những việc cần làm, nhưng lại Cùng với sự ra đời của lý thuyết tập mờ, các không thể diễn tả chính xác cách thực hiện mô hình mờ được xây dựng và áp dụng để giải chúng). Đối với tri thức có ý thức, các chuyên gia quyết nhiều bài toán thực tế trong các lĩnh vực diễ̃n tả nó bằng nhóm các luật mờ IF-THEN và thương mại, tài chính, quản lý,... (George đặt chúng vào trong các mô hình mờ. Đối với tri Bojadjev et al., 2007). Với ưu điểm nổi trội trong thức tiề̀m thức, các chuyên gia chỉ có thể minh việc biểu diễn các yếu tố không đầy đủ, không rõ họa, chỉ ra những gì họ làm trong một số tình ràng, không chắc chắn, các mô hình mờ là lựa huống điển hình, khi đó họ được xem như một chọn thích hợp trong các bài toán nhận dạng hệ hộp đen và được đo lường các đầu vào và các đầu thống mà đầu ra phụ thuộc vào các yếu tố khó ra, từ đó thu được một tập hợp các cặp dữ liệu được định lượng một cách chính xác hoặc hàm vào - ra. Bằng cách này, các tri thức tiềm thức ánh xạ giữa đầu vào - đầu ra rất phức tạp, khó có được chuyển đổi thành một tập các cặp vào - ra. thể xây dựng một cách tường minh. Khi sử dụng Vấn đề đặt ra là phải xây dựng được các mô hình mô hình mờ để diễ̃n tả tri thứ́c của con người, cần mờ từ các cặp dữ liệu vào - ra đó. lưu ý hai dạng tri thức: tri thức có ý thức (có thể̉ Trong khuôn khổ bài báo này, nhóm tác giả diễ̃n tả bằng lời một cách rõ ràng) và tri thức trình bày một số vấn đề tổng quan về cấu trúc 75
Một số phương pháp xây dựng mô hình mờ dựa trên tập dữ liệu vào-ra và việc sử dụng tập mờ loại 2 rời rạc của mô hình mờ, các phương pháp xây dựng mô nguyên tắc logic mờ được sử dụng để kết hợp các hình mờ dựa trên các tập dữ liệu vào - ra sử luật mờ IF-THEN trong cơ sở luật mờ thành dụng tập mờ loại 1, sau đó trình bày phương một ánh xạ từ một tập mờ A' nằm trong U tới pháp xây dựng mô hình mờ sử dụng tập mờ loại một tập mờ B' nằm trong V. Ở đây, mỗi một luật 2 rời rạc và xem xét ứng dụng của chúng. mờ IF-THEN được hiểu như là một quan hệ mờ trong không gian tích vào - ra U V. 2. CẤU TRÚC CỦA MỘT MÔ HÌNH MỜ Module mờ hóa (hay giao diện mờ hóa): thực hiện việc chuyển đổi các đầu vào rõ thành mức Trong thực tế, cấu trúc của một mô hình thông thường bao gồm: đầu vào (input), đầu ra độ trực thuộc các giá trị ngôn ngữ. Mờ hóa được (output) cùng với một bộ xử lý. Bộ xử lý thực định nghĩa như là một ánh xạ từ một điểm giá chất là một ánh xạ phản ánh sự phụ thuộc của trị thực x*  U  R n tới một tập mờ A' trong U. biến đầu ra của hệ thống đối với các biến đầu Module khử mờ (hay giao diện khử mờ): vào. Đối với mô hình mờ, các yếu tố đầu vào thực hiện chuyển đổi kết quả suy diễn mờ thành nhận giá trị số rõ, còn đầu ra có thể là một tập giá trị đầu ra rõ ràng. Khử mờ được định nghĩa mờ hoặc một giá trị số rõ. Quan hệ ánh xạ của như là một ánh xạ từ tập mờ B' nằm trong đầu ra đối với các đầu vào của mô hình mờ được V  R (đầu ra của cơ chế suy diễn mờ) tới điểm mô tả bằng một tập luật mờ, thay vì một hàm số rõ y* V . tường minh. Thông thường, một mô hình mờ tổng quát sẽ có nhiều đầu vào và nhiều đầu ra, 3. XÂY DỰNG MÔ HÌNH MỜ DỰA TRÊN tuy nhiên, một mô hình nhiều đầu ra luôn có thể được chia thành một tập các mô hình một TẬP DỮ LIỆU VÀO- RA SỬ DỤNG TẬP MỜ đầu ra nên ở đây chúng ta chỉ xem xét trường LOẠI 1 hợp nhiều đầu vào - một đầu ra. Cụ thể, cấu Khi xây dựng mô hình mờ để giải quyết các trúc cơ bản của một mô hình mờ bao gồm 5 bài toán thực tế, không phải lúc nào cơ sở tri thành phần (Li-Xin Wang, 1996): thức cũng được tích lũy sẵn từ kinh nghiệm của Cơ sở luật mờ: gồm một tập các luật mờ chuyên gia và phát biểu dưới dạng các luật, các IF-THEN, là thành phần cốt lõi của mô hình mờ quy tắc mà trong nhiều trường hợp chúng ta theo ý nghĩa tất cả các thành phần khác trong mô phải tích lũy, tổng hợp và hoàn thiện cơ sở tri hình mờ được sử dụng để thực thi các luật mờ này thức từ các thực nghiệm trên các hệ thống thực một cách hợp lý và hiệu quả. Cụ thể, các luật mờ (thông qua tập dữ liệu vào - ra đo được). IF-THEN có dạng: Xét bài toán: Cho N cặp dữ liệu vào - ra: Ru(l ) : IF x1 is A1l and ... and xn is An , THEN y is Bl l ( x0p , y0p ), p 1,2,..., N , trong đó: l l Trong đó: Ai và B là các tập mờ có các tập nền x0p  U  [1 , 1 ]...[ n , n ]  R n Ui  R và V R tương ứng, và x = và y 0p  V  [ y ,  y ]  R .  x1, x2 ,..., xn T U và y  V là các biến (ngôn ngữ) Mục tiêu đặt ra là cần thiết kế được một mô đầu vào và đầu ra tương ứng của mô hình mờ. hình mờ f(x) dựa trên N cặp dữ liệu vào - ra này. Bộ tham số mô hình: quy định hình dạng Một số phương pháp sử dụng lý thuyết tập mờ loại hàm thuộc của giá trị ngôn ngữ được sử dụng để 1 được đưa ra dưới đây (Li-Xin Wang, 1996). biểu diễn các biến mờ và các luật mờ. Giá trị các tham số có thể được đánh giá bằng kinh nghiệm 3.1. Phương pháp bảng tra cứu của các chuyên gia hoặc là kết quả của quá Ý tưởng của phương pháp này là sinh các trình khai phá tri thức từ thực nghiệm. luật mờ IF-THEN từ các cặp dữ liệu đầu vào- Cơ chế suy diễn: có nhiệm vụ thực hiện thủ đầu ra, sau đó xây dựng mô hình mờ từ các luật tục suy diễn mờ dựa trên cơ sở tri thức và các này dựa theo những lựa chọn nhất định của bộ giá trị đầu vào để đưa ra một giá trị dự đoán ở suy diễn mờ, mờ hóa, và khử mờ. Quá trình thực đầu ra. Trong một cơ chế suy diễn mờ, các hiện gồm các bước sau: 76
Lê Thị Nhung, Ngô Công Thắng Bước 1. Xác định các tập mờ bao phủ các n không gian dữ liệu đầu vào và đâu ra. Cụ thể, đối D  rule    x    y   i 1 Aij * p 0i Bl * p 0 p (3) với từng căp i , i  , i = 1, 2, ..., n, xác định Ni tập j Bước 4. Tạo cơ sở luật mờ. Các cơ sở luật mờ mờ Ai (j = 1, 2, ..., Ni) là đầy đủ trong i , i  (tức bao gồm các tập luật sau đây: j là, đối với bất kỳ xi  i , i  , sẽ tồn tại Ai mà Tập các luật được sinh ra trong Bước 2 mà  A j ( xi )  0 ); tương tự, xác định Ny tâp mờ Bj (j = 1, không mâu thuân với bất kỳ luật nào khác; i Tập luật được sinh từ nhóm luật mâu thuân 2, ..., Ny), là đầy đủ trong  y ,  y  .   mà nó có mức độ tin cậy lớn nhất; Bước 2. Sinh một luật từ một cặp dữ liệu Tập các luật ngôn ngữ từ các chuyên gia vào - ra. Với mỗi cặp vào - ra ( x01 ,..., x0 n ; y0 ) , p p p (nhơ các tri thức có ý thức). p Bước 5. Xây dựng mô hình mờ dựa trên cơ xác định các giá trị độ thuộc của x0i (i = 1, 2, ..., sở luật mờ. Có thể sử dụng phương pháp bất kỳ j n) trong các tập mờ Ai : (j = 1, 2, ..., Ni) và các để xây dựng mô hình mờ dựa trên cơ sở luật mờ p được tạo từ Bước 4. Ví dụ, có thể chọn mô hình giá trị độ thuộc của y0 (i = 1, 2, ..., n) trong các l mờ với cơ chế suy n dạng tích (product tập mờ B : (l = 1, 2, ..., Ny). Tức là, thực hiện inference), mờ hóa duy nhất (singleton p tính toán:  A j ( x0 i ) vơi j = 1, 2, …, Ni , với i = 1, fuzzifier), và khử mờ trọng tâm (center of i p 2, …, n và Bl ( y0 ) vơi l = 1, 2, ..., Ny . Sau đó, gravity defuzzifier). vơi mỗi biến đầu vào xi (i = 1, 2, ..., n), xác định 3.2. Phương pháp đệ quy bình phương tối thiểu p các tập mờ mà tại đó x0i có giá trị độ thuôc lớn Phương pháp này sử dụng một thuật toán nhất, tức là, xác định Aij * mà huấn luyện làm cực tiểu tổng các sai số kết hợp  A j * ( x0pi )   A j ( x0pi ) với j = 1, 2,..., Ni. Tương tự, Jp cho tất cả các cặp đầu vào - đầu ra đến p, i i nghĩa là mô hình mờ f(x) được cực tiểu hóa: l p p xác định B * mà  Bl * ( y0 )   Bl ( y0 ) với l = 1, 2, p 2 ..., Ny. Cuối cùng, thu được một luật mờ dạng: Jp     j 1  f x0j  y0j    (4) j j IF x1 is A1 * and … and xn is An * , THEN Bước 1. Giả sử rằng l is B * (1) U   1 , 1   ...   n ,  n   R . n Đối với mỗi Bước 3. Chỉ định một mức độ cho từng luật l được sinh trong Bước 2. Giả sử rằng luật mờ ở  i , i  (i = 1, 2, ..., n), xác định Ni tập mờ Ai i : Bước 2 được tạo ra từ cặp vào - ra ( x0 , y0 ) , khi p p (li = 1, 2, ..., Ni), hoàn toàn thuộc trong i ,  i  . đó mức độ tin cậy của nó được định nghĩa là: l Giả sử, chọn Ai i là các tập mờ dạng giả hình n D  rule    x    y  Ai j * p 0i Bl * p 0 (2) i i  thang:  Ali  xi    Ali xi ; aili , bili , cili , dili  i đó: i 1 a1  bi1  i , cij  aij 1  di j  bij 1 vơi j = 1, 2, …, i Nếu các cặp vào - ra có mức độ tin cậy khác nhau và chúng ta có thể xác định một số để Ni - ciNi  diNi  i . đánh giá nó, khi đó ta có thể kết hợp thông tin Bước 2. Xây dựng mô hình mờ từ nhóm này vào thành mức độ tin cậy của các luật. Cụ N thể, giả sử cặp vào - ra ( x0 , y0 ) có mức độ tin p p N i 1 i các luât mờ IF-THEN: cậy  p  0,1 , khi đó mức độ tin cậy của luật IF x1 is Al1 and ... and xn is Anjn , THEN y is Bl1...ln (5) 1 p p được sinh bởi ( x0 , y0 ) sẽ được định nghĩa lại: Trong đó, li  1, 2,..., N i , i  1, 2,..., n B l1 ...ln l1 ...ln là tập mờ bất kỳ với trọng tâm tại y là tự do thay đôi. Cụ thể, chúng ta chọn mô hình mờ với cơ 77
Một số phương pháp xây dựng mô hình mờ dựa trên tập dữ liệu vào-ra và việc sử dụng tập mờ loại 2 rời rạc chế suy diễn dạng tích, mờ hóa duy nhất và khử l1 ...ln các tham số y bằng các thành phầ̀n tương mờ trọng tâm. Mô hình mờ được thiết kế là: ứng trong  ( p ) . N1 n Nn   l1 ...ln ... y     i 1 i  Ali ( xi )    3.3. Phương pháp sử dụng kỹ thuật l 1 l n  1 f  x  1   (6) N1 Nn  n  phân cụm ...  l1 1 ln 1  i 1 i    Ali  xi    Phương pháp này xem số lượng các luật   trong mô hình mờ như một tham số thiết kế và l1 ...ln trong đó y là các tham số tự do được xác định nó dựa trên các cặp đầu vào-đầu ra. thiết kế, và Aili được thiết kế trong Bước 1. Thu Giả sử có N cặp đầu vào - đầu ra ( x0 , y0 ) , l l  l1 ...ln với l = 1, 2, ..., N, N là nhỏ, ví dụ N = 20. Nhiệm thập các tham số tự do y vào trong vector n vụ đặt ra là phải xây dựng một mô hình mờ f(x) N i chiều: có thể phù hợp tất cả N cặp với độ chính xác tùy i 1 ý, có nghĩa là, với bất kỳ   0 cho trước thì T    y 1...1,..., y N11...1, y121...1,..., y N1 21...1,..., y1N2 ...Nn ,..., y N1N2 ...Nn  (7) l l f ( x0 )  y0   với mọi l = 1, 2, ... , N. T và viết lại công thức (6) thành: f ( x)  b ( x) (8) Mô hình mờ tối ưu được xây dựng từ N luật trong đó:  x  xl 2  với  Al  xi   exp    , trọng tâm của i 0i  x  (9) T b x   b  1...1  x ,..., b N11...1 121...1  x , b  x ,..., b N1 21...1  x  ,..., b 1N2 ...Nn  x ,..., b N1N2 ... Nn  2  n i       x  Aili i l b l1 ...ln  x  i 1 (10) B l là y 0 , sử dụng cơ chế suy diễn dạng tích, N1 Nn n   mờ hóa duy nhất, và khử mờ trọng tâm:  ...    x  Aili i l1 1 ln 1  i 1  N  x  xl 2  y0 exp   l 0  Bước 3. Chọn các tham số ban đầu  (0) theo  l 1    2   cách: Nếu có các luật ngôn ngữ f  x    (14) từ các chuyên gia (tri thức có ý thức) mà các N  x  xl 2  exp   0  phần IF của chúng nhất quán với các phầ̀n IF  l 1    2   l1...ln của công thức (5), khi đó chọn y (0) làm các   trọng tâm của các tập mờ phầ̀n kết luận THEN Bước 1. Bắt đầu với cặp đầu vào - đầu ra trong các luật ngôn ngữ này, nếu không, chọn 1 1 đầu tiên ( x0 , y0 ) , thiết lập một trọng tâm cụm  (0) tùy ý trong không gian đầu ra V  R (ví x1 tại x1 , và thiết lập A1 (1)  y1 , B1 (1)  1 . Chọn c 0 0 dụ, chọn  (0) = 0 hoặc các phần tử của  (0) một bán kính r. được phân bố đồng đều trên V). Bước 2. Giả sử rằng khi xem xét cặp đầu Bước 4. Đối với p = 1, 2, ..., tính toán các k k vào-đầu ra thứ k: ( x0 , y0 ) , với k = 2, 3, ..., ta đã tham số  bằng cách sử dụng thuật toán đệ có M cụm với các điểm trọng tâm tại quy bình phương tối thiểu: M k x1 , xc ,..., xc . Tính toán các khoảng cách của x0 2   p     p  1  K  p   y0p  bT x0p   p  1  (11)     c k l 1 tới M điểm trọng tâm của các cụm này, x0  xc , K  p  P p 1 b   b   P p 1 b  1  p x0 T  p x0 x0p (12) l = 1, 2, ..., M, và lấy các khoảng cách nhỏ nhất 1 P p  P p 1  P p 1 b   x0p bT (x0p)P(p 1)b(x0p) 1 bT x0p P p 1 (13)   k l là x0  xck , có nghĩa là, cụm gần nhất với x0 là k   trong đó:  (0) được chọn tại Bước 3, và P(0) = l xck . Khi đó: I trong đó  là một hằng số lớn. Mô hình mờ được thiết kế tuân theo dạng công thức (6) với 78
Lê Thị Nhung, Ngô Công Thắng k l a) Nếu x0  xck > r, thiết lập x0 như một k đủ. Một phương pháp khác cho phép tối ưu một số tham số xác định trước theo cách sử dụng điểm trọng tâm cụm mới M k xc 1  x0 , đặt một thuật toán huấn luyện để cập nhật các AM 1 (k )  y0 , B M 1  1 ; k giữ tham số cho phù hợp với một cặp vào - ra tại l l l l một thời điểm đó là phương pháp Hướng dốc A (k)  A (k 1), B (k)  B (k 1) với l = 1, 2, ..., M. Gradient (Li-xin Wang, 2004). Tuy nhiên, sự k l Nếu x0  xck  r , với l = 1, 2, ..., M và l  l k , thành công của phương pháp này phụ thuộc vào việc lựa chọn các tham số ban đầu. Nếu các ta làm như sau: tham số ban đầu là gần với các tham số tối ưu, Alk (k )  Alk (k 1)  y0 k (15) thuật toán có một cơ hội tốt để hội tụ về giải lk lk B (k )  B (k  1)  1 (16) pháp tối ưu ; nếu không, thuật toán có thể hội tụ l l về một giải pháp không tối ưu hoặc thậm chí và thiết lập: A (k )  A (k  1) (17) phân tán. Phương pháp Đệ quy bình phương tối l l B (k )  B (k  1) (18) thiểu đã khắc phục được nhược điểm trên nhờ k việc sử dụng một thuật toán huấn luyện làm cực Bước 3. Nếu x 0 không thành lập một cụm tiểu tổng các sai số kết hợp cho tất cả các cặp mới, khi đó mô hình mờ được thiết kế dựa trên k j j đầu vào-đầu ra đến p, và nhờ đó làm cho mô cặp đầu vào - đầu ra ( x0 , y0 ) , j = 1, 2, ..., k, là: hình mờ f(x) được cực tiểu hóa. Tuy nhiên, 2 M  x  xl  nhược điểm của nó là các tập mờ phần IF cũng A  k  exp    l c l 1       được cố định trong một giới hạn số lượng các   luật, do đó nếu có quá nhiều luật trả về trong fk  x   2 (19) một mô hình mờ phức tạp có thể là không cần M  x  xl  B l  k  exp    c thiết cho bài toán, trong khi nếu có quá ít các l 1       luật lại làm cho mô hình mờ yếu hơn và do đó   không đủ để đạt được mục tiêu. Phương pháp sử k Nếu x0 thiết lập một cụm mới, sau đó mô dụng kỹ thuật phân cụm nhờ việc xem số lượng hình mờ được thiết kế là: các luật trong mô hình mờ như một tham số  x  xl 2  thiết kế và xác định nó dựa trên các cặp đầu vào M 1 A  k  exp    c l - đầu ra nên cho phép xây dựng một mô hình l 1       mờ sát gần với mô hình mờ tối ưu. Tuy nhiên số fk  x     (20) 2 lượng các cụm (hay số lượng các luật) phụ thuộc M 1  x  xl  vào sự phân bố của các điểm đầu vào ở các cặp Bl  k  exp    c l 1       vào - ra và phụ thuộc vào bán kính r. Khi r là   lớn, số lượng các cụm là nhỏ, hệ thống mờ được Bước 4. Lặp lại bằng cách quay lại bước 2 thiết kế là đơn giản hơn nhưng nhiều khi lại với k = k + 1. không đủ mạnh. Để khắc phục những nhược điểm của các 3.4. Đánh giá các phương pháp xây dựng phương pháp trên, ý tưởng đưa ra là sử dụng mô hình mờ sử dụng tập mờ loại 1 tập mờ loại 2 để xây dựng mô hình mờ. Xét Các phương pháp xây dựng mô hình mờ sử phương pháp sử dụng tập mờ loại 2 rời rạc được dụng tập mờ loại 1 trên đều có những ưu-nhược trình bày dưới đây. điểm nhất định. Với phương pháp Bảng tra cứu, ưu điểm là đơn giản, dễ thực hiện, nhưng vì các 4. XÂY DỰNG MÔ HÌNH MỜ SỬ DỤNG TẬP hàm thuộc là cố định trong bước đầu tiên và không phụ thuộc vào các cặp dữ liệu vào - ra MỜ LOẠI 2 RỜI RẠC nên các hàm thuộc không được tối ưu hóa theo 4.1. Mô hình mờ sử dụng tập mờ loại 2 các cặp đầu vào-đầu ra và cơ sở luật mờ được rời rạc tạo ra bởi phương pháp này có thể là không đầy 79
Một số phương pháp xây dựng mô hình mờ dựa trên tập dữ liệu vào-ra và việc sử dụng tập mờ loại 2 rời rạc Theo Mendel (2001), tập mờ loại 2 đầy đủ các giá trị của các tham số suy diễn. Vì vậy, các FT2FS (Full Type 2 Fuzzy Sets) là một tập mờ mô hình mờ nhúng loại 1 sẽ được xác định cho m đặc trưng với một hàm thuộc mờ hơn là một giá giá trị khác nhau. Bộ các mô hình mờ nhúng trị vô hướng trong khoảng đơn vị, FT2FS A, loại 1 này sẽ đại diện cho mô hình mờ loại 2 rời được ký hiệu là Ã, có thể được hình thức hóa rạc. Vì vậy, cấu trúc cơ sở luật mờ loại 2 được đề như sau:  xuất, R có thể được hình thức hóa như sau: c* Ã  x, u , f x  u    | x  X , u  J x  0,1 (21)       R   ALSO Rir  , mr  m1 , ..., m NM  (24) trong đó, Jx là một tập con của khoảng đơn  i 1  vị, X  R NV là miền của x, u  J x là giá trị độ trong đó NM là số lượng các giá trị m được sử dụng trong cấu trúc nhận dạng. mr là mức độ thuộc chính kết hợp với x  X , fx(u) là hàm mờ thứ r của giá trị mờ, R ir là luật thứ i được thuộc thứ cấp ánh xạ từ giá trị độ thuộc chính xác định bởi việc thực thi giải thuật phân cụm lên khoảng đơn vị (fx(u): [0,1]  [0,1]) và NV là FCM với mr. R ir có thể được viết một cách rõ số các biến đầu vào trong mô hình hệ thống. ràng như sau: Theo Liang (2000), tập mờ loại 2 khoảng IVT2FS (Interval Type 2 Fuzzy Sets) được xem Rir : IF x  X isr Air THEN y Y isr Bir (25) như là một ánh xạ từ tập vũ trụ liên tục của một với i = l, ..., c*; r = l, ... , NM biến sang một khoảng trong đoạn [0,1]. Vì vậy, IVT2FS là một trường hợp đặc biệt của FT2FS 4.2. Phương pháp xây dựng mô hình mờ sử mà tại đó fx (u): [0,1]  1 và có thể được biểu dụng tập mờ loại 2 rời rạc diễn như sau: Theo Uncu et al. (2004), để xây dựng mô Ã   x, u,1 | x  X , uJ  0,1 x (22) hình mờ sử dụng tập mờ loại 2 rời rạc, cần nhận dạng cấu trúc thông qua việc xác định các tham Tập mờ loại 2 rời rạc DT2FS (Discrete Type số, sau đó tiến hành suy diễn mờ. 2 Fuzzy Sets) là một trường hợp đặc biệt của IVT2FS mà tại đó Jx là tập các giá trị thực với 4.2.1. Phân cụm dữ liệu với giải thuật FCM các phần tử hữu hạn: Thực thi giải thuật phân cụm FCM Ã   x,u,1 | x  X ,uu , u 0,1 (23) i i (Bezdek, 1973) để biểu diễn các tập mờ liên kết với  i = 1, ..., NM với các phần tiền đề và kết luận của các luật mờ. trong đó, NM là số lượng các giá trị độ thuộc Nhờ đó xác định các tâm cụm dữ liệu và độ được kết hợp với một giá trị đặc biệt x  X . thuộc của từng dữ liệu đối với từng cụm mờ. Từ Cũng theo Mendel (2001), để xây dựng các đó ta có thể gán nhãn cho mỗi cụm mờ để có thể mô hình mờ loại 2 rời rạc, phương án được đề sinh tập luật cơ sở dựa trên dữ liệu luyện tập xuất là sử dụng sự không chắc chắn trong việc dùng để huấn luyện mô hình. lựa chọn các tham số học của một phương pháp 4.2.2. Xác định cấu trúc mô hình mờ loại 2 học không giám sát như là nguồn của sự không rời rạc ứng với số cụm c chắc chắn về giá trị của các tham số suy diễn. Ở đó, phương pháp phân cụm mờ FCM (Fuzzy C- Kí hiệu ND và NV là số lượng dữ liệu và số Means Clustering) (Bezdek, 1973) được chọn lượng biến đầu vào tương ứng trong tập dữ liệu làm phương pháp xác định cấu trúc cơ bản của huấn luyện và kí hiệu mô hình hệ thống. Phương pháp FCM yêu cầu người dùng cung cấp số lượng cụm trong hệ r ,c r ,c r ,c rc  rc v i = vi ,1 , vi ,w , ..., vi ,,NV , vi ,,NV 1 thống, c*, và mức độ mờ m, xác định mức độ là tâm cụm thứ i xác định bởi việc thực thi chồng lấp giữa các cụm mờ. Sự không chắc chắn giải thuật phân cụm mờ FCM với mức độ mờ: mr (độ bất định) trong lựa chọn giá trị mức độ mờ,  M = {m1, …, mNM} để chia tập dữ liệu huấn m, được chọn làm nguồn không chắc chắn trong luyện ra thành c cụm, trong đó i = 1, ..., c; r = 1, 80
Lê Thị Nhung, Ngô Công Thắng ..., NM và c = cmin, ..., cmax. Khi đó, các tâm cụm số dự đoán nhỏ nhất cho véc tơ dữ liệu huấn của phần tiền đề NV chiều và cụm kết luận 1 luyện đầu vào thứ k, bảng tra cứu m sẽ được chiều (là tập mờ) thu được thứ i được kí hiệu xây dựng (Uncu and Turksen, 2003; Uncu et tương ứng là al., 2004): (29) viX , r , c   vir,1,c , vir,,wc , ..., vir,,NV  c  NM  mk  mr '  M | SE  yMod ,k   min SE  yMod ,k   k 1, ..., ND  r ',c*  r,c*    r 1    và  viY ,r ,c  vir,,NV 1 c . 4.2.5. Suy diễn mờ Bằng cách xác định viX,r,c và viY,r,c cho mỗi Cho một véc tơ dữ liệu đầu vào x’, giải thuật cặp (mr,c), mô hình mờ loại 2 rời rạc sẽ được xây suy diễn gồm các bước: dựng cho tất cả các trường hợp c = cmin, ..., cmax. Bước 1. Lựa chọn giá trị m tối ưu cho x’ (ký 4.2.3. Xác định số lượng cụm tối ưu hiệu là m’): Khi véc tơ dữ liệu đầu vào kiểm thử, r ,c Kí hiệu: y Mod , k là đầu ra của mô hình thu x’, được đưa vào mô hình, đầu tiên véc tơ dữ liệu được bởi véc tơ dữ liệu đầu vào thứ k trong tập huấn luyện đầu vào gần nhất theo phép đo dữ liệu huấn luyện bằng cách sử dụng mức độ khoảng cách được lựa chọn. Sau đó, mô hình mờ loại 1 tương ứng với giá trị m liên kết với véc tơ mờ mr và c là số lượng các luật; SE y Mod , k  r ,c  là dữ liệu huấn luyện đầu vào đã chọn sẽ được sử sai số dự đoán bình phương (Square prediction dụng: Error hay SE) thu được bằng cách sử dụng  ND  r ,c yMod ,k . Khi đó, với số lượng cụm của hệ thống   m '   m f | d x ', x f  min  d  x ', xk    (30) k 1   được cho ban đầu là c, đầu ra tối ưu của mô hình c với f  {1,..., ND} ; mf, m '  M và mf là giá cho véc tơ dữ liệu huấn luyện thứ k, yMod,k , trị mức độ mờ liên kết với véc tơ dữ liệu đầu vào được tính như sau: (26) NM huấn luyện thứ f trong bảng tra cứu m. Như  r ',c  c r ',c   r ,c yMod ,k   yMod , k | SE yMod , k  min  SE yMod , k    r 1       vậy, mô hình mờ loại 2 rời rạc đã được giảm loại sang loại 1 với bộ tham số suy diễn (viX,r*,c*, trong đó, c = cmin, ..., cmax, k = 1, ..., ND. CGir*,c* ), trong đó mr*= m’. Kí hiệu: SSE(c) là tổng sai số dự đoán bình Bước 2. Tìm mức độ đốt cháy cho mỗi luật phương thu được đối với số lượng cụm c cụ thể với véc tơ dữ liệu kiểm thử đầu vào đã cho x’: mô (Sum of Square prediction Error): ND 2 hình mờ loại 1 nhúng liên kết với giá trị mức độ c  SSE  c    yk  yMod , k k 1  mờ, được sử dụng để tìm ra một đầu ra với dữ liệu vào x’ đã cho. Mức độ đốt cháy của luật thứ c = cmin, ..., cmax. (27) i cho x’ được xác định: Khi đó, số lượng luật tối ưu c* được xác 1 2 định:     cmax   i  x '        c*  d x ', viX ,r *,c*   m r* 1   c*  cmin  p  cmax | SSE   p   cmin  SSE  c  c  (28)   X , r *,c*  j 1  d x ', v j   (31)  min      Đến đây, số lượng cụm tốt nhất c* đã được   chọn và tất cả các tham số tiền đề và kết luận Bước 3. Tìm kiếm tập mờ đầu ra của mô được xác định cho c* và cho các giá trị độ mờ hình cho mỗi luật bằng cách tính toán kết quả khác nhau, m M . của toán tử kéo theo (min) với mức độ đốt cháy được tính toán trong Bước 2 và các tập mờ đầu 4.2.4. Xây dựng bảng tra cứu m ra tương ứng. Giả định rằng tập mờ đầu ra của Ký hiệu mk là giá trị mức độ mờ tối ưu liên mỗi luật được biểu diễn bằng ma trận phân tán kết với mô hình mờ loại 1 nhúng cung cấp sai chứa NS giá trị mẫu đầu ra và các giá trị độ 81
Một số phương pháp xây dựng mô hình mờ dựa trên tập dữ liệu vào-ra và việc sử dụng tập mờ loại 2 rời rạc thuộc tương ứng trong mỗi luật. Vì vậy, tập mờ cứu m cho phép thực thi việc giảm loại cho mô đầu ra mô hình của luật thứ i, Bi*, sẽ được biểu hình mờ loại 2 ngay tại thời điểm bắt đầu quá diễn toán học với hàm thuộc µi*(y), có thể được trình suy diễn (xác định mô hình mờ loại 1 nhúng xác định như là tập các cặp có thứ tự: thích hợp nhất với một mẫu dữ liệu đã cho), do đó µi *  y    y ,min   x' ,   y  p i i p giảm bớt được chi phí tính toán cho phương pháp. Trong thực tế, mô hình mờ sử dụng tập mờ (32) trong đó µi*(yp) có thể được xác định bởi: loại 2 rời rạc đã được áp dụng trong nhiều bài 1  2  toán cụ thể và đạt hiệu quả cao. Một ví dụ điển  c* d  y p , viY , r *,c*  m r* 1  hình là trong bài toán dự đoán giá cổ phiếu của    d y µi y p         j 1 X , r *, c* p ,vj     Uncu et al. (2004) cho thấy, mô hình mờ sử   dụng tập mờ loại 2 rời rạc cho kết quả dự đoán (33) tốt hơn so với các mô hình khác như hệ thống Bước 4. Kết tập các tập mờ đầu ra của mỗi suy luận mờ thích nghi, mô hình hồi quy tuyến luật để tìm tập mờ đầu ra mô hình tổng thể. tính hay mạng nơron. Bằng cách sử dụng toán tử ALSO (max) và mô Trong quá trình tìm hiểu về mô hình này, hình Mamdani, đầu ra mô hình tổng thể có thể nhóm tác giả cũng đã tiến hành cài đặt thử được biểu diễn toán học với hàm thuộc µ*(y) được nghiệm với bài toán dự đoán ảnh hưởng của sâu xác định: bệnh hại lúa (diện tích lúa bị nhiễm bệnh) dựa    µ *  y   y p , max min i  x ' , i y p i 1..c*   , trên các yếu tố thời tiết. Với bài toán thử nghiệm này, các biến hệ thống ban đầu gồm: p = 1, …, NS (34) x1: Nhiệt độ trung bình Bước 5. Tìm đầu ra rõ của mô hình, y*, x2: Nhiệt độ thấp nhất bằng cách tính toán trọng tâm của tập mờ đầu x3: Nhiệt độ cao nhất ra mô hình theo công thức: NS x4: Độ ẩm trung bình y p 1 p i 1..c*   max min i  x '  , i y p    x5: Lượng mưa trung bình y*  (35) x6: Lượng bốc hơi trung bình NS  max  min    x ' ,   y  p 1 i 1..c* i i p x7: Ánh sáng x8: Tốc độ gió 4.3. Đánh giá phương pháp xây dựng mô x9: Hướng gió hình mờ sử dụng tập mờ loại 2 rời rạc y: Diện tích lúa bị nhiễm bệnh Có thể nhận thấy phương pháp xây dựng mô Tuy nhiên, theo kinh nghiệm của các hình mờ dựa trên tập dữ liệu vào - ra sử dụng tập chuyên gia, 3 biến x1, x4, x7 là các biến có ảnh mờ loại 2 rời rạc đã khắc phục được những nhược hưởng nhiều nhất đến đầu ra y của hệ thống và điểm của các phương pháp sử dụng tập mờ loại 1 được chọn làm các biến đầu vào. Khi thử nghiệm đã đề xuất trước đó. Việc thực thi giải thuật phân với bộ 48 véc tơ dữ liệu mẫu điều tra về ảnh cụm FCM cho phép xác định các tâm cụm dữ liệu hưởng của rầy nâu tại Hải Phòng, trong đó, 36 và độ thuộc của từng dữ liệu đối với từng cụm mờ, véc tơ dữ liệu đầu tiên được dùng làm dữ liệu từ đó có thể gán nhãn cho mỗi cụm mờ để có thể huấn luyện, 12 véc tơ dữ liệu cuối được dùng sinh tập luật cơ sở dựa trên dữ liệu luyện tập dùng làm dữ liệu kiểm thử (Bảng 1). để huấn luyện mô hình. Bên cạnh đó nhờ việc xác Sau khi thực hiện việc xác định cấu trúc mô định đầu ra tối ưu của mô hình cho mỗi véc tơ dữ hình hệ thống, số cụm tối ưu thu được là c* = 6, liệu huấn luyện, tổng sai số dự đoán bình phương Sau khi thiết lập bảng tra cứu m, nhập bộ dữ thu được đối với số lượng cụm c xác định là hoàn liệu kiểm thử, sai số bình phương tính được là toàn tính được, từ đó cho phép xác định số lượng RMSE = 2,8468, Thử nghiệm với véc tơ dữ liệu cụm tối ưu. Việc kết hợp phương pháp Bảng tra kiểm thử (25,3; 29,8; 0,8; 16) thu được sai số đầu 82
Lê Thị Nhung, Ngô Công Thắng ra của mô hình là 0,57932, giá trị độ mờ liên kết Các kết quả thu được theo dữ liệu kiểm thử với véc tơ dữ liệu huấn luyện gần nhất với véc tơ cho thấy mô hình mờ đã xây dựng cho phép dự dữ liệu kiểm thử là 1,94. đoán kết quả đầu ra (diện tích lúa bị nhiễm bệnh) tương đối chính xác. Bảng 1. Dữ liệu mẫu khi điều tra ảnh hưởng của rầy nâu hại lúa tại Hải Phòng x1 x4 x7 y x1 x4 x7 y x1 x4 x7 y 27,2 82 6,2 69 26,1 83 7,8 69 25 84 9 69 24,7 82 3,7 30 26,6 89 9,3 10 24,7 50 7,5 30 24,4 82 3,7 30 25,7 90 9 9 24,3 58 9 69 26,7 86 0,7 30 24,2 87 0 68 27,9 78 4,9 75 23,9 94 0,3 30 26,8 89 2,6 75 27,1 83 6,2 69 28,4 79 9,2 30 25 91 1,7 80 26,2 83 7,8 69 31,3 65 8,8 180 21,5 58 7,4 80 26,7 88 9,2 10 28,3 80 6,1 180 25,4 83 0,8 16 25,5 90 9 9 25,9 91 2,7 180 26,5 81 4,6 30 24,3 87 0 68 28,4 82 7,5 10 28,6 76 9,3 180 26,7 90 2,7 75 30 78 8,8 10 29,7 84 9,4 180 25,1 91 1,7 80 29,3 88 9 10 27 83 7,9 80 21,8 58 7,3 80 27,5 85 9,1 20 29,5 85 7,5 75 25,3 82 0,8 16 24,1 92 0 20 26,7 69 8 40 26,6 81 4,7 30 25 81 0,2 20 28 70 4,5 60 28,7 76 9,3 180 26,8 81 1,3 69 26,5 77 7,9 80 29,6 85 9,5 180 83
Một số phương pháp xây dựng mô hình mờ dựa trên tập dữ liệu vào-ra và việc sử dụng tập mờ loại 2 rời rạc Hình 1. Kết quả thử nghiệm với bộ dữ liệu mẫu 5. KẾT LUẬN rạc cho các bài toán khác với bộ dữ liệu thử nghiệm lớn hơn, đồng thời xem xét kết hợp việc Việc xây dựng mô hình mờ dựa trên tập dữ đánh giá trọng số để xác định mức độ ảnh hưởng liệu vào - ra đã đáp ứng các yêu cầu đặt ra của của các tham số đầu vào tới kết quả đầu ra dự các bài toán trong thực tế. Các phương pháp xây đoán của mô hình. dựng mô hình mờ sử dụng lý thuyết tập mờ loại 1 tuy đã đạt những hiệu quả nhất định song do bản thân lý thuyết tập mờ loại 1 vốn tiềm ẩn TÀI LIỆU THAM KHẢO mâu thuẫn (để biểu diễn sự không chắc chắn lại George Bojadjev, Maria Bojadjev (2007). Fuzzy logic sử dụng các độ thuộc mà bản thân chúng là các for Business, Finance, and Management, World Scientific Publishing Co. Pte. Ltd. số thực chính xác) nên các phương pháp xây Bezdek J. C. (1973). Fuzzy Mathematics in Pattern dựng mô hình mờ đã nêu vẫn còn một số hạn chế Classification, Ph.D. Thesis, Applied Mathematics (còn phụ thuộc vào việc lựa chọn các tham số ban Center, Comell University, Ithaca. Mendel J. M. (2001). Uncertain Rule-Based Fuzzy đầu, hàm thuộc chưa được tối ưu theo các cặp dữ Logic Systems: introduction and new directions”, liệu vào - ra, …). Việc sử dụng lý thuyết tập mờ Prentice, Upper Saddle River. loại 2 đã góp phần giải quyết vấn đề trên. Li-Xin Wang (1996). A course in Fuzzy sytems and control, Prentice Hall, Facsimile edition, pp. 89- Phương pháp xây dựng mô hình mờ sử dụng tập 118, 151-204. mờ loại 2 rời rạc là một minh chứng cho ưu điểm Ozge Uncu, I. B. Turksen and K. Kilic (June 2003). của tập mờ loại 2 so với tập mờ loại 1. LOCALM- FSM: A New Fuzzy System Modeling Trong tương lai, nhóm tác giả hy vọng có Approach Using a Two-step Fuzzy Inference Mechanism Based on Local Fuzziness Level thể tiếp tục xem xét ứng dụng của phương pháp Selection, Znternationol Fuzzy Systems xây dựng mô hình mờ sử dụng tập mờ loại 2 rời 84
Lê Thị Nhung, Ngô Công Thắng Association World Congress ZFSA’2003, pp. 191- Uncu O., Kemal Kilic, I.B. Turksen (2004). A New 194, Istanbul, Turkey. Fuzzy Inference Approach Based on Mamdani Uncu O. and I. B. Turksen (July 2003). A New Two- Inference Using Discrete Type 2 Fuzzy Sets, 2004 step Fuzzy Inference Approach Based on Takagi- IEEE International Conference on Systems, Man Sugeno Inference Using Discrete Type 2 Fuzzy and Cybernetics, 2272-2277. Sets, Proc. of 2Td Znternational Conference of Q, Liang and J. M. Mendel (2000). Interval Type-2 the North American Fuzzy Information Processing Fuzzy Logic Systems: Theoly and Design”, ZEEE Sociery, NAFZPS’2003, pp. 32-37, Chicago, USA. Tran, on Fuzzy Systems, 8 (9): 939-550 85