
Thuật toán khai phá dữ liệu
-
Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application): Partitioning Method K-Means trình bày phương pháp phân cụm K-Means – một trong những thuật toán phổ biến nhất trong khai thác dữ liệu không giám sát. Bài thuyết trình giới thiệu nguyên lý hoạt động, quy trình thực hiện, cách chọn số cụm và tổng kết các đặc điểm của phương pháp. K-Means là công cụ hiệu quả để khám phá cấu trúc ẩn trong dữ liệu lớn.
37p
hoatrongguong03
15-05-2025
1
0
Download
-
Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application): Hierarchical Clustering tập trung trình bày các phương pháp phân cụm phân cấp trong khai phá dữ liệu. Nội dung bao gồm phân cụm kết tụ (agglomerative), phân cụm phân chia (divisive), đo lường độ tương đồng, thuật toán BIRCH và phương pháp phân cụm phân cấp xác suất. Đây là phương pháp quan trọng giúp khám phá cấu trúc phân cấp tự nhiên trong dữ liệu. Mời các bạn cùng tham khảo để biết thêm chi tiết!
32p
hoatrongguong03
15-05-2025
1
1
Download
-
Luận văn Thạc sĩ Kỹ thuật "Khai phá tri thức trong cơ sở dữ liệu phân tán" gồm các nội dung: Tổng quan về khai phá dữ liệu; Khai phá luật kết hợp trong cơ sở dữ liệu; Nghiên cứu các thuật toán khai phá luật kết hợp trong cơ sở dữ liệu phân tán.
87p
vijiraiya
26-04-2025
6
1
Download
-
Trong quá trình phát triển hệ thống dựa trên tri thức, việc biểu diễn tri thức là giai đoạn đầu tiên và rất quan trọng. Bài viết đề xuất thuật toán xây dựng các tri thức từ các nguồn dữ liệu, trong đó các cơ sở tri thức được biểu diễn bằng GBPA.
3p
vimaito
11-04-2025
1
1
Download
-
Bài viết FHNM: Thuật toán khai phá tập mục hữu ích cao từ cơ sở dữ liệu giao tác có giá trị hữu ích âm trình bày về khai phá tập mục hữu ích cao dựa trên ràng buộc về độ dài của tập mục; Đề xuất một thuật toán mới được xây dựng từ sự cải tiến của thuật toán FHM+ và FHN có tên là FHNM.
5p
vispyker
16-11-2022
22
3
Download
-
Các tác giả đã áp dụng và cải tiến mô hình, thuật toán khai phá dữ liệu để trích rút các luật kết hợp mờ. Các luật này cho phép đánh giá ảnh hưởng của quá trình học tập, giảng dạy ở cấp PTTH đến kết quả tuyển chọn vào Đại học, Cao đẳng trong những năm qua.
9p
bautroibinhyen17
13-02-2017
57
5
Download
-
Nghiên cứu khảo sát mối quan hệ liều – đáp ứng của vị thuốc Bạch thược dựa trên các RCTs nhằm cung cấp bằng chứng khoa học cho việc áp dụng hợp lý liều lượng Bạch thược trong thực hành lâm sàng giúp sử dụng thuốc hiệu quả, an toàn, kinh tế và hạn chế quá liều.
6p
viyamanaka
06-02-2025
2
1
Download
-
Nghiên cứu này sẽ tập trung phân tích, khai phá và tìm ra luật kết hợp dựa trên dữ liệu của quá khứ, từ đó đề xuất một số kiến nghị để hỗ trợ cho hoạt động kinh doanh của siêu thị được tối ưu hơn.
6p
vimichaeldell
04-12-2021
78
8
Download
-
Bài viết Phát hiện mẫu bất thường cho trong doanh nghiệp bán lẻ bằng phân tích motif khai phá motif cho chuỗi thời gian và phát hiện bất thường bằng thuật toán học máy rừng ngẫu nhiên được đề xuất. Một mô hình xác định các mẫu hành vi gian lận và phân loại các đối tượng trong bài toán phát hiện bất thường ở cấp độ tài khoản được mô hình hoá.
12p
vizenvo
02-12-2022
14
4
Download
-
Trong nghiên cứu này, quy trình phân khúc khách hàng được thực hiện bằng cách khám phá dữ liệu lịch sử giao dịch của khách hàng tại công ty bán lẻ trực tuyến, triển khai thuật toán phân cụm K-Means trên Spark cùng với việc áp dụng RFM (Recency: Lần truy cập gần đây, Frequency: Tần suất, Money: Tiền tệ). Để xác định số cụm tối ưu đã sử dụng phương pháp Elbow Method.
8p
gaupanda051
13-09-2024
18
2
Download
-
CHƯƠNG 1 Tổng quan về khai phá dữ liệu I. Khai phá dữ liệu (Data Mining) Khai phá dữ liệu (Data mining) là một khái niệm ra đời vào những năm cuối của thập kỷ 80. Nó bao hàm một loạt các kỹ thuật nhằm phát hiện ra các thông tin có giá trị tiềm ẩn trong các tập dữ liệu lớn trong thực tế. Về bản chất, khai phá dữ liệu liên quan đến việc phân tích các dữ liệu và sử dụng các kỹ thuật để tìm ra các mẫu hình có tính chính quy (regularities) từ các tập dữ liệu lớn...
31p
201630589
23-03-2013
225
64
Download
-
Báo cáo thực tập tốt nghiệp: Khai phá dữ liệu bằng cây quyết định và ứng dụng có cấu trúc gồm 3 chương với nội dung trình bày về công nghệ khai phá trí thức; các phương pháp khai phá dữ liệu bằng cây quyết định; cài đặt chương trình khai phá dữ liệu sử dụng cây quyết định. Tài liệu hữu ích với những bạn chuyên ngành Công nghệ thông tin và những bạn quan tâm tới lĩnh vực này.
45p
saucaca
24-07-2013
1076
165
Download
-
Đối với một tập các ví dụ/bản ghi ( instances/records) – gọi là tậộ ập ụ g ) gọ ập huấn luyện/học (training/learning set). Mỗi bản ghi được biểu diễn bằng một tập các thuộc tính, trong đó có một thuộc tính phân lớp (class attribute). Tìm/học một hàm cho thuộc tính phân lớp (hàm phân lớp) đối với các giá trị của các thuộc tính khác.
55p
phuonggm
30-09-2012
231
69
Download
-
Một số tên gọi khác của phương pháp học dựa trên các láng giềng gần nhất (Nearest neighbor learning) • Instance-based learning • Lazy learning • Memory-Memory based learning
78p
phuonggm
30-09-2012
241
67
Download
-
Học có giám sát (Supervised learning) Tập dữ liệu (dataset) bao gồm các ví dụ, mà mỗi ví dụ được gắn kèm với một nhãn lớp/giá trị đầu ra mong muốn. Mục đích là học (xấp xỉ) một giả thiết (vd: một phân lớp, một hàm mục tiêu,...) phù hợp với tập dữ liệu hiện có. Giả thiết học được (learned hypothesis) sau đó sẽ được dùng để phân lớp/dự đoán đối với các ví dụ mới.
35p
phuonggm
30-09-2012
158
40
Download
-
Hướng dẫn phân cụm các dữ liệu thuộc D thành các cụm,Các dữ liệu trong một cụm: “tương tự” nhau , Dữ liệu hai cụm: “không tương tự” nhau .Tiên đề phân cụm: Nếu người dùng lựa chọn một đối tượng d thì họ cũng lựa chọn các đối tượng cùng cụm . Với các cách sau đây bạn dễ dàng phân cụm theo các chức năng khác nhau, chúc các bạn thành công!
22p
duylong2091
27-12-2012
213
54
Download
-
Khai phá luệt kết hợp: Tìm tất cả mẫu phổ biến, kết hợp, tương quan, hoặc cấu trú nhanquả trong tập các mục hoặc đối tượng trong CSDL quan hệ hoặc các kho chứa thông tin khác. Mẫu phổ biến (Frequent pattern): là mẫu (tập mục, dãy mục…) mà xuất hiện phổ biến trong 1 CSDL [AIS93]
60p
duylong2091
27-12-2012
189
42
Download
-
Hướng dẫn Biểu diễn web bằng văn bản gồm các bước thật đơn giản để các bạn có thể thực hành dễ dàng hãy tham khảo các bước sao đây thứ nhất: Là bước cần thiết đầu tiên trong xử lý văn bản, Phù hợp đầu vào của thuật toán khai phá dữ liệt, Tác động tới chất lượng kết quả của thuật toán KHDL.
38p
duylong2091
02-01-2013
211
82
Download
-
Sự bùng nổ thông tin hiện nay do tác động của các siêu phương tiện và WWW. Các hệ thống truy vấn thông tin dựa trên việc phân nhóm, gom cụm (clustering) ra đời để làm tăng tốc độ tìm kiếm thông tin. Do sự biến động thường xuyên của thông tin nên các thuật toán clustering đang tồn tại không thể duy trì tốt các nhóm, cụm (cluster) trong một môi trường như thế. Vấn đề đặt ra là làm thế nào để cập nhật các cluster trong hệ thống mỗi khi thông tin được cập nhật thay vì phải thường xuyên...
35p
trinhvang
18-01-2013
125
23
Download
-
Mục tiêu cơ bản của chương 2 Luật kết hợp (Association Rules) thuộc bài giảng Khai phá dữ liệu trình bày về khái niệm cơ bản về luật kết hợp, thuật toán Apriori, tìm tập phổ biến tối đại với FP-Tree, phân loại luật kết hợp và tối ưu tập luật.
52p
thick_12
12-07-2014
151
31
Download
CHỦ ĐỀ BẠN MUỐN TÌM
