
Khai phá dữ liệu lớn
-
Bài thuyết trình Ứng dụng khai thác dữ liệu (Data Mining and Application): Partitioning Method K-Means trình bày phương pháp phân cụm K-Means – một trong những thuật toán phổ biến nhất trong khai thác dữ liệu không giám sát. Bài thuyết trình giới thiệu nguyên lý hoạt động, quy trình thực hiện, cách chọn số cụm và tổng kết các đặc điểm của phương pháp. K-Means là công cụ hiệu quả để khám phá cấu trúc ẩn trong dữ liệu lớn.
37p
hoatrongguong03
15-05-2025
1
0
Download
-
Nghiên cứu này đề xuất một mô hình quản lý siêu dữ liệu nhằm hỗ trợ hiện thực hóa tài liệu kết hợp trong môi trường dữ liệu lớn và hệ thống phân tán. Cách tiếp cận tập trung vào việc tổ chức, truy xuất và đồng bộ hóa thông tin từ nhiều nguồn dữ liệu khác nhau. Hệ thống hỗ trợ khả năng mở rộng và tích hợp linh hoạt giữa dữ liệu thô và tài liệu phân tích. Kết quả minh chứng khả năng ứng dụng trong quản lý tri thức và khai phá thông tin hiệu quả. Mô hình phù hợp với các nền tảng lưu trữ số và ứng dụng công nghệ ngữ nghĩa.
4p
vimaito
11-04-2025
1
1
Download
-
Bài viết này nghiên cứu đề xuất mô hình kiến trúc hệ thống cùng với các giải pháp hỗ trợ đánh giá và khuyến nghị dịch vụ du lịch dựa trên phương pháp khai thác ý kiến. Nghiên cứu này tiếp cận theo phương pháp khai phá dữ liệu theo chuẩn công nghiệp (CRISP-DM). Dữ liệu thực nghiệm nghiên cứu là những bình luận của du khách về các khách sạn tại các tỉnh và thành phố lớn tại Việt Nam, được thu thập tự động trên trang web Agoda. Mời các bạn cùng tham khảo!
15p
tunelove
12-06-2021
34
2
Download
-
Bài viết Giải pháp ứng dụng công nghệ big data hỗ trợ doanh nghiệp bán lẻ tại Việt Nam nghiên cứu dữ liệu lớn, phân tích dữ liệu lớn và giới thiệu về ứng dụng công nghệ dữ liệu lớn trong một số doanh nghiệp bán lẻ trên thế giới. Đồng thời, bài viết chỉ ra thực trạng ứng dụng dữ liệu lớn tại một số doanh nghiệp bán lẻ Việt Nam.
14p
vimulcahy
18-09-2023
25
6
Download
-
CHƯƠNG 1 Tổng quan về khai phá dữ liệu I. Khai phá dữ liệu (Data Mining) Khai phá dữ liệu (Data mining) là một khái niệm ra đời vào những năm cuối của thập kỷ 80. Nó bao hàm một loạt các kỹ thuật nhằm phát hiện ra các thông tin có giá trị tiềm ẩn trong các tập dữ liệu lớn trong thực tế. Về bản chất, khai phá dữ liệu liên quan đến việc phân tích các dữ liệu và sử dụng các kỹ thuật để tìm ra các mẫu hình có tính chính quy (regularities) từ các tập dữ liệu lớn...
31p
201630589
23-03-2013
225
64
Download
-
Mở đầu Khi bạn đang làm việc với lượng dữ liệu lớn, điều quan trọng là bạn hiểu rõ các quy tắc về các thực thể khác nhau có liên quan với nhau như thế nào. Thường phát hiện ra các quy tắc này là một quá trình phức tạp. Các quy tắc kết hợp rất đơn giản chỉ là chủ nghĩa hình thức có tác động mạnh đến các quy tắc mô tả các tập dữ liệu vì chúng biểu thị các thực thể nào có thể xuất hiện đồng thời với nhau. Một ví dụ truyền thống về...
23p
buncha_1
11-05-2013
115
9
Download
-
Một số khái niệm cơ bản về phần mềm – Phâǹ mềm là gì? – Vai tro ̀ của phần mềm – Đặc trưng của phần mềm – Thuộc tính của phần mềm • Công nghệ phần mềm là gì? – Khái niệm, đặc trưng – Lic̣ h sử • Khủng hoảng phần mềm • Một số quan điểm sai lệch.Phần mềm máy tính (Computer software) là: – Sản phẩm do các nhà phát triển phần mềm thiết kế và xây dựng • So sánh chương trình (program) và phần mềm (software) • Software bao gồm 3 phần: – Programs – Data structure • Internal structure • External structure – Documentation, procedures to setup and operate,.....
30p
thienthanoze
12-11-2012
171
29
Download
-
Các tiện ích thu thập dữ liệu tự động và công nghệ cơ sở dữ liệu lớn mạnh dẫn tới một lượng lớn dữ liệu được tích lũy và/hoặc cần được phân tích trong cơ sở dữ liệu, kho dữ liệu và trong các nguồn chứa dữ liệu khác.
40p
sakuraphuong
20-05-2013
205
63
Download
-
Mục tiêu nghiên cứu của đề tài "Phương pháp ẩn các tập mục có độ hữu ích cao trong cơ sở dữ liệu giao tác lớn" nhằm tìm hiểu các thông số đánh giá tính hiệu quả của các phương pháp ẩn tập mục có độ hữu ích cao nhạy cảm. Tiến hành cài đặt thử nghiệm phương pháp đề xuất, đánh giá dựa trên các thông số, so sánh với các phương pháp ẩn hiện có.
26p
trankora03
05-08-2023
16
4
Download
-
Mục tiêu nghiên cứu của đề tài là phát triển một số phương pháp khai phá dữ liệu trên dữ liệu có cấu trúc, tập trung vào dữ liệu biểu diễn cấu trúc dạng bảng và dạng đồ thị. Đối với dữ liệu dạng bảng, mục tiêu nghiên cứu là các bài toán giảm dư thừa dữ liệu, rút gọn thuộc tính, rút gọn đối tượng để thu được tập dữ liệu nhỏ hơn trong khi vẫn bảo toàn được tính chất rút gọn thuộc tính, sinh cây quyết định trong khai phá dữ liệu lớn.
135p
tabicani
13-09-2021
44
4
Download
-
Đề tài “Ứng dụng phân cụm dữ liệu trong quản lý bảo hiểm tại công ty Bảo Việt nhân thọ Hà Nội” ứng dụng thuật toán của phân cụm dữ liệu để đưa ra nhóm khách hàng có sự giống nhau là lớn nhất và từ đó có thể giúp cho các chuyên ra đưa ra các đánh giá về các mẫu khách hàng, trên cơ sở hồ sơ mua bảo hiểm gồm các thông tin độ tuổi, số tiền, số năm mua. Mời các bạn cùng tham khảo!
64p
heavysweetness
04-08-2021
48
8
Download
-
Luận văn này tìm hiểu về phụ thuộc hàm xấp xỉ và nghiên cứu thuật toán AFDMCEC, một thuật toán mới tìm các phụ thuộc hàm xấp xỉ trong các CSDL lớn dựa trên độ đo xấp xỉ. Thuật toán này sử dụng một số khái niệm trong lý thuyết thiết kế CSDL quan hệ, đặc biệt là các khái niệm phủ tối thiểu và lớp tương đương. Mời các bạn cùng tham khảo!
69p
heavysweetness
04-08-2021
23
3
Download
-
Data mining là lĩnh vực đóng vai trò quan trọng trong việc phân tích và quản lý dữ liệu. Dựa vào đó chúng ta có thể đưa ra những dự đoán cho kế hoạch tương lai. Trong thời buổi công nghệ ngày càng phát triển như hiện nay, việc áp dụng khoa học công nghệ thông tin vào quá trình xử lý và phân tích dữ liệu là vô cùng cần thiết. Data mining chính là một trong số đó. Mời các bạn cùng tham khảo tài liệu để nắm chi tiết hơn các nội dung nghiên cứu.
17p
khiemthocu
11-07-2021
194
20
Download
-
Luận văn Thạc sĩ Công nghệ thông tin: Khai thác mẫu tuần tự nén được thực hiện với nhiệm vụ nhằm mã hóa dữ liệu tuần tự bằng cách gán các codeword đối với các khoảng cách nhỏ, rồi từ đó tiến hành xử lý trên mẫu với khoảng cách lớn hơn, tính toán độ phức tạp của quá trình khai phá mẫu nén trên cơ sở dữ liệu tuần tự, nghiên cứu thuật toán GoKrimp để khai phá trực tiếp trên mẫu đã được nén dựa trên thuật toán tham lam. Mời các bạn cùng tham khảo.
59p
xusong
12-07-2021
62
4
Download
-
Mục đích của Luận văn này nghiên cứu và tìm hiểu một số nền tảng của hệ thống dữ liệu lớn. Tìm hiểu một số lĩnh vực phân tích tìm các giá trị của hệ thống dữ liệu lớn (thực chất là khai phá dữ liệu tìm các tri thức). Mời các bạn cùng tham khảo!
81p
monsterhunterer
15-06-2021
41
7
Download
-
Mục đích của Luận văn này là nghiên cứu và tìm hiểu một số nền tảng của hệ thống dữ liệu lớn. Tìm hiểu một số lĩnh vực phân tích tìm các giá trị của hệ thống dữ liệu lớn (thực chất là khai phá dữ liệu tìm các tri thức). Nghiên cứu và tìm hiểu một số thuật toán liên quan đến tập rút gọn (tập thuộc tính rút gọn bảo toàn thông tin phân lớp của bảng quyết định). Trên cơ sở này tiến hành xây dựng phần mềm thử nghiệm. Mời các bạn cùng tham khảo!
17p
monsterhunterer
15-06-2021
41
4
Download
-
Nội dung của bài tập lớn này với mục đích tìm hiểu và trình bày về một kỹ thuật trong khai phá dữ liệu để phân lớp dữ liệu cũng như tổng quan về khai phá dữ liệu. Mời các bạn cùng tham khảo tài liệu để nắm chi tiết hơn nội dung nghiên cứu.
22p
tuyetminhhb
19-03-2021
464
42
Download
-
Phân lớp dữ liệu là vấn đề lớn và quan trọng của khai phá dữ liệu. Cây quyết định là giải pháp hữu hiệu của bài toán phân lớp, nó bao gồm từ mô hình cho quá trình học đến các thuật toán huấn luyện cụ thể để xây dựng cây. Luận án tập trung nghiên cứu mô hình linh hoạt cho quá trình huấn luyện cây từ tập mẫu huấn luyện, nghiên cứu phương pháp xử lý giá trị ngôn ngữ và xây dựng các thuật toán học phân lớp dữ liệu bằng cây quyết định mờ đạt nhằm đạt hiệu quả trong dự đoán và đơn giản đối với người dùng. Để tìm hiểu rõ hơn, mời các bạn cùng xem và tham khảo.
120p
dtphuongg
10-09-2018
89
11
Download
-
Phân tích tương ứng được áp dụng rất rộng rãi trong rất nhiều lĩnh vực như phân tích dữ liệu kinh doanh, điều tra xã hội học, khai phá dữ liệu,…. CA cho phép phát hiện các tri thức tiềm ẩn trong khối lượng dữ liệu lớn một cách dễ dàng thông qua phương pháp trực quan hóa (sử dụng bản đồ các điểm).
23p
hoanglinh0808
13-06-2017
314
23
Download
-
Trong thời đại công nghệ thông tin hiện nay, sự phát triển của công nghệ kéo theo sự gia tăng rất lớn của lưu lượng thông tin lưu trữ và trao đổi. Do đó, yêu cầu về tổ chức lưu trữ và truy cập thông tin sao cho hiệu quả được đặt lên hàng đầu. Hướng giải quyết được đưa ra là tổ chức, tìm kiếm và phân loại thông tin một cách hiệu quả.
18p
thompilu
03-05-2017
273
45
Download
CHỦ ĐỀ BẠN MUỐN TÌM
