Xử lý ngôn ngữ tự nhiên tiếng Việt
-
Luận văn của tôi tập trung nghiên cứu cơ sở lý thuyết về xử lý ngôn ngữ tự nhiên (NLP-Natural Language Processing); các thuật toán học máy, mô hình mạng nơ-ron nhân tạo áp dụng cho phát hiện nội dung phản động như SVM (Support Vector Machine), MLP (Multi-layer Perceptron) và các phương pháp trích trọn đặc trưng của bài viết và bình luận tiếng Việt có nội dung phản động trên Facebook.
89p khanhchi0912 12-04-2024 8 4 Download
-
Luận án Tiến sĩ Kỹ thuật "Nghiên cứu các phương pháp học máy cho trích xuất thông tin tự động từ văn bản" trình bày các nội dung chính sau: Tổng quan về trích xuất thông tin tự động từ văn bản; Trích xuất khía cạnh và phân loại quan điểm cho tiếng Việt tận dụng nguồn dữ liệu đã được gán nhãn từ ngôn ngữ khác; Trích xuất thực thể và quan hệ trong văn bản pháp quy tiếng Việt sử dụng học máy truyền thống và học sâu.
158p vilazada 02-02-2024 12 2 Download
-
Bài viết "Tập dữ liệu tiếng Việt cho bài toán tìm câu hỏi tương đồng" trình bày một phương pháp xây dựng tập dữ liệu tiếng Việt cho bài toán tìm kiếm câu hỏi tương đồng.Tác giả xây dựng được 7911 cặp câu hỏi được gán nhãn. Đồng thời, tập dữ liệu này cũng được thử nghiệm đánh giá trên một số mô hình học máy cơ bản.
5p phuong798 26-12-2023 9 3 Download
-
Luận văn "Nhận diện cảm xúc trong văn bản tiếng Việt bằng mô hình máy học" được hoàn thành với mục tiêu nhằm mô hình giải quyết bài toán nhận diên cảm xúc trong văn bản tiếng việt phải được tối ưu về độ chính xác, hiệu suất thời gian thực hiện, giúp giải quyết các vấn đề còn mắc phải trong nhận diện cảm xúc khách hàng nói riêng và xử lý ngôn ngữ tự nhiên ở Việt Nam nói chung.
28p trankora03 05-08-2023 12 5 Download
-
Bài viết "Phương pháp tạo ra văn bản tiếng Việt có đề tài xác định" nghiên cứu và phát triển hệ thống điều khiển sinh văn bản tiếng Việt có đề tài xác định nhằm tạo ra trải nghiệm tương tác tốt giữa người và máy. Nghiên cứu của chúng tôi hướng đến việc tạo ra văn bản rõ ràng, mạch lạc và hơn hết là nó được áp dụng trên môi trường ngôn ngữ đặc thù - tiếng Việt. Phương pháp đề xuất điều khiển việc sinh văn bản mà không cần cập nhật các siêu tham số khi các chủ đề mới được thêm vào.
7p lieuyeuyeu18 23-12-2022 32 3 Download
-
Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 5b cung cấp cho học viên những nội dung về: phân tích cú pháp xác suất; kết hợp từ (bigrams pr); văn phạm phi ngữ cảnh xác suất; thuật toán CKY kết hợp xác suất; tìm kiếm kiểu chùm; nhập nhằng trong phân tích cú pháp tiếng Việt;... Mời các bạn cùng tham khảo chi tiết nội dung bài giảng!
41p duonghoanglacnhi 07-11-2022 23 3 Download
-
Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 7 cung cấp cho học viên những nội dung về: nghĩa từ vựng và phân giải nhập nhằng từ; từ đồng âm và phân loại từ đồng âm tiếng Việt; từ đa nghĩa, đồng nghĩa; các quan hệ khác trong WordNet; phân giải nhập nhằng sử dụng quan hệ từ vựng;... Mời các bạn cùng tham khảo chi tiết nội dung bài giảng!
61p duonghoanglacnhi 07-11-2022 21 3 Download
-
Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 3 cung cấp cho học viên những nội dung về: tách từ tiếng Việt; qui tắc cấu tạo từ tiếng Việt; các hướng tiếp cận; thuật toán so khớp từ dài nhất; tách từ sử dụng biểu thức chính qui; phân giải nhập nhằng;... Mời các bạn cùng tham khảo chi tiết nội dung bài giảng!
28p duonghoanglacnhi 07-11-2022 23 2 Download
-
Bài viết Giải pháp xây dựng kho ngữ liệu đa ngữ Việt - ÊĐê gán nhãn theo ngữ cảnh đề xuất giải pháp xây dựng kho ngữ liệu đa ngữ Việt-ÊĐê với phông chữ Unicode có xử lý nhập nhằng và từ đa ngữ nghĩa, bằng cách gán nhãn theo từng ngữ cảnh thuộc lĩnh vực giáo dục như giáo dục về chăn nuôi, trồng trọt, bảo vệ rừng, chăm sóc sức khoẻ,... cho các đồng bào các dân tộc thiểu số Việt Nam.
4p vikoenigsegg 29-09-2022 15 2 Download
-
Bài viết Phương pháp phân tách, nhận dạng tiếng nói trong tổng đài chăm sóc khách hàng trình bày một phương pháp để phân tách và nhận dạng lời nói của điện thoại và khách hàng trong một cuộc trò chuyện qua tổng đài chăm sóc khách hàng. Thông tin về tiếng nói được sử dụng để phân cụm các đoạn giọng nói thành hai cụm.
3p vimegwhitman 10-06-2022 17 2 Download
-
Bài viết "Ứng dụng xử lý ngôn ngữ tự nhiên trong dịch máy" đề xuất một mô hình nhận biết và rút trích tự động cụm danh từ song ngữ từ ngữ liệu song ngữ Anh-Việt, bằng các công cụ nổi tiếng như GIZA++ -2003 và GATE – 2005. Ngoài ra, bài viết cũng trình bày phương pháp xây dựng bảng từ và cụm từ song ngữ từ ngữ liệu song ngữ với các nét ngữ nghĩa, xác suất xuất hiện và luật chuyển đổi. Mời các bạn tham khảo.
14p thenthen19 03-06-2022 35 3 Download
-
Nội dung của bài viết này được trình bày theo bố cục như sau: Phần I giới thiệu chung. Phần II giới thiệu các công trình liên quan đến đánh giá độ khó văn bản. Phần III trình bày các phương pháp chúng tôi đề xuất. Phần IV nói về cách thu thập ngữ liệu. Phần V là thực nghiệm và kết quả. Cuối cùng phần VI kết luận lại vấn đề và hướng đi trong tương lai.
7p visherylsandberg 18-05-2022 43 3 Download
-
Bài viết đề xuất phương pháp xây dựng WordNet tiếng Việt chỉ dựa trên WordNet của 4 ngôn ngữ nguồn là Anh, Tây Ban Nha, Pháp, Nhật Bản; Một số cải tiến như sử dụng kho ngữ liệu TEDTalk, cải tiến phương pháp chọn lọc các tập từ đồng nghĩa (synset).
8p visherylsandberg 18-05-2022 45 2 Download
-
Trong nghiên cứu này đề xuất một mô hình làm tăng dữ liệu văn bản dựa trên các câu bình luận áp dụng cho ngôn ngữ tiếng Việt. Một số kỹ thuật cơ bản được sử dụng nhằm sinh thêm số lượng bình luận như chèn từ, thay thế từ, xóa từ. Kết quả thực nghiệm đã cho thấy hiệu quả của mô hình này.
8p viellenkullman 13-05-2022 57 3 Download
-
Bài viết này đề xuất phương pháp chẩn đoán bệnh từ thông tin mô tả triệu chứng bằng các phương pháp học sâu. Phương pháp bài báo này đề xuất dựa trên các kỹ thuật xử lý ngôn ngữ tự nhiên đối với tiếng Việt trong quá trình xây dựng kho dữ liệu huấn luyện hệ thống học sâu.
6p vistephenhawking 26-04-2022 17 2 Download
-
Trong bài viết này, trình bày một giải pháp xây dựng phần mềm để phát hiện đạo văn tiếng Việt dựa trên các bài toán xử lý ngôn ngữ tự nhiên tiếng Việt như tách câu, tách từ, gán nhãn từ loại, sinh tập từ khóa phục vụ cho việc phát hiện sự trùng lặp về nội dung, sản phẩm nghiên cứu phục vụ công tác quản lý đề tài khoa học quân sự.
4p vistephenhawking 26-04-2022 42 1 Download
-
Hiện nay trên thế giới đã có một số công trình nghiên cứu ứng dụng khai phá văn bản trong việc dự đoán thị trường chứng khoán cũng như biến động về giá. Tuy nhiên, ở Việt Nam chưa thực sự có nhiều nghiên cứu về khai phá văn bản (Textmining) ứng dụng trong tài chính cũng như xử lý ngôn ngữ tiếng Việt. Bài nghiên cứu là nguồn tham khảo khách quan và có giá trị cho các nhà quản lý và nhà đầu tư trong việc đưa ra các quyết định trên thị trường chứng khoán.
16p vikissinger 03-03-2022 55 9 Download
-
Bài viết giới thiệu một biểu diễn từ vựng theo ngữ cảnh bằng học sâu, mô hình hóa cả (1) đặc điểm phức tạp của việc sử dụng từ vựng (ví dụ: Cú pháp và ngữ nghĩa) và (2) cách sử dụng biểu diễn từ vựng này theo ngữ cảnh ngôn ngữ .
7p vialexanderfleming 09-02-2022 30 3 Download
-
Bài toán trả lời câu hỏi trực quan (VQA) là bài toán kết hợp thị giác máy tính và xử lý ngôn ngữ tự nhiên. Trong bài viết này, chúng tôi trình bày các chiến lược xây dựng bộ dữ liệu VQA mới bằng tiếng Việt, Flickr8k-ViQA, bằng cách sinh tự động các cặp câu hỏi – câu trả lời từ những chú thích của bộ dữ liệu Flickr8k.
10p vielonmusk 21-01-2022 53 2 Download
-
Nghiên cứu đã trình bày những nét chính về mặt ý tưởng, giải thuật; ưu, nhược điểm của một số giải thuật phân lớp dữ liệu được sử dụng phổ biến trong xử lý tiếng Việt như SVM, cây quyết định, giải thuật Bayes.
8p tomjerry008 11-12-2021 19 2 Download