intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA

Chia sẻ: Nguyen Hai Bang | Ngày: | Loại File: DOC | Số trang:81

148
lượt xem
28
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Xử lý ảnh là một khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác, nhất là trên quy mô công nghiệp, song trong xử lý ảnh đã bắt đầu xuất hiện những máy tính chuyên dụng. Nhận dạng là một trong những bộ phận quan trọng của xử lý ảnh và đã được ứng dụng rất hiệu quả trong nhiều lĩnh vực khác nhau như y tế, quốc phòng, nghiên cứu vũ trụ. Mục đích của khóa luận này là nghiên cứu và áp dụng xử lý ảnh vào việc nhận dạng tự động phiếu điều...

Chủ đề:
Lưu

Nội dung Text: XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA

  1. KHÓA LUẬN TỐT NGHIỆP 1 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Trβêng ®¹i häc vinh Khoa c«ng nghÖ th«ng tin *********** Kho¸ luËn tèt nghiÖp ®¹i häc Xö lý tù ®éng phiÕu ®iÒu tra Gi¸o viªn híng dÉn : Lª V¨n B»ng. Sinh viªn thùc hiÖn : Lª V¨n Vinh Líp : 43A CNTT Vinh, 5-2006 -------- Lời nói đầu Xử lý ảnh là một khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác, nhất là trên quy mô công nghiệp, song trong xử lý ảnh đã bắt đầu xuất hiện những máy tính chuyên dụng. Nhận dạng là một trong những bộ ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  2. KHÓA LUẬN TỐT NGHIỆP 2 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA phận quan trọng của xử lý ảnh và đã được ứng dụng rất hiệu quả trong nhiều lĩnh vực khác nhau như y tế, quốc phòng, nghiên cứu vũ trụ. Mục đích của khóa luận này là nghiên cứu và áp dụng x ử lý ảnh vào vi ệc nhận dạng tự động phiếu điều tra. Từ đó làm nền tảng cho việc xây dựng và phát triển hệ thống tổ chức điều tra. Trong các cuộc điều tra, chúng tôi nhận thấy rằng: Việc xử lý k ết qu ả điều tra một cách thủ công thì rất tốn công sức, khả năng nhầm lẫn cao, đặc biệt là trong các cuộc điều tra quy mô lớn. Ví dụ: trong một cuộc điều tra dân số, số phiếu điều tra lên tới hàng trăm nghìn bản. N ếu công vi ệc x ử lý k ết qu ả điều tra được tự động hóa thì hiệu quả hơn rất nhiều. Trên thực tế đã có một số hệ thống nhận dạng được cứng hóa phục vụ cho một số mục đích nhất định như: các máy xác định k ết qu ả b ầu c ử t ổng thống ở Mỹ…Và cũng có những sản phẩm phần mềm nhận dạng như : nhận dạng kết quả chấm thi trắc nghiệm…Tuy vậy, những hệ thống này mang tính đặc thù cao, khó áp dụng đồng thời cho nhiều mục đích khác nhau. Do đó chúng tôi có ý tưởng xây dựng một hệ thống nhận dạng tự động phiếu điều tra nhằm mục tiêu có được một hệ thống nhận dạng dễ áp dụng, dùng chung, tốc độ nhanh, với độ chính xác cao. Mặc dù tôi đã hết sức cố gắng trong việc thu thập và nghiên cứu tài liệu, tìm hiểu ngôn ngữ cài đặt nhưng thời gian không cho phép và trình đ ộ còn hạn chế, bên cạnh đó thì tài liệu h ết sức nghèo nàn nên s ẽ không tránh kh ỏi sai sót. Vì vậy, tôi rất mong nhận được sự đánh giá đóng góp, bổ sung và khuy ến khích của thầy giáo hướng dẫn, các thầy cô giáo trong khoa Công Nghệ Thông Tin cùng các bạn để tôi có thể hoàn thành tốt khoá luận của mình. Cuối cùng tôi xin bày tỏ lòng biết ơn chân thành tới sự hướng dẫn và chỉ bảo tận tình của thầy giáo Lê Văn Bằng cùng các thầy cô giáo trong khoa Công Nghệ Thông Tin đã giúp đỡ trong quá trình thực hiện khoá luận này. ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  3. KHÓA LUẬN TỐT NGHIỆP 3 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Vinh, tháng 5 năm 2006. Sinh viên thực hiện: Lê Văn Vinh 43 A CNTT ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  4. KHÓA LUẬN TỐT NGHIỆP 4 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Tóm tắt Xử lý ảnh là một trong những lĩnh vực có nhiều ứng dụng thiết thực trong thực tế. Khoá luận này trình bày một ứng dụng của xử lý ảnh vào t ự động nh ận dạng phiếu trả lời trong các cuộc điều tra xã hội. Chúng tôi nhận thấy đây là một hệ thống có nhiều ý nghĩa th ực ti ễn và có khả năng ứng dụng cao. Khoá luận trình bày về hệ thống xử lý tự động phiếu điều tra, bao gồm các nội dung sau: Chương 1 trình bày cơ sở lý thuyết của xử lý ảnh, bao g ồm các khái ni ệm cơ bản, các kỹ thuật thông dụng trong xử lý và nhận dạng ảnh. Chương 2 đi sâu vào thiết kế phiếu điều tra và các thuật toán nhận dạng phiếu điều tra. Chương 3 khái quát về các chức năng của hệ thống xử lý phiếu điều tra. Chương 4 trình bày các kết quả thực nghiệm của quá trình thiết kế mẫu và nhận dạng phiếu trả lời câu hỏi điều tra. Chương 5 là chương kết luận, nêu một số thành quả thu được và hướng phát triển trong tương lai của đề tài. ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  5. KHÓA LUẬN TỐT NGHIỆP 5 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Chương 1: Các vấn đề cơ bản trong xử lý ảnh 1.1. Tổng quan về một hệ thống xử lý ảnh Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trước hết chúng ta sẽ xem xét các bước cần thiết trong xử lý ảnh. Lưu trữ Scanner Thu nhận Số hóa Phân tích Nhận dạng ảnh ảnh Camera Lưu trữ Hệ quyết định Hình 1.1. Các giai đoạn chính trong xử lý ảnh Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera. Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống ki ểu CCIR), nhưng cũng có thể là tín hiệu số hóa (loại CCD – Charge Coupled Devide). Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh, tranh được quét trên scanner. Chi tiết về quá trình thu nhận ảnh sẽ được mô tả trong mục 1.3. Tiếp theo là quá trình số hóa (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa b ằng l ượng hóa, tr ước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại. Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước hết là công việc tăng cường ảnh để nâng cao chất lượng ảnh. Do nh ững nguyên nhân khác nhau: có thể do chất lượng thiết bị thu nh ận ảnh, do ngu ồn sáng hay do nhiễu, ảnh có thể bị suy biến. Do vậy cần ph ải tăng c ường và khôi ph ục l ại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh g ần gi ống ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  6. KHÓA LUẬN TỐT NGHIỆP 6 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA nhất với trạng thái gốc – trạng thái trước khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng ảnh, trích chọn các đặc tính, v.v… Cuối cùng, tùy theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định khác. Các giai đoạn chính của các quá trình x ử lý ảnh có thể mô tả như hình 1.1. 1.2 Các vấn đề cơ bản trong xử lý ảnh Như đã đề cập trong phần giới thiệu, chúng ta đã th ấy được một cách khái quát các vấn đề chính trong xử lý ảnh. Để hiểu chi tiết hơn, trước tiên ta xem xét hai khái niệm (thuật ngữ) thường dùng trong xử lý ảnh, đó là Pixel (phần tử ảnh) và Grey level (mức xám), tiếp theo là tóm tắt các vấn đề chính. 1.2.1. Một số khái niệm • Pixel (Picture Element): phần tử ảnh Ảnh trong thực tế là một ảnh liên tục về không gian và v ề giá tr ị độ sáng. Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hóa ảnh. Trong quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và l ượng hóa thành ph ần giá trị mà về nguyên tắc bằng mắt thường không phân biệt được hai đi ểm k ề nhau. Trong quá trình này, người ta sử dụng khái niệm Picture element mà ta quen g ọi hay viết là Pixel – phần tử ảnh. Như vậy, một ảnh là m ột t ập h ợp các pixel. Ở đây cũng cần phân biệt khái niệm pixel hay đề cập đến trong các h ệ thống đồ họa máy tính. Để tránh nhầm lẫn ta tạm gọi khái niệm pixel này là pixel thiết bị. Khái niệm pixel thiết bị có thể xem xét như sau: khi ta quan sát màn hình (trong chế độ đồ họa), màn hình không liên tục mà gồm nhi ều đi ểm nh ỏ, g ọi là pixel. Mỗi pixel gồm một cặp tọa độ (x, y) và màu. ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  7. KHÓA LUẬN TỐT NGHIỆP 7 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA a. Ảnh với độ phân giải 72 dpi b. Ảnh với độ phân giải 36 dpi Hình 1.2. Biểu diễn ảnh với độ phân giải khác nhau Cặp tọa độ (x, y) tạo nên độ phân giải (resolution). Như màn hình máy tính có nhiều loại với độ phân giải khác nhau: màn hình CGA có độ phân gi ải là 320 x 320; màn hình VGA là 640 x 350,… Như vậy, một ảnh là một tập hợp các điểm ảnh. Khi được s ố hóa, nó thường được biểu diễn bởi bảng hai chiều I(n, p): n dòng và p cột. Ta nói ảnh gồm n x p pixels. Người ta thường ký hiệu I(x, y) để ch ỉ một pixel. Hình 1.2 cho ta thấy việc biểu diễn một ảnh với độ phân giải khác nhau. Một pixel có th ể lưu trữ trên 1, 4, 8 hay 24 bit. • Gray level: Mức xám Mức xám là kết quả sự mã hóa tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số - kết quả của quá trình lượng hóa. Cách mã hóa kinh điển thường dùng 16, 32 hay 64 mức. Mã hóa 256 mức là phổ dụng nhất do lý do kỹ thuật. Vì 2^8 = 256 (0, 1, …, 255), nên với 256 mức, mỗi pixel s ẽ đ ược mã hóa bởi 8 bit. 1.2.2. Biểu diễn ảnh Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng c ủa ảnh là pixel. Nhìn chung có thể xem một hàm hai biến chứa các thông tin nh ư biểu diễn của một ảnh. Các mô hình biểu diễn ảnh cho ta một mô tả logic hay ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  8. KHÓA LUẬN TỐT NGHIỆP 8 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA định lượng các tính chất của hàm này. Trong biểu diễn ảnh cần chú ý tính trung thực của ảnh hoặc các tiêu chuẩn “thông minh” để đo chất lượng ảnh ho ặc tính hiệu quả của các kỹ thuật xử lý. Việc xử lý ảnh số yêu cầu ảnh phải được mẫu hóa và lượng tử hóa. Thí dụ một ảnh ma trận 512 dòng gồm khoảng 512 x 512 pixel. Việc lượng tử hóa ảnh là chuyển đổi tín hiệu tương tự sang tín hiệu s ố (Analog Digital Convert) của một ảnh đã lấy mẫu sang một số hữu hạn các mức xám. Một số mô hình thường được dùng trong biểu diễn ảnh: mô hình toán, mô hình thống kê. Trong mô hình toán, ảnh hai chiều được biểu diễn nhờ các hàm hai biến trực giao gọi là các hàm cơ sở. Với mô hình th ống kê, một ảnh đ ược coi như một phần tử của một tập hợp đặc trưng bởi các đ ại l ượng nh ư: kỳ vọng toán học, hiệp biến, phương sai, moment. 1.2.3. Tăng cường ảnh – khôi phục ảnh Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Nó gồm một loạt các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu, v.v… 2.2.4. Nhận dạng ảnh Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích ch ọn các đặc tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng: - Mô tả tham số (nhận dạng theo tham số). - Mô tả theo cấu trúc (nhận dạng theo cấu trúc). Trên thực tế, người ta đã áp dụng kỹ thuật nh ận dạng khá thành công v ới nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng ch ữ (ch ữ cái, chữ số, chữ có dấu). Ngoài ra, hiện nay một kỹ thuật nhận dạng mới dựa vào kỹ thuật mạng nơron đang được áp dụng và cho kết quả khả quan. ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  9. KHÓA LUẬN TỐT NGHIỆP 9 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA 1.3. Thu nhận ảnh 1.3.1. Thiết bị thu nhận ảnh Các thiết bị thu nhận ảnh có thể cho ảnh trắng đen B/W (Black & White) với mật độ từ 400 đến 1600 dpi (dot per inch) hoặc ảnh màu 600 dpi. Với ảnh B/W mức màu là 0 hoặc 1. Với ảnh đa cấp xám, mức xám biến thiên từ 0 đến 255. Ảnh màu, mỗi điểm ảnh lưu trữ trong 3 bytes và do đó ta có 2 8 x 3 màu (cỡ 16,7 triệu màu). Khi dùng scanner, một dòng photodiot sẽ quét ngang ảnh (quét theo hàng) và cho ảnh với độ phân giải ngang khá tốt. Đầu ra của scanner là ảnh ma trận số mà ta quen gọi là bản đồ ảnh (ảnh Bitmap), bộ số hóa (digitalizer) s ẽ tạo ảnh vectơ có hướng. Trong xử lý ảnh bằng máy tính, ta không th ể không nói đến thiết b ị monitor (màn hình) để hiện ảnh. Monitor có nhiều loại khác nhau: - CGA: 640 x 320 x 16 màu, - EGA: 640 x 350 x 16 màu, - VGA: 640 x 480 x 16 màu, - SVGA: 1024 x 768 x 256 màu. Với ảnh màu, có nhiều cách tổ hợp màu khác nhau. Theo lý thuy ết màu do Thomas đưa ra từ năm 1802, mọi màu đều có thể tổ hợp từ 3 màu cơ bản: Red (đỏ), Green (lục) và Blue (lơ). Thiết bị ra ảnh có thể là máy đen trắng, máy in màu hay máy vẽ (ploter). Máy vẽ cũng có nhiều loại: loại dùng bút, loại phun mực. Nhìn chung, các hệ thống thu nhận ảnh thực hiện hai quá trình: - Cảm biến: biến đổi năng lượng quang học (ánh sáng) thành năng lượng điện. - Tổng hợp năng lượng điện thành ảnh. ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  10. KHÓA LUẬN TỐT NGHIỆP 10 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA 1.3.2. Biểu diễn màu Ánh sáng màu là tổ hợp của ánh sáng đơn sắc. Mắt người ch ỉ có th ể c ảm nhận được vài chục màu, song lại có thể phân biệt được hàng ngàn màu. Có 3 thuộc tính chủ yếu trong cảm nhận màu: - Brighness: sắc màu, còn gọi là độ chói. - Hue: sắc lượng, còn gọi là sắc thái màu. - Saturation: độ bão hòa. Với nguồn sáng đơn sắc, độ hue tương ứng với bước sóng λ. Độ bão hòa thay đổi nhanh nếu ta thêm lượng ánh sáng trắng. Hình 2.3 mô t ả m ối liên quan giữa những các đại lượng trên và 3 màu chủ yếu R, G và B. Với điểm W* cố định, các ký hiệu G, R, B chỉ vị trí tương đối của các phổ màu đỏ, lục và lơ. Do sự tán sắc ánh sáng mà ta nhìn rõ màu. Theo Maxwell, trong võng mạc có 3 loại tế bào hình nón cảm thụ 3 màu cơ bản ứng với 3 phổ hấp thụ S1( λ ), S2( λ ) và S3( λ ); λ min = 380 nm; λ max = 780 nm. - Một màu bất kỳ sẽ là một điểm trên vòng tròn. - Nếu White và Black là như nhau thì đường tròn là lớn nhất và R là điểm bão hòa. - S thay đổi theo bán kính - H thay đổi theo góc θ . - W* là sắc màu. Hình 1.3. Hệ tọa độ màu RGB 1.3.3. Hệ tọa độ màu Tổ chức y tế về chuẩn hóa màu CIE (Commision Internationalé d’Eclairage) đưa ra một số các chuẩn để biểu diễn màu. Các hệ này có các ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  11. KHÓA LUẬN TỐT NGHIỆP 11 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA chuẩn riêng. Ở đây chỉ đề cập đến chuẩn mầu CIE-RGB (hệ tọa độ dùng 3 màu cơ bản). Như đã nêu trên, một màu là tổ hợp của các màu c ơ bản theo m ột t ỉ l ệ nào đấy. Người ta dùng hệ tọa độ ba màu R-G-B (tương ứng với h ệ tọa đ ộ x-y- z) để biểu diễn màu như sau: Hình 1.4. Hệ tọa độ R-G-B Trong cách biểu diễn này ta có công thức: đỏ + lục + lơ = 1. Công th ức này gọi là công thức Maxwell. Ta cũng có th ể chuy ển từ h ệ t ọa đ ộ 3 màu v ề h ệ tọa độ x-y-z. 1.4. Các kỹ thuật xử lý ảnh cơ bản Trên đây đã nói các khái niệm cơ bản trong xử lý ảnh, chúng ta s ẽ tìm hiểu một số kỹ thuật xử lý ảnh sẽ được dùng trong nhận dạng phiếu điều tra. 1.4.1. Nhị phân hóa Nhị phân hóa là thực hiện phép biến đổi ảnh từ ảnh đa cấp xám về ảnh nhị phân (có 2 cấp xám). Do các kỹ thuật nhận dạng ch ỉ cẩn ảnh đầu vào là ảnh nhị phân nên bước này cần thực hiện khi ảnh đầu vào là ảnh đa cấp xám. Phương pháp đơn giản là dùng một hàm cắt với giá trị ngưỡng θ. ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  12. KHÓA LUẬN TỐT NGHIỆP 12 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA 0 : u≥θ f (u ) =  1 : u
  13. KHÓA LUẬN TỐT NGHIỆP 13 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Kỹ thuật Unger dùng một tập luật để lấp đầy chỗ trống. Giả sử P là điểm đang xét, ta có các điểm lân cận của P như sau: P3 P2 P9 P4 P P8 P5 P6 P7 Điểm P trên ảnh mới là đen khi và chỉ khi thỏa mãn 1 trong 2 điều kiện sau: 1. P là điểm đen 2. Có ít nhất 3 trong 4 láng giềng P 2 , P 3 , P 6 , P 8 là đen Để loại bỏ các điểm cô lập sau khi lấp đầy chỗ trống, Unger lại dùng một tập luật khác: 1. Có ít nhất 1 trong 3 láng giềng P 2 , P 3 , P 4 là đen 2. Có ít nhất 1 trong 3 láng giềng P 6 , P 7 , P 8 là đen hay 1. Có ít nhất 1 trong 3 láng giềng P 4 , P 5 , P 6 là đen 2. Có ít nhất 1 trong 3 láng giềng P 2 , P 8 , P 9 là đen 1.4.4. Đường thẳng Hough Chúng ta sẽ dùng biến đổi Hough để tìm các đường th ẳng trên ảnh. Kĩ thuật tìm đường thẳng theo biến đổi Hough sẽ được ứng dụng vào tìm góc nghiêng của phiếu trả lời. x−x y-y Ta có phương trình đường thẳng: x − x = y - y 1 1 2 1 2 1 Ta sẽ biến đổi phương trình trên thành phương trình tham số của đường thẳng theo tọa độ cực. ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  14. KHÓA LUẬN TỐT NGHIỆP 14 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA r là khoảng cách từ gốc đến đường thẳng, θ là góc giữa véc tơ pháp tuyến của đường thẳng và trục Ox r Với x 1 = 0 => y 1 = sin θ r Với y 2 = 0 => x 2 = cos θ r y− x −0 sin θ ⇒ = r r −0 0− cos θ sin θ ⇔ − x.r = y.r - r2 sin θ cos θ sinθ.cosθ Hình 1.5. Đường thẳng Hough trên tọa độ cực r x y ⇔ = + cosθ sinθ cosθ ⇒ r = x.cos θ + y.sin θ Phương trình này được gọi là phương trình đường thẳng Hough. Tư tưởng của nhận dạng đường thẳng Hough là: với mỗi giá trị của các tham số r và θ , ta tính số tọa độ (x, y) thỏa mãn ph ương trình đ ường th ẳng Hough và là điểm đen. Nếu số này lớn hơn một ngưỡng th thì t ập h ợp các đi ểm đó có thể tạo nên một đường thẳng. Thuật toán tìm đường thẳng dựa trên phương trình đường thẳng Hough được mô tả dưới dạng giả ngôn ngữ như sau: for r = 0 to width 2 + height 2 do for θ = 0 to 360  do { count = 0; for x = 0 to width do ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  15. KHÓA LUẬN TỐT NGHIỆP 15 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA { Tính y; if (x, y) là điểm đen then count = count + 1; } if count > th then thông báo có một đường thẳng; } Trong đó, width và height là độ rộng và chiều cao c ủa ảnh. Bi ến count dùng để đếm số điểm đen ứng với mỗi r và θ . Nếu count lớn hơn một ngưỡng th cho trước thì có một đường thẳng. Ưu điểm của thuật toán này là có thể tìm được các đường th ẳng không liền nét (các điểm trên đường thẳng rời rạc nhau) với độ chính xác cao. Đi ều này phù hợp với thực tế rằng, một ảnh khi quét vào có thể bị nhiễu hoặc đứt nét. Với thuật toán này, ta cũng có thể tính ngay được góc nghiêng của đ ường thẳng. Từ đó dễ dàng chuyển sang bước chỉnh độ nghiêng. 1.4.5. Chỉnh độ nghiêng của ảnh Trong trường hợp người quét ảnh không cẩn thận, ảnh đầu vào có th ể b ị nghiêng đi một góc nào đó so với phương ngang. Khi đó cần xác đ ịnh góc nghiêng của văn bản và quay về vị trí 0  . Để xoay ảnh một góc θ , ta dùng biến đổi tọa độ như sau:  cosθ sinθ  ( x ' , y ' ) = (x, y).   − sin θ cosθ  Trong đó (x ' , y ' ) là tọa độ mới sau khi quay. ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  16. KHÓA LUẬN TỐT NGHIỆP 16 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Chương 2: Nhận dạng phiếu điều tra 2.1. Mô tả bài toán Bài toán bao gồm các công đoạn: - Đọc phiếu tự động - Nhận dạng kết quả tự động - Thống kê Để hệ thống có thể nhận dạng được phiếu trả lời, các phiếu này ph ải có một khuôn mẫu cố định, sau đó ta áp dụng các kỹ thuật nhận dạng để đọc kết quả trả lời từ phiếu. Dưới đây sẽ trình bày chi tiết về thiết kế mẫu phiếu trả lời và các kỹ thuật nhận dạng phiếu. 2.2. Thiết kế mẫu phiếu điều tra Để hệ thống có thể nhận dạng được các phiếu điều tra, các phiếu này đều phải tuân theo một mẫu chuẩn. Mẫu này được thiết kế sao cho quá trình nhận dạng được thực hiện một cách nhanh chóng và chính xác. Khi nhận dạng, phiếu điều tra được quét bởi scanner, do vậy không th ể tránh khỏi tờ phiếu bị xoay nghiêng. Việc điều chỉnh lại tờ phiếu là rất quan trọng, vì nó có ảnh hưởng đến quá trình nhận dạng về sau. Để có th ể nh ận bi ết độ nghiêng của phiếu, chúng ta sẽ thiết kế một đường thẳng nằm ngang song song với mép trên của phiếu. Ảnh của phiếu trả lời khi được quét qua scanner sẽ có nhiễu và có thể mất nét vì nhiều lý do (tờ phiếu bị nhàu nát, hoặc đã được phô tô lại,…) nên đường thẳng này phải được để độ dày m ột cách phù h ợp. Thuật toán nhận dạng đường thẳng này và điều chỉnh độ nghiêng sẽ đ ược trình bày ở mục 1.4. Để nhận dạng phiếu điều tra có độ chính xác cao và nhanh, ta c ần bi ết v ị trí tương đối của các ô trắc nghiệm. Ở đây chúng ta dùng các khung đ ể khoanh vùng các ô trắc nghiệm. ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  17. KHÓA LUẬN TỐT NGHIỆP 17 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Phần dành cho trắc nghiệm phải được thiết kế đậm để có th ể nhận d ạng chính xác. Ngoài ra mẫu phiếu điều tra phải có tính thẩm mỹ cao và thuận tiện đối với đáp án viên (người được điều tra). Ở đây, chúng tôi dùng hai mẫu trắc nghiệm, sẽ được nói chi tiết ở dưới đây. Vùng nhận dạng cần nằm gọn trong tờ giấy, không được gần mép giấy quá để tránh khi đưa vào máy scanner, vùng nhận dạng không được quét hết. Trong điều tra, có thể có các câu hỏi mở, vì vậy ngoài vùng nh ận dạng phải có phần dành cho các câu hỏi mở nếu có. Ở cuối tờ phiếu, nên có những hướng dẫn cần thiết về quy cách trắc nghiệm để tránh những lỗi không hợp lệ gây ra bởi người trắc nghiệm. Từ đó chúng tôi đưa ra hai mẫu phiếu trả lời sau: ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  18. KHÓA LUẬN TỐT NGHIỆP 18 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA PHIẾU TRẢ LỜI CÂU HỎI ĐIỀU TRA PHẦN TRẢ LỜI 1 A B C D 16 A B C D 31 A B C D 2 A B C D 17 A B C D 32 A B C D 3 A B C D 18 A B C D 33 A B C D 4 A B C D 19 A B C D 34 A B C D 5 A B C D 20 A B C D 35 A B C D 6 A B C D 21 A B C D 36 A B C D 7 A B C D A B C D A B C D 22 37 8 A B C D A B C D A B C D 23 38 A B C D A B C D A B C D 9 24 39 A B C D A B C D A B C D 10 25 40 A B C D A B C D A B C D 11 26 41 A B C D A B C D A B C D 12 27 42 A B C D A B C D A B C D 13 28 43 A B C D A B C D A B C D 14 29 44 A B C D A B C D A B C D 15 30 45 Cách thức trắc nghiệm: - Bạn không cần ghi họ tên của mình. - Khi trắc nghiệm, bạn có thể tick, bôi đen vào ô tròn. - Tờ trắc nghiệm không được bẩn, không được làm dây mực. - Ngoài ra, tờ trắc nghiệm được coi là không hợp lệ Hình 2.1. Mẫu phiếu 1 ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  19. KHÓA LUẬN TỐT NGHIỆP 19 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA PHIẾU TRẢ LỜI CÂU HỎI ĐIỀU TRA PHẦN TRẢ LỜI 01 A B C D 16 A B C D 31 A B C D 02 A B C D 17 A B C D 32 A B C D 03 A B C D 18 A B C D 33 A B C D 04 A B C D 19 A B C D 34 A B C D 05 A B C D 20 A B C D 35 A B C D 06 A B C D 21 A B C D 36 A B C D 07 A B C D 22 A B C D 37 A B C D 08 A B C D 23 A B C D 38 A B C D 09 A B C D 24 A B C D 39 A B C D 10 A B C D 25 A B C D 40 A B C D 11 A B C D 26 A B C D 41 A B C D 12 A B C D 27 A B C D 42 A B C D 13 A B C D 28 A B C D 43 A B C D 14 A B C D 29 A B C D 44 A B C D 15 A B C D 30 A B C D 45 A B C D Cách thức trắc nghiệm: - Bạn có thể ghi họ tên của mình hoặc không. - Khi trắc nghiệm, bạn có thể tick, bôi đen vào ô tròn. - Tờ trắc nghiệm không được bẩn, không được làm dây mực. - Ngoài ra, tờ trắc nghiệm được coi là không hợp lệ Hình 2.2. Mẫu phiếu 2 ĐẠI HỌC VINH KHOA CÔNG NGHỆ
  20. KHÓA LUẬN TỐT NGHIỆP 20 XỬ LÝ TỰ ĐỘNG PHIẾU ĐIỀU TRA Trong mẫu 1, vùng trắc nghiệm là các ô tròn đậm nét, trong các ô tròn là các chữ cái A, B, C, D, … tương ứng với các tùy ch ọn c ủa m ỗi câu tr ả l ời. V ới mẫu này, đáp án viên có thể chọn các cách th ức trắc nghi ệm nh ư tick ( √), gạch chéo hoặc bôi đen các ô trắc nghiệm. Với mẫu 2, vùng trắc nghiệm là các chữ cái A, B, C, D, … t ương ứng v ới các tùy chọn của mỗi câu trả lời. Đáp án viên chọn kết quả bằng cách khoanh tròn hoặc bôi đen các chữ cái. 2.3. Kỹ thuật nhận dạng chung phiếu điều tra Trong phần này, chúng ta lần lượt xem xét các thuật toán chung trong nhận dạng phiếu điều tra. 2.3.1. Các tham số cần thiết Để có thể nhận dạng được định dạng chung của phiếu trả lời, ta cần biết một số các tham số. Các tham số này được tạo khi hệ thống sinh phiếu trả lời dưới dạng Word. Dưới đây là các tham số cần thiết: - Độ phân giải của ảnh (thường là 100 dpi hoặc 150 dpi) - Kích cỡ ảnh (chiều rộng và chiều cao) - Độ dài, độ dày của đường thẳng dày - Độ rộng, cao của khung - Khoảng cách giữa khung và đường thẳng dày - Khoảng cách giữa các dòng (chứa các ô trả lời) - Khoảng cách giữa các ô - Số khung - Số câu hỏi mỗi khung - Số tùy chọn mỗi câu hỏi ĐẠI HỌC VINH KHOA CÔNG NGHỆ
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2