Nguyễn Văn Huy<br />
<br />
Tạp chí KHOA HỌC & CÔNG NGHỆ<br />
<br />
61(12/2): 74 - 77<br />
<br />
ỨNG DỤNG FRACTAL TRONG PHÂN TÍCH ẢNH TÀI LIỆU<br />
ĐA CẤP XÁM CÓ NHIỄU<br />
Nguyễn Văn Huy*<br />
Đại học Kỹ thuật công nghiệp - Đại học Thái Nguyên<br />
<br />
TÓM TẮT<br />
Hình học Fractal đã mở ra một hướng đi hoàn toàn mới về cách mô tả toán học cho các đối tượng<br />
phức tạp trong tự nhiên, trong bài báo này Fractal được ứng dụng vào việc mô tả cho các vùng văn<br />
bản hay đồ họa trong một ảnh tài liệu từ đó tìm ra được đặc trưng Fractal của nó để nhận dạng. Bài<br />
báo trình bày giải pháp sử dụng Fractal phân tích ảnh tài liệu đa cấp xám có nhiễu.<br />
Từ khóa: Hình học Fractal, Phân tích trang tài liệu, Phân tích cấu trúc hình học, top-down,<br />
bottom-up.<br />
<br />
<br />
MỞ ĐẦU<br />
Đã có nhiều thuật toán phân tích tài liệu như<br />
Top-down, Bottom-Up,… Tuy nhiên tất cả<br />
chúng đều tồn tại những nhược điểm chính<br />
như sau:<br />
- Tốc độ thực hiện phụ thuộc vào độ phức tạp<br />
của ảnh<br />
- Kém hiệu quả với loại tài liệu có cấu trúc<br />
phức tạp<br />
- Kém hiệu quả với ảnh đa cấp xám<br />
- Kém hiệu quả với ảnh có nhiễu<br />
- Không thể làm việc với ảnh bị nghiêng, hay<br />
lại tài liệu có font chữ nghiêng hoặc có nhiều<br />
loại font chữ khác nhau<br />
Phương pháp Fractal Signature giải quyết tối<br />
đa các nhược điểm mà các phương pháp trên<br />
gặp phải và mục tiêu của bài báo này đi cài<br />
đặt phương pháp Fractal Signature nhằm phân<br />
tách vùng ảnh, vùng nền, vùng văn bản trên<br />
ảnh tài liệu đa cấp xám có cấu trúc phức tạp<br />
và tồn tại nhiễu.<br />
Cơ sở của thuật toán Fractal<br />
Ý tưởng chính của thuật toán chia trang tài<br />
liệu A thành các vùng có kích thước bằng<br />
nhau Bk (k=1,..,n) sao cho Bk Є A. Sau đó<br />
tính FS cho mỗi vùng này, theo lý thuyết FS<br />
thì nếu có 3 vùng B1(giả thiết là vùng nền),<br />
B2(giả thiết là vùng chữ), B3(giả thiết là vùng<br />
đồ họa) thì luôn có FS(B1)