intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Giáo trình Kỹ thuật số hóa tài liệu

Chia sẻ: Phạm Huy | Ngày: | Loại File: PDF | Số trang:283

194
lượt xem
52
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Chương này sẽ trình bày về những khái niệm và thuật ngữ cơ bản ảnh hưởng của độ phân giải, số bit và độ nén đến chất lượng ảnh; các đặc tính của văn bản và những yếu tố khác ảnh hưởng đến quá trình chuyển đổi chất lượng và lựa chọn cho quá trình số hoá. Mời các bạn tham khảo.

Chủ đề:
Lưu

Nội dung Text: Giáo trình Kỹ thuật số hóa tài liệu

  1. GIÁO TRÌNH KỸ THUẬT SỐ HÓA TÀI LIỆU
  2. Mục lục Kỹ thuật số hoá Chương 1: Khái quát lý thuyết Chương 2: Khái quát kỹ thuật Chương 3: Nghiên cứu trường hợp Chương 4: Tạo siêu dữ liệu: từ các ảnh số đến cơ sở dữ liệu của các tư liệu Chương 5: Sử dụng các dịch vụ ảnh Chương 6: Quét ảnh chụp Chương 7: Quét phim Chương 8: Giải pháp kết hợp Chương 9: Duy trì khai thác và tiếp tục bổ sung kiến thức
  3. Chương này sẽ trình bày về những khái niệm và thuật ngữ cơ bản; ảnh hưởng của độ phân giải, số bit và độ nén đến chất lượng ảnh; các đặc tính của văn bản và những yếu tố khác ảnh hưởng đến quá trình chuyển đổi chất lượng và lựa chọn cho quá trình số hoá. Định nghĩa Ảnh số là các "ảnh điện tử" được quét từ các tài liệu gốc. Một ảnh số có thể thể hiện chính xác nội dung, bố cục và cách trình bày của văn bản gốc bao gồm kiểu chữ, chú thích và ảnh minh hoạ. Quá trình quét Một ảnh số được lấy mẫu và vẽ dưới dạng một hệ thống các điểm hay các nguyên tố ảnh được gọi là các pixel. Mỗi pixel thể hiện một đơn vị màu (đen, trắng hoặc các gam màu khác) và về mặt số được biểu diễn dưới dạng các mã nhị phân (mã chỉ gồm các số 0 và/ hoặc 1). Các chữ số nhị phân (bit) trong mỗi pixel được ghi theo một trình tự nhất định trong máy tính, hoặc được rút gọn thành một công thức toán học. Các số nhị phân này sẽ được máy tính dịch và đọc để tạo ra một hình ảnh analog hiện trên màn hình hoặc bản in. Các ảnh số khác với các dạng tệp điện tử khác. Mặc dù cũng được gọi là "ảnh mành" ("raster image") hoặc "ảnh nhị phân" ("bitmapped
  4. image") song ảnh số khác với các ảnh vectơ ở chỗ đồ hoạ của chúng không được thể hiện dưới dạng các đường thẳng và đường cong toán học xác định mà được thể hiện dưới dạng hệ thống các điểm. Ảnh vectơ nhìn chung là có thể được tạo ra với kích cỡ và độ chính xác bất kỳ, còn chất lượng của ảnh số lại phụ thuộc vào độ phân giải được ấn định từ trước khi quét. Khác với các tệp văn bản chữ - số như ASCII, các ảnh số là những tệp "câm" bởi vì thông tin chứa trong đó không thể duyệt hoặc điều chỉnh được. Tuy nhiên, chúng lại có thể được sử dụng làm tệp nguồn để tạo ra các tệp văn bản có thể đọc được thông qua các chương trình nhận dạng chữ quang học (ORC). Độ chính xác của những chương trình như vậy vô cùng khác nhau, tuỳ thuộc vào thuộc tính của nguyên bản và các ảnh số được quét. Tổng hợp các khả năng kỹ thuật Mặc dù kỹ thuật ảnh số đã được biết đến từ khá lâu nhưng nó mới bắt đầu được sử dụng rộng rãi từ thập niên 1990, khi những tiến bộ kỹ thuật cho ra đời những hình ảnh rõ nét hơn, chi phí thấp hơn và khả năng truy cập cao hơn. Các nhân tố đã tạo ra những điều kiện thuận lợi đó là: - Sự phát triển kỳ diệu của máy tính cá nhân - Các hệ thống mạng rộng lớn có tốc độ cao trở nên phổ biến - Chi phí kỹ thuật giảm, đặc biệt là trong việc lưu trữ
  5. - Sự ra đời của các máy quét có độ phân giải cao - Sự xuất hiện của kiến trúc phục vụ khách hàng và mạng quốc tế (World Wide Web) Lợi ích của ảnh số Ảnh số mang những đặc điểm ưu việt hơn hẳn ảnh analog về mặt độ nét, độ chính xác, độ trung thực so với nguyên bản, chi phí bộ nhớ và khai thác Trong lưu trữ + trung thực so với nguyên bản - tương đương với kỹ thuật ánh sáng thấu kính - thay đổi được kích cỡ ảnh - có thể chỉnh sửa ảnh + trung thực trong sao chép - sản phẩm phong phú và có chất lượng - truy cập thông tin liên tục mà không phải bảo quản phương tiện Trong khai thác - có thể nối mạng
  6. - có thể truy cập nhiều ảnh cùng một lúc - có thể tạo ra nhiều ảnh phái sinh - có thể thao tác và sử dụng ảnh - ít tốn kém - tiết kiệm không gian Những mặt hạn chế của ảnh số Mặc dù ảnh số là một kỹ thuật mới đầy hứa hẹn, nhưng vẫn còn có rất nhiều điều bất lợi làm hạn chế khả năng được sử dụng của nó trong công tác thư viện và văn thư hiện nay, bao gồm: - cơ sở kỹ thuật thay đổi nhanh chóng - đang ở giai đoạn giao thời nên phải chấp nhận cả những cái truyền thống và những cái mới - chịu nhiều sức ép về mặt pháp luật, trong đó có luật bản quyền - chưa có các tiêu chuẩn cụ thể - chất lượng và khả năng của các phần cứng, phần mềm rất không đồng nhất - có những yêu cầu cao về sao chép, lưu trữ và di nhập - nhu cầu và khả năng của các cơ sở lưu trữ chưa cao
  7. - thiếu tính ổn định và sự hỗ trợ của các hãng dịch vụ Khi nào vượt qua được những trở ngại này, kỹ thuật ảnh số sẽ bước vào giai đoạn thực nghiệm tại các cơ sở văn hoá. Tuy nhiên, các cơ sở này hiện nay đã có cơ hội để tạo điều kiện phát triển cho kỹ thuật mới này theo hướng đáp ứng được những nhu cầu cụ thể của họ. Sự tăng số lượng thư viện và cơ sở lưu trữ hiện đang giúp kỹ thuật ảnh số tiến đến gần những mục đích hiện nay và trong tương lai. Song vì tiềm lực của các cơ sở còn hạn chế, các dự án đều phải được xây dựng một cách cẩn thận nhằm đảm bảo cho khả năng thành công cao nhất và hạn chế thất bại. Điều này đòi hỏi các cơ sở phải đặt ra những mục tiêu không quá tham vọng, dựa trên cơ sở đã hiểu biết đầy đủ về những thuộc tính của các văn bản sẽ được quét, các thao tác phức tạp của quá trình quét và mọi mặt hữu dụng của ảnh số. Quét ảnh: chuyển từ analog sang số Các thuộc tính của tư liệu Khi quét ảnh số phải tính toán đến các quy trình kỹ thuật liên quan đến việc chuyển từ ảnh analog sang ảnh số cũng như các thuộc tính của chính các văn bản gốc như: kích thước, mức độ chi tiết, thang màu. Các văn bản có thể được định tính bằng các quy trình kỹ thuật được sử dụng để tạo ra nó, bao gồm các phương pháp bằng tay, bằng máy, chụp ảnh hay mới nhất là điện tử. Hoặc toàn bộ các văn bản bằng giấy hoặc bằng phim có thể được chia thành 4 loại sau:
  8. + Bản văn/Dòng (Text/line art): Gồm những hình ảnh đồng màu có ranh giới rõ ràng, thường đơn sắc, có thể được tạo ra bằng tay, máy chữ hoặc máy in, bao gồm: bản văn, bản viết tay, đồ thị, bản khắc gỗ, văn bản được đánh máy hay in laser, bản thiết kế, bản đồ và bản chép nhạc. + Tông màu chuyển tiếp (Continuous tone): Những văn bản gồm các gam chuyển tiếp nhau, có thể đơn sắc hoặc đa sắc, bao gồm ảnh chụp, một số loại tranh (như bản phác hoạ bằng chì, tranh màu nước) và các tác phẩm đồ hoạ có các thuộc tính gam chuyển tiếp như bản khắc đồng, in đá, in chụp. + Nửa tông hoặc kiểu nửa tông (Halftone or halftone-like): Những hình ảnh tạo thành từ các điểm hoặc đường nằm cách đều, có thể đơn hoặc đa sắc, bao gồm những ảnh đồ hoạ được tạo thành từ các nét hoặc đường kẻ song song sít nhau nằm cách đều, ví dụ bản chạm khắc hoặc khắc axit. + Hỗn hợp (Mixed): Tổng hợp cả 3 loại văn bản trên, đơn hoặc đa sắc, bao gồm báo, tạp chí, sách có tranh minh hoạ. Ba loại kỹ thuật quét + "đen trắng" ("bitonal"): một pixel gồm một số nhị phân thể hiện màu trắng hoặc đen, thích hợp với các loại bản văn và một số loại nửa tông. + "dải xám" ("grayscale"): một pixel gồm nhiều số nhị phân thể hiện các gam màu xám khác nhau, thích hợp với các văn bản gam chuyển tiếp đen trắng, nửa tông, hỗn hợp và một số bản viết tay.
  9. + "màu" ("color"): một pixel gồm nhiều số nhị phân thể hiện các màu sắc khác nhau, thích hợp với tất cả các loại văn bản trong đó màu sắc giữ vai trò quan trọng. Chất lượng ảnh số được quét chịu ảnh hưởng của: + độ phân giải và ngưỡng + kỹ thuật chỉnh sửa ảnh + quá trình nén + thiết bị sử dụng và hiệu suất của thiết bị đó + vận hành hợp lý, cẩn thận Độ phân giải (Resolution) được xác định bằng số lượng pixel tạo ra ảnh theo đơn vị dpi (số điểm trên 1 insơ). Số lượng pixel càng lớn thì độ phân giải càng cao và khả năng thể hiện các chi tiết của ảnh càng cao. Tuy nhiên, đến một mức độ nào đó, độ phân giải cao hơn cũng không cải thiện đáng kể chất lượng ảnh mà chỉ làm tăng kích thước của tệp. Vấn đề mấu chốt khi quét ảnh là phải xác định được độ phân giải vừa đủ để thể hiện được tất cả những chi tiết quan trọng của nguyên bản. Ngưỡng (threshold) là thuật ngữ được dùng trong kỹ thuật quét đen trắng để chỉ một điểm trên thước đo mà tại đó các giá trị thể hiện màu xám được dịch thành các pixel trắng hoặc đen. Điểm này thường nằm trong khoảng từ 0 đến 255. Dưới đây là ví dụ về ảnh hưởng của các
  10. ngưỡng khác nhau lên bản đánh máy được quét ở cùng một độ phân giải. Trong kỹ thuật quét đen trắng, độ phân giải và ngưỡng là mấu chốt của chất lượng ảnh. Kỹ thuật này phù hợp nhất với các văn bản có độ tương phản cao như bản văn, đồ hoạ. Những văn bản gam chuyển tiếp hoặc có độ tương phản thấp như ảnh chụp cần đến kỹ thuật quét dải xám hoặc nhiều màu. Trong 2 loại kỹ thuật quét này, độ phân giải và số bit là 2 yếu tố cấu thành nên chất lượng ảnh. Số bit (bit depth) được xác định bằng số lượng chữ số nhị phân được sử dụng để thể hiện mỗi pixel. Số bit càng lớn thì càng nhiều sắc màu được thể hiện. Dải biến động (dynamic range) là thuật ngữ chỉ toàn bộ mức biến đổi các gam màu - được đo bằng mật độ kế- từ vùng sáng nhất đến vùng tối nhất của văn bản. Các vật liệu trong suốt có dải biến động rộng hơn, do đó thể hiện được nhiều gam màu hơn các vật liệu phản quang. Khả năng bắt được tất cả các sắc màu của máy quét, bao gồm những chi tiết trong vùng sáng và vùng tối, phụ thuộc vào dải biến động của máy và số bit. Máy quét drum thường bắt màu tốt nhất và máy quét flatbed thường bắt màu kém nhất (Xem chương 2 và chương 6). Số bit tăng lên sẽ ảnh hưởng đến độ phân giải cần thiết, kích thước tệp và phương pháp nén. Chỉnh sửa ảnh (Image enhancement) là quá trình cải thiện chất lượng ảnh. Tuy nhiên, việc chỉnh sửa rất có thể sẽ ảnh hưởng đến độ trung thực của ảnh. Chỉnh sửa còn làm tăng chi phí quét ảnh. Các đặc điểm
  11. chỉnh sửa điển hình có thể được thực hiện trong quá trình quét hoặc trong phần mềm biên tập ảnh gồm lọc (filter), các đường cong tái tạo tông màu (tonal reproduction curves) và quản lý màu (color management). Dưới đây là ví dụ về sử dụng bộ lọc ở một bản viết tay được quét với cùng một ngưỡng và độ phân giải, và một bức ảnh được "hiệu chỉnh" bằng chương trình biên tập ảnh. Nén (Compression) làm giảm kích thước tệp trong quá trình xử lý, lưu trữ và chiếu ảnh. Chất lượng ảnh có thể bị ảnh hưởng bởi kỹ thuật nén và mức độ nén. Thiết bị sử dụng và hiệu suất của nó qua thời gian sẽ ảnh hưởng đến chất lượng hình ảnh. Những công nghệ quét khác nhau có ảnh hưởng rõ rệt đến sản phẩm và độ chính xác của kỹ thuật xác định chuẩn chất lượng sẽ được trình bày ở phần sau. Vì vậy, những đòi hỏi của các nhà sản xuất về các khả năng của hệ thống (độ phân giải, số bit, các kỹ thuật chỉnh sửa, sản lượng đầu vào, tuổi thọ phần cứng, độ tin cậy) cần phải được xem xét cẩn thận. Bạn hãy đảm bảo rằng những yêu cầu về chất lượng ảnh đã được đáp ứng bằng cách kiểm tra các sản phẩm qua màn hình và giấy, sử dụng kết hợp các vị trí kiểm tra kỹ thuật và các mẫu nguyên bản. Tính hợp lý và cẩn trọng của người điều hành cùng với các phương tiện quét có ảnh hưởng rất lớn đến chất lượng hình ảnh thu được. Những quyết định hợp lý của người điều hành là vô cùng quan trọng khi quét đen trắng vì ở đó chất lượng ảnh hoàn toàn phụ thuộc vào ngưỡng và độ
  12. phân giải. Quá trình quét xám phụ thuộc ít hơn vào những quyết định đó. Tuy nhiên, vẫn cần phải thực hiện thường xuyên một chương trình bảo hiểm chất lượng ảnh để kiểm tra sản phẩm của mọi kỹ thuật quét. Đảm bảo ghi được đầy đủ thông tin Trường Đại học Cornell đã áp dụng một nguyên tắc quét ảnh đảm bảo chất lượng và tính thực dụng cao nhất với chi phí thấp nhất. Các yêu cầu về lưu trữ, khai thác và tính kinh tế đòi hỏi phải có một tệp số chủ (digital master) chứa đầy đủ mọi thông tin có trong nguyên bản. Chuyển đổi bằng kỹ thuật số hay analog chỉ là các cách khác nhau để ghi lại nội dung thông tin chứa trong nguyên bản dưới dạng cất giữ hay trưng bày. Còn về mặt giá trị thực hay giá trị nhân văn thì bản copy chỉ có thể đại diện chứ không thể thay thế được nguyên bản. Lưu trữ Nếu ảnh số được sử dụng với mục đích lưu trữ thì chất lượng ảnh là yếu tố quan trọng, bởi vì nó sẽ được sử dụng để thay thế cho nguyên bản, còn nguyên bản sẽ được cất giữ ở một nơi khác, trong môi trường phù hợp. Số lượng ảnh phải đủ để giảm hoặc loại bỏ hoàn toàn khả năng người đọc dùng đến nguyên bản. Ảnh số có thể thay thế nguyên bản trong một số trường hợp nhất định, ví dụ khi nguyên bản là sách dễ hư hỏng. Khi đó ảnh số phải mang được đầy đủ những thông tin quan trọng của nguyên bản để có thể đáp ứng được mọi yêu cầu về nghiên cứu, pháp luật và tài chính. Như sẽ nói ở
  13. phần sau, các tiêu chuẩn và thông lệ đối với việc bảo quản các tư liệu vi phim phải được đặt ra để xác định các yêu cầu về chất lượng trong số hoá. Khai thác Ảnh số là công cụ để thuận tiện hoá việc khai thác, nhưng trong mọi trường hợp, một ảnh số không thể thoả mãn được tất cả các nhu cầu của người sử dụng. Một tệp số chủ cần được tạo ra và sử dụng để nhân bản hàng loạt hình ảnh vì các nguyên nhân sau: - với những khả năng khác nhau của máy tính, tất cả các nhu cầu sử dụng có thể được đáp ứng thông qua các bản phái sinh - các yêu cầu và khả năng về in ấn, hiển thị và xử lý ảnh vô cùng đa dạng - khó có thể cùng một lúc đáp ứng được tất cả các nhu cầu về sự hoàn chỉnh, chi tiết của ảnh và tốc độ xử lý - quá trình quét càng tốt thì chất lượng bản phái sinh càng tốt - những đòi hỏi của người sử dụng ngày càng cao, phải có đủ các tệp số chủ để cung cấp cho những ứng dụng trong tương lai Chi phí Chi phí sản xuất những ảnh số có chất lượng cao sẽ ít hơn chi phí dành cho những ảnh chất lượng thấp và không đáp ứng được những yêu cầu lâu dài. Tạo ảnh số là một công việc tốn kém; chi phí vào nhân lực và
  14. việc tìm kiếm, chuẩn bị, kiểm tra và ghi kỹ hiệu thông tin số cao hơn nhiều so với chính chi phí quét ảnh. Trong những năm tới, giá quét và lưu ảnh sẽ hạ xuống và làm giảm bớt sự chênh lệch nói trên. Chất lượng ảnh cao không đồng nghĩa với độ phân giải và số bit cao nhất, mà chính là sự phù hợp giữa quá trình quét ảnh với nội dung của nguyên bản và quét ở mức độ đảm bảo bắt được đúng những thông tin đó, không nhiều hơn cũng không ít hơn. Bằng cách đó, có thể tránh được khả năng phải quét lại ảnh sau này; chi phí cho lưu trữ và di nhập thông tin không phải là nhỏ nhưng ở mức độ hợp lý và có thể được bù lại bằng giá trị lâu dài của thông tin số. Giá trị đó nên được xác định bằng nội dung tri thức chứa trong các ảnh số chứ không bị hạn chế bởi những phán quyết về mặt kỹ thuật tại thời điểm quét. Độ phân giải, kích thước tệp và chất lượng ảnh Độ phân giải thường được đo bằng số lượng điểm thể hiện ảnh trên một insơ vuông(ký hiệu: insơ = in hoặc "). Ví dụ: 100 điểm/ in (dpi) = 100 x 100 (1002) hay 10 000 điểm/ in2 200 dpi = 2002 hay 40 000 điểm/ in2 Chú ý: Cấp số nhân tăng nhanh hơn cấp số cộng. Số lượng điểm được sử dụng ở độ phân giải 200 dpi gấp 4 lần số lượng điểm được sử dụng ở độ phân giải 100 dpi.
  15. Quan hệ giữa độ phân giải và kích thước tệp Tổng số điểm được sử dụng trên bề mặt ảnh được xác định bằng cách nhân chiều cao ảnh với chiều rộng và dpi2. Trong kỹ thuật quét đen trắng, 1 số nhị phân (bit) thể hiện 1 pixel. Khi chuyển đổi, kích thước tệp chứa ảnh được tính bằng byte, mỗi byte được cấu thành từ 8 bit. Do đó, để tính kích thước tệp chứa ảnh được quét bằng kỹ thuật đen trắng theo byte, ta lấy tổng số bit (h . w . dpi2) chia cho 8. Công thức 1: xác định kích thước tệp của ảnh đen trắng: Ví dụ kích thước của tệp quét một trang giấy viết thư (khổ 8,5'x11') với dộ phân giải 100 dpi là 116.875 byte So sánh với tệp văn bản giãn dòng đơn chứa một trang giấy viết thư có kích thước 2000 đến 3000 byte. Do các tệp ảnh số thường có kích thước lớn, người ta thường dùng một số đơn vị rút gọn của byte như: 1 KB = 1000 byte 1 MB = 1 000 000 byte = 1000 KB 1 GB = 1 000 000 000 byte = 1000 MB
  16. Kích thước pixel, kích thước vật lý và dpi Nguyên bản được xác định bằng kích thước vật lý và mức độ chi tiết của nó, còn một ảnh số được xác định bằng kích thước pixel, "kích thước vật lý" và dpi. Máy quét, máy in và màn hình cũng được mô tả bằng 3 thuộc tính này. Bạn có thể hình dung chúng như những hình chữ nhật gồm các pixel xếp theo hàng và cột, trong đó: - kích thước pixel tính = số pixel nằm theo hàng ngang x số pixel nằm theo cột dọc (màn hình VGA có kích thước pixel 640 x 480). - kích thước vật lý được đo bằng không gian tính bằng insơ theo chiều ngang và chiều thẳng đứng mà các pixel đó chiếm (phần lớn các máy quét flatbed đều thích hợp với các văn bản có kích thước 8,5" x 14"). - dpi thể hiện số lượng pixel trên 1 insơ. Các máy quét flatbed quét ở một độ phân giải đặt sẵn với các tư liệu có kích thước khác nhau nhưng không vượt quá 11" x 17". ở loại thiết bị này, mảng quét (scanning array) được đặt ở kích thước cố định đó, và tất cả các văn bản phù hợp với máy đều được quét ở cùng một độ phân giải (dpi) được đặt sẵn đó. Độ phân giải sẽ chỉ thay đổi khi thiết định dpi được thay đổi, ví dụ, chuyển từ 300 dpi lên 600 dpi. Ví dụ: Máy quét được đặt ở độ phân giải 300 dpi trên mảng quét 11" x 17". Kích thước pixel của máy được xác định bằng cách nhân tích số của độ phân giải và kích thước pixel thứ nhất (300 x 11) với tích số của độ phân giải và kích thước pixel thứ hai (300 x 17), ta có kết quả là là 3300 x
  17. 5100. Nếu đặt lại độ phân giải ở mức 600 dpi, kích thước pixel của máy quét sẽ là (600 x11) x (600 x 17) = 6600 x 10200. Các máy quét khác, trong đó có camera số, không đặt sẵn độ phân giải. Các camera số có kích thước pixel đặt sẵn (ví dụ 2000 x 3000) nhưng không có tấm ép (platen) cố định. Về mặt lý thuyết thì loại máy này có thể quét được văn bản ở mọi kích cỡ. Camera số hoạt động tương tự như máy quay vi phim. Kích thước pixel của mảng quét được điều chỉnh theo kích thước vật lý của nguyên bản bằng cách tăng hoặc giảm khoảng cách giữa camera và tư liệu (hoặc sử dụng một thấu kính khác). Do đó, độ phân giải sẽ thay đổi theo các kích thước khác nhau của các tư liệu. Nếu tư liệu có kích thước nhỏ, độ phân giải có thể ở mức cao. Khi kích thước tư liệu tăng lên, khoảng cách giữa camera và tư liệu đó cũng phải tăng lên, làm tăng khoảng cách giữa các pixel và vì vậy độ phân giải sẽ giảm. Ví dụ, một tư liệu kích thước 4x5 in có độ phân giải thích hợp lớn gấp 10 lần độ phân giải thích hợp của tư liệu kích thước 40 x 50 in với cùng một kích thước pixel. Xác định dpi từ kích thước pixel Để xác định dpi từ kích thước pixel, trước hết ta phải xét tỉ lệ cạnh (aspect ratio) của cả vật liệu nguồn và mảng pixel của máy quét. Tỉ lệ cạnh là đại lượng liên hệ giữa các số đo cạnh của một hình chữ nhật. Trong trường hợp một văn bản, tỉ lệ cạnh là tỉ lệ giữa chiều cao và chiều rộng. Còn đối với một camera số thì đại lượng này thể hiện quan hệ giữa kích thước pixel theo chiều này với kích thước kia. Mối quan hệ giữa tỉ lệ
  18. cạnh của nguyên bản và kích thước pixel của camera sẽ ảnh hưởng đến cách tính dpi. Để đạt được dpi cao nhất khi quét toàn bộ một văn bản thì kích thước vật lý của văn bản đó phải nằm trong giới hạn kích thước pixel của camera (hay chính là nằm gọn trong khu vực quét). Vì hình ảnh có thể được xoay sau khi đã xử lý nên định hướng tư liệu (theo chiều nằm ngang hay dựng đứng) không phải là một khâu trong quá trình quét. Tư liệu có thể được đặt ở theo một trong hai hướng trên trong camera số. Có thể tạo được một tư liệu kích thước lớn ở các độ phân giải cao hơn bằng cách quét từng phần văn bản đó và xếp hoặc đính các ảnh rời rạc vào với nhau sau khi đã xử lý. Công thức 2: Xác định các tỷ lệ cạnh khi quét: Ví dụ 1: Xét một văn bản có kích thước 4 x 6 in được quét với mảng quét 2000 x 3000 pixel. Tỉ lệ cạnh của tư liệu sẽ = 6/ 4 = 1,5; tỉ lệ cạnh của mảng quét = 3000/ 2000 = 1,5. Vì có cùng tỉ lệ cạnh nên văn bản sẽ trùm khít mảng quét, và toàn bộ mảng quét được sử dụng để quét văn bản. (Khi hai tỉ lệ cạnh như trên không trùng nhau, hai hình chữ nhật tạo thành do văn bản và mảng quét sẽ không trùng khớp và hoặc chỉ có một phần mảng quét được sử dụng, hoặc chỉ có một phần văn bản được quét. Xem các ví dụ 2 và 3)
  19. Ví dụ 2: Xét trường hợp tư liệu có tỉ lệ cạnh nhỏ hơn tỉ lệ cạnh của mảng quét. Một văn bản có kích thước giấy viết thư sẽ có tỉ lệ cạnh là 11/ 8,5 = 1,29. Nếu được quét bằng camera số có tỉ lệ cạnh 3072/ 2048 = 1,5 thì kích thước của văn bản sẽ nhỏ hơn mảng quét. (Hình vuông có tỉ cạnh = 1) Nếu kích thước pixel thứ nhất của camera được đặt để quét chiều rộng của văn bản thì chiều chiều dài của văn bản sẽ ngắn hơn cạnh thứ hai của pixel. Toàn bộ văn bản sẽ được quét nhưng chỉ có một phần mảng quét được sử dụng. Ví dụ 3: Xét trường hợp tư liệu có tỉ lệ cạnh lớn hơn tỉ lệ cạnh của mảng quét (ví dụ: văn bản có kích thước 7" x 14", tức là có tỉ lệ cạnh = 2), được quét bằng camera số với mảng quét 2048 x 3072. Nếu kích thước thứ nhất của pixel tương ứng với chiều rộng của văn bản và kích thước pixel thứ hai đặt tương ứng với chiều dài (ví dụ 3a) thì văn bản sẽ dài hơn mảng quét và chỉ có một phần văn bản được quét. Nhưng nếu xoay lại thì xét về chiều rộng, văn bản vẫn ngắn hơn mảng quét và toàn bộ văn bản sẽ được quét (ví dụ 3b). Khi nào văn bản và mảng quét đã phù hợp với nhau thì độ phân giải để quét toàn bộ văn bản có thể được xác định bằng cách chia kích thước pixel của máy quét (xem công thức số 3). Công thức tương tự có thể được sử dụng để tính độ phân giải hữu hiệu khi quét phim của một văn bản bằng kỹ thuật quét trượt. Lưu ý là bạn phải sử dụng kích thước thật của nguyên bản chứ không phải kích thước của phim (Xem chương 7). Công thức 3: xác định độ phân giải từ kích thước pixel của máy quét:
  20. Xác định độ phân giải cần thiết để bắt được đầy đủ thông tin Chúng ta đã biết làm thế nào để xác định độ phân giải và kích thước tệp từ kích thước pixel, song làm thế nào để biết liệu độ phân giải đó có phù hợp để bắt được đầy đủ thông tin trong nguyên bản hay không? Tại Cornell, chúng tôi đã xây dựng một phương pháp đặt chuẩn để tính toán các yêu cầu về độ phân giải khi tạo ra và hiển thị ảnh số, trong đó áp dụng những tiêu chuẩn về chất lượng ảnh của công nghiệp vi đồ hoạ. Xác định chuẩn số là gì? Xác định chuẩn số là một thủ tục không thể thiếu để dự đoán về sản phẩm. - trước hết là xác định rõ các thuộc tính của tư liệu nguồn và các nhu cầu sử dụng hiện thời cũng như trong tương lai. - xác định các nhân tố trong các biến số liên quan (cả chủ quan lẫn khách quan) - sử dụng những công thức bắt nguồn từ vi đồ hoạ
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2