Thuat toan xu ly anh khuếch tán lỗi 1 chiều năm 2024

Khoảng hơn mười năm trở lại đây, phần cứng máy tính và các thiết bị liên quan đã có sự tiến bộ vượt bậc về tốc độ tính toán, dung lượng chứa, khả năng xử lý v.. và giá cả đã giảm đến mức máy tính và các thiết bị liên quan đến xử lý ảnh đã không còn là thiết bị chuyên dụng nữa. Khái niệm ảnh số đã trở nên thông dụng với hầu hết mọi người trong xã hội và việc thu nhận ảnh số bằng các thiết bị cá nhân hay chuyên dụng cùng với việc đưa vào máy tính xử lý đã trở nên đơn giản.

Trong hoàn cảnh đó, xử lý ảnh là một lĩnh vực đang được quan tâm và đã trở thành môn học chuyên ngành của sinh viên ngành công nghệ thông tin trong nhiều trường đại học trên cả nước. Tuy nhiên, tài liệu giáo trình còn là một điều khó khăn. Hiện tại chỉ có một số ít tài liệu bằng tiếng Anh hoặc tiếng Pháp, tài liệu bằng tiếng Việt thì rất hiếm. Với mong muốn đóng góp vào sự nghiệp đào tạo và nghiên cứu trong lĩnh vực này, chúng tôi biên soạn cuốn giáo trình Xử lý ảnh dựa trên đề cương môn học đã được duyệt. Cuốn sách tập trung vào các vấn đề cơ bản của xử lý ảnh nhằm cung cấp một nền tảng kiến thức đầy đủ và chọn lọc nhằm giúp người đọc có thể tự tìm hiểu và xây dựng các chương trình ứng dụng liên quan đến xử lý ảnh.

Giáo trình được chia làm 7 chương: Chương 1, trình bày Tổng quan về xử lý ảnh, các khái niệm cơ bản, sơ đồ tổng quát của một hệ thống xử lý ảnh và các vấn đề cơ bản trong xử lý ảnh. Chương 2, trình bày các vấn đề liên quan đến thu nhận ảnh, bao gồm các thiết bị thu nhận ảnh cơ bản, quá trình lấy mẫu và lượng tử hóa, một số phương pháp biểu diễn ảnh, cũng như một số định dạng ảnh phổ dụng. Chương 3, trình bày các kỹ thuật nâng cao chất lượng ảnh dựa vào các thao tác với điểm ảnh, nâng cao chất lượng ảnh thông qua việc xử lý các điểm ảnh trong lân cận điểm ảnh đang xét. Chương này cũng trình bày các kỹ thuật nâng cao chất lượng ảnh nhờ vào việc lọc nhiễu. Chương 4, trình bày các kỹ thuật cơ bản trong việc phát hiện biên của các đối tượng ảnh theo cả hai khuynh hướng: Phát hiện biên trực tiếp và phát hiện biên gián tiếp. Chương 5 thể hiện các kỹ thuật phân vùng ảnh, đây là khâu quan trọng hỗ trợ cho việc trích chọn các thuộc tính của ảnh để tiến tới hiểu ảnh. Chương 6, trình bày các vấn đề và kỹ thuật liên quan đến nhận dạng ảnh, theo tiếp cận không gian, tiếp cận cấu trúc và tiếp cận mạng nơron. Và cuối cùng là Chương 7 với các kỹ thuật nén ảnh, đây là vấn đề luôn được quan tâm trong xử lý ảnh.

Giáo trình được biên soạn dựa trên kinh nghiệm giảng dạy của tác giả trong nhiều năm tại các khóa đại học và cao học của ĐH Công nghệ - ĐHQG Hà Nội, ĐH Khoa học tự nhiên – ĐHQG Hà Nội, Khoa Công nghệ thông tin – ĐH Thái Nguyên, Khoa Công nghệ thông tin – Học viện Công nghệ BCVT v.. Cuốn sách có thể làm tài liệu tham khảo cho sinh viên các hệ kỹ sư, cử nhân và các bạn quan tâm đến vấn đề nhận dạng và xử lý ảnh.

Các tác giả bày tỏ lòng biết ơn chân thành tới các bạn đồng nghiệp trong Viện Công nghệ thông tin, Khoa Công nghệ thông tin – Học viện Công nghệ BCVT, Khoa Công nghệ thông tin - ĐH Thái Nguyên, Khoa Công nghệ thông tin - ĐH Công nghệ - ĐHQG Hà Nội, Khoa Toán – Cơ – Tin, ĐH Khoa học tự nhiên, ĐHQG Hà Nội đã động viên, góp ý và giúp đỡ để hoàn chỉnh nội dung cuốn sách này. Xin cám ơn Lãnh đạo Khoa Công nghệ thông

PTIT

MỤC LỤC

  • LỜI NÓI ĐẦU
  • Chương 1: NHẬP MÔN XỬ LÝ ẢNH
  • 1. TỔNG QUAN VỀ HỆ THỐNG XỬ LÝ ẢNH
  • 1. NHỮNG VẤN ĐỀ CƠ BẢN TRONG XỬ LÝ ẢNH
    • 1.2. Một số khái niệm cơ bản
    • 1.2. Nắn chỉnh biến dạng............................................................................................................................................
    • 1.2. Khử nhiễu
    • 1.2. Chỉnh số mức xám
    • 1.2. Phân tích ảnh
    • 1.2. Nhận dạng và phân loại ảnh...........................................................................................................................
    • 1.2. Nén ảnh
  • Chương 2: THU NHẬN ẢNH
  • 1. CÁC THIẾT BỊ THU NHẬN ẢNH
  • 1. LẤY MẪU VÀ LƯỢNG TỬ HOÁ
    • 2.2. Giai đoạn lấy mẫu
    • 2.2. Lượng tử hóa
  • 1. MỘT SỐ PHƯƠNG PHÁP BIỂU DIỄN ẢNH
    • 2.3. Mô hình Raster
    • 2.3. Mô hình Vector
  • 1. CÁC ĐỊNH DẠNG ẢNH CƠ BẢN
    • 2.4. Định dạng ảnh IMG
    • 2.4. Định dạng ảnh PCX
    • 2.4. Định dạng ảnh TIFF
    • 2.4. Định dạng file ảnh BITMAP
  • 1. KỸ THUẬT TÁI NHẬN ẢNH
    • 2.5 Kỹ thuật chụp ảnh................................................................................................................................................
    • 2.5 Kỹ thuật in ảnh
  • 1. KHÁI NIỆM ẢNH ĐEN TRẮNG, ẢNH MÀU
    • 2.6. Phân loại ảnh số
    • 2.6. Màu sắc
  • 1. CÂU HỎI ÔN TẬP CHƯƠNG
  • Chương 3: XỬ LÝ NÂNG CAO CHẤT LƯỢNG ẢNH
  • 1. CẢI THIỆN ẢNH SỬ DỤNG CÁC TOÁN TỬ ĐIỂM
    • 3.1. Giới thiệu
    • 3.1. Tăng giảm độ sáng
    • 3.1. Tách ngưỡng
    • 3.1. Cân bằng histogram
    • 3.1. Kỹ thuật tìm tách ngưỡng tự động
    • 3.1. Biến đổi cấp xám tổng thể
  • 1. CẢI THIỆN ẢNH SỬ DỤNG CÁC TOÁN TỬ KHÔNG GIAN
    • 3.2. Phép cửa sổ di chuyển.....................................................................................................................................
    • 3.2. Phép nhân chập và mẫu
    • 3.2. Lọc trung vị
    • 3.2. Lọc trung bình
    • 3.2. Lọc trung bình theo k giá trị gần nhất
  • 1. KHÔI PHỤC ẢNH.........................................................................................................................................................
    • 3.3. Nhiễu và mô hình nhiễu.................................................................................................................................
    • 3.3. Các loại nhiễu
    • 3.3. Các kỹ thuật lọc nhiễu
  • 1. CÂU HỎI ÔN TẬP CHƯƠNG
  • Chương 4: CÁC PHƯƠNG PHÁP PHÁT HIỆN BIÊN
  • 1. KHÁI QUÁT VỀ BIÊN VÀ PHÂN LOẠI CÁC KỸ THUẬT DÒ BIÊN CƠ BẢN
    • 4.1. Giới thiệu
    • 4.1. Kỹ thuật phát hiện biên Gradient
    • 4.1. Kỹ thuật phát hiện biên Laplace
    • 4.1. Kỹ thuật Canny
  • 1. PHƯƠNG PHÁP PHÁT HIỆN BIÊN CỤC BỘ.......................................................................................
    • 4.2. Biên và độ biến đổi về mức xám
    • 4.2. Phát hiện biên dựa vào trung bình cục bộ
  • 1. DÒ BIÊN THEO QUY HOẠCH ĐỘNG
    • 4.3. Một số khái niệm cơ bản
    • 4.3. Chu tuyến của một đối tượng ảnh...........................................................................................................
    • 4.3. Thuật toán dò biên tổng quát......................................................................................................................
  • 4.4ÁC PHƯƠNG PHÁP KHÁC
    • 4.4. Các phép toán hình thái cơ bản
    • 4.4. Một số tính chất của phép toán hình thái
    • 4.4. Xấp xỉ trên và xấp xỉ dưới đối tượng ảnh
    • 4.4. Thuật toán phát hiện biên dựa vào phép toán hình thái
  • 1. CÂU HỎI ÔN TẬP CHƯƠNG
  • Chương 5: PHÂN VÙNG ẢNH...................................................................................................................................
  • 1. GIỚI THIỆU
  • 1. PHÂN VÙNG ẢNH THEO NGƯỠNG BIÊN ĐỘ
    • 5.2. Thuật toán đẳng liệu
    • 5.2. Thuật toán đối xứng nền
    • 5.2. Thuật toán tam giác
    • 5.2. Chọn ngưỡng đối với Bimodal Histogram
  • 1. PHÂN VÙNG THEO MIỀN ĐỒNG NHẤT
    • 5.3. Giới thiệu
    • 5.3. Phương pháp tách cây tứ phân (quad tree)

Chương 1: NHẬP MÔN XỬ LÝ ẢNH

1. TỔNG QUAN VỀ HỆ THỐNG XỬ LÝ ẢNH

Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người máy.

Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh <tốt hơn= hoặc một kết luận.

Hình 1. Quá trình xử lý ảnh Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c 1 , c 2 ,..., cn). Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều.

Hình 1. Các bước cơ bản trong một hệ thống xử lý ảnh

Hình 1 biểu diễn sơ đồ tổng quát của một hệ thống xử lý ảnh:  Khối thu nhận ảnh: có nhiệm vụ tiếp nhận ảnh đầu vào.  Khối tiền xử lý: có nhiệm vụ xử lý nâng cao chất lượng ảnh như giảm nhiễu, phân vùng, tìm biên v..  Khối trich chọn đặc điểm: có nhiệm vụ trích chọn các đặc trưng quan trọng của các bức ảnh đã được tiền xử lý để sử dụng trong hệ quyết định

Lưu trữ

Thu nhận ảnh (Scanner, Camera,Sensor)

Tiền xử lý Trích chọn đặc điểm

Hệ quyết định

Đối sánh rút xử lý Hậu ra kết luận

Ảnh XỬ LÝ ẢNH

Ảnh <Tốt hơn=

Kết luận

PTIT

Chương 1: Nhập môn xử lý ảnh

 Khối hậu xử lý: có nhiệm vụ xử lý các đặc điểm đã trích chọn, có thể lược bỏ hoặc biến đổi các đặc điểm này để phù hợp với các kỹ thuật cụ thể sử dụng trong hệ quyết định  Khối hệ quyết định và lưu trữ: có nhiệm vụ đưa ra quyết định (phân loại) dựa trên dự liệu đã học lưu trong khối lưu trữ  Khối kết luận: đưa ra kết luận dựa vào quyết định của khối quyết định

1. NHỮNG VẤN ĐỀ CƠ BẢN TRONG XỬ LÝ ẢNH

1.2. Một số khái niệm cơ bản

  • Ảnh và điểm ảnh: Điểm ảnh được xem như là dấu hiệu hay cường độ sáng tại một vị trí nào đó của đối tượng trong không gian và ảnh được xem như là một tập hợp các điểm ảnh.
  • Mức xám, màu Là số các giá trị có thể có của các điểm ảnh của ảnh

1.2. Nắn chỉnh biến dạng............................................................................................................................................

Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử.

Ảnh thu nhận Ảnh mong muốn

Hình 1. Ảnh thu nhận và ảnh mong muốn Để khắc phục người ta sử dụng các phép chiếu được xây dựng trên tập các điểm điều khiển. Giả sử có hai ảnh I và I&

039; tương ứng với ảnh thu nhận được và ảnh mong muốn. Pi là một điểm thuộc I tương ứng với một điểm Pi&

039; trên I&

039;, ta có n các cặp điểm điều khiển như vậy.

Nắn chỉnh biến dạng là tìm hàm : P→ () sao cho

&

039; 2 min)( 1

  

ii

n

i

PPf

Thông thường các điểm điều khiển được lấy bằng cách chụp những ảnh có cấu trúc

định sẵn như là ảnh lưới giống như ảnh mong muốn trên Hình 1.

1.2. Khử nhiễu

Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh mà chúng ta cần loại bỏ:  Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi  Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân có thể khắc phục bằng các phép lọc

P

i P’f(Pi i)

PTIT

Chương 1: Nhập môn xử lý ảnh

Có nhiều cách tiếp cận khác nhau trong lý thuyết nhận dạng trong đó có: Đối sánh mẫu dựa trên các đặc trưng được trích chọn, phân loại thống kê, đối sánh cấu trúc, phân loại dựa trên mạng nơ-ron nhân tạo...

Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ yếu sau đây:

  1. Thu nhận dữ liệu và tiền xử lý.
  2. Biểu diễn dữ liệu.
  3. Nhận dạng, ra quyết định. Trong ứng dụng thực tiễn, không thể chỉ dùng có một cách tiếp cận đơn lẻ để phân loại <tối ưu= vì vậy các phương thức phân loại tổ hợp thường được sử dụng khi nhận dạng. Cho đến nay các hệ thống lai (hybrid system) sử dụng nhiều phương pháp và cách tiếp cận khác nhau đã cho những kết quả nhiều triển vọng.

1.2. Nén ảnh Nén ảnh là kỹ thuật nhằm giảm thiểu không gian lưu trữ. Có hai hướng tiếp cận chính là nén có bảo toàn và không bảo toàn thông tin. Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng không phục hồi được ảnh gốc, ngược lại nén có bảo toàn cho phép khôi phục hoàn toàn ảnh gốc. Nén ảnh nói chung có 4 cách tiếp cận cơ bản:

 Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF  Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX  Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy tỉ lệ nén tương đối cao. *.JPG chính là tiếp cận theo kỹ thuật nén này.  Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh. Tính chất Fractal của ảnh thể hiện sự lặp lại của các chi tiết tại nhiều vị trí khác nhau với kích thước và hướng khác nhau. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.

PTIT

Chương 2:

THU NHẬN ẢNH

2. CÁC THIẾT BỊ THU NHẬN ẢNH

Các thiết bị thu nhận ảnh có hai loại chính ứng với hai loại ảnh thông dụng Raster, Vector và có thể cho ảnh đen trắng hoặc ảnh màu.

Các thiết bị thu nhận ảnh Raster thông thường là camera, scanner. Còn các thiết bị thu nhận ảnh Vector thông thường là sensor hoặc bàn số hoá digitalizer hoặc được chuyển đổi từ ảnh Raster.

Các hệ thống thu nhận ảnh sử dụng chung một quá trình thu nhận:  Cảm biến: biến đổi năng lượng quang học thành năng lượng điện (giai đoạn lấy mẫu)  Tổng hợp năng lượng điện thành ảnh (giai đoạn lượng tử hóa)

  1. LẤY MẪU VÀ LƯỢNG TỬ HOÁ 2.2. Giai đoạn lấy mẫu Người ta sử dụng bộ cảm biến hoặc máy quét để biến tín hiệu quang của ảnh thành tín hiệu điện liên tục. Phương pháp sử dụng máy quét phổ biến hơn. Máy quét sẽ quét theo chiều ngang để tạo ra tín hiệu điện của ảnh, kết quả cho ra một tín hiệu điện hai chiều I(x,y) liên tục.

Xét ảnh liên tục được biểu diễn bởi hàm I(x, y), gọi xlà khoảng cách giữa hai điểm được giữ lại theo trục x, gọi ylà khoảng cách giữa hai điểm được giữ lại theo trục y. y,

x được gọi là chu kỳ lấy mẫu theo trục x và y. Giai đoạn lấy mẫu sẽ biến hàm liên tục I(x,y) thành hàm rời rạc I(nx, my). Với

m,n là nguyên.

Theo SHANON để đảm bảo không xảy ra hiện tượng chồng phổ, cho phép tái tạo lại ảnh gốc từ ảnh đã số hóa thì tần số lấy mẫu phải ít nhất phải lớn hơn hoặc bằng hai tần số cao nhất của tín hiệu ảnh. Gọi fxmax, fymax là tần số cao nhất của tín hiệu theo trục x, y thì:

 fx  2fxmax với fx = x

1 là tần số lấy mẫu theo trục x.

 fy  2fymax với fy = y

1 là tần số lấy mẫu theo trục y.

Dạng tín hiệu ảnh

Ảnh chứa tín hiệu quang học

PTIT

Chương 2: THU NHẬN ẢNH

2.3. Mô hình Vector Biểu diễn ảnh ngoài tiêu chí tiết kiệm không gian lưu trữ, dễ dàng cho hiển thị và in ấn còn cần đảm bảo dễ dàng trong lựa chọn, sao chép, di chuyển và tìm kiếm v.. Theo những yêu cầu này kỹ thuật biểu diễn Vector tỏ ra ưu việt hơn.

Trong mô hình vector người ta sử dụng hướng giữa các vector của điểm ảnh lân cận để mã hoá và tái tạo hình ảnh ban đầu ảnh vector được thu nhận trực tiếp từ các thiết bị số hoá như Digital hoặc được chuyển đổi từ ảnh Raster thông qua các chương trình số hoá

Công nghệ phần cứng cung cấp những thiết bị xử lý với tốc độ nhanh và chất lượng cho cả đầu vào và ra nhưng lại chỉ hỗ trợ cho ảnh Raster. Do vậy, những nghiên cứu về biểu diễn Vector đều tập trung vào việc chuyển đổi ảnh từ mô hình Raster.

Hình 2. Sự chuyển đổi giữa các mô hình biểu diễn ảnh

  1. CÁC ĐỊNH DẠNG ẢNH CƠ BẢN Hiện nay trên thế giới có trên 50 khuôn dạng ảnh thông dụng. Sau đây là một số định dạng ảnh hay dùng trong quá trình xử lý ảnh hiện nay.

2.4. Định dạng ảnh IMG Ảnh IMG là ảnh đen trắng, phần đầu của ảnh IMG có 16 byte chứa các thông tin:  6 byte đầu: dùng để đánh dấu định dạng ảnh. Giá trị của 6 byte này viết dưới dạng Hexa: 0x0001 0x0008 0x  2 byte tiếp theo: chứa độ dài mẫu tin. Đó là độ dài của dãy các byte kề liền nhau mà dóy này sẽ được lặp lại một số lần nào đó. Số lần lặp này sẽ được lưu trong byte đếm. Nhiều dãy giống nhau được lưu trong một byte.  4 byte tiếp: mô tả kích cỡ pixel.  2 byte tiếp: số pixel trên một dòng ảnh.  2 byte cuối: số dòng ảnh trong ảnh. Ảnh IMG được nén theo từng dòng, mỗi dòng bao gồm các gói (pack). Các dòng giống nhau cũng được nén thành một gói. Có 4 loại gói sau:

 Loại 1: Gói các dòng giống nhau. Quy cách gói tin này như sau: 0x00 0x 0xFF Count. Ba byte đầu tiên cho biết số các dãy giống nhau, byte cuối cho biết số các dòng giống nhau.  Loại 2: Gói các dãy giống nhau. Quy cách gói tin này như sau: 0x00 Count. Byte thứ hai cho biết số các dãy giống nhau được nén trong gói. Độ dài của dãy ghi ở đầu tệp.  Loại 3: Dãy các Pixel không giống nhau, không lặp lại và không nén được. Quy cách gói tin này như sau: 0x80 Count. Byte thứ hai cho biết độ dài dãy các pixel không giống nhau không nén được.

RASTER
VECTOR

Vector hóa Raster hóa RASTER

PTIT

Chương 2: Thu nhận ảnh

 Loại 4: Dãy các Pixel giống nhau. Tuỳ theo các bít cao của byte đầu tiên được bật hay tắt. Nếu bít cao được bật (giá trị 1) thì đây là gói nén các byte chỉ gồm bít 0, số các byte được nén được tính bởi 7 bít thấp còn lại. Nếu bớt cao tắt (giá trị 0) thì đây là gói nén các byte gồm toán bít 1. Số các byte được nén được tính bởi 7 bít còn lại. Các gói tin của file IMG rất đa dạng do ảnh IMG là ảnh đen trắng, do vậy chỉ cần 1 bít cho 1 pixel thay vì 4 hoặc 8 như đã nói ở trên. Toàn bộ ảnh chỉ có những điểm sáng và tối tương ứng với giá trị 1 hoặc 0. Tỷ lệ nén của kiểu định dạng này là khá cao.

2.4. Định dạng ảnh PCX Định dạng ảnh PCX là một trong những định dạng ảnh cổ điển. Nó sử dụng phương pháp mã hoá loạt dài RLE (Run – Length – Encoded) để nén dữ liệu ảnh. Quá trình nén và giải nén được thực hiện trên từng dạng ảnh. Thực tế, phương pháp giải nén PCX kém hiệu quả hơn so với kiểu IMG. Tệp PCX gồm 3 phần: đầu tệp (header), dữ liệu ảnh (Image data) và bảng màu mở rộng.

Header của tệp PCX có kích thước cố định gồm 128 byte và được phân bố như sau:  1 byte: chỉ ra kiểu định dạngếu là PCX/PCC thì nó luôn có giá trị là 0Ah.  1 byte: chỉ ra version sử dụng để nén ảnh, có thể có các giá trị sau:  0: version 2.  2: version 2 với bảng màu.  3: version 2 hay 3 không có bảng màu.  5: version 3 cố bảng màu.  1 byte: chỉ ra phương pháp mã hoá. Nếu là 0 thì mã hoá theo phương pháp BYTE PACKED, ngược lại là phương pháp RLE.  1 byte: Số bít cho một điểm ảnh phẳng (plane).  1 word: toạ độ góc trái của ảnh. Với kiểu PCX nó có giá trị là (0,0), cũn PCC thì khác (0,0).  1 word: toạ độ góc phải dưới.  1 word: kích thước bề rộng và bề cao của ảnh.  1 word: số điểm ảnh.  1 word: độ phân giải màn hình.  1 word.  48 byte: chia nó thành 16 nhóm, mỗi nhóm 3 byte. Mỗi nhóm này chứa thông tin về một thanh ghi màu. Như vậy ta có 16 thanh ghi màu.  1 byte: không dùng đến và luôn đặt là 0.  1 byte: số bớt plane mà ảnh sử dụng. Với ảnh 16 màu, giá trị này là 4, với ảnh 256 mầu (1pixel/8bits) thì số bít plane lại là 1.  1 byte: số bytes cho một dòng quét ảnh.  1 word: kiểu bảng màu.  58 byte: không dùng.

PTIT

Chương 2: Thu nhận ảnh

Dữ liệu chứa trong tệp thường được tổ chức thành các nhóm dòng (cột) quét của dữ liệu ảnh. Cách tổ chức này làm giảm bộ nhớ cần thiết cho việc đọc tệp. Việc giải nén được thực hiện theo 4 kiểu khác nhau được lưu trữ trong byte dấu hiệu nén.

2.4. Định dạng ảnh IMG

Mỗi file BITMAP gồm đầu file chứa các thông tin chung về file, đầu thông tin chứa các thông tin về ảnh, một bảng màu và một mảng dữ liệu ảnh. Khuôn dạng được cho như sau:

BITMAPFILEHEADER bmfh; BITMAPINFOHEADER bmih; RGBQUAD aColors[]; BYTE aBitmapBits[]; Trong đó, các cấu trúc được định nghĩa như sau: typedef struct tagBITMAPFILEHEADER { /* bmfh */ UINT bfType; DWORD bfSize; UINT bfReserved1; UINT bfReserved2; DWORD bfOffBits; } BITMAPFILEHEADER;

typedef struct tagBITMAPINFOHEADER { /* bmih */ DWORD biSize; LONG biWidth; LONG biHeight; WORD biPlanes; WORD biBitCount; DWORD biCompression; DWORD biSizeImage; LONG biXPelsPerMeter; LONG biYPelsPerMeter; DWORD biClrUsed; DWORD biClrImportant; } BITMAPINFOHEADER, *LPBITMAPINFOHEADER;

PTIT

Chương 2: Thu nhận ảnh

Với biến chi tiết như sau biSize kích thước của BITMAPINFOHEADER biWidth Chiều rộng của ảnh, tính bằng số điểm ảnh biHeight Chiều cao của ảnh, tính bằng số điểm ảnh biPlanes Số plane của thiết bị, phải bằng 1 biBitCount Số bit cho một điểm ảnh biCompression Kiểu nén biSizeImage Kích thước của ảnh tính bằng byte biXPelsPerMeter độ phân giải ngang của thiết bị, tính bằng điểm ảnh trên met biYPelsPerMeter độ phân giải dọc của thiết bị, tính bằng điểm ảnh trên met biClrUsed Số lượng các màu thực sự được sử dụng

biClrImportant

Số lượng các màu cần thiết cho việc hiển thị, bằng 0 nếu tất cả các màu đều cần để hiển thị Nếu bmih > 8 thì mảng màu rgbq[] trống, ngược lại thì mảng màu có 2<< bmih phần tử.

typedef struct tagRGBQUAD { /* rgbq */ BYTE rgbBlue; BYTE rgbGreen; BYTE rgbRed; BYTE rgbReserved; } RGBQUAD;

typedef struct tagBITMAPINFO { BITMAPINFOHEADER bmiHeader; RGBQUAD bmiColors[1]; } BITMAPINFO, *PBITMAPINFO;

2. KỸ THUẬT TÁI NHẬN ẢNH

2.5 Kỹ thuật chụp ảnh................................................................................................................................................

Phương pháp sao chụp ảnh là phương pháp đơn giản, giá thành thấp, chất lượng cao. Sau bước chụp là kỹ thuật phòng tối nhằm tăng cường ảnh như mong muốn. Ví dụ kỹ thuật phòng tối như: phóng đại ảnh, thu nhỏ ảnh..., tùy theo ứng dụng. Kỹ thuật chụp ảnh màn hình màu khá đơn giản. Nó bao gồm các bước sau:

 Đặt camera trong phòng tối, cách màn hình khoảng 10 feet (1feet=0,3048m)  Mở ống kính để phẳng mặt cong màn hình, do vậy ảnh sẽ dàn đều hơn

PTIT

Chương 2: Thu nhận ảnh

  1. Kỹ thuật chọn theo mẫu (Patterning) Kỹ thuật này sử dụng một nhóm các phần tử trên thiết bị ra (máy in chẳng hạn) để biểu diễn một pixel trên ảnh nguồn. Các phần tử của nhóm quyết định độ sáng tối của cả nhóm. Các phần tử này mô phỏng các chấm đen trong kỹ thuật nửa cường độ. Nhóm thường được chọn có dạng ma trận vuông. Nhóm nn phần tử sẽ tạo nên n 2 +1 mức sáng. Ma trận mẫu thường được chọn là ma trận Rylander. Ma trận Rylander cấp 4 có dạng như Bảng 2.

0 8 2 10

4 12 6 14

3 11 1 9

7 15 5 13

Bảng 2. Ma trận Rylander cấp 4 Việc chọn kích thước của nhóm như vậy sẽ làm giảm độ mịn của ảnh. Vì vậy kỹ thuật này chỉ áp dụng trong trường hợp mà độ phân giải của thiết bị ra lớn hơn độ phân giải của ảnh nguồn.

Ví dụ: thiết bị ra có độ phân giải 640480 khi sử dụng nhóm có kích thước 44 sẽ chỉ còn 160120.

4.1. Kỹ thuật Canny

Dithering là việc biến đổi một ảnh đa cấp xám (nhiều mức sáng tối) sang ảnh nhị phân (hai mức sáng tối). Kỹ thuật Dithering đựợc áp dụng để tạo ra ảnh đa cấp sáng khi độ phân giải nguồn và đích là như nhau. Kỹ thuật này sử dụng một ma trận mẫu gọi là ma trận Dither. Ma trận này gần giống như ma trận Rylander.

Để tạo ảnh, mỗi phần tử của ảnh gốc sẽ được so sánh với phần tử tương ứng của ma trận Dither. Nếu lớn hơn, phần tử ở đầu ra sẽ sáng và ngược lại.

  1. Kỹ thuật khuếch tán lỗi (Error diffusion) Khuếch tán lỗi cho phép giảm thiểu mức độ mất chi tiết của ảnh khi tách ngưỡng bằng cách phân tán lỗi do lượng tử hóa ra các điểm ảnh xung quanh. Bằng cách này tổng giá trị điểm ảnh của một vùng nhỏ được giữ tương đối gần với giá trị trên ảnh gốc.

Khuếch tán lỗi có hai dạng, khuếch tán lỗi một chiều và khuếch tán lỗi hai chiều. Khuếch tán lỗi một chiều chỉ phân tán lỗi sang điểm ảnh lân cận trên cùng một dòng trong khi đó khuếch tán lỗi hai chiều phân tán lỗi sang các điểm ảnh lân cận theo một tỷ lệ xác định bởi một ma trận khuếch tán lỗi.

 Kỹ thuật khuếch tán lỗi một chiều: o Ảnh được duyệt từ trái qua phải, từ trên xuống dưới. o Tại mỗi điểm ảnh, giá trị điểm ảnh được tách theo ngưỡng có sẵn. o Phần dư do lượng tử hóa được được chuyến sang điểm ảnh tiếp theo trên cùng dòng.

PTIT

Chương 2: Thu nhận ảnh

o Các bước được lặp lại cho đến hết dòng, phần dư của điểm ảnh cuối cùng sẽ được loại bỏ.  Kỹ thuật khuếch tán lỗi hai chiều: o Các bước được thực hiện như khuếch tán lỗi một chiều, tuy nhiên lỗi do lượng tử hóa sẽ đươc phân tán ra các điểm xung quanh theo tỷ lệ xác định bởi ma trận khuếch tán o Có hai ma trận phổ biến (Hình 2):  Ma trận của Floyd và Steinberg.  Ma trận của J F Jarvis, C N Judice, và W H Ninke tại phòng thí nghiệm Bell.

Floyd và Steinberg Phòng thí nghiệm Bell Hình 2. Ma trận khuếch tán lỗi,

"#" chỉ điểm đang xét và "" chỉ các điểm đã xét, các con số chỉ tỷ lệ lỗi được phân

tán từ điểm hiện tại

2. KHÁI NIỆM ẢNH ĐEN TRẮNG, ẢNH MÀU

Ảnh trong thực tế là một ảnh liên tục về không gian và giá trị cường độ sáng. Để có thể xử lý ảnh bằng máy tính người ta cần thiết phải số hóa ảnh. Trong quá trình số hóa, ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng hóa thành phần giá trị mà về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau. Một ảnh sẽ là một tập hợp các phần tử ảnh (Picture element) hay còn được gọi là Pixel.

Như vậy, ảnh số là một tập hợp các điểm ảnh. Khi được số hóa, nó thường được biểu diễn bởi một mảng hai chiều I(n,p) với n là số dòng và p là số cột. Ta nói ảnh gồm np pixels. Người ta thường ký hiệu I(x,y) để chỉ một pixel I chính là giá trị cường độ sáng của ảnh tại pixel đó. Ảnh có thể được biểu diễn với các độ phân giải khác nhau. Một pixel có thể được lưu trữ trên 1, 4, 8 hay 24 bit tùy thuộc vào các mức cường độ sáng cần phân biệt của ảnh và số lượng thành phần mầu cơ bản chứa trong ảnh đó.

2.6. Phân loại ảnh số

Người ta thường chia ảnh số ra làm ba loại chính là:  Ảnh đen trắng: Mỗi phần tử ảnh nhận một trong hai giá trị tương ứng với hai mức sáng đen và trắng (còn gọi là ảnh nhị phân)  Ảnh đa mức xám (Grayscale): Các phần tử ảnh chứa thông số về cường độ sáng đã được mã hoá thành N mức (8, 256 hoặc nhiều hơn) tương ứng với 3 bít, 8 bít hoặc hơn nữa, ảnh xám có một đặc trưng là lược đồ xám (histogram).  Ảnh mầu: Mỗi phần tử ảnh được lưu trữ trong ảnh dưới dạng một cấu trúc có 3 trường chứa thông tin về 3 màu cơ bản là đỏ, xanh, lơ (red, blue, green). Màu của