Giáo trình Xử lý ảnh số
Ảnh
- Tín hiệu ảnh thuộc loại tín hiệu đa chiều: tọa độ(x,y,z), độ sáng(λ), thời gian(t).
- Ảnh tĩnh trong không gian 2 chiều được định nghĩa là một hàm 2 biến S(x,y), với S
là giá trị biên độ (được biểu diễn bằng màu sắc) tại vị trí không gian (x,y).
- Phân loại ảnh
+ Ảnh tương tự S(x,y): (x,y) liên tục, S liên tục.
+ Ảnh số S(m,n): (m,n) rời rạc, S rời rạc.
- Một ảnh (gồm một tập các điểm ảnh) có thể xem như bao gồm tập các ảnh con (các
vùng ảnh). Thuật ngữ gọi là ROIs – vùng quan tâm (Regions of Interest).
- Ảnh số trong không gian rời rạc thu được từ ảnh tương tự trong không gian liên tục
thông qua quá trình số hóa. Quá trình số hóa có thể hiểu đơn giản như sau
+ Ảnh tương tự được chia thành M hàng, N cột.
+ Giao của hàng và cột được gọi là: pixel
+ Giá trị biên độ của pixel tại tọa độ nguyên (m,n) là s(m,n): là trung bình độ
sáng trong pixel đó. S(m,n) ≤ L (L số mức xám dùng biểu diễn ảnh).
- M, N thường được chọn là M=N=2K (K=8,9,10). L =2B , B là số bít mã hóa cho độ
sáng(biên độ) mỗi pixel.
- Ảnh số được biểu diễn bởi ma trận 2 chiều. Các phần tử của nó là biểu diễn cho
các pixel số hóa.
- Ta ký hiệu 1 ảnh số là S(M,N). Ta nói ảnh có độ phân giải MxN. Ký hiệu s(m,n) để
chỉ ra một phần tử ảnh.
Hệ thống xử lý ảnh
- Xử lý ảnh: Ảnh vào → Ảnh kết quả.
- Đối tượng xử lý của hệ thống ở đây là các ảnh (hàm 2 biến liên tục hoặc rời rạc).
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Tóm tắt nội dung tài liệu: Giáo trình Xử lý ảnh số
lace. Toán tử Laplace được định nghĩa như sau: 2 2 2 2 2 dy f dx ff ∂+∂=∇ Toán tử Laplace dùng nhiều kiểu mặt nạ khác nhau để xấp xỉ rời rạc đạo hàm bậc hai. Dưới đây là 3 kiểu mặt nạ hay dùng: 121 252 121 111 181 111 010 141 010 321 − −− − = −−− −− −−− = − −− − = HHH Với mặt nạ H1, đôi khi người ta dùng phần tử ở tâm có giá trị là 8 thay vì giá trị là 4 như đã chỉ ra. Để dễ hình dung việc xấp xỉ đạo hàm bậc hai trong không gian rời rạc bởi mặt nạ H1 hay là ý nghĩa của mặt nạ H1, ta xét chi tiết cách tính đạo hàm bậc 2. Trong không gian rời rạc đạo hàm bậc 2 có thể tính: WS NW E W N S NE SE Mô hình 8 hướng Bài giảng Xử lý ảnh 55 GV. Mai Cường Thọ )1,()1,(),(2 ),1(),1(),(2 2 2 2 2 +−−−= ∂ ∂ +−−−= ∂ ∂ yxfyxfyxf y f yxfyxfyxf x f Vậy ),1()1,(),(4)1,(),1(2 yxfyxfyxfyxfyxff +−+−+−−−−=∇ 3. Phương pháp khớp nối lỏng a. Khái niệm láng giềng 4 và láng giềng 8 Với điểm P được bao phủ xung quanh bởi 8 điểm: P0, P1, P8 Ta có láng giềng 8 của P gồm các điểm: P0, P1, P2, P3, P4, P5, P6, P7 Láng giềng 4 của P gồm các điểm: P0, P2, P4, P6. b. Phương pháp khớp nối lỏng • Xét các điểm p và q là 2 điểm 4 láng giềng. • I(p), I(q): giá trị mức xám của điểm p và q • Nếu θ>− )()( qIpI thì coi như có cặp biên (p, q). Ví dụ: Cho ma trận ảnh chọn θ =3 ta có II. CÁC KỸ THUẬT DÒ BIÊN 1 Kỹ thuật Freeman(dò biên theo ảnh đen trắng) Thuật toán Bước1: Quét ảnh đến khi gặp điểm đen. Gọi nó là pixel 1. Bước 2: Lặp Nếu “điểm ảnh hiện thời là đen” rẽ trái Ngược lại thì rẽ phải. Dừng khi gặp điểm 1 ban đầu. P3 P2 P1 P4 P P0 P5 P6 P7 6 2 3 6 2 3 6 2 3 6 2 3 6 2 3 2 3 6 2 3 1 4 2 8 5 7 4 2 8 5 7 1 2 8 5 7 1 4 3 6 1 4 2 8 5 7 4 2 8 5 7 1 2 8 5 7 1 4 Bài giảng Xử lý ảnh 56 GV. Mai Cường Thọ Cải tiến thuật toán trên (Luân văn tiến sĩ: Hồ Ngọc Kỷ -1992) Thuật toán Bước1: Quét ảnh đến khi gặp điểm đen. Gọi nó là pixel 1. Bước 2: Lặp Nếu “điểm ảnh hiện thời là đen” Thì “dò ngược”. Ngược lại “sang phải”. Đến khi gặp pixel 1 2. Dò biên theo cặp nền vùng Phương pháp Tìm cặp điểm (n,v), trong đó n và v là điểm 8 láng giềng, n là điểm nền và v là điểm vùng. Ban đầu có (n0, v0) dựa vào đó ta tìm được (n1, v1), qua trình này cứ tiếp tục. Tổng quát nếu có (ni, vi) ta sẽ tìm (ni+1, vi+1), sao cho ni và ni+1 là 8 láng giềng , vi và vi+1 là 8 láng giềng. 11 14 19 24 25 30 13 7 3 2 1 4 5 6 8 10 9 12 15 16 17 18 20 21 22 23 26 27 28 29 31 32 33 34 35 1 2 12 3 11 4 6 5 10 9 8 7 Bài giảng Xử lý ảnh 57 GV. Mai Cường Thọ Quá trình dò biên theo nền vùng là: tìm 1 dãy các điểm (n0, v0), (n1, v1)(nk, vk) sao cho n0, n1, .nk : chu tuyến nền v0, v1, .vk : chu tuyến vùng 3. Xấp xỉ bởi đoạn thẳng Nối điểm xuất phát R với điểm đang xét Pc bởi một đoạn thẳng. Sau đó tính toạ độ của Pi, một điểm nằm giữa R và Pc sao cho khoảng cách từ Pi đến đoạn thẳng là cực đại. Gọi khoảng cách này là di. Nếu di lớn hơn một ngưỡng cho trước (độ chính xác của xấp xỉ) người ta phân đoạn RPc thành 2 đoạn RPi và PiPc và tiếp tục thực hiện lấy mẫu với từng đoạn cho tới khi đoạn thẳng tìm được là “rất gần” với đường bao. 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Cặp (ni+1, vi+1) 8 láng giềng Pi • • • • • • • • • • • • R Pc di Pi di • • • • • • • • • • • • R Pc P1 P2 • • • • • • • • • • • • R Pc Hình xấp xỉ đường biên bằng đường gấp khúc Bài giảng Xử lý ảnh 58 GV. Mai Cường Thọ III. CÁC PHƯƠNG PHÁP PHÂN VÙNG ẢNH Để phân tích các đối tượng trong ảnh, chúng ta cần phải phân biệt được các đối tượng cần quan tâm với phần còn lại của ảnh. Những đối tượng này có thể tìm ra được nhờ các kỹ thuật phân đoạn ảnh, theo nghĩa tách phần tiền cảnh ra khỏi hậu cảnh trong ảnh. Chúng ta cần phải hiểu được là: - Không có kỹ thuật phân đoạn nào là vạn năng, theo nghĩa có thể áp dụng cho mọi loại ảnh. - Không có kỹ thuật phân đoạn nào là hoàn hảo. Có thể hiểu phân vùng là tiến trình chia ảnh thành nhiều vùng, mỗi vùng chứa một đối tượng hay nhóm đối tượng cùng kiểu. Chẳng hạn, một đối tượng có thể là một kí tự trên một trang văn bản hoặc một đoạn thẳng trong một bản vẽ kỹ thuật hoặc một nhóm các đối tượng có thể biểu diễn một từ hay hay đoạn thẳng tiếp xúc nhau. Ta có một số phương pháp phân vùng ảnh như sau: 1. Thuật toán gán nhãn thành phần liên thông Kỹ thuật này gán cho mỗi thành phần liên thông của ảnh nhị phân một nhãn riêng biệt. Nhãn thường là các số tự nhiên bắt đầu từ một đến tổng số các thành phần liên thông có trong ảnh. Giải thuật quét ảnh từ trái sang phải và từ trên xuống dưới. Trong dòng thứ nhất của các pixel đen, một nhãn duy nhất được gán cho mỗi đường chạy liên tục của pixel đen. Với mỗi pixel đen của các dòng tiếp theo, các pixel lân cận trên dòng trước và pixel bên trái được xem xét. Nếu bất kì pixel lân cận nào được gán nhãn, nhãn tương tự được gán cho pixel đen hiện thời; ngược lại nhãn tiếp theo chưa được sử dụng được chọn. Thủ tục này được tiếp tục cho tới dòng cuối của ảnh. Lúc kết thúc tiến trình này, một thành phần liên thông có thể chứa các pixel có các nhãn khác nhau vì khi chúng ta xem xét lân cận của pixel đen, chẳng hạn pixel “?” trong hình vẽ. Pixel đối với lân cận trái và những lân cận trong dòng trước có thể được gán nhãn một cách riêng biệt. Một tình huống như vậy phải được xác định và ghi lại. Sau tiến trình quét ảnh, việc gán nhãn được hoàn tất bằng cách thống nhất các mâu thuẫn các nhãn và gán lại các nhãn chưa sử dụng. Bài giảng Xử lý ảnh 59 GV. Mai Cường Thọ Để minh hoạ ta có hình biểu diễn sau : Vd : một phương pháp sửa nhãn ∃(p,q) là liên thông 8 mà label(p)label(q) -> sửa nhãn cho giống nhau. 2. Phân vùng bằng tách cây tứ phân Về nguyên tắc, phương pháp này kiểm tra tính hợp thức của tiêu chuẩn một cách tổng thể trên miền lớn của ảnh. Nếu tiêu chuẩn được thỏa, việc phân đoạn coi như kết thúc. Trong trường hợp ngược lại, ta chia miền đang xét thành 4 miền nhỏ hơn. Với mỗi miền nhỏ, ta áp dụng một cách đệ quy phương pháp trên cho đến khi tất cả các miền đều thỏa. Thuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọi mức trừ mức ngoài cùng. Vì thế cây này có tên là cây tứ phân. Cây này cho ta hình ản rõ nét về cấu trúc phân cấp của các vùng tương ứng với tiêu chuẩn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . * * * * . . * * * . . . . . 1 1 1 1 . . 2 2 2 . . . . . . * * * . . * * * * . . . . . 1 1 1 . . 2 2 2 2 . . . . * * * * . * * * * * . . . . 1 1 1 1 . 2 2 2 2 2 . . . . . . * * * * * . . . . . . . . . 1 1 ? * * . . . . . . . . . * * * * * * . * . . . ⇒ . . . * * * * * * . * . . . * * . . . . . . . . * * . . * * . . . . . . . . * * . . . * * . . . . . . . * * . . . * * . . . . . . . * * . . . * * . . . . . . . . . . . . * * . . . . . . . . . . . Hình b . Ảnh ban đầu Hình c . Tiến trình gán nhãn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 1 . . 2 2 2 . . . . . 1 1 1 1 . . 1 1 1 . . . . . . 1 1 1 . . 2 2 2 2 . . . . . 1 1 1 . . 1 1 1 1 . . . . 1 1 1 1 . 2 2 2 2 2 . . . . 1 1 1 1 . 1 1 1 1 1 . . . . . . 1 1 1 1 1 . . . . . . . . . 1 1 1 1 1 . . . . . . . . . 1 1 1 1 1 1 . 3 . . . ⇒ . . . 1 1 1 1 1 1 . 2 . . . 4 4 . . . . . . . . 3 3 . . 3 3 . . . . . . . . 2 2 . . . 4 4 . . . . . . . 3 3 . . . 3 3 . . . . . . . 2 2 . . . 4 4 . . . . . . . . . . . . 3 3 . . . . . . . . . . . Hình d . Sau khi quét đầy đủ Hình e .Kết quả sau cùng . . . . . . . . . .. . . . . P P P P . . . . . . . . L ? . . . . . . . . . . . . . . .. . . . . .. P: lân cận trước, L lân cân trái Bài giảng Xử lý ảnh 60 GV. Mai Cường Thọ Một vùng thỏa chuẩn sẽ tạo nên một nút lá, nếu không nó sẽ tạo nên một nút trong và có 4 nút con tương ứng với việc chia làm 4 vùng. Ta cứ tiếp tục như vậy cho đến khi phân xong. Các nút của cây biểu diễn số vùng đã phân. Tiêu chuẩn phân vùng ở đây là màu sắc. Nếu mọi điểm của vùng đều là màu trắng thì sẽ tạo nên nút lá trắng và tương tự như vậy với nút lá đen. Nút màu ghi vùng không thuần nhất và phải tiếp tục chia. Với ngưỡng θ cho trước, vùng thuần nhất phải thỏa điều kiện • Độ lệch chuẩn σ < θ • Hoặc θ<− MinMax với Max, Min lần lượt là giá trị lớn nhất và nhỏ nhất của mức xám trong vùng cần chia. • Giá trị điểm ảnh trong vùng bằng cách lấy trung bình giá trị của vùng đó Ảnh gốc Phân đoạn ở mức 1 Ví dụ: Cho ảnh S(m, n) , hãy phân vùng theo tiêu chí: ngưỡng θ= 2 và θ<− MinMax 98664422 98664422 22335577 22335577 12335578 98765532 88664422 88664422 ),( =nmS kết quả Vùng 2 Vùng 1 Vùng 3 Vùng 4 98664422 98664422 22335577 22335577 12335578 98765532 88664422 88664422 ),( =nmS Vùng 1 Bài giảng Xử lý ảnh 61 GV. Mai Cường Thọ Ta có cây tứ phân như sau 3. Phân vùng bởi hợp Ý tưởng của phương pháp này là xem xét ảnh từ các miền nhỏ nhất rồi hợp chúng lại nếu thỏa tiêu chuẩn để được một miền đồng nhất lớn hơn. Ta lại tiếp tục với miền thu được cho tới khi không thể hợp được nữa. Số miền còn lại cho ta kết quả phân đoạn. Như vậy miền nhỏ nhất của bước xuất phát là điểm ảnh. Phương pháp hợp vùng được thực hiện như sau: • Giả sử có 2 vùng ω và ω’ • Ta xác định cặp các điểm 4 láng giềng (p, q) sao cho p ∈ω và q ∈ω’ • Xác định ≤−= otherwise qIpIif qpT 0 )()(1),( 1θ Trong đó I(p), I(q) là giá trị mức xám của điểm p và q, θ1 là giá trị ngưỡng cho trước. • Gọi b(ω) và b(ω’) là số điểm biên của 2 vùng ω và ω’ (8) (3) 22 21 (1) (2) (8) (9) 14 4 3 2 1 13 12 11 (6) (7) (6) (3) (3) 23 24 (4) (2) (5) (2) (8) (7) (5) (7) (2) (4) (2) (3) (6) (9) Bài giảng Xử lý ảnh 62 GV. Mai Cường Thọ • Xét hàm khả năng hợp 2 vùng : ))(),(( ),(),( ' ' ϖϖ ϖϖ bbMin qpT KNG ∑= • Nếu ( ) 2', θϖϖ ≥KNG thì có thể hợp 2 vùng ω và ω’ thành 1 vùng. Ví dụ: Xét khả năng hợp các vùng của ảnh sau, 1θ =3, 2θ =0.6 44442222 88644222 88662212 88866612 68886111 66666111 66666611 ),( =nmS Gọi A, B, C, D, E lần lượt là các vùng chứa mức xám 1, 2, 4, 6, 8 Ta có bảng 1, Đếm số điểm biên các vùng và tính toán các ∑ ),( qpT Xác định hợp vùng Bảng 2 Kết luận : Có thể hợp được 2 vùng D và E vì 11/10 >θ2 Có thể hợp được 2 vùng B và C vì 4/6 >θ2 KNG(ω,ω’) A B C D E A - 5/10 0 0 0 B 5/10 - 4/6 0 0 C 0 4/6 - 3/6 0 D 0 0 3/6 - 11/10 ω’ ω A B C D E B(ω) A - 5 0 0 0 10 B 5 - 4 0 0 11 C 0 4 - 3 0 6 D 0 0 3 - 11 19 E 0 0 0 11 - 10 Bài giảng Xử lý ảnh 63 GV. Mai Cường Thọ IV. Phân vùng ảnh dựa theo ngưỡng biên độ - Kỹ thuật lấy ngưỡng Kỹ thuật này dựa trên một ý tưởng hết sức đơn giản. Một tham số θ, gọi là ngưỡng độ sáng, sẽ được chọn để áp dụng cho một ảnh a[m,n] theo cách sau: Nếu [ ] θ≥nma , thì [ ] 1, == objectnma Ngược lại [ ] 0, == backgroundnma Thuật toán trên giả định rằng chúng ta đang quan tâm đến các đối tượng sáng (object) hay nền ảnh (background) bằng các giá trị “1” hoặc “0”. Câu hỏi trung tâm trong kỹ thuật lấy ngưỡng khi đó sẽ là: Chúng ta nên chọn ngưỡng θ như thế nào? Mặc dù không có thuật toán chọn ngưỡng vạn năng nào có thể áp dụng cho mọi loại ảnh. Chúng ta cũng có nhiều phương pháp đưa ra dưới đây: 1. Ngưỡng cố định Phương pháp đầu tiên là chọn một ngưỡng độc lập với dữ liệu ảnh. Nếu chúng ta biết trước là chương trình ứng dụng sẽ làm việc với những ảnh có độ tương phản rất cao, trong đó các đối tuợng quan tâm rất tối còn nền gần như đồng nhất và rất sáng, thì giá trị ngưỡng không đổi 128 trên thang độ sáng từ 0 đến 255 sẽ là một giá trị chọn khá chính xác. Chính xác ở đây nên được hiểu theo nghĩa là số lượng các điểm ảnh bị phân lớp sai là cực tiểu. 2. Ngưỡng dựa trên lược đồ Trong hầu hết các trường hợp, ngưỡng được chọn từ lược đồ độ sáng của vùng hay ảnh cần được phân đoạn. Hình dưới đây cho chúng ta một ví dụ về ảnh và lược đồ độ sáng liên kết với nó. Bài giảng Xử lý ảnh 64 GV. Mai Cường Thọ Có rất nhiều kỹ thuật chọn ngưỡng tự động xuất phát từ lược đồ xám. Những kỹ thuật phổ biến nhất trong số đó sẽ được trình bày dưới đây. Những kỹ thuật này có thể tận dụng lợi thế do sự làm trơn dữ liệu lược đồ ban đầu mang lại, nhằm loại bỏ những dao động nhỏ về độ sáng. Tuy nhiên các thuật toán làm trơn cần phải cẩn trọng không được làm dịch chuyển các vị trí đỉnh của lược đồ. Nhận xét này dẫn đến thuật toán làm trơn lược đồ dưới dây, với độ rộng của cửa sổ W là N, thông dụng là N=3 hoặc N=5 (bộ lọc trung bình 1-chiều): [ ] ( ) ( ) [ ]ibh N bh N Ni rawsmooth −= ∑ − −−= 2/1 2/1 1 2.1. Tuật toán đẳng liệu (Isodata) Kỹ thuật chọn ngưỡng theo kiểu lặp này do Ridler và Calvard đưa ra. Thuật toán như sau: - Chia lược đồ thành 2 đoạn bằng một giá trị ngưỡng khởi động 10 2 −= Bθ , tức là bằng phần nửa thang độ xám động của ảnh. - Sau đó tính toán độ sáng trung bình của 2 vùng: - 0,fm của những điểm ảnh thuộc đối tượng - 0,bm của những điểm ảnh nền. - Tính giá trị ngưỡng mới 2 0,0, 1 bf mm + =θ Quá trình này cứ thế sẽ được tiếp tục với các ngưỡng mới cho đến khi nào giá trị ngưỡng không thay đổi nữa thì dừng lại. Biểu diễn dưới dạng công thức toán học, chúng ta có: 2 1,1, −− + = kbkf k mm θ cho tới khi 1−= kk θθ 2.2. Thuật toán tam giác Thuật toán này do Zack đưa ra trong (36) và được minh họa trong hình (trang bên). Trong hình này, chúng ta có thể quan sát thấy một đường thẳng đã được xây dựng bằng cách nối từ giá trị lớn nhất của lược đồ tại độ sáng bmax đến giá trị nhỏ nhất của lược đồ tại độ sáng bmin .Với mỗi độ sáng b trong khoảng [bmax, bmin], chúng ta đi tính khoảng cách d từ giá trị lược đồ tại b là h[b] đến đường thẳng đã có. Giá trị b0 ứng với khoảng cách lớn nhất sẽ được chọn làm giá trị ngưỡng θ. Bài giảng Xử lý ảnh 65 GV. Mai Cường Thọ Kỹ thuật lấy ngưỡng không nhất thiét phải được áp dụng cho toàn bộ ảnh, mà có thể áp dụng cho từng vùng ảnh một. Hai tác giả Chow và Kaneko đã phát triển một biến thể của kỹ thuật lấy ngưỡng bằng cách chia một ảnh có kích thước MxN ra thành nhiều vùng không chồng chất lên nhau. Các giá trị ngưỡng được tính riêng biệt cho từng vùng một và sau đó được kết hợp lại thông qua phép nội suy để hình thành nên một mặt ngưỡng cho toàn bộ ảnh. Trong thuật toán mới này, kích thước của các vùng cần được chọn một cách thích hợp sao cho có một lượng đáng kể các điểm ảnh ở trong một vùng, nhằm phục vụ cho việc tính lược đồ và xác định ngưỡng tương ứng. Tính hữu ích của thuật toán này, cũng như nhiêu thuật toán khác, sẽ phụ thuộc vào từng ứng dụng cụ thể.
File đính kèm:
- giao_trinh_xu_ly_anh_so.pdf