Giáo trình Xử lý ảnh số

Ảnh

- Tín hiệu ảnh thuộc loại tín hiệu đa chiều: tọa độ(x,y,z), độ sáng(λ), thời gian(t).

- Ảnh tĩnh trong không gian 2 chiều được định nghĩa là một hàm 2 biến S(x,y), với S

là giá trị biên độ (được biểu diễn bằng màu sắc) tại vị trí không gian (x,y).

- Phân loại ảnh

+ Ảnh tương tự S(x,y): (x,y) liên tục, S liên tục.

+ Ảnh số S(m,n): (m,n) rời rạc, S rời rạc.

- Một ảnh (gồm một tập các điểm ảnh) có thể xem như bao gồm tập các ảnh con (các

vùng ảnh). Thuật ngữ gọi là ROIs – vùng quan tâm (Regions of Interest).

- Ảnh số trong không gian rời rạc thu được từ ảnh tương tự trong không gian liên tục

thông qua quá trình số hóa. Quá trình số hóa có thể hiểu đơn giản như sau

+ Ảnh tương tự được chia thành M hàng, N cột.

+ Giao của hàng và cột được gọi là: pixel

+ Giá trị biên độ của pixel tại tọa độ nguyên (m,n) là s(m,n): là trung bình độ

sáng trong pixel đó. S(m,n) ≤ L (L số mức xám dùng biểu diễn ảnh).

- M, N thường được chọn là M=N=2K (K=8,9,10). L =2B , B là số bít mã hóa cho độ

sáng(biên độ) mỗi pixel.

- Ảnh số được biểu diễn bởi ma trận 2 chiều. Các phần tử của nó là biểu diễn cho

các pixel số hóa.

- Ta ký hiệu 1 ảnh số là S(M,N). Ta nói ảnh có độ phân giải MxN. Ký hiệu s(m,n) để

chỉ ra một phần tử ảnh.

Hệ thống xử lý ảnh

- Xử lý ảnh: Ảnh vào → Ảnh kết quả.

- Đối tượng xử lý của hệ thống ở đây là các ảnh (hàm 2 biến liên tục hoặc rời rạc).

Download

Trang 1

Trang 2

Trang 3

Trang 4

Trang 5

Trang 6

Trang 7

Trang 8

Trang 9

Trang 10

Tải về để xem bản đầy đủ

65 trang duykhanh 20700

Download

Bạn đang xem 10 trang mẫu của tài liệu "Giáo trình Xử lý ảnh số", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Giáo trình Xử lý ảnh số

lace. Toán tử Laplace được định nghĩa như sau:
2
2
2
2
2
dy
f
dx
ff ∂+∂=∇
Toán tử Laplace dùng nhiều kiểu mặt nạ khác nhau để xấp xỉ rời rạc đạo hàm
bậc hai. Dưới đây là 3 kiểu mặt nạ hay dùng:
121
252
121
111
181
111
010
141
010
321
−
−−
−
=
−−−
−−
−−−
=
−
−−
−
= HHH
Với mặt nạ H1, đôi khi người ta dùng phần tử ở tâm có giá trị là 8 thay vì giá
trị là 4 như đã chỉ ra. Để dễ hình dung việc xấp xỉ đạo hàm bậc hai trong không gian
rời rạc bởi mặt nạ H1 hay là ý nghĩa của mặt nạ H1, ta xét chi tiết cách tính đạo hàm
bậc 2. Trong không gian rời rạc đạo hàm bậc 2 có thể tính:
WS
NW
E W
N
S
NE
SE
Mô hình 8 hướng
Bài giảng Xử lý ảnh 55
GV. Mai Cường Thọ
)1,()1,(),(2
),1(),1(),(2
2
2
2
2
+−−−=
∂
∂
+−−−=
∂
∂
yxfyxfyxf
y
f
yxfyxfyxf
x
f
Vậy ),1()1,(),(4)1,(),1(2 yxfyxfyxfyxfyxff +−+−+−−−−=∇
3. Phương pháp khớp nối lỏng
a. Khái niệm láng giềng 4 và láng giềng 8
Với điểm P được bao phủ xung quanh bởi 8 điểm: P0, P1, P8
Ta có láng giềng 8 của P gồm các điểm: P0, P1, P2, P3, P4, P5, P6, P7
Láng giềng 4 của P gồm các điểm: P0, P2, P4, P6.
b. Phương pháp khớp nối lỏng
• Xét các điểm p và q là 2 điểm 4 láng giềng.
• I(p), I(q): giá trị mức xám của điểm p và q
• Nếu θ>− )()( qIpI thì coi như có cặp biên (p, q).
Ví dụ:
Cho ma trận ảnh
chọn θ =3 ta có
II. CÁC KỸ THUẬT DÒ BIÊN
1 Kỹ thuật Freeman(dò biên theo ảnh đen trắng)
Thuật toán
Bước1: Quét ảnh đến khi gặp điểm đen. Gọi nó là pixel 1.
Bước 2: Lặp
Nếu “điểm ảnh hiện thời là đen” rẽ trái
Ngược lại thì rẽ phải.
Dừng khi gặp điểm 1 ban đầu.
P3 P2 P1
P4 P P0
P5 P6 P7
6 2 3 6
2 3 6 2
3 6 2 3 6
2
3
2 3 6 2 3 1 4 2 8 5 7
4 2 8 5 7 1
2 8 5 7 1 4
3
6 1 4 2 8 5 7
4 2 8 5 7 1
2 8 5 7 1 4
Bài giảng Xử lý ảnh 56
GV. Mai Cường Thọ
Cải tiến thuật toán trên (Luân văn tiến sĩ: Hồ Ngọc Kỷ -1992)
Thuật toán
Bước1: Quét ảnh đến khi gặp điểm đen. Gọi nó là pixel 1.
Bước 2: Lặp
Nếu “điểm ảnh hiện thời là đen”
Thì “dò ngược”.
Ngược lại “sang phải”.
Đến khi gặp pixel 1
2. Dò biên theo cặp nền vùng
Phương pháp
Tìm cặp điểm (n,v), trong đó n và v là điểm 8 láng giềng, n là điểm nền và v
là điểm vùng.
Ban đầu có (n0, v0) dựa vào đó ta tìm được (n1, v1), qua trình này cứ tiếp tục.
Tổng quát nếu có (ni, vi) ta sẽ tìm (ni+1, vi+1), sao cho ni và ni+1 là 8 láng giềng , vi và
vi+1 là 8 láng giềng.
11 14 19
24 25
30
13
7
3 2
1 4 5
6
8
10
9
12
15
16 17
18
20 21
22 23 26 27
28 29
31
32 33
34 35
1 2
12
3
11
4 6
5
10 9 8 7
Bài giảng Xử lý ảnh 57
GV. Mai Cường Thọ
Quá trình dò biên theo nền vùng là: tìm 1 dãy các điểm (n0, v0), (n1, v1)(nk, vk) sao
cho
n0, n1, .nk : chu tuyến nền
v0, v1, .vk : chu tuyến vùng
3. Xấp xỉ bởi đoạn thẳng
Nối điểm xuất phát R với điểm đang xét Pc bởi một đoạn thẳng. Sau đó tính
toạ độ của Pi, một điểm nằm giữa R và Pc sao cho khoảng cách từ Pi đến đoạn thẳng
là cực đại. Gọi khoảng cách này là di. Nếu di lớn hơn một ngưỡng cho trước (độ
chính xác của xấp xỉ) người ta phân đoạn RPc thành 2 đoạn RPi và PiPc và tiếp tục
thực hiện lấy mẫu với từng đoạn cho tới khi đoạn thẳng tìm được là “rất gần” với
đường bao.
0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 1 1 1 1 1 1 1 0 0 0
0 0 0 1 1 1 1 1 1 1 1 1 0 0
0 0 0 1 1 1 1 1 1 1 1 1 0 0
0 0 0 1 1 1 1 1 1 1 1 0 0 0
0 0 0 1 1 1 1 1 1 1 0 0 0 0
0 0 0 0 1 1 1 1 1 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0
Cặp (ni+1, vi+1) 8 láng giềng
Pi
•
•
•
•
•
•
•
•
• •
•
•
R
Pc
di
Pi
di
•
•
•
•
•
•
•
•
• •
•
•
R
Pc
P1
P2
•
•
•
•
•
•
•
•
• •
•
•
R
Pc
Hình xấp xỉ đường biên bằng đường gấp khúc
Bài giảng Xử lý ảnh 58
GV. Mai Cường Thọ
III. CÁC PHƯƠNG PHÁP PHÂN VÙNG ẢNH
Để phân tích các đối tượng trong ảnh, chúng ta cần phải phân biệt được các
đối tượng cần quan tâm với phần còn lại của ảnh. Những đối tượng này có thể tìm ra
được nhờ các kỹ thuật phân đoạn ảnh, theo nghĩa tách phần tiền cảnh ra khỏi hậu
cảnh trong ảnh. Chúng ta cần phải hiểu được là:
- Không có kỹ thuật phân đoạn nào là vạn năng, theo nghĩa có thể áp dụng cho
mọi loại ảnh.
- Không có kỹ thuật phân đoạn nào là hoàn hảo.
Có thể hiểu phân vùng là tiến trình chia ảnh thành nhiều vùng, mỗi vùng chứa
một đối tượng hay nhóm đối tượng cùng kiểu. Chẳng hạn, một đối tượng có thể là
một kí tự trên một trang văn bản hoặc một đoạn thẳng trong một bản vẽ kỹ thuật
hoặc một nhóm các đối tượng có thể biểu diễn một từ hay hay đoạn thẳng tiếp xúc
nhau. Ta có một số phương pháp phân vùng ảnh như sau:
1. Thuật toán gán nhãn thành phần liên thông
Kỹ thuật này gán cho mỗi thành phần liên thông của ảnh nhị phân một nhãn
riêng biệt. Nhãn thường là các số tự nhiên bắt đầu từ một đến tổng số các thành phần
liên thông có trong ảnh. Giải thuật quét ảnh từ trái sang phải và từ trên xuống dưới.
Trong dòng thứ nhất của các pixel đen, một nhãn duy nhất được gán cho mỗi đường
chạy liên tục của pixel đen. Với mỗi pixel đen của các dòng tiếp theo, các pixel lân
cận trên dòng trước và pixel bên trái được xem xét. Nếu bất kì pixel lân cận nào
được gán nhãn, nhãn tương tự được gán cho pixel đen hiện thời; ngược lại nhãn tiếp
theo chưa được sử dụng được chọn. Thủ tục này được tiếp tục cho tới dòng cuối của
ảnh.
Lúc kết thúc tiến trình này, một thành phần liên thông có thể chứa các pixel
có các nhãn khác nhau vì khi chúng ta xem xét lân cận của pixel đen, chẳng hạn
pixel “?” trong hình vẽ. Pixel đối với lân cận trái và những lân cận trong dòng trước
có thể được gán nhãn một cách riêng biệt. Một tình huống như vậy phải được xác
định và ghi lại. Sau tiến trình quét ảnh, việc gán nhãn được hoàn tất bằng cách thống
nhất các mâu thuẫn các nhãn và gán lại các nhãn chưa sử dụng.
Bài giảng Xử lý ảnh 59
GV. Mai Cường Thọ
Để minh hoạ ta có hình biểu diễn sau :
Vd : một phương pháp sửa nhãn
∃(p,q) là liên thông 8 mà label(p)label(q) -> sửa nhãn cho giống nhau.
2. Phân vùng bằng tách cây tứ phân
Về nguyên tắc, phương pháp này kiểm tra tính hợp thức của tiêu chuẩn một
cách tổng thể trên miền lớn của ảnh. Nếu tiêu chuẩn được thỏa, việc phân đoạn coi
như kết thúc. Trong trường hợp ngược lại, ta chia miền đang xét thành 4 miền nhỏ
hơn. Với mỗi miền nhỏ, ta áp dụng một cách đệ quy phương pháp trên cho đến khi
tất cả các miền đều thỏa.
Thuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọi mức trừ
mức ngoài cùng. Vì thế cây này có tên là cây tứ phân. Cây này cho ta hình ản rõ nét
về cấu trúc phân cấp của các vùng tương ứng với tiêu chuẩn.
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
. * * * * . . * * * . . . . . 1 1 1 1 . . 2 2 2 . . . .
. . * * * . . * * * * . . . . . 1 1 1 . . 2 2 2 2 . . .
. * * * * . * * * * * . . . . 1 1 1 1 . 2 2 2 2 2 . . .
. . . * * * * * . . . . . . . . . 1 1 ? * * . . . . . .
. . . * * * * * * . * . . . ⇒ . . . * * * * * * . * . . .
* * . . . . . . . . * * . . * * . . . . . . . . * * . .
. * * . . . . . . . * * . . . * * . . . . . . . * * . .
. * * . . . . . . . . . . . . * * . . . . . . . . . . .
Hình b . Ảnh ban đầu Hình c . Tiến trình gán nhãn
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
. 1 1 1 1 . . 2 2 2 . . . . . 1 1 1 1 . . 1 1 1 . . . .
. . 1 1 1 . . 2 2 2 2 . . . . . 1 1 1 . . 1 1 1 1 . . .
. 1 1 1 1 . 2 2 2 2 2 . . . . 1 1 1 1 . 1 1 1 1 1 . . .
. . . 1 1 1 1 1 . . . . . . . . . 1 1 1 1 1 . . . . . .
. . . 1 1 1 1 1 1 . 3 . . . ⇒ . . . 1 1 1 1 1 1 . 2 . . .
4 4 . . . . . . . . 3 3 . . 3 3 . . . . . . . . 2 2 . .
. 4 4 . . . . . . . 3 3 . . . 3 3 . . . . . . . 2 2 . .
. 4 4 . . . . . . . . . . . . 3 3 . . . . . . . . . . .
Hình d . Sau khi quét đầy đủ Hình e .Kết quả sau cùng
. . . . . . . . . ..
. . . . P P P P . . . .
. . . . L ? . . . . . . .
. . . . . . . .. . . . . ..
P: lân cận trước, L lân cân trái
Bài giảng Xử lý ảnh 60
GV. Mai Cường Thọ
Một vùng thỏa chuẩn sẽ tạo nên một nút lá, nếu không nó sẽ tạo nên một nút
trong và có 4 nút con tương ứng với việc chia làm 4 vùng. Ta cứ tiếp tục như vậy
cho đến khi phân xong. Các nút của cây biểu diễn số vùng đã phân.
Tiêu chuẩn phân vùng ở đây là màu sắc. Nếu mọi điểm của vùng đều là màu
trắng thì sẽ tạo nên nút lá trắng và tương tự như vậy với nút lá đen. Nút màu ghi
vùng không thuần nhất và phải tiếp tục chia.
Với ngưỡng θ cho trước, vùng thuần nhất phải thỏa điều kiện
• Độ lệch chuẩn σ < θ
• Hoặc θ<− MinMax với Max, Min lần lượt là giá trị lớn nhất và nhỏ nhất của
mức xám trong vùng cần chia.
• Giá trị điểm ảnh trong vùng bằng cách lấy trung bình giá trị của vùng đó
Ảnh gốc Phân đoạn ở mức 1
Ví dụ:
Cho ảnh S(m, n) , hãy phân vùng theo tiêu chí: ngưỡng θ= 2 và θ<− MinMax
98664422
98664422
22335577
22335577
12335578
98765532
88664422
88664422
),( =nmS kết quả
Vùng 2
Vùng 1
Vùng 3
Vùng 4
98664422
98664422
22335577
22335577
12335578
98765532
88664422
88664422
),( =nmS
Vùng 1
Bài giảng Xử lý ảnh 61
GV. Mai Cường Thọ
Ta có cây tứ phân như sau
3. Phân vùng bởi hợp
Ý tưởng của phương pháp này là xem xét ảnh từ các miền nhỏ nhất rồi hợp
chúng lại nếu thỏa tiêu chuẩn để được một miền đồng nhất lớn hơn. Ta lại tiếp tục
với miền thu được cho tới khi không thể hợp được nữa. Số miền còn lại cho ta kết
quả phân đoạn. Như vậy miền nhỏ nhất của bước xuất phát là điểm ảnh.
Phương pháp hợp vùng được thực hiện như sau:
• Giả sử có 2 vùng ω và ω’
•
Ta xác định cặp các điểm 4 láng giềng (p, q) sao cho p ∈ω và q ∈ω’
• Xác định

 ≤−=
otherwise
qIpIif
qpT
0
)()(1),( 1θ
Trong đó I(p), I(q) là giá trị mức xám của điểm p và q, θ1 là giá trị ngưỡng cho
trước.
• Gọi b(ω) và b(ω’) là số điểm biên của 2 vùng ω và ω’
(8)
(3)
22 21
(1) (2) (8) (9)
14
4
3
2
1
13
12
11
(6)
(7) (6) (3) (3)
23
24
(4)
(2) (5)
(2)
(8)
(7)
(5)
(7) (2) (4) (2) (3) (6) (9)
Bài giảng Xử lý ảnh 62
GV. Mai Cường Thọ
• Xét hàm khả năng hợp 2 vùng : ))(),((
),(),(
'
'
ϖϖ
ϖϖ
bbMin
qpT
KNG ∑=
• Nếu ( ) 2', θϖϖ ≥KNG thì có thể hợp 2 vùng ω và ω’ thành 1 vùng.
Ví dụ:
Xét khả năng hợp các vùng của ảnh sau, 1θ =3, 2θ =0.6
44442222
88644222
88662212
88866612
68886111
66666111
66666611
),( =nmS
Gọi A, B, C, D, E lần lượt là các vùng chứa mức xám 1, 2, 4, 6, 8
Ta có bảng 1, Đếm số điểm biên các vùng và tính toán các ∑ ),( qpT
Xác định hợp vùng Bảng 2
Kết luận : Có thể hợp được 2 vùng D và E vì 11/10 >θ2
Có thể hợp được 2 vùng B và C vì 4/6 >θ2
KNG(ω,ω’) A B C D E
A - 5/10 0 0 0
B 5/10 - 4/6 0 0
C 0 4/6 - 3/6 0
D 0 0 3/6 - 11/10
ω’
ω
A B C D E B(ω)
A - 5 0 0 0 10
B 5 - 4 0 0 11
C 0 4 - 3 0 6
D 0 0 3 - 11 19
E 0 0 0 11 - 10
Bài giảng Xử lý ảnh 63
GV. Mai Cường Thọ
IV. Phân vùng ảnh dựa theo ngưỡng biên độ
- Kỹ thuật lấy ngưỡng
Kỹ thuật này dựa trên một ý tưởng hết sức đơn giản. Một tham số θ, gọi là
ngưỡng độ sáng, sẽ được chọn để áp dụng cho một ảnh a[m,n] theo cách sau:
Nếu [ ] θ≥nma , thì [ ] 1, == objectnma
Ngược lại [ ] 0, == backgroundnma
Thuật toán trên giả định rằng chúng ta đang quan tâm đến các đối tượng sáng
(object) hay nền ảnh (background) bằng các giá trị “1” hoặc “0”.
Câu hỏi trung tâm trong kỹ thuật lấy ngưỡng khi đó sẽ là: Chúng ta nên chọn
ngưỡng θ như thế nào? Mặc dù không có thuật toán chọn ngưỡng vạn năng nào có
thể áp dụng cho mọi loại ảnh. Chúng ta cũng có nhiều phương pháp đưa ra dưới đây:
1. Ngưỡng cố định
Phương pháp đầu tiên là chọn một ngưỡng độc lập với dữ liệu ảnh. Nếu chúng
ta biết trước là chương trình ứng dụng sẽ làm việc với những ảnh có độ tương phản
rất cao, trong đó các đối tuợng quan tâm rất tối còn nền gần như đồng nhất và rất
sáng, thì giá trị ngưỡng không đổi 128 trên thang độ sáng từ 0 đến 255 sẽ là một giá
trị chọn khá chính xác. Chính xác ở đây nên được hiểu theo nghĩa là số lượng các
điểm ảnh bị phân lớp sai là cực tiểu.
2. Ngưỡng dựa trên lược đồ
Trong hầu hết các trường hợp, ngưỡng được chọn từ lược đồ độ sáng của vùng
hay ảnh cần được phân đoạn. Hình dưới đây cho chúng ta một ví dụ về ảnh và lược
đồ độ sáng liên kết với nó.
Bài giảng Xử lý ảnh 64
GV. Mai Cường Thọ
Có rất nhiều kỹ thuật chọn ngưỡng tự động xuất phát từ lược đồ xám. Những kỹ
thuật phổ biến nhất trong số đó sẽ được trình bày dưới đây. Những kỹ thuật này có
thể tận dụng lợi thế do sự làm trơn dữ liệu lược đồ ban đầu mang lại, nhằm loại bỏ
những dao động nhỏ về độ sáng. Tuy nhiên các thuật toán làm trơn cần phải cẩn
trọng không được làm dịch chuyển các vị trí đỉnh của lược đồ. Nhận xét này dẫn đến
thuật toán làm trơn lược đồ dưới dây, với độ rộng của cửa sổ W là N, thông dụng là
N=3 hoặc N=5 (bộ lọc trung bình 1-chiều):
[ ]
( )
( ) [ ]ibh
N
bh
N
Ni
rawsmooth −= ∑
−
−−=
2/1
2/1
1
2.1. Tuật toán đẳng liệu (Isodata)
Kỹ thuật chọn ngưỡng theo kiểu lặp này do Ridler và Calvard đưa ra. Thuật
toán như sau:
- Chia lược đồ thành 2 đoạn bằng một giá trị ngưỡng khởi động 10 2 −= Bθ , tức
là bằng phần nửa thang độ xám động của ảnh.
- Sau đó tính toán độ sáng trung bình của 2 vùng:
- 0,fm của những điểm ảnh thuộc đối tượng
- 0,bm của những điểm ảnh nền.
- Tính giá trị ngưỡng mới
2
0,0,
1
bf mm +
=θ
Quá trình này cứ thế sẽ được tiếp tục với các ngưỡng mới cho đến khi nào giá
trị ngưỡng không thay đổi nữa thì dừng lại. Biểu diễn dưới dạng công thức toán học,
chúng ta có:
2
1,1, −− +
=
kbkf
k
mm
θ cho tới khi 1−= kk θθ
2.2. Thuật toán tam giác
Thuật toán này do Zack đưa ra trong (36) và được minh họa trong hình (trang
bên). Trong hình này, chúng ta có thể quan sát thấy một đường thẳng đã được xây
dựng bằng cách nối từ giá trị lớn nhất của lược đồ tại độ sáng bmax đến giá trị nhỏ
nhất của lược đồ tại độ sáng bmin .Với mỗi độ sáng b trong khoảng [bmax, bmin], chúng
ta đi tính khoảng cách d từ giá trị lược đồ tại b là h[b] đến đường thẳng đã có. Giá trị
b0 ứng với khoảng cách lớn nhất sẽ được chọn làm giá trị ngưỡng θ.
Bài giảng Xử lý ảnh 65
GV. Mai Cường Thọ
Kỹ thuật lấy ngưỡng không nhất thiét phải được áp dụng cho toàn bộ ảnh, mà
có thể áp dụng cho từng vùng ảnh một. Hai tác giả Chow và Kaneko đã phát triển
một biến thể của kỹ thuật lấy ngưỡng bằng cách chia một ảnh có kích thước MxN ra
thành nhiều vùng không chồng chất lên nhau. Các giá trị ngưỡng được tính riêng
biệt cho từng vùng một và sau đó được kết hợp lại thông qua phép nội suy để hình
thành nên một mặt ngưỡng cho toàn bộ ảnh. Trong thuật toán mới này, kích thước
của các vùng cần được chọn một cách thích hợp sao cho có một lượng đáng kể các
điểm ảnh ở trong một vùng, nhằm phục vụ cho việc tính lược đồ và xác định ngưỡng
tương ứng. Tính hữu ích của thuật toán này, cũng như nhiêu thuật toán khác, sẽ phụ
thuộc vào từng ứng dụng cụ thể.

File đính kèm:

giao_trinh_xu_ly_anh_so.pdf