Ứng dụng cắt ảnh tự động trong thiết kế thẻ sinh viên

TÓM TẮT

Hình ảnh người trên các dạng thẻ như thẻ sinh viên, thẻ học sinh, thẻ nhân viên. là một

trong những thành phần quan trọng để nhận diện người. Hiện nay, cách phổ biến để xử lý các

hình thẻ này là cắt thủ công trên các phần mềm xử lý đồ họa (Adobe Photoshop, Corel, MS

Paint, ) dẫn đến mất nhiều thời gian khi xử lý tập ảnh lớn và chưa có căn cứ để xác định vị

trí của đối tượng bên trong ảnh. Trong bài báo này, nhóm tác giả đề xuất giải pháp kết hợp

thuật toán phát hiện khuôn mặt và thuật toán phát hiện biên để cắt ảnh thẻ tự động theo tỷ lệ

kích thước 3:4. Trong đó, vị trí đối tượng bên trong ảnh được tính sao cho cách đều 2 biên

dọc và cách biên ngang phía trên của vùng cắt một khoảng cách phù hợp. Phương pháp đề

xuất thử nghiệm trên tập ảnh có nền đồng nhất đạt được tỷ lệ chính xác cao.

Download

Trang 1

Trang 2

Trang 3

Trang 4

Trang 5

Trang 6

Trang 7

Trang 8

8 trang xuanhieu 2820

Download

Bạn đang xem tài liệu "Ứng dụng cắt ảnh tự động trong thiết kế thẻ sinh viên", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Ứng dụng cắt ảnh tự động trong thiết kế thẻ sinh viên

a
quan tâm đến vị trí, kích thước của người bên trong ảnh, điều này dẫn đến sự không đồng
đều giữa các đối tượng trong các ảnh thẻ và một số ảnh bị lệch đối tượng (Hình 1). Tuy
nhiên, Tổ chức Hàng không Dân dụng Quốc tế có các tiêu chuẩn quy định rất chặt chẽ về
ảnh chụp sử dụng trong hộ chiếu và đã được rất nhiều nước trên thế giới áp dụng [1]. Theo
tiêu chuẩn này, chiều rộng ảnh 35-40 mm, khuôn mặt chiếm từ 70-80% ảnh, mặt nhìn thẳng
về trước Trong bài báo này, nhóm tác giả đề xuất phương pháp cắt ảnh chứa đối tượng
người một cách tự động theo tỷ lệ kích thước ảnh 3:4 từ một ảnh kỹ thuật số bất kỳ. Trong
đó, vị trí của đối tượng người được tính cân đối với các đường biên của vùng cắt hình chữ
nhật. Thuật toán Viola – Jones được sử dụng để phát hiện và xác định tọa độ của khuôn mặt
người có trong ảnh [2]. Thuật toán này phát hiện được nhiều khuôn mặt trong một ảnh với
nền ảnh bất kỳ. Tuy nhiên, vùng cắt ảnh thẻ được xác định là một hình chữ nhật duy nhất
nên tập ảnh đầu vào được chọn để phát hiện khuôn mặt là các ảnh đơn, nghĩa là mỗi ảnh gồm
một đối tượng người. Để xác định vị trí đối tượng, nhóm tác giả sử dụng thuật toán Canny
Edge Dectection [3], thuật toán này tìm ra các đường biên của đối tượng (Hình 7b). Dựa vào
tập đường biên này để xác định vị trí đỉnh đầu và tính khoảng cách từ đỉnh đầu đến biên
ngang phía trên của khung ảnh.
Nguyễn Văn Lễ, Phạm Nguyễn Huy Phương, Vũ Văn Vinh
108
(a) (b) (c) (d)
Hình 1. Ảnh thẻ với đối tượng người bị lệch
(a): lệch trái, (b): lệch phải, (c) và (d): lệch trên
Hình 2. Ảnh gốc ban đầu
Hình 3. Kết quả ảnh sau khi cắt tự động theo tỷ lệ 3:4
2. CÁC CÔNG TRÌNH LIÊN QUAN
Năm 2003, Bongwon Suh và B.Bederson đề xuất phương pháp cắt ảnh thu nhỏ tự động
(Thumbnail Cropping) dựa trên những điểm nổi bật của đối tượng (Saliency Map) [4].
Phương pháp này tìm ra hình chữ nhật tối ưu bao quanh đối tượng với các ngưỡng cho trước
và cắt thành ảnh thu nhỏ tương ứng. Ngoài ra, kết hợp phát hiện khuôn mặt (face detection)
để cắt ảnh chứa đối tượng người hỗ trợ cho các hệ thống nhận dạng. Năm 2005, Mingju
Zhang và Lei Zhang đề xuất phương pháp cắt ảnh tự động dựa trên 14 loại mẫu hình ảnh
được xác định trước, kết hợp với kết quả phát hiện khuôn mặt và phát hiện các vùng nổi bật
để cắt ảnh người theo tỷ lệ cho trước như 2:1, 4:3, 1:1, 3:4, 2:3 [5]. Tuy nhiên, việc dựa vào
các điểm nổi bật để xác định vùng cắt đôi khi dẫn đến kết quả không chính xác vì một số đối
tượng trong ảnh rất nổi bật nhưng không phải là đối tượng trung tâm. Năm 2006, A.Santella
và D.DeCarlo đề xuất phương pháp cắt ảnh bán tự động dựa trên tương tác góc nhìn. Xác
định vùng cắt bằng cách phân đoạn ảnh kết hợp với kỹ thuật Eye Tracking [6]. Năm 2007,
Fred Stentiford đề xuất phương pháp cắt ảnh tự động dựa trên điểm chú ý [7]. Phương pháp
này dựa trên nền tảng Saliency Map và tìm vùng chứa các điểm chú ý là các điểm có sự
chênh lệch màu sắc lớn hơn một ngưỡng xác định. Ngoài ra, kết hợp với hệ số phóng to để
cắt ảnh chứa các điểm chú ý theo nhiều kích thước khác nhau. Năm 2009, Nishiyama et al.
trình bày phương pháp cắt hình ảnh dựa trên cảm giác [8]. Phương pháp này sử dụng
Saliency Map để trích xuất các đối tượng có trong ảnh, mỗi đối tượng được chỉ định một
Ứng dụng cắt ảnh tự động trong thiết kế thẻ sinh viên
109
vùng cắt tương ứng. Sau đó, chọn vùng cắt phù hợp nhất dựa vào kết quả phân lớp hình ảnh.
Nguồn dữ liệu huấn luyện để phân lớp được thu thập từ các trang web lưu trữ ảnh với số
lượng lớn. Năm 2010, nhóm tác giả G. Liu và J. Chen đề xuất tối ưu hóa thành phần ảnh
bằng cách xác định vùng cắt tối ưu là hình chữ nhật có cùng tỷ lệ với ảnh gốc ban đầu [9].
Phương pháp này thực hiện phân đoạn ảnh để tìm ra các vùng nổi bật (salient regions) và
đường nổi bật (prominent lines), sau đó đo lường mức độ thẩm mỹ và xác định vùng cắt tối
ưu. Năm 2011, J.She và D.Wang đề xuất cắt ảnh tự động dựa trên mã hóa mật độ thấp
(Sparse coding) [10]. Phương pháp này thực hiện phân loại ảnh thành 13 danh mục, trích
xuất các điểm nổi bật của ảnh dựa trên đồ thị để tạo từ điển cho từng danh mục. Vùng cắt
được xác định dựa trên mã hóa mật độ thấp và bộ từ điển. Năm 2013, J.Yan và S.Lin xây
dựng 3 bộ huấn luyện liên quan đến các chủ đề ảnh khác nhau dựa trên cặp ảnh gốc và ảnh
được cắt bởi các chuyên gia về nhiếp ảnh [11]. Phương pháp này kết hợp phát hiện khuôn
mặt, phát hiện điểm nổi bật để trích xuất các đối tượng tiền cảnh, sau đó loại trừ các đối
tượng phụ và xác định vùng cắt phù hợp. Gần đây, Chen et al. nghiên cứu độ phức tạp tính
toán trong việc tìm kiếm vùng cắt tối ưu dựa trên điểm nổi bật của ảnh và chỉ ra 3 vấn đề
trong các thuật toán trước đó có độ phức tạp tính toán cao [12]. Các vấn đề là: tìm kiếm vùng
cắt tối thiểu, cố định tỷ lệ vùng cắt tìm kiếm và xác định nhiều vùng cắt trên một ảnh cho các
đối tượng rời rạc, đồng thời đưa ra thuật toán để giải quyết các vấn đề này.
Các công trình nghiên cứu vừa trình bày cho thấy việc cắt ảnh chủ yếu dựa vào phát
hiện các điểm nổi bật (Saliency Map) để khoanh vùng các đối tượng chính có trong ảnh hoặc
kết hợp với phát hiện khuôn mặt (đối với ảnh người), từ đó xác định vùng cắt bằng cách tìm
kiếm hình chữ nhật tối ưu theo nhiều phương pháp khác nhau. Trong bài báo này, nhóm tác
giả đề xuất giải pháp mới để cắt ảnh thẻ, vùng cắt là hình chữ nhật được xác định theo tỷ lệ
kích thước 3:4. Phương pháp này kết hợp phát hiện khuôn mặt (Face Detection) và phát hiện
biên (Edge Detection) sau đó tính toán đưa ra vùng cắt phù hợp nhất.
3. PHƢƠNG PHÁP CẮT ẢNH THẺ
3.1. Cấu trúc ảnh thẻ
Trong bài báo này, nhóm tác giả đề xuất cấu trúc ảnh thẻ bao gồm kích thước biên ảnh
với chiều rộng RecW và chiều cao RecH theo tỷ lệ 3:4; khoảng cách từ đỉnh đầu của người
đến biên trên là H = *RecW; khoảng cách từ hai biên trái và phải của khuôn mặt đến 2 biên
trái và phải của khung ảnh là D = *FaceW/2, với FaceW là độ rộng của khuôn mặt.
Hình 4. Cấu trúc ảnh thẻ
Nguyễn Văn Lễ, Phạm Nguyễn Huy Phương, Vũ Văn Vinh
110
Tìm hệ số : Với ảnh thẻ giấy chuẩn kích thước 30 x 40 mm thì khoảng cách K tính từ
đỉnh đầu người trong ảnh đến biên trên của khung ảnh phù hợp nhất là trong khoảng từ 2 đến
8 mm. Tuy nhiên, ảnh kỹ thuật số sử dụng đơn vị Pixel nên kích thước các ảnh có thể chênh
lệch với nhau tùy thuộc vào độ phân giải của ảnh. Do đó, với một ảnh kỹ thuật số có chiều
rộng là RecW pixel thì khoảng cách từ đỉnh đầu người đến biên trên của khung ảnh được tính
lại theo công thức H=(K/30)*RecW. Đặt = K/30, vậy H=*RecW. Hệ số  có giá trị phụ
thuộc vào K được liệt kê như trong bảng 1. Giá trị  càng lớn thì khoảng cách H tính từ đỉnh
đầu người đến biên trên càng lớn.
Bảng 1. Giá trị hệ số 
K 2 3 4 5 6 7 8
Hệ số  0,067 0,100 0,133 0,167 0,200 0,233 0,267
Tìm hệ số : Để tìm hệ số này, nhóm tác giả thu thập 100 ảnh thẻ gồm 50 ảnh của sinh
viên chụp tại Trường Đại học Công nghiệp Thực phẩm TP.HCM, 50 ảnh thẻ trên mạng
internet và tiến hành đo thực nghiệm 2 giá trị gồm: tổng khoảng cách W tính từ 2 biên trái
phải của khuôn mặt đến 2 biên trái phải của khung ảnh (W = 2D) và độ rộng F của khuôn
mặt. Sau đó tính trung bình các giá trị này trên 100 ảnh (N = 100).
∑
∑
Ta có công thức tính hệ số  như sau:
(1)
3.2. Quy trình xử lý cắt ảnh thẻ
Hình 5. Sơ đồ xử lý cắt ảnh thẻ
Mục tiêu hoạt động của hệ thống là xác định vùng cắt hình chữ nhật trên mỗi ảnh đầu
vào, vùng cắt này là duy nhất nên ảnh đầu vào được chọn là ảnh đơn, nghĩa là mỗi ảnh chỉ
chứa một đối tượng người. Các thông số của vùng cắt cần xác định gồm: chiều rộng RecW,
chiều cao RecH và tọa độ của hình chữ nhật này trong không gian 2 chiều gồm: hoành độ
Xrec và tung độ Yrec
Ứng dụng cắt ảnh tự động trong thiết kế thẻ sinh viên
111
Hình 6. Vùng cắt hình chữ nhật trong hệ trục tọa độ không gian hai chiều
Thuật toán Viola – Jones xác định tọa độ của khuôn mặt với hoành độ Xface và hình chữ
nhật màu đỏ (Hình 6, Hình 7a) chứa khuôn mặt với độ rộng FaceW. Dựa vào độ rộng FaceW
của hình chữ nhật này và hệ số  để tính độ rộng RecW vùng cắt ảnh thẻ:
( ) (2)
Chiều cao RecH của vùng cắt được xác định dựa vào chiều rộng RecW theo tỷ lệ 3:4:
(3)
Hoành độ vùng cắt (Hình 6) được xác định theo công thức:
(4)
Thuật toán Canny edge detection xác định tất cả các đường biên của đối tượng (Hình 7b).
Mục tiêu bước này là tìm đường biên qua đỉnh (Hình 7c). Đường biên qua đỉnh được xác
định là đường biên đi qua điểm có tung độ nhỏ nhất Ytophead, sau đó ta tính được Yrec theo
công thức:
(5)
Sau cùng là cắt ảnh dựa vào vùng cắt đã xác định: Xrec , Yrec , RecW, RecH
(a) Phát hiện (b) Phát hiện tất cả biên (c) Tìm đường biên d) Vùng cắt với
khuôn mặt của đối tượng qua đỉnh đường nét đứt
Hình 7. Xác định vùng cắt
Nguyễn Văn Lễ, Phạm Nguyễn Huy Phương, Vũ Văn Vinh
112
Đối với ảnh có nền không đồng nhất, một số ảnh sẽ xuất hiện các đường biên phía trên
tập đường biên của đối tượng người do nền ảnh sinh ra dẫn đến sai số trong việc xác định
Ytophead. Để hạn chế sai số này, việc tìm kiếm đường biên qua đỉnh chỉ giới hạn trong một
khoảng cho trước ở vị trí phía trên khuôn mặt.
3.3. Đánh giá phƣơng pháp
Để đánh giá độ chính xác của phương pháp cắt ảnh thẻ, nhóm tác giả thu thập 200 ảnh
người chụp với tư thế mặt hướng ra phía trước. Trong đó, 100 ảnh được chụp với nền không
đồng nhất [13], 100 ảnh còn lại có nền đồng nhất [14] và tiến hành thử nghiệm cắt ảnh thẻ tự
động theo tỷ lệ kích thước 3:4 trên 2 tập ảnh này. Các giá trị được ghi nhận gồm: số lượng
ảnh cắt đúng (sau khi cắt, đối tượng người được canh cân đối so với các biên của khung
ảnh); số lượng ảnh cắt lệch (đối tượng người bị lệch so với các biên của khung ảnh sau khi
cắt); số lượng ảnh không xác định (không phát hiện được mặt người trong ảnh); tỷ lệ đúng
(tính bằng tỷ lệ phần trăm của số lượng ảnh cắt đúng trên tổng số lượng ảnh). Kết quả thử
nghiệm được trình bày trong bảng dưới đây.
Bảng 2. Đánh giá cắt ảnh thẻ
Loại ảnh Số lượng Cắt đúng Cắt lệch Không xác định Tỷ lệ đúng
Ảnh có nền không đồng nhất 100 85 10 5 85%
Ảnh có nền đồng nhất 100 93 4 3 93%
Bảng kết quả thử nghiệm trên cho thấy, ảnh có nền đồng nhất có tỷ lệ cắt đúng (93%)
cao hơn so với ảnh có nền không đồng nhất (85%). Thông thường các ảnh dùng làm thẻ
được chụp với tư thế nhìn thẳng về trước, màu nền đồng nhất nên việc áp dụng nghiên cứu
này trong các hệ thống cắt ảnh thẻ sẽ rất phù hợp và cho hiệu suất cao.
Hình 8. Ứng dụng cắt ảnh thẻ trong thiết kế thẻ sinh viên
Ứng dụng cắt ảnh tự động trong thiết kế thẻ sinh viên
113
4. KẾT LUẬN
Nhóm tác giả vừa trình bày phương pháp cắt ảnh thẻ theo tỷ lệ kích thước 3:4 dựa trên
sự kết hợp thuật toán Viola – Jones để phát hiện khuôn mặt và thuật toán Canny edge
detection nhằm xác định biên đối tượng. Kết quả thử nghiệm trên 2 tập dữ liệu ảnh có nền
đồng nhất và có nền không đồng nhất là 93% và 85%. Trong đó tập ảnh có nền đồng nhất
cho tỷ lệ chính xác cao hơn, phù hợp để ứng dụng trong thiết kế thẻ sinh viên.
Dựa trên kết quả này, hướng phát triển tiếp theo là xử lý cắt và xoay đối với các ảnh
nghiêng, tính tỷ lệ phần trăm đối tượng trong ảnh và một số ràng buộc khác đáp ứng tiêu
chuẩn ảnh thẻ được quy định cho thẻ visa hoặc hộ chiếu.
TÀI LIỆU THAM KHẢO
1. Poon J. - A photograph guidelines, International Civil Aviation Organization (ICAO),
2011 (https://www.icao.int/Security/mrtd/Downloads/Technical Reports/Annex_A-
Photograph_Guidelines.pdf).
2. Viola P. and Jones M. - Rapid object detection using a boosted cascade of simple
features, Proceedings of the 2001 IEEE Computer Society Conference on Computer
Vision and Pattern Recognition (CVPR) 1 (2001) 511-518.
3. Canny J. - A computational approach to edge detection, IEEE Transactions on Pattern
Analysis And Machine Intelligence 6 (1986) 679–698.
4. Suh B., Ling H., Bederson B.B. and Jacobs D.W. - Automatic thumbnail cropping and
its effectiveness, Proceedings of the 16th annual ACM symposium on User interface
software and technology (2003) 95-104.
5. Zhang M., Zhang L., Sun Y., Feng L. and Ma W. - Auto cropping for digital
photographs, IEEE International Conference on Multimedia and Expo (ICME) (2005).
6. Santella A., Agrawala M., DeCarlo D., Salesin D. and Cohen M. - Gaze-based
interaction for semi-automatic photo cropping, Proceedings of the SIGCHI conference
on Human Factors in Computing Systems (2006) 771-780.
7. Stentiford F. - Attention based auto image cropping, Workshop on Computational
Attention and Applications on International Conference on Computer Vision Systems
(ICVS) 1 (2007) 253-261.
8. Nishiyama M., Okabe T., Sato Y. and Sato I. - Sensation-based photo cropping,
Proceedings of the 17th ACM International Conference on Multimedia (2009) 669-672.
9. Liu L., Chen R., Wolf L. and Cohen‐Or D. - Optimizing photo composition, Computer
Graphics Forum 29 (2010) 469-478.
10. She J., Wang D. and Song M. - Automatic image cropping using sparse coding, First
Asian Conference on Pattern Recognition (ACPR) (2011) 490-494.
11. Yan J., Lin S., Bing Kang S. and Tang X. - Learning the change for automatic image
cropping, Proceedings of the IEEE Conference on Computer Vision and Pattern
Recognition (CVPR) (2013) 971-978.
12. Chen J., Bai G., Liang S. and Li Z. - Automatic Image Cropping: A Computational
Complexity Study, Proceedings of the IEEE Conference on Computer Vision and
Pattern Recognition (CVPR) (2016) 507-515.
Nguyễn Văn Lễ, Phạm Nguyễn Huy Phương, Vũ Văn Vinh
114
13. Nguyễn Văn Lễ, 100 ảnh có nền không đồng nhất, 2018
(https://www.flickr.com/gp/108852439@N03/30W18x).
14. Nguyễn Văn Lễ, 100 ảnh có nền đồng nhất, 2018
(https://www.flickr.com/gp/108852439@N03/p8N2j6).
ABSTRACT
APPLYING AUTO IMAGE CROPPING TO DESIGN STUDENT CARD
Nguyen Van Le*, Pham Nguyen Huy Phuong, Vu Van Vinh
Ho Chi Minh City University of Food Industry
*Email: lecntp@gmail.com
The people image on cards such as student cards, staff cards is one of the important
components to identify people. Currently, the common way to create these images is manual
image cropping on the graphics processing software (Adobe Photoshop, Corel, MS Paint,
etc.), this task takes a long time to process the large numbers of image files and there is
baseless to determine the location of the object inside the image. In this paper, the face
detection and edge detection algorithm were combined to automatically crop the image at the
aspect ratio of 3:4. In which the position of the object inside the image was calculated to
equal the distance of both vertical edges side and far away to the upper edge on a suitable
distance. The proposed method was tested on a set of images with uniform backgrounds
achieved a high accuracy rate.
Keywords: Face detection, Canny edge, image cropping, auto cropping, edge detection.

File đính kèm:

ung_dung_cat_anh_tu_dong_trong_thiet_ke_the_sinh_vien.pdf