Ứng dụng mạng Nơron nhân tạo nhận dạng biển số xe ô tô
Cùng với sự phát triển của khoa học kỹ thuật và nhu
cầu đi lại ngày càng tăng số lƣợng phƣơng tiện giao
thông đã làm nảy sinh nhiều vấn đề trong việc kiểm soát
cũng nhƣ quản lý các phƣơng tiện. Để giải quyết vấn đề
này nhu cầu đặt ra là áp dụng các hệ thống tự động.
Xuất phát từ nhu cầu trên có rất nhiều giải pháp đã đƣợc
đƣa ra để xây dựng hệ thống và một số giải pháp, thuật
toán xử lý ảnh đƣợc nguyên cứu, phát triển cho việc
nhận dạng biển số xe ô tô. Ví dụ nhƣ sử dụng đặc tính
đƣờng bao của biển số [1], [2], [4], [5] hay sử dụng bộ
lọc Sobel để phát hiện đƣờng viền giữa biển số và thân
xe [14]-[19], sử dụng đặc trƣng của màu sắc khác nhau
giữa màu nền của biển số và ký tự [20] hoặc sử dụng
phƣơng pháp hình chiếu là những hƣớng nghiên cứu để
tìm ra vùng chứa biển số. Phân đoạn ký tự có những
hƣớng nghiên cứu nhƣ sử dụng phƣơng pháp đánh nhãn
các liên kết đƣợc thực hiện trong [16], [21]-[25] cũng
nhƣ phƣơng pháp trích thuộc tính từ hình chiếu: từ ký tự
và hình nền biển số có sự khác nhau về màu sắc,
phƣơng pháp trên đƣợc đề xuất trong [19], [20], [26],
[27], [29], hay nhị phân hóa, trích dẫn đƣợc tọa độ đầu
và cuối của ký tự. Hoặc phân đoạn ký tự bằng phƣơng
pháp trích đƣờng bao của ký tự: mô hình đƣờng bao
cũng nói lên đặc điểm của ký tự [28]. Riêng phần nhận
dạng ký tự, vì đặc điểm của biển xe có giới hạn về số ký
tự và cấu trúc rõ ràng vậy nên có thể áp dụng phƣơng
pháp cấu trúc kết hợp với đối sánh để nhận dạng, khớp
mẫu đơn giản, so sánh độ tƣơng quan chéo hoặc các
phƣơng pháp học: K-nearest neighbor, SVM, hoặc dùng
mạng Nơron nhân tạo [3], [7] để nhận dạng các ký tự
trên biển số.
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Tóm tắt nội dung tài liệu: Ứng dụng mạng Nơron nhân tạo nhận dạng biển số xe ô tô
nh 9. Ảnh biển số đã đƣợc phân đoạn Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) ISBN: 978-604-67-0349-5 485 bé hơn nhƣng vẫn không làm mất thông tin của dữ liệu. Có rất nhiều cách để trích giảm thuộc tính nhƣ: Phân tích thành phần chính - principal components analysis PCA) [11], phƣơng pháp chiếu - projection pursuit (PP), phân tích đƣờng cong chính - principal curves (PC), self- organizing maps (SM) [12]. 2. Mạng Nơron nhân tạo Để nhận biết các ký tự phân đoạn có hai phƣơng pháp phổ biến là dựa trên mẫu phù hợp và dựa trên các mạng thần kinh nhân tạo. Phƣơng pháp phù hợp với mẩu có thể nhanh chóng nhận ra các ký tự bằng cách tính toán các mối tƣơng quan giữa các mẫu và hình ảnh [13], tuy nhiên khi các biển số có biến dạng hoặc đƣợc luân chuyên, tỉ lệ nhận dạng của mẫu phù hợp sẽ giảm đáng kể [13 ]. Vì lý do này, muốn mạng lƣới Nơron để mẫu phù hợp và đào tạo ba mạng nhận dạng mẩu sử dụng công cụ Matlab đã cung cấp, cho các nhiệm vụ nhận dạng. Mỗi mạng có 20 nút ẩn và đƣợc huấn luyện, sử dụng thuật toán Levenberg – Marquardt [30]. VII. ĐÁNH GIÁ A. Đánh giá kết quả tìm vùng chứa biển số. Cơ s dữ liệu đầu vào Để đánh giá quá trình thực hiện tìm vùng chứa biển số bằng phƣơng pháp đã đề xuất, sử dụng cơ sở dữ liệu có 127 tấm ảnh đã đƣợc xây dựng dựa trên việc sƣu tâm hình ảnh trên internet, và đƣợc chụp lại bởi nhóm nguyên cứu. Cơ sở dữ liệu đƣợc phân loại theo điều kiện ánh sáng, thời tiết, góc định hƣớng và chất lƣợng của hình ảnh (một tấm ảnh có thể bao gồm nhiều điều kiện phân loại trên). Chi tiết của cơ sở dữ liệu, và kết quả đƣợc mô tả trong bảng 1. BẢNG 1. CHI TIẾT KẾT QUẢ BƢỚC TÌM VÙNG BIỂN SỐ Cơ sở dữ liệu Số lượng Phân đoạn Đúng (%) Sai (%) Tổng 127 107 84.25 15.75 Độ tương phản Thấp 35 27 77.14 22.86 Cao 92 79 85.87 14.13 Thời tiết Mƣa 32 31 96.88 3.13 Gió 93 78 83.87 16.13 Nắng 25 23 92 8 Góc xoay, nghiêng Chính diện 60 55 91.67 8.33 Bị lệnh 39 32 82.05 17.95 Vị trí chụp Trƣớc 95 86 90.53 9.47 Sau 31 20 64.52 35.48 Cảnh nền Đơn giản 40 34 85 15 Phức tạp 28 20 71.43 28.57 B. Đánh giá kết quả phân đoạn ký tự Cơ s dữ liệu là vùng chứa biển số Cơ sở dữ liệu của phần này là 341 tấm ảnh biển số xe đƣợc lấy từ kết quả của bƣớc trên, và một phần đƣợc tìm kiếm trên internet. Và chia chúng thành 3 loại, chi tiết mỗi loại đƣợc mô tả trong bảng 2. Đánh giá Kết quả của bƣớc phân đoạn đƣợc cho trong bảng 3. Đối với bộ dữ liệu có chất lƣợng thì kết quả thu đƣợc lên đến 96.17%, là một kết quả khá tốt. Còn với các loại dữ liệu còn lại, kết quả thu đƣợc khá thấp, chƣa đến 77%. Nhƣ vậy, hiệu suất của bƣớc này đối với tất cả dữ liệu chỉ đạt 83%. BẢNG 2. MÔ TẢ CƠ SƠ DỮ LIỆU Cơ sở dữ liệu Số lượng Mô tả Loại 1 183 Là tập hợp những biển số có chất lƣợng tốt: điều kiện sáng bình thƣờng, thời thiết đẹp, ảnh không bị xoay, ký tự trên biển số màu đen trên nền trắng. Loại 2 67 Là những biển số xe bị lêch, nghiêng với một góc bất kỳ và có cƣờng độ sáng tốt. Loại 3 91 Những biển số có góc lệnh lớn, cƣờng độ sáng xấu (Quá sáng hoặc quá tối). Chất lƣợng kém, mờ, bị nhiễu. BẢNG 3. CHI TIẾT KẾT QUẢ CỦA BƢỚC PHÂN ĐOẠN Số lượng biển số Phân đoạn Hiệu suất Loại 1 183 176 96.17% Loại 2 67 51 76.12% Loại 3 91 56 61.54% Tổng 341 283 83% C. Đánh giá ước phân loại ký tự 1. Cơ s dữ liệu ký tự. Do loại điều kiện chụp ảnh của dẫn đến sự khác biệt về kích thƣớc, độ sáng, và độ tƣơng phản của các ký tự đƣợc phân đoạn; hai loại cơ sở dữ liệu huấn luyện đƣợc đề xuất là dữ liệu sạch và dữ liệu không sạch để cải thiện chất lƣợng của việc phân loại. Tập dữ liệu không nhiễu sẽ đƣợc huấn trên một bộ dữ liệu bao gồm điều kiện chiếu sáng tốt và đối tƣợng không bị lệch. Mỗi ký tự trong tập huấn luyện có 20 mẫu. Tập dữ liệu không sạch đƣợc huấn luyện trên một bộ dữ liệu trong đó có 20 mẫu tốt và 30 mẫu không tốt cho mỗi ký tự. Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) ISBN: 978-604-67-0349-5 486 Dữ liệu được chia thành 3 loại: Chất lượng tốt (WM): Các mẫu thử của từng ký tự tƣơng tự, gần giống nhƣ những mẫu mà ta đã huấn luyện cho mạng. Chất lượng trung bình (MM): Là tập hợp bao gồm các mẫu mà có sự sai khác về điều kiện sáng, phông chữ, góc nghiêng. Chất lượng không tốt (HM): Là tập hợp khác hẳn về phông chữ, góc xoay của đối tƣợng và điều kiện chiếu sáng so với đối tƣợng mà ta đã huấn luyện trƣớc đó. Cơ sở dữ liệu của phần này, các mẫu đƣợc đem đi huấn luyện cũng nhƣ kiểm tra, đánh giá đối với dữ liệu có chất lƣợng tốt (WM) đƣợc trích ra từ kết quả của phần phân đoạn ký tự trong loại 1 (bảng 2). Tƣơng tự nhƣ vây, dữ liệu loại MM đƣợc trích ra từ loại 2 và HM từ loại 3. Cơ sở dữ liệu của phần đánh giá này đƣợc chia thành 2 loại: 1. Dữ liệu sạch: Bao gồm toàn bộ các mẫu tốt. 2. Dữ liệu không sạch: Bao gồm cả mẫu tốt xen lẫn mẫu chƣa tốt. Mô tả chi tiết của cơ sở dữ liệu cho hai loại dữ liệu huấn luyện và kiểm tra đƣợc trình bày trong Bảng 4. BẢNG 4. CHI TIẾT CƠ SỞ DỮ LIỆU CỦA PHẦN PHÂN LOẠI KÝ TỰ VÀ KẾT QUẢ Huấn luyện (Số mẫu/ký tự) Kiểm tra (Mẫu/ký tự) Tốt Chưa tốt WM MM HM ALL Dữ liệu sạch 20 0 20 20 20 60 Dữ liệu không sạch 20 30 10 10 10 30 2. Đánh giá Tập dữ liệu để đánh giá bao gồm WM, MM, HM và TỔNG = (WM+MM+HM), nó đƣợc sử dụng để thực hiện đánh giá trong cả hai mô hình huấn luyện. Đầu tiên, đặc tính vùng đóng kín đƣợc dùng để phân loại ký tự. Kết quả phân loại đƣợc mô tả trong Bảng 5 và Bảng 6. a) Dữ liệu sạch Tập dữ liệu của WM là 700 mẫu ký tự, MM 700 mẫu ký tự, HM 700 mẫu ký tự và TỔNG là 2100 mẫu ký tự đƣợc sử dụng cho việc đánh giá dữ liệu sạch. BẢNG 5. KẾT QUẢ CỦA KIỂM THỬ DỮ LIỆU SẠCH Dữ liệu sạch WM MM HM TỔNG T1 T2 T3 T1 T2 T3 T1 T2 T3 T1 T2 T3 Không có bụng (T1) 498 2 0 499 1 0 499 1 0 1496 4 0 Có một bụng (T2) 2 158 0 4 155 1 6 150 4 12 463 5 Có hai bụng (T3) 0 0 40 0 0 40 1 0 39 1 0 119 b) Dữ liệu không sạch Tập dữ liệu của WM là 350 mẫu ký tự, MM 350 mẫu ký tự, HM 350 mẫu ký tự và TỔNG là 1050 mẫu ký tự đƣợc sử dụng cho việc đánh giá dữ liệu không sạch. BẢNG 6. KẾT QUẢ CỦA KIỂM THỬ DỮ LIỆU KHÔNG SẠCH Dữ liệu không sạch WM MM HM TỔNG T1 T2 T3 T1 T2 T3 T1 T2 T3 T1 T2 T3 Không có bụng (T1) 250 0 0 249 1 0 249 1 0 748 2 0 Có một bụng (T2) 2 78 0 1 79 0 1 78 1 4 235 1 Có hai bụng (T3) 0 0 20 0 0 20 0 0 20 0 0 60 D. Đánh giá ước nhận dạng ký tự. 1) Cách đánh giá Trong bài báo này, thực hiện thuật toán nhận dạng đƣợc đề xuất đánh giá thông qua tỷ lệ ảnh nhận dạng đúng (TPR), ảnh nhận dạng sai (FPR): , (8) Trong đó TP, FP, FN và TN đƣợc xác định nhƣ sau: TP: Số lƣợng những ký tự A đƣợc nhận dạng đúng. FP: Số lƣợng những ký tự không phải là A đƣợc nhận dạng sai thành ký tứ A. FN: Số lƣợng ký tự A đƣợc nhận dạng sai. TN: Số lƣợng những ký tự không phải A đƣợc nhận dạng đúng là không phải ký tự A. 2) Đánh giá Sau khi phân ký tự thành ba loại, mỗi loại đƣợc nhận dạng bằng ba mạng Nơron riêng. Kết quả của cả hai loại dữ liệu đƣợc thể hiện trong Bảng 7 và Bảng 8. a) Dữ liệu sạch BẢNG 7. KẾT QUẢ NHẬN DẠNG KÝ TỰ TRONG DỮ LIỆU SẠCH Dữ liệu sạch TỔNG TPR FPR WM 700 99.43% 0.018% MM 700 93.98% 0.187% HM 700 85.12% 0.458% ALL 2100 92.84% 0.221% Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) ISBN: 978-604-67-0349-5 487 b) Dữ liệu không sạch BẢNG 8. KẾT QUẢ NHẬN DẠNG KÝ TỰ TRONG DỮ LIỆU KHÔNG SẠCH Dữ liệu không sạch TỔNG TPR FPR WM 350 99.43% 0.018% MM 350 98.29% 0.054% HM 350 92.00% 0.249% ALL 1050 96.57% 0.107% Dựa vào kết quả trên, chúng ta thấy rằng: Khi huấn luyện cho dữ liệu sạch, TPR của WM, MM, HM đạt đƣợc cao cụ thể lần lƣợt là 99.43%, 93.98%, 85.12%, trung bình cho cả ba là 92.84%. Còn FPR là khá thấp cho cả ba loại, trung bình là 0.221%. Khi huấn luyện cho dữ liệu không sạch, hiệu suất của kết quả phân loại đã đƣợc cải thiện đáng kể. TPR của MM, HM đã tăng xếp xỉ 4%. VIII. KẾT LUẬN Trong bài báo này, đã trình bày bốn bƣớc của việc nhận dạng biển số xe ô tô và cũng trình bày chi tiết đánh giá kết quả cho mỗi phần. Với thuật toán đã đƣa ra cho thấy hiệu suất khối nhận dạng ký tự cho ra kết quả cao nhất do đã đƣợc cải tiến bổ sung thêm bƣớc phân loại ký tự. Ngoài ra trong phần phân đoạn ký tự cho hiệu suất thu đƣợc lên đến 96.17% nhờ sử dụng thuật toán đánh nhãn. Kết quả của toàn bộ thuật toán phụ thuộc rất nhiều vào bƣớc tiền xử lý. Do bƣớc tiền xử lý đã đề xuất chƣa làm nổi bật đƣợc phần chữ số nên khối tìm vùng chứa biển số chỉ đạt hiệu suất 84.25%, làm cho hiệu suất của toàn bộ thuật toán bị giảm. Trong tƣơng lai, sẽ tiếp tục nghiên cứu phƣơng pháp phát hiện cạnh kết hợp với phát hiện sự thay đổi biên để nâng cao hiệu suất bƣớc tiền xử lý. Và phƣơng pháp Hough Transform sẽ xử lý các trƣờng hợp góc chụp bị lệch. LỜI CẢM ƠN Để đạt đƣợc kết quả nhƣ đã trình bày, xin gửi lời cảm ơn đến tập thể nhóm nghiên cứu TRT 3DCS và Kỹ Sƣ Nguyễn Hải Triều Anh, Khoa Điện Tử Viễn Thông, Đại học Bách Khoa, Đại học Đà Nẵng đã hỗ trợ, giúp đỡ rất nhiều trong quá trình thực hiện đề tài này. TÀI LIỆU THAM KHẢO [1] H. Bai and C. Liu "A hybrid license plate extraction method based on edge statistics andmorphology", Proc. Int. Conf. Pattern Recognit., vol. 2, pp.831 -834 2004. [2] D. Zheng, Y. Zhao and J. Wang "An efficientmethod of license plate location", Pattern Recognit. Lett., vol. 26, no. 15, pp.2431 -2438 2005. [3] A. Akoum, B. Daya , P. Chauviet, “Two Neural Networks for License Number Plates Recognition”, Lebanese University, Institute of Technology, P.O.B. 813 - Saida – LEBANON. [4] S. Wang and H. Lee "Detection and recognition of license platecharacters with different appearances", Proc. Int. Conf. Intell. Transp.Syst., vol. 2, pp.979 -984 2003. [5] F. Faradji, A. H. Rezaie and M. Ziaratban "A morphological- based license plate location", Proc. IEEE Int. Conf. Image Process., vol. 1, pp.57 -60 2007. [6] Naikur Bharatkumar Gohil; “Car License Plate Detection”; B.E., Dharmsinh Desai University, India, 2006. [7] Trƣơng Quốc Bảo, Võ Văn Phúc; “Giải thuật mới cho bài toán định vị và nhận dạng biển số xe ô tô”; Tạp chí khoa học Trƣờng đại học Cần Thơ; Phần A: Khoa học Tự nhiên, Công nghệ và Môi trƣờng: 27(2013):44-45. [8] Lƣơng Vũ Trúc, Lâm Tú Bình, Huỳnh Thị Phƣơng Oanh, Nguyễn Chí Thanh; “Ứng dụng mạng Neutral trong nhận dạng ký tự quang học”; Tiểu luận. [9] Lu Liu; Hongjiang Yu; Kehe Cai; Jia Wang; , "License plate recognition using topology structure features," Computing, Control and Industrial Engineering (CCIE), 2011 IEEE 2nd International Conference on, vol.2, no., pp.251-254, 20-21 Aug. 2011. [10] Peter Tarábek;, “Morphology Image Pre-Processing For Thinning Algorithms” Journal of Information, Control and Management Systems, vol. 5, no. 1, pp. 131-138, 2007. [11] Ondrej Martinsky; “Algorithmic And Mathematical Principles Of Automatic Number Plate Recognition Systems”, Faculty Of Information Technology Department Of Intelligent Systems, Brno University Of technology, 2007. [12] Fodor I. K.;, "A survey of dimension reduction techniques" LLNL technical report, june 2002. [13] Guangmin Sun; Canhui Zhang; Weiwei Zou; Guangyu Yu; "A new recognition method of vehicle license plate based on Genetic Neural Network" Industrial Electronics and Applications (ICIEA), 2010 the 5th IEEE Conference on, vol., no., pp.1662-1666, 15-17 June 2010. [14] M. Sarfraz, M. J. Ahmed and S. A. Ghazi "Saudi Arabian license plate recognition system", Proc. Int. Conf. Geom.Model. Graph., pp.36 -41 2003. [15] D. Zheng, Y. Zhao and J. Wang "An efficientmethod of license plate location", Pattern Recognit. Lett., vol. 26, no. 15, pp.2431 -2438 2005. [16] K. Kanayama, Y. Fujikawa, K. Fujimoto and M. Horino "Development of vehicle-license numberrecognition system using real-time image processing and its application to travel-time measurement", Proc. IEEE Veh. Tech. Conf., pp.798 -804 1991. [17] V. Kamat and S. Ganesan "An efficient implementation of the Hough transform for detecting vehicle license plates usingDSPs", Proc. Real-Time Tech. Applicat. Symp., pp.58 - 59 1995. [18] C. Busch, R. Domer, C. Freytag and H. Ziegler "Feature based recognition of trafficvideo streams for online route tracing", Proc. IEEE Veh. Tech. Conf., vol. 3, pp.1790 -1794 1998. [19] S. Zhang, M. Zhang and X. Ye "Car plate character extraction under complicated environment", Proc. IEEE Int. Conf. Syst. Man Cybern., vol. 5, pp.4722 -4726 2004. [20] X. Shi, W. Zhao and Y. Shen "Automatic license plate recognition system based on color imageprocessing", Lecture Notes Comput. Sci., vol. 3483, pp.1159 -1168 2005. [21] K. Miyamoto, K. Nagano, M. Tamagawa, I. Fujita and M. Yamamoto "Vehicle license-plate recognition byimage analysis", Proc. Int. Conf. Ind. Electron. Control Instrum., vol. 3, pp.1734 -1738 1991. [22] S.-L. Chang, L.-S. Chen, Y.-C. Chung and S.-W. Chen "Automatic license platerecognition", IEEE Trans. Intell. Transp. Syst., vol. 5, no. 1, pp.42 -53 2004. [23] T. Nukano, M. Fukumi and M. Khalid "Vehicle license plate characterrecognition by neural networks", Proc. Int. Symp. Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) ISBN: 978-604-67-0349-5 488 Intell. Signal Process. Commun.Syst., pp.771 -775 2004. [24] V. Shapiro and G. Gluhchev "Multinational license plate recognition system: Segmentation andclassification", Proc. Int. Conf. Pattern Recognit., vol. 4, pp.352 -355 2004. [25] B.-F. Wu, S.-P. Lin and C.-C. Chiu "Extractingcharacters from real vehicle license plates out-of-doors", IET Comput.Vision, vol. 1, no. 1, pp.2 -10 2007. [26] T. D. Duan, T. L. H. Du, T. V. Phuoc and N. V. Hoang "Building an automatic vehicle license-plate recognition system", Proc. Int. Conf. Comput. Sci. RIVF, pp.59 -63 2005. [27] K. K. Kim, K. I. Kim, J. B. Kim and H. J. Kim "Learning- based approach for license plate recognition", Proc. IEEESignal Process. Soc. Workshop Neur. Netw. Signal Process., vol. 2, pp.614 -623 2000. [28] A. Capar and M. Gokmen "Concurrent segmentation and recognition with shape-driven fast marchingmethods", Proc. Int. Conf. Pattern Recognit., vol. 1, pp.155 -158 2006. [29] R. Parisi, E. D. D. Claudio, G. Lucarelli and G. Orlandi "Car plate recognition by neuralnetworks and image processing", Proc. IEEE Int. Symp. Circuits Syst., vol. 3, pp.195 -198 1998. [30] Ananth Ranganathan " The Levenberg-Marquardt Algorithm", 8th June 2004. Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) ISBN: 978-604-67-0349-5 489
File đính kèm:
- ung_dung_mang_noron_nhan_tao_nhan_dang_bien_so_xe_o_to.pdf