Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh
TÓM TẮT
Trong bài báo này, một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh
được đề xuất. Các kỹ thuật trích xuất đặc trưng bao gồm: phân vùng ảnh dựa trên
độ tương phản; bộ mô tả màu chủ đạo MPEG-7; nhận dạng đối tượng dựa trên biên
và làm mịn bề mặt dựa trên phép lọc Sobel; phát hiện biên đối tượng với phương
pháp LoG (Laplace of Gaussian); nâng cao cường độ ảnh với phép lọc Gaussian.
Từ đó, một phương pháp tìm kiếm ảnh dựa trên cây C-Tree [20] được thực hiện để
tìm tập các ảnh tương tự với một ảnh truy vấn cho trước. Để minh chứng cho lý
thuyết đề xuất thực nghiệm được xây dựng trên tập ảnh COREL-1K, WANG, đồng
thời đánh giá độ chính xác của phương pháp đề xuất. Kết quả thực nghiệm cho thấy
phương pháp trích xuất đặc trưng hình ảnh và tìm kiếm ảnh tương tự của chúng tôi
là hiệu quả.
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Tóm tắt nội dung tài liệu: Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh
uả là ảnh đường nét của đối tượng. Hình 3 là một kết quả phát hiện biên đối tượng dựa trên phương pháp LoG. Hình 3 bao gồm: a) ảnh gốc; b) ảnh được làm mờ; c) đường nét ảnh theo phép lọc LoG; d) ảnh đường nét theo phép lọc tần suất cao. Từ kết quả này, các đặc trưng của đối tượng được trích xuất gồm chu vi, diện tích đối tượng, vị trí tương đối của các đường viền. Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh 38 a) b) c) d) Hình 3. Một kết quả phát hiện biên dựa trên phương pháp LoG 3.4. Thực nghiệm trích xuất vec-tơ đa đặc trưng cho hình ảnh Từ các lý thuyết đã đề xuất, một hệ trích xuất đặc trưng được xây dựng như trong Hình 4. Hình 4. Hệ trích xuất đặc trưng hình ảnh Mỗi ảnh được trích xuất một vec-tơ đa đặc trưng gồm 81 giá trị, cụ thể như sau: • Độ tương phản để thiết lập đối tượng và nền, và đặc trưng diện tích vùng ảnh phân đoạn (3 giá trị); • Đặc trưng giá trị kỳ vọng theo trục X và Y của ảnh phân đoạn (2 giá trị); • Tính đặc trưng độ lệch chuẩn theo trục X và Y của ảnh phân đoạn (2 giá trị); • Lấy cấu trúc vân ảnh theo phép lọc Sobel và tính giá trị diện tích vùng theo vân ảnh (2 giá trị); • Lấy đặc trưng cường độ các điểm ảnh theo láng giềng dựa vào phép lọc Sobel (1 giá trị); • Tính giá trị kỳ vọng của vân ảnh theo trục X và Y (2 giá trị); • Tính giá trị độ lệch chuẩn theo trục X và Y trên vân ảnh (2 giá trị); • Lấy đặc trưng đường nét và tính chu vi đối tượng theo phương pháp LoG (2 giá trị); TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021) 39 • Tính giá trị kỳ vọng theo trục X và Y của đường biên đối tượng (2 giá trị); • Tính giá trị độ lệch chuẩn theo trục X và Y của đường biên đối tượng (2 giá trị); • Lấy đặc trưng nâng cao cường độ ảnh với phép lọc Gaussian (9 giá trị); • Lấy đường nét ảnh với phép lọc tần số cao (9 giá trị); • Lấy đặc trưng cường độ của đối tượng (9 giá trị); • Lấy đặc trưng cường độ của hình nền (9 giá trị); • Lấy đặc trưng màu sắc chủ đạo MPEG-7 (25 giá trị) 4. HỆ TRUY VẤN ẢNH DỰA TRÊN VEC-TƠ ĐẶC TRƯNG 4.1. Mô hình hệ truy vấn ảnh Các vec-tơ đặc trưng ảnh sau khi được trích xuất, tạo thành một cơ sở dữ liệu các đặc trưng nội dung ảnh. Trong bài báo này, các vec-tơ được lưu trữ trên cấu trúc cây phân cụm cân bằng C-Tree[20],làm cơ sở cho việc tìm kiếm tập ảnh tương tự dựa trên khoảng cách Euclide. Mô hình hệ truy vấn ảnh trên cây C-Tree dựa vào các vec-tơ đặc trưng, gọi là SBIR_CT, được mô tả trong Hình 5. Hình 5. Mô hình hệ truy vấn ảnh trên cây C-Tree Hệ truy vấn bao gồm 2 pha: Pha tiền xử lý và pha truy vấn. Pha tiền xử lý thực hiện các thao tác như sau: Bước 1. Từ tập dữ liệu ảnh, thực hiện phân vùng ảnh (1) để tạo các đối tượng ảnh; Bước 2. Thực hiện trích xuất đặc trưng cho các phân vùng đối tượng (2) và kết hợp các đặc trưng để tạo thành vec-tơ đa đặc trưng 𝑓 cho mỗi ảnh trong tập dữ liệu (3); Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh 40 Bước 3. Huấn luyện các mẫu dữ liệu với cấu trúc cây phân cụm cân bằng C-Tree để lưu trữ cơ sở dữ liệu các vec-tơ đặc trưng. Pha truy vấn thực hiện các thao tác như sau: Bước 1. Mỗi ảnh truy vấn 𝐼𝑄 đầu vào được trích xuất các vec-tơ đặc trưng 𝑓; Bước 2. Thực hiện so sánh 𝑓 với cơ sở dữ liệu đặc trưng trên cây C-Tree để tìm nhánh có độ đo tương tự gần nhất và các nút lá phù hợp nhất dựa vào khoảng cách Euclid; Bước 3. Kết quả là tập các ảnh tương tự được sắp xếp theo độ đo. 4.2. Thực nghiệm hệ truy vấn ảnh Hệ truy vấn ảnh SBIR_CT thực nghiệm trên tập ảnh COREL (1000 ảnh) và WANG (10.800 ảnh). Thực nghiệm được xây dựng trên nền tảng dotNET Framework 4.8, ngôn ngữ lập trình C#. Các đồ thị được biểu diễn trên Mathlab 2015. Cấu hình máy tính của thực nghiệm: Intel(R) CoreTM i7-8750H, CPU 2,70GHz, RAM 8GB và hệ điều hành Windows 10 Professional. Trong thực nghiệm này, việc truy vấn ảnh được thực hiện so sánh độ đo tương tự giữa hai hình ảnh dựa trên khoảng cách Euclide của véc-tơ đặc trưng. Hình 6 là một kết quả tìm kiếm hệ truy vấn SBIR_CT, bao gồm: giao diện ảnh truy vấn cùng với vec-tơ của ảnh đó và tập các hình ảnh tương tự với ảnh truy vấn theo độ đo. Hình 6. Một kết quả tìm kiếm của hệ truy vấn SBIR_CT 4.3. Đánh giá thực nghiệm Để đánh giá hiệu quả tìm kiếm ảnh, luận án sử dụng các yếu tố để đánh giá bao gồm: precision, recall và F-measure, thời gian truy vấn (milli seconds). Trên cơ sở thực nghiệm, các giá trị hiệu suất và thời gian tìm kiếm trung bình của các thư mục ảnh trên tập ảnh COREL, WANG được tổng hợp trong Bảng 1. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021) 41 Bảng 1. Hiệu suất tìm kiếm của hệ truy vấn SBIR_CT trên tập ảnh COREL, WANG Giá trị hiệu suất COREL WANG Avg. Precision 0.677655 0.6072217 Avg. Recall 0.699885 0.4891839 Avg. F-measure 0.688521 0.5450113 Avg. Query time (ms) 19.91437 39.746901 Từ Bảng 1 cho thấy, độ chính xác của hệ truy vấn SBIR_CT trên bộ ảnh COREL và WANG là khá cao, thời gian truy vấn trên cây C-Tree nhanh. Điều này chứng tỏ, các lý thuyết đề xuất trong bài báo về trích xuất đặc trưng thị giác là hiệu quả. Tập COREL với số lượng ít (1000 ảnh), nên cho độ chính xác, độ phủ cao hơn so với tập WANG (10.800 ảnh). Dựa trên các số liệu thực nghiệm, các đồ thị Precision-Recall curve và ROC curve được thực hiện để đánh giá độ chính xác của hệ truy vấn SBIR_CT. Hình 7, Hình 8 lần lượt là hiệu suất trên tập COREL và WANG. Trong đồ thị đường cong PR, mỗi đường cong là một thư mục của tập ảnh. Mỗi đường cong này cho thấy tỷ lệ giữa độ chính xác (precision) và độ phủ (recall) của một chủ đề ảnh; Đồng thời, đường cong tương ứng trong đồ thị ROC cho biết tỷ lệ kết quả truy vấn đúng và sai, nghĩa là diện tích dưới đường cong này đánh giá được tính đúng đắn của các kết quả truy vấn. Hình 7. Hiệu suất tìm kiếm dựa trên cây C- Tree của tập ảnh COREL Hình 8. Hiệu suất tìm kiếm dựa trên cây C- Tree của tập ảnh WANG Bảng 2. So sánh độ chính xác giữa các phương pháp trên tập ảnh COREL Phương pháp Độ chính xác trung bình A. Huneiti, 2015 [18] 0.559 Garg, M., 2019 [17] 0.602 Bella M. I. T., 2019 [5] 0.658 SBIR_CT 0.6777 Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh 42 Bảng 3. So sánh độ chính xác giữa các phương pháp trên tập ảnh WANG Phương pháp Độ chính xác trung bình Dos Santos, 2015 [15] 0.570 R. Das, 2017 [12] 0.559 P. Chhabra, 2018 [11] 0.577 SBIR_CT 0.6072 Bảng 4. So sánh thời gian tìm kiếm trên tập ảnh COREL Phương pháp Thời gian tìm kiếm trung bình (ms) Bibi R., 2019 [6] 512.675 Pavithra L. K., 2018 [21] 657.568 Zhou J., 2019 [1] 783.712 SBIR_CT 19.91437 Để đánh giá độ chính xác và hiệu quả của hệ truy vấn SBIR_CT, chúng tôi so sánh hiệu suất thu được từ thực nghiệm với các công trình nghiên cứu khác trên cùng tập dữ liệu ảnh. Bảng 2, Bảng 3 lần lượt là kết quả so sánh độ chính xác trung bình của tập ảnh COREL và WANG với kết quả của các phương pháp khác. Đồng thời, Bảng 4 là kết quả so sánh về thời gian tìm kiếm ảnh (milli giây) trên tập ảnh COREL. Qua số liệu của các bảng trên, cho thấy phương pháp tìm kiếm ảnh dựa trên cây C-Tree với vec-tơ đa đặc trưng được đề xuất trong bài báo có độ chính xác vượt trội so với các phương pháp khác trên cùng tập ảnh, thời gian tìm kiếm nhanh (bộ COREL). Điều này chứng tỏ, phương pháp đề xuất của chúng tôi là đúng đắn và hiệu quả trong bài toán về tìm kiếm ảnh. 5. KẾT LUẬN Trong bài báo này, phương pháp trích xuất vec-tơ đa đặc trưng của hình ảnh được đề xuất với các kỹ thuật trích xuất đặc trưng màu trội MPEG-7, kỹ thuật phát hiện biên với LoG, phép lọc Sobel, nâng cao cường độ ảnh với Gaussian... Mỗi hình ảnh trong tập dữ liệu được trích xuất thành một vec-tơ đặc trưng, tạo thành cơ sở dữ liệu đặc trưng, và lưu trữ trên cây C-Tree cho bài toán tìm kiếm ảnh. Thực nghiệm về trích xuất đặc trưng và tìm kiếm ảnh được thực hiện trên tập ảnh COREL, WANG. Kết quả thực nghiệm được so sánh với các phương pháp khác trên cùng tập ảnh cho thấy, các đề xuất trong bài báo về trích xuất đặc trưng áp dụng cho bài toán tìm kiếm ảnh trên cây C-Tree là hiệu quả: có độ chính xác cao, thời gian tìm kiếm nhanh. Hướng phát triển tiếp theo TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021) 43 của bài báo này là từ các đặc trưng cấp thấp, xác định ngữ nghĩa của hình ảnh nhằm đáp ứng được yêu cầu của người dùng. TÀI LIỆU THAM KHẢO [1] Ashraf, R. B. (2015). Content based image retrieval using embedded neural networks with bandletized regions. Entropy, 3552-3580. [2] Babu, S. A. (2014). Improving Quality of Content Based Image Retrieval with Graph Based Ranking. International Journal of Research and Applications, 1(1), 2349-0020. [3] Bagri, N. &. (2015). A comparative study on feature extraction using texture and shape for content based image retrieval. International Journal of Advanced Science and Technology, 41-52. [4] Barrios, J. M.-E. (2009). Text-based and content-based image retrieval on Flickr. Second International Workshop on Similarity Search and Applications. IEEE. [5] Bella, M. I. (2019). An efficient image retrieval framework using fused information feature. Computers & Electrical Engineering, 75, 46-60. [6] Bibi, R. M. (2020). Query-by-visual-search: multimodal framework for content-based image retrieval. Journal of Ambient Intelligence and Humanized Computing, 11(11), 5629-5648. [7] Bora, D. J. (2017). A novel approach for color image edge detection using multidirectional Sobel filter on HSV color space. Int. J. Comput. Sci. Eng, 5(2), 154-159. [8] Chaki, J. &. (2018). A Beginner’s Guide to Image Preprocessing Techniques. CRC Press. [9] Chaki, J. &. (2021). Image Color Feature Extraction Techniques: Fundamentals and Applications. Singapore: Springer. [10] Chaki, J. &. (n.d.). A beginner’s guide to image shape feature extraction techniques. 2019: CRC Press. [11] Chhabra, P. G. (2020). Content-based image retrieval system using ORB and SIFT features. Neural Computing and Applications, 32(7), 2725-2733. [12] Das, R. T. (2017). Novel feature extraction technique for content-based image recognition with query classification. International Journal of Computational Vision and Robotics, 7(1-2), 123- 147. [13] Deloitte. (2016). Photo sharing: trillions and rising. Deloitte Touche Tohmatsu Limited. [14] Dharani, T. &. (2013). A survey on content based image retrieval. International Conference on Pattern Recognition, Informatics and Mobile Engineering. IEEE. [15] Dos, S. J. (2015). A signature-based bag of visual words method for image indexing and search. Pattern Recognition Letters, 65, 1-7. [16] Erwin, M. F. (2017). Content Based Image Retrieval for Multi-Objects Fruits Recognition using k-Means and k-Nearest Neighbor. International Conference on Data and Software Engineering. [17] Garg, M. S. (2019). Fuzzy-NN approach with statistical features for description and classification of efficient image retrieval. Modern Physics Letters A, 34(03)(1950022). Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh 44 [18] Huneiti, A. &. (2015). Content-based image retrieval using SOM and DWT. Journal of software Engineering and Applications, 8(02)(51). [19] K., A. M. (2020). Content-Based Image Retrieval Using Color, Shape and Texture Descriptors and Features. Arabian Journal for Science and Engineering, 82-94. [20] Nhi, N. T. (2020). A SELF-BALANCED CLUSTERING TREE FOR SEMANTIC-BASED IMAGE RETRIEVAL. Journal of Computer Science and Cybernetics, 49-67. [21] Pavithra, L. K. (2019). An efficient seed points selection approach in dominant color descriptors (DCD). Cluster Computing, 22(4), 788–795. [22] Shao, H. W. (2008). Image retrieval based on MPEG-7 dominant color descriptor. The 9th International Conference for Young Computer Scientists (pp. 753-757). IEEE. [23] Singha, M. &. (2012). Content based image retrieval using color and texture. Signal & Image Processing. [24] Van, T. T. (2018). Content-based image retrieval based on binary signatures cluster graph. Expert Systems, 35(1), e12220. [25] Vinayak, V. &. (2017). CBIR system using color moment and color auto-Correlogram with block truncation coding. International Journal of Computer Applications, 161(9), 1-7. [26] Zhou, J. L. (2019). Image retrieval based on effective feature extraction and diffusion process. Multimedia Tools and Applications, 78(5), 6163-6190. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021) 45 A FEATURE EXTRACTION METHOD FOR IMAGE RETRIEVAL Nguyen Thi Uyen Nhi1,2, Van The Thanh3 1Faculty of Information Technology, University of Sciences, Hue University 2 Faculty of Statistics and Informatics, University of Economics, The University of Danang 3 HCMC University of Food Industry Email: nhintu@due.edu.vn, thanhvt@hufi.edu.vn ABSTRACT In this paper, a feature extraction method for image retrieval is proposed. Feature extraction techniques include: segmentation of an image based on contrast; the MPEG-7 dominant color descriptor; edge-based object recognition and surface smoothing based on Sobel filtering; detecting object boundary with LoG (Laplace of Gaussian) method; enhancing image intensity with Gaussian filtering ... Hence, a method for image retrieval based on C-Tree [20] was implemented to find a set of similar images. To demonstrate the effectiveness of the proposals, the experiment was built on the COREL-1K, WANG image set. At the same time, the experimental results are used to evaluate the effectiveness of the proposed method. The experimental results show that our method of feature extraction image and similar image retrieval on C-Tree is effective. Keywords: C-Tree, feature extraction, image retrieval. Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh 46 Nguyễn Thị Uyên Nhi sinh năm 1985. Bà nhận bằng cử nhân và thạc sĩ chuyên ngành Khoa học máy tính và kỹ thuật tính toán, tại trường Đại học tổng hợp kỹ thuật Volgagrad, Liên bang Nga, lần lượt vào các năm 2008, 2010. Từ năm 2017, bà học NCS ngành Khoa học máy tính tại Trường Đại học Khoa học, Đại học Huế. Hiện nay, bà công tác tại khoa Thống kê – Tin học, Trường Đại học Kinh Tế (DUE), Đại học Đà Nẵng. Lĩnh vực nghiên cứu: xử lý ảnh, tìm kiếm ảnh, cơ sở dữ liệu. Văn Thế Thành sinh năm 1979. Ông tốt nghiệp đại học chuyên ngành Toán tin tại Đại học Khoa học Tự nhiên - Đại học Quốc gia TP.HCM vào năm 2001, nhận bằng Thạc sĩ Khoa học Máy tính tại Đại học Quốc gia TP.HCM vào năm 2008. Năm 2016, ông nhận bằng Tiến sĩ Khoa học Máy tính tại Trường Đại học Khoa học, Đại học Huế. Hiện nay, ông công tác tại Trường ĐH Công nghiệp Thực phẩm TP.HCM. Lĩnh vực nghiên cứu: xử lý ảnh, khai thác dữ liệu ảnh và tìm kiếm ảnh.
File đính kèm:
- mot_phuong_phap_trich_xuat_dac_trung_cho_bai_toan_tim_kiem_a.pdf