Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh

TÓM TẮT

Trong bài báo này, một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh

được đề xuất. Các kỹ thuật trích xuất đặc trưng bao gồm: phân vùng ảnh dựa trên

độ tương phản; bộ mô tả màu chủ đạo MPEG-7; nhận dạng đối tượng dựa trên biên

và làm mịn bề mặt dựa trên phép lọc Sobel; phát hiện biên đối tượng với phương

pháp LoG (Laplace of Gaussian); nâng cao cường độ ảnh với phép lọc Gaussian.

Từ đó, một phương pháp tìm kiếm ảnh dựa trên cây C-Tree [20] được thực hiện để

tìm tập các ảnh tương tự với một ảnh truy vấn cho trước. Để minh chứng cho lý

thuyết đề xuất thực nghiệm được xây dựng trên tập ảnh COREL-1K, WANG, đồng

thời đánh giá độ chính xác của phương pháp đề xuất. Kết quả thực nghiệm cho thấy

phương pháp trích xuất đặc trưng hình ảnh và tìm kiếm ảnh tương tự của chúng tôi

là hiệu quả.

Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh trang 1

Trang 1

Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh trang 2

Trang 2

Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh trang 3

Trang 3

Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh trang 4

Trang 4

Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh trang 5

Trang 5

Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh trang 6

Trang 6

Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh trang 7

Trang 7

Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh trang 8

Trang 8

Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh trang 9

Trang 9

Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 14 trang xuanhieu 10620
Bạn đang xem 10 trang mẫu của tài liệu "Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh

Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh
uả là ảnh đường nét của 
đối tượng. Hình 3 là một kết quả phát hiện biên đối tượng dựa trên phương pháp LoG. 
Hình 3 bao gồm: a) ảnh gốc; b) ảnh được làm mờ; c) đường nét ảnh theo phép lọc LoG; 
d) ảnh đường nét theo phép lọc tần suất cao. Từ kết quả này, các đặc trưng của đối tượng 
được trích xuất gồm chu vi, diện tích đối tượng, vị trí tương đối của các đường viền. 
Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh 
38 
 a) b) c) d) 
Hình 3. Một kết quả phát hiện biên dựa trên phương pháp LoG 
3.4. Thực nghiệm trích xuất vec-tơ đa đặc trưng cho hình ảnh 
Từ các lý thuyết đã đề xuất, một hệ trích xuất đặc trưng được xây dựng như trong 
Hình 4. 
Hình 4. Hệ trích xuất đặc trưng hình ảnh 
Mỗi ảnh được trích xuất một vec-tơ đa đặc trưng gồm 81 giá trị, cụ thể như sau: 
• Độ tương phản để thiết lập đối tượng và nền, và đặc trưng diện tích vùng 
ảnh phân đoạn (3 giá trị); 
• Đặc trưng giá trị kỳ vọng theo trục X và Y của ảnh phân đoạn (2 giá trị); 
• Tính đặc trưng độ lệch chuẩn theo trục X và Y của ảnh phân đoạn (2 giá trị); 
• Lấy cấu trúc vân ảnh theo phép lọc Sobel và tính giá trị diện tích vùng theo 
vân ảnh (2 giá trị); 
• Lấy đặc trưng cường độ các điểm ảnh theo láng giềng dựa vào phép lọc Sobel 
(1 giá trị); 
• Tính giá trị kỳ vọng của vân ảnh theo trục X và Y (2 giá trị); 
• Tính giá trị độ lệch chuẩn theo trục X và Y trên vân ảnh (2 giá trị); 
• Lấy đặc trưng đường nét và tính chu vi đối tượng theo phương pháp LoG (2 
giá trị); 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021) 
39 
• Tính giá trị kỳ vọng theo trục X và Y của đường biên đối tượng (2 giá trị); 
• Tính giá trị độ lệch chuẩn theo trục X và Y của đường biên đối tượng (2 giá 
trị); 
• Lấy đặc trưng nâng cao cường độ ảnh với phép lọc Gaussian (9 giá trị); 
• Lấy đường nét ảnh với phép lọc tần số cao (9 giá trị); 
• Lấy đặc trưng cường độ của đối tượng (9 giá trị); 
• Lấy đặc trưng cường độ của hình nền (9 giá trị); 
• Lấy đặc trưng màu sắc chủ đạo MPEG-7 (25 giá trị) 
4. HỆ TRUY VẤN ẢNH DỰA TRÊN VEC-TƠ ĐẶC TRƯNG 
4.1. Mô hình hệ truy vấn ảnh 
Các vec-tơ đặc trưng ảnh sau khi được trích xuất, tạo thành một cơ sở dữ liệu các 
đặc trưng nội dung ảnh. Trong bài báo này, các vec-tơ được lưu trữ trên cấu trúc cây 
phân cụm cân bằng C-Tree[20],làm cơ sở cho việc tìm kiếm tập ảnh tương tự dựa trên 
khoảng cách Euclide. Mô hình hệ truy vấn ảnh trên cây C-Tree dựa vào các vec-tơ đặc 
trưng, gọi là SBIR_CT, được mô tả trong Hình 5. 
Hình 5. Mô hình hệ truy vấn ảnh trên cây C-Tree 
Hệ truy vấn bao gồm 2 pha: Pha tiền xử lý và pha truy vấn. Pha tiền xử lý thực 
hiện các thao tác như sau: 
Bước 1. Từ tập dữ liệu ảnh, thực hiện phân vùng ảnh (1) để tạo các đối tượng 
ảnh; 
Bước 2. Thực hiện trích xuất đặc trưng cho các phân vùng đối tượng (2) và kết 
hợp các đặc trưng để tạo thành vec-tơ đa đặc trưng 𝑓 cho mỗi ảnh trong tập dữ liệu (3); 
Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh 
40 
Bước 3. Huấn luyện các mẫu dữ liệu với cấu trúc cây phân cụm cân bằng C-Tree 
để lưu trữ cơ sở dữ liệu các vec-tơ đặc trưng. 
Pha truy vấn thực hiện các thao tác như sau: 
Bước 1. Mỗi ảnh truy vấn 𝐼𝑄 đầu vào được trích xuất các vec-tơ đặc trưng 𝑓; 
Bước 2. Thực hiện so sánh 𝑓 với cơ sở dữ liệu đặc trưng trên cây C-Tree để tìm 
nhánh có độ đo tương tự gần nhất và các nút lá phù hợp nhất dựa vào khoảng cách 
Euclid; 
Bước 3. Kết quả là tập các ảnh tương tự được sắp xếp theo độ đo. 
4.2. Thực nghiệm hệ truy vấn ảnh 
Hệ truy vấn ảnh SBIR_CT thực nghiệm trên tập ảnh COREL (1000 ảnh) và 
WANG (10.800 ảnh). Thực nghiệm được xây dựng trên nền tảng dotNET Framework 
4.8, ngôn ngữ lập trình C#. Các đồ thị được biểu diễn trên Mathlab 2015. Cấu hình máy 
tính của thực nghiệm: Intel(R) CoreTM i7-8750H, CPU 2,70GHz, RAM 8GB và hệ điều 
hành Windows 10 Professional. Trong thực nghiệm này, việc truy vấn ảnh được thực 
hiện so sánh độ đo tương tự giữa hai hình ảnh dựa trên khoảng cách Euclide của véc-tơ 
đặc trưng. Hình 6 là một kết quả tìm kiếm hệ truy vấn SBIR_CT, bao gồm: giao diện ảnh 
truy vấn cùng với vec-tơ của ảnh đó và tập các hình ảnh tương tự với ảnh truy vấn theo 
độ đo. 
Hình 6. Một kết quả tìm kiếm của hệ truy vấn SBIR_CT 
4.3. Đánh giá thực nghiệm 
Để đánh giá hiệu quả tìm kiếm ảnh, luận án sử dụng các yếu tố để đánh giá bao 
gồm: precision, recall và F-measure, thời gian truy vấn (milli seconds). Trên cơ sở thực 
nghiệm, các giá trị hiệu suất và thời gian tìm kiếm trung bình của các thư mục ảnh trên 
tập ảnh COREL, WANG được tổng hợp trong Bảng 1. 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021) 
41 
Bảng 1. Hiệu suất tìm kiếm của hệ truy vấn SBIR_CT trên tập ảnh COREL, WANG 
Giá trị hiệu suất COREL WANG 
Avg. Precision 0.677655 0.6072217 
Avg. Recall 0.699885 0.4891839 
Avg. F-measure 0.688521 0.5450113 
Avg. Query time (ms) 19.91437 39.746901 
Từ Bảng 1 cho thấy, độ chính xác của hệ truy vấn SBIR_CT trên bộ ảnh COREL 
và WANG là khá cao, thời gian truy vấn trên cây C-Tree nhanh. Điều này chứng tỏ, các 
lý thuyết đề xuất trong bài báo về trích xuất đặc trưng thị giác là hiệu quả. Tập COREL 
với số lượng ít (1000 ảnh), nên cho độ chính xác, độ phủ cao hơn so với tập WANG 
(10.800 ảnh). Dựa trên các số liệu thực nghiệm, các đồ thị Precision-Recall curve và ROC 
curve được thực hiện để đánh giá độ chính xác của hệ truy vấn SBIR_CT. Hình 7, Hình 
8 lần lượt là hiệu suất trên tập COREL và WANG. Trong đồ thị đường cong PR, mỗi 
đường cong là một thư mục của tập ảnh. Mỗi đường cong này cho thấy tỷ lệ giữa độ 
chính xác (precision) và độ phủ (recall) của một chủ đề ảnh; Đồng thời, đường cong 
tương ứng trong đồ thị ROC cho biết tỷ lệ kết quả truy vấn đúng và sai, nghĩa là diện 
tích dưới đường cong này đánh giá được tính đúng đắn của các kết quả truy vấn. 
Hình 7. Hiệu suất tìm kiếm dựa trên cây C-
Tree của tập ảnh COREL 
Hình 8. Hiệu suất tìm kiếm dựa trên cây C-
Tree của tập ảnh WANG 
Bảng 2. So sánh độ chính xác giữa các phương pháp trên tập ảnh COREL 
Phương pháp Độ chính xác trung bình 
A. Huneiti, 2015 [18] 0.559 
Garg, M., 2019 [17] 0.602 
Bella M. I. T., 2019 [5] 0.658 
SBIR_CT 0.6777 
Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh 
42 
Bảng 3. So sánh độ chính xác giữa các phương pháp trên tập ảnh WANG 
Phương pháp Độ chính xác trung bình 
Dos Santos, 2015 [15] 0.570 
R. Das, 2017 [12] 0.559 
P. Chhabra, 2018 [11] 0.577 
SBIR_CT 0.6072 
Bảng 4. So sánh thời gian tìm kiếm trên tập ảnh COREL 
Phương pháp Thời gian tìm kiếm trung bình (ms) 
Bibi R., 2019 [6] 512.675 
Pavithra L. K., 2018 [21] 657.568 
Zhou J., 2019 [1] 783.712 
SBIR_CT 19.91437 
Để đánh giá độ chính xác và hiệu quả của hệ truy vấn SBIR_CT, chúng tôi so 
sánh hiệu suất thu được từ thực nghiệm với các công trình nghiên cứu khác trên cùng 
tập dữ liệu ảnh. Bảng 2, Bảng 3 lần lượt là kết quả so sánh độ chính xác trung bình của 
tập ảnh COREL và WANG với kết quả của các phương pháp khác. Đồng thời, Bảng 4 là 
kết quả so sánh về thời gian tìm kiếm ảnh (milli giây) trên tập ảnh COREL. 
Qua số liệu của các bảng trên, cho thấy phương pháp tìm kiếm ảnh dựa trên cây 
C-Tree với vec-tơ đa đặc trưng được đề xuất trong bài báo có độ chính xác vượt trội so 
với các phương pháp khác trên cùng tập ảnh, thời gian tìm kiếm nhanh (bộ COREL). 
Điều này chứng tỏ, phương pháp đề xuất của chúng tôi là đúng đắn và hiệu quả trong 
bài toán về tìm kiếm ảnh. 
5. KẾT LUẬN 
Trong bài báo này, phương pháp trích xuất vec-tơ đa đặc trưng của hình ảnh 
được đề xuất với các kỹ thuật trích xuất đặc trưng màu trội MPEG-7, kỹ thuật phát hiện 
biên với LoG, phép lọc Sobel, nâng cao cường độ ảnh với Gaussian... Mỗi hình ảnh trong 
tập dữ liệu được trích xuất thành một vec-tơ đặc trưng, tạo thành cơ sở dữ liệu đặc trưng, 
và lưu trữ trên cây C-Tree cho bài toán tìm kiếm ảnh. Thực nghiệm về trích xuất đặc 
trưng và tìm kiếm ảnh được thực hiện trên tập ảnh COREL, WANG. Kết quả thực 
nghiệm được so sánh với các phương pháp khác trên cùng tập ảnh cho thấy, các đề xuất 
trong bài báo về trích xuất đặc trưng áp dụng cho bài toán tìm kiếm ảnh trên cây C-Tree 
là hiệu quả: có độ chính xác cao, thời gian tìm kiếm nhanh. Hướng phát triển tiếp theo 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021) 
43 
của bài báo này là từ các đặc trưng cấp thấp, xác định ngữ nghĩa của hình ảnh nhằm đáp 
ứng được yêu cầu của người dùng. 
TÀI LIỆU THAM KHẢO 
[1] Ashraf, R. B. (2015). Content based image retrieval using embedded neural networks with 
bandletized regions. Entropy, 3552-3580. 
[2] Babu, S. A. (2014). Improving Quality of Content Based Image Retrieval with Graph Based 
Ranking. International Journal of Research and Applications, 1(1), 2349-0020. 
[3] Bagri, N. &. (2015). A comparative study on feature extraction using texture and shape for 
content based image retrieval. International Journal of Advanced Science and Technology, 41-52. 
[4] Barrios, J. M.-E. (2009). Text-based and content-based image retrieval on Flickr. Second 
International Workshop on Similarity Search and Applications. IEEE. 
[5] Bella, M. I. (2019). An efficient image retrieval framework using fused information feature. 
Computers & Electrical Engineering, 75, 46-60. 
[6] Bibi, R. M. (2020). Query-by-visual-search: multimodal framework for content-based image 
retrieval. Journal of Ambient Intelligence and Humanized Computing, 11(11), 5629-5648. 
[7] Bora, D. J. (2017). A novel approach for color image edge detection using multidirectional 
Sobel filter on HSV color space. Int. J. Comput. Sci. Eng, 5(2), 154-159. 
[8] Chaki, J. &. (2018). A Beginner’s Guide to Image Preprocessing Techniques. CRC Press. 
[9] Chaki, J. &. (2021). Image Color Feature Extraction Techniques: Fundamentals and Applications. 
Singapore: Springer. 
[10] Chaki, J. &. (n.d.). A beginner’s guide to image shape feature extraction techniques. 2019: CRC 
Press. 
[11] Chhabra, P. G. (2020). Content-based image retrieval system using ORB and SIFT features. 
Neural Computing and Applications, 32(7), 2725-2733. 
[12] Das, R. T. (2017). Novel feature extraction technique for content-based image recognition 
with query classification. International Journal of Computational Vision and Robotics, 7(1-2), 123-
147. 
[13] Deloitte. (2016). Photo sharing: trillions and rising. Deloitte Touche Tohmatsu Limited. 
[14] Dharani, T. &. (2013). A survey on content based image retrieval. International Conference on 
Pattern Recognition, Informatics and Mobile Engineering. IEEE. 
[15] Dos, S. J. (2015). A signature-based bag of visual words method for image indexing and 
search. Pattern Recognition Letters, 65, 1-7. 
[16] Erwin, M. F. (2017). Content Based Image Retrieval for Multi-Objects Fruits Recognition 
using k-Means and k-Nearest Neighbor. International Conference on Data and Software 
Engineering. 
[17] Garg, M. S. (2019). Fuzzy-NN approach with statistical features for description and 
classification of efficient image retrieval. Modern Physics Letters A, 34(03)(1950022). 
Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh 
44 
[18] Huneiti, A. &. (2015). Content-based image retrieval using SOM and DWT. Journal of software 
Engineering and Applications, 8(02)(51). 
[19] K., A. M. (2020). Content-Based Image Retrieval Using Color, Shape and Texture Descriptors 
and Features. Arabian Journal for Science and Engineering, 82-94. 
[20] Nhi, N. T. (2020). A SELF-BALANCED CLUSTERING TREE FOR SEMANTIC-BASED 
IMAGE RETRIEVAL. Journal of Computer Science and Cybernetics, 49-67. 
[21] Pavithra, L. K. (2019). An efficient seed points selection approach in dominant color 
descriptors (DCD). Cluster Computing, 22(4), 788–795. 
[22] Shao, H. W. (2008). Image retrieval based on MPEG-7 dominant color descriptor. The 9th 
International Conference for Young Computer Scientists (pp. 753-757). IEEE. 
[23] Singha, M. &. (2012). Content based image retrieval using color and texture. Signal & Image 
Processing. 
[24] Van, T. T. (2018). Content-based image retrieval based on binary signatures cluster graph. 
Expert Systems, 35(1), e12220. 
[25] Vinayak, V. &. (2017). CBIR system using color moment and color auto-Correlogram with 
block truncation coding. International Journal of Computer Applications, 161(9), 1-7. 
[26] Zhou, J. L. (2019). Image retrieval based on effective feature extraction and diffusion process. 
Multimedia Tools and Applications, 78(5), 6163-6190. 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021) 
45 
A FEATURE EXTRACTION METHOD FOR IMAGE RETRIEVAL 
Nguyen Thi Uyen Nhi1,2, Van The Thanh3 
1Faculty of Information Technology, University of Sciences, Hue University 
2 Faculty of Statistics and Informatics, University of Economics, The University of Danang 
3 HCMC University of Food Industry 
Email: nhintu@due.edu.vn, thanhvt@hufi.edu.vn 
ABSTRACT 
In this paper, a feature extraction method for image retrieval is proposed. Feature 
extraction techniques include: segmentation of an image based on contrast; the 
MPEG-7 dominant color descriptor; edge-based object recognition and surface 
smoothing based on Sobel filtering; detecting object boundary with LoG (Laplace of 
Gaussian) method; enhancing image intensity with Gaussian filtering ... Hence, a 
method for image retrieval based on C-Tree [20] was implemented to find a set of 
similar images. To demonstrate the effectiveness of the proposals, the experiment 
was built on the COREL-1K, WANG image set. At the same time, the experimental 
results are used to evaluate the effectiveness of the proposed method. The 
experimental results show that our method of feature extraction image and similar 
image retrieval on C-Tree is effective. 
Keywords: C-Tree, feature extraction, image retrieval. 
Một phương pháp trích xuất đặc trưng cho bài toán tìm kiếm ảnh 
46 
Nguyễn Thị Uyên Nhi sinh năm 1985. Bà nhận bằng cử nhân và thạc sĩ 
chuyên ngành Khoa học máy tính và kỹ thuật tính toán, tại trường Đại 
học tổng hợp kỹ thuật Volgagrad, Liên bang Nga, lần lượt vào các năm 
2008, 2010. Từ năm 2017, bà học NCS ngành Khoa học máy tính tại 
Trường Đại học Khoa học, Đại học Huế. Hiện nay, bà công tác tại khoa 
Thống kê – Tin học, Trường Đại học Kinh Tế (DUE), Đại học Đà Nẵng. 
Lĩnh vực nghiên cứu: xử lý ảnh, tìm kiếm ảnh, cơ sở dữ liệu. 
Văn Thế Thành sinh năm 1979. Ông tốt nghiệp đại học chuyên ngành 
Toán tin tại Đại học Khoa học Tự nhiên - Đại học Quốc gia TP.HCM vào 
năm 2001, nhận bằng Thạc sĩ Khoa học Máy tính tại Đại học Quốc gia 
TP.HCM vào năm 2008. Năm 2016, ông nhận bằng Tiến sĩ Khoa học Máy 
tính tại Trường Đại học Khoa học, Đại học Huế. Hiện nay, ông công tác 
tại Trường ĐH Công nghiệp Thực phẩm TP.HCM. 
Lĩnh vực nghiên cứu: xử lý ảnh, khai thác dữ liệu ảnh và tìm kiếm ảnh. 

File đính kèm:

  • pdfmot_phuong_phap_trich_xuat_dac_trung_cho_bai_toan_tim_kiem_a.pdf