Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử
Hệ gợi ý (Recommender System) là công cụ được thiết kế nhằm cung cấp những khuyến nghị hữu ích về sản
phẩm, dịch vụ, cho người dùng. Hệ gợi ý dựa trên dữ liệu về mối quan hệ giữa người dùng, sản phẩm và các hành
vi của người dùng trong quá khứ đối với sản phẩm để đưa ra những gợi ý thông minh, phù hợp với sở thích của
từng khách hàng. Hệ gợi ý giúp khách hàng nhanh chóng định vị được những sản phẩm họ quan tâm để từ đó đưa
ra quyết định đúng đắn khi mua sắm online. Trong bài báo này, chúng tôi trình bày tổng quan một số phương pháp
gợi ý, đánh giá điểm mạnh, điểm yếu, so sánh hiệu quả thực hiện của mỗi phương pháp. Chúng tôi chỉ ra lợi ích mà
các hệ gợi ý mang lại cho thương mại điện tử, đồng thời nêu ra những thách thức và giải pháp khắc phục. Kết quả
thực nghiệm của chúng tôi trên 4 tập dữ liệu chuẩn (Movielens, Epinions, BookCrossing, LastFM) cho thấy mỗi
phương pháp đều có những ưu điểm và hạn chế riêng, không có phương pháp nào là tốt nhất trên tất cả các tiêu chí.
Ngoài ra, chúng tôi cũng đưa ra quy trình chung để xây dựng hệ gợi ý trong các website thương mại và thực hiện tích
hợp các kỹ thuật hệ gợi ý trong website thương mại điện tử khắc phục vấn đề người dùng mới, sản phẩm mới (vấn
đề này còn gọi là “Cold start problem”) của các phương pháp gợi ý cá nhân hóa.
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Tóm tắt nội dung tài liệu: Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử
ách hàng mới, hệ thống không thể cung cấp gợi ý phù hợp. 3. Không gợi ý được thêm các sở thích mới của khách. 4 Lọc cộng tác 1. Hệ thống không cần sử dụng đến hồ sơ 1. Không thể gợi ý nếu khách hàng chưa (Collaborative nhân khẩu học của người dùng để gợi ý từng tương tác với các mặt hàng. Filtering) sản phẩm. 2. Không thể gợi ý được các sản phẩm mới 2. Có khả năng dự đoán được sở thích và nhu hoặc sản phẩm chưa được ai đánh giá. cầu của người dùng mà không cần hiểu sản 3. Khi lượng sản phẩm lớn nhưng số lượng phẩm. khách hàng đánh giá không nhiều thì 3. Có thể gợi ý tới người dùng những sản phương pháp này không hiệu quả. phẩm bên ngoài sở thích đang có. Nhữngnhững sản phẩm này có thể phù hợp sở thích mới của họ. 5 Phương pháp tổng 1. Kết hợp tất cả các ưu điểm của phương 1. Không thể gợi ý cho người dùng mới hợp (Hybrid method) pháp Content-based filtering và Collaborative 2. Khi lượng sản phẩm lớn nhưng số lượng Filtering. khách hàng đánh giá không nhiều thì phương pháp này không hiệu quả. 526 Hoàng Thị Hà, Ngô Nguyễn Thức Bâng 4. Thông tin các tập dữ liệu thử nghiệm Datasets #Items #Users # Rating Range Rating Mô tả Movielens 100K 1,700 1,000 100,000 1÷5 Chứa đánh giá của người dùng trên các các bộ phim. Mỗi bộ phim có các đặc trưng (id, title, realise date, type, rating, time ) Epinion 138,738 49,290 139,738 1÷5 Chứa quan điểm của người dùng về các sản phẩm thương mại BookCrossing 271,379 278,858 1,149,780 1÷10 Chứa đánh giá của người dùng về sách. LastFM 17,632 1,892 92,834 Số lần các bài hát Chứa danh sách top những bài hát được được bật bởi người dùng nghe nhiều nhất (2100 users users and 18,745) 5.2.3. Kết quâ thử nghiệm thuêt gợi ý cá nhån hòa nhþ: phþĄng pháp gợi ý dăa trên nội dung, phþĄng pháp gợi ý lọc cộng Kết quâ ć bâng 5 cho thçy, thuêt toán tác để thông báo cho khách hàng nhĂng sân Content - based có thąi gian chäy nhanh hĄn phèm họ có thể thích, hỗ trợ khách hàng trong User-based và Item-based, nhþng độ chính xác quá trình tìm mua sân phèm. không cao. GiĂa thuêt toán User-based và Item-based, nếu xét về sai số cûa dă đoán 6.1. Tổng quan về cách tiếp cận thìtiếp cên lọc cộng tác dăa trên sân phèm Cách tiếp cên tổng quan cûa chúng tôi đþợc (Item-based) cho sai số thçp hĄn (hay cho độ thể hiện trong hình 5. chính xác cao hĄn) tiếp cên lọc cộng tác dăa trênngþąi dùng (User - based) vĆi tỷ lệ 3/4 têp 6.2. Luồng xử lý chính trong hệ thống dĂ liệu. Tuy nhiên, xét về thąi gian thăc hiện thì phþĄng pháp lọc cộng tác dăa trên ngþąi Luồng xā lý chính trong hệ thống đþợc thể dùng thăc hiện nhanh hĄn nhiều so vĆi phþĄng hiện trong hình 6. pháp lọc cộng tác dăa trên sân phèm câ giai Giâi thích: Hệ thống sẽ kiểm tra xem khách đoän huçn luyện (training) và giai đoän kiểm hàng cò đëng nhêp hay không. Nếu khách hàng thā (testing) ć câ 4 têp dĂ liệu. Do đò, cò thể nói cò đëng nhêp, hệ thống sẽ kiểm tra xem khách phþĄng pháp lọc cộng tác dăa trên User - based hàng đã cò độ tþĄngtă vĆi ngþąi khác hay chþa, sẽ có khâ nëng mć rộng (scability) tốt hĄn nếu có thì sẽ sā dýng mô hình lọc cộng tác để phþĄng pháp Item - based. Vì vêy, khó có thuêt hiển thð thông tin gợi ý, ngþợc läi hệ thống sẽ toán nào là tốt nhçt trên mọi tiêu chí. Tùy theo kiểm tra xem khách hàng có thông tin cá nhân mýc đích gợi ý và Āng dýng thăc tế để chọn để quyết đðnh lăa chọn mô hình nhân khèu học phþĄng pháp gợi ý phù hợp. hoặc không cá nhån để đþa ra gợi ý cho khách hàng. Trþąng hợp gợi ý dăa trên mô hình không 6. TÍCH HỢP HỆ GỢI Ý TRONG HỆ THỐNG cá nhân thì sẽ đþa ra nhĂng sân phèm mĆi, sân BÁN HÀNG TRỰC TUYẾN phèm bán chäy, sân phèm đþợc nhiều khách hàng quan tâm. Để thā nghiệm trăc quan hệ gợi ý Āng dýng Trong trþąng hợp khách hàng không đëng trong thþĄng mäi điện tā, chúng tôi tiến hành nhêp, hệ thống sẽ kiểm tra lðch sā khách hàng xây dăng hệ thống bán sách trăc tuyến tích hợp đã tÿng truy cêp vào trang web dăa vào IP vĆi các thuêt toán gợi ý đã trình bày ć trên. máy tính mà khách hàng truy cêp, hệ thống sẽ Hệ thống sā dýng thuêt toán gợi ý không cá lþu vết läi lðch sā quá trình truy cêp. Nếu có nhån hòa để hiển thð các sân phèm mĆi, sân thông tin dăa theo đða chî IP, hệ thống sẽ đþa phèm bán chäy nhçt, sân phèm đþợc þa thích ra gợi ý về nhĂng sân phèm mà khách hàng đã nhçt. Đặc biệt, hệ thống tích hợp một số kỹ tÿng xem. 527 Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử Bâng 5. Sai số dự đoán và thời gian thực hiện trung bình 5 lần chäy của các phương pháp lọc cộng tác Thời gian(sec) Dataset Thuật toán NRMSE Training testing Movielens (100K) Content - based 0,317 0,093 0,027 User - based 0,280 1,126 3,107 Item - based 0,288 0,147 7,793 Epinion User - based 0,285 6,515 158,91 Item - based 0,254 7,518 3869,7 BookCrossing User - based 0,248 9,126 171,73 Item - based 0,282 20,142 4030,5 LastFM User - based 0,0131 4,313 165,398 Item - based 0,0103 39,326 4431,387 Ghi chú: giá trị tốt nhất của các tiêu chí trên mỗi tập dữ liệu được tô đậm. Thông tin về Users (products cataluge) Thông tin về sản phẩm Recommender System (products cataluge) Tương tác của User-item (peocduct (User product interactions) (products cataluge) (Peocduct Danh sách các sản phẩm gợi ý cho khách Hình 5. Tổng quan về cách tiếp cận 6.3. Tiến trình gợi ý trong hệ thống website sân phèm mĆi, sân phèm bán chäy, sân phèm thương mäi đþợc nhiều ngþąi đánh giá. Tiến trình gợi ý sân phèm trong hệ thống - Nhóm 2: Sā dýng nhóm thuêt toán cá thþĄng mäi điện tā đþợc thể hiện trong hình 7. nhån hòa đã trình bày ć mýc 2.2 để gợi ý cho khách hàng: thuêt toán nhân khèu học, thuêt Tiến trình này bao gồm 3 giai đoän: toán gợi ý dăa trên nội dung (content - based), Giai đoän 1: Thu thêp thông tin ngþąi dùng thuêt toán lọc cộng tác (Collaborative filtering) Để có thể dă đoán đþợc sć thích cûa ngþąi để đoán các sân phèm phù hợp vĆi khách hàng. dùng, hệ thống phâi học một mô hình ngþąi Giai đoän 3: Gợi ý: Giai đoän này, cën cĀ dùng (User model). Mô hình ngþąi dùng mà vào tÿng đặc điểm cûa khách hàng, hệ thống sẽ chúng tôi thu thêp là các dĂ liệu cûa ngþąi dùng dă đoán và gợi ý nhĂng sân phèm mà khách nhþ: thông tin cá nhån, thông tin lðch sā tþĄng hàng có thể thích. tác cûa ngþąi dùng trên sân phèm. Giai đoän 2: Sā dýng các thuêt toán gợi ý: 6.4. Một số giao diện kết quâ chính ứng với Giai đoän này, chúng tôi sā dýng dĂ liệu thu 3 giai đoän gợi ý của hệ thống thêp đþợc ć giai đoän 1 và dĂ liệu sân phèm để chäy 2 nhóm thuêt toán: 6.4.1. Trang đánh giá sản phẩm - Nhóm 1: Sā dýng thuêt toán gợi ý không Giao diện đánh giá sân phèm đþợc thể hiện cá nhân hóa (Non - personalized) để gợi ý các trong hình 8. 528 Hoàng Thị Hà, Ngô Nguyễn Thức Hình 6. Luồng xử lý chính trong hệ thống Thu thập thông tin (Information collection) Phản hồi (Feedback) Học (Learning) Dự đoán/Gợi ý (Recommender System) Hình 7. Tiến trình gợi ý trong hệ thống 6.4.2. Một số trang huấn luyện mô hình kiếm một sân phèm, hệ thống sẽ hiển thð danh - Trang thống kê đánh giá sân phèm cûa sách nhĂng sân phèm mĆi và nhĂng sân phèm ngþąi dùng đþợc thể hiện trong hình hình 9. tþĄng tă mà nhiều ngþąi quan tåm để gợi ý cho khách hàng. - Trang đo lþąng độ tþĄng tă giĂa các ngþąi dùng đþợc thể hiện trong hình 10. b. Đối với khách hàng thành viên Nếu khách hàng là thành viên cûa hệ 6.4.3. Các kết quả gợi ý sản phẩm thống, tÿng cò đánh giá sân phèm, website sẽ a. Đối với khách hàng mới gợi ý nhĂng sân phèm mĆi, sân phèm nhiều Nếu là khách hàng mĆi (khách hàng chþa ngþąi quan tâm, sân phèm tþĄng tă. Ngoài ra, đánh giá bçt kỳ sân phèm nào), khi họ tìm hệ thống còn dăa vào độ tþĄng tă giĂa các ngþąi 529 Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử dùng để hiển thð nhĂng sân phèm mà khách Nhþ vêy, bìng việc xây dăng một Āng dýng hàng chþa đþợc trâi nghiệm nhþng đã đþợc các thþĄng mäi điện tā có tích hợp đa däng các khách hàng tþĄng tă khác đánh giá cao. phþĄng pháp hệ gợi ý, website đã tă động đþa ra cho khách hàng các gợi ý khá thông minh, đa - Trang gợi ý nhĂng sân phèm ngþąi dùng däng, trăc quan, phù hợp vĆi tÿng cá nhân khách có thể thích đþợc thể hiện trong hình 12. hàng và đã khíc phýc đþợc vçn đề ngþąi dùng - Trang hiển thð nhĂng sân phèm khách mĆi, sân phèm mĆi. VĆi nhĂng khâ nëng trên cho hàng đã xem hoặc đã mua đþợc thể hiện trong thçy, hệ gợi ý mang läi trâi nghiệm tốt chokhách hình 13. hàng, giúp khách hàng giâm thąi gian tìm kiếm - Trang gợi ý sân phèm có thể đþợc mua sân phèm, tëng độ hài lñng, tëng cĄ hội mua cùng nhau đþợc thể hiện trong hình 14. hàng và nâng cao tỷ lệ chuyển đổi mua hàng. Hình 8. Giao diện đánh giá sân phẩm của người dùng Hình 9. Giao diện kết quâ đánh giá sân phẩm của người dùng 530 Hoàng Thị Hà, Ngô Nguyễn Thức Hình 10. Giao diện đo lường độ tương tự giữa các người dùng Hình 11. Giao diện gợi ý cho người dùng mới 531 Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử Hình 12. Giao diện gợi ý các sân phẩm người dùng có thể thích Hình 13. Giao diện hiển thị những sân phẩm người dùng đã xem/mua Hình 14. Giao diện gợi ý các sân phẩm hay mua cùng nhau 532 Hoàng Thị Hà, Ngô Nguyễn Thức 7. KẾT LUẬN TÀI LIỆU THAM KHẢO Adomavicius G., Sankaranarayanan R., Sen S. & Hệ gợi ý có vai trò rçt quan trọng trong Tuzhilin A. (2005). Incorporating contextual thþĄng mäi điện tā. Nó là một trong nhĂng vü information in recommender systems using a khí mänh mẽ giúp nhiều doanh nghiệp tëng multidimensional approach.. ACM Transactions on doanh số bán hàng, là một trong nhĂng nhân tố Information Systems (TOIS). pp. 103-145. täo nên să thành công cûa các trang thþĄng mäi Dias M.B., Locher D., Li M., El-Deredy W. & Lisboa P.J. (2008). The value of personalised điện tā và sẽ đþợc Āng dýng rộng rãi trong recommender systems to e-business: a case study. tþĄng lai. Proceedings of the 2008 ACM conference on Trong nghiên cĀu này, chúng tôi đã trình Recommender systems. pp. 291-294. bày tổng quan về hệ gợi ý, khám phá nhĂng tác GroupLens (1998). MovieLens 100K Dataset, Retrieved from https://grouplens.org/datasets/ động cûa hệ gợi ý đối vĆi thþĄng mäi điện tā. movielens/ on October 03, 2020. Bìng thăc nghiệm, chúng tôi đã so sánh đþợc Grouplens (2011). Last.FM. Retrieved from hiệu quâ thăc hiện cûa các phþĄng pháp gợi ý https://grouplens.org/datasets/hetrec-2011 on Content-based, User-based và Item-based, October 03, 2020. đánh giá đþợc nhĂng điểm mänh, điểm yếu cûa Google & Temasek (2018). Báo cáoReport e-Conomy mỗi phþĄng pháp gợi ý. Ngoài ra, chúng tôi báo SEA 2018, Retrieved from . https://www.thinkwithgoogle.com/_qs/documents/ cáo thách thĀc cûa các phþĄng pháp gợi ý khi áp 6730/Report_e-Conomy_SEA_2018_by_Google_ dýng trong thþĄng mäi điện tā và chî ra giâi Temasek_v.pdf on March 20, 2020. pháp khíc phýc. Cuối cùng, chúng tôi đã xåy Ionos (2017). Recommendation systems in e- dăng thành công hệ thống bán hàng trăc tuyến commerce. US: IONOS Inc. Retrieved from có tích hợp các phþĄng pháp gợi ý khác nhau, https://www.ionos.com/digitalguide/online-mark eting/online-sales/how-to-use-recommendation- bao gồm kỹ thuêt gợi ý không cá nhân hóa systems-in-e-commerce on May 15, 2020. (Non-personalized) và các kỹ thuêt gợi ý cá Jordan T. (2016). New insight from Experian nhân hóa hiệu quâ nhþ: gợi ý dăa trên nội dung Marketing Services helps brands prepare for the (Content-based filtering), lọc cộng tác (User- holiday season. https://www.experianplc.com. based, Item-based). Qua đò, ngþąi đọc hiểu đþợc Khusro S., Ali Z. & Ullah I. (2016). Recommender nền tâng lý thuyết hệ gợi ý, điểm mänh, điểm systems: issues, challenges, and research opportunities. In Information Science and yếu cûa các hệ gợi ý cüng nhþ quy trình xåy Applications (ICISA) 2016. Springer. In dăng một Āng dýng thþĄng mäi điện tā có tích Information Science and Applications (ICISA). hợp các phþĄng pháp gợi ý trong thăc tế. Lei Tang, Zongtao Duan, Yishui Zhu, Junchi Ma & HþĆng nghiên cĀu trong tþĄng lai cûa lïnh Zihang Liu (2019). Recommendation for văc này còn khá rộng mć, đặc biệt là các kỹ Ridesharing Groups Through Destination Prediction on Trajectory Data. IEEE Transactions thuêt gợi ý cá nhân hóa. Chúng tôi sẽ tiếp týc on Intelligent Transportation Systems. 99: 14. nghiên cĀu, câi tiến Āng dýng các thuêt toán gợi Mohamed M.H., Khafagy M.H. & Ibrahim M.H. (2019). ý trong lïnh văc e-commerce, lïnh văc Recommender Systems Challenges and Solutions e-learning để trợ giúp ngþąi dùng trong quá survey. International Conference on Innovative trình mua hàng, tìm kiếm tài liệu cüng nhþ hỗ Trends in Computer Engineering (ITCE) trợ quá trình học têp trăc tuyến. Nguyễn Hùng Dũng & Nguyễn Thái Nghe (2013). Hệ thống gợi ý sản phẩm trong bán hàng trực tuyến sử dụng kỹ thuật lọc cộng tác Tạp chí Khoa học, LỜI CẢM ƠN Trường Đại học Cần Thơ. 31: 15. Nguyễn Thanh Hưng (2019). Báo cáo chỉ số thương Chúng tôi câm Ąn Khoa Công nghệ thông mại điện tử 2019. Hiệp hội thương mại điện tử tin, Học viện Nông nghiệp Việt Nam đã täo Việt Nam. điều kiện tốt nhçt để chúng tôi thăc hiện Reichheld & F.F. (1993). Loyalty-based management. nghiên cĀu này. Harvard business review. 71(2): 64-73. 533 Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử Schafer Ben J., Joseph Konstan & John Riedl (2001). International Conference Proceeding Series. ACM E-commence Recommendation Applications. press. New York, USA. 8. Data Mining and Knowledge Discovery. Trademark Notice (2003). Epinions dataset. Retrieved 5(1-2): 115-153. from on Sharma L. & Gera A. (2013). A survey of October 03, 2020. recommendation system: Research challenges. University of Freiburg (2004). BookCrossing, International Journal of Engineering Trends and Retrieved from Technology (IJETT). 4(5): 1989-1992. freiburg.de/~cziegler/BX/ on October 03, 2020 Singh P. (2019). A Survey of Recommendation Viễn Thông (2020). Thương mại điện tử Việt Nam Systems in Electronic Commerce. Apress, 2020 sẽ ra sao? Truy cập từ Berkeley, CA. pp. 123-157. https://vnexpress.net/kinh-doanh/thuong-mai-dien- Stephan S. (2019). Personalized Product tu-viet-nam-2020-se-ra-sao-4045309.html, ngày10 Recommendation Tips and Stats. Retrieved tháng 3 năm 2020. fromhttps://www.barilliance.com/personalized- Xue A.Y., Qi J., Xie X., Zhang R., Huang J. & Li Y. product-recommendations-stats/ on Feb 25, 2020. (2015). Solving the data sparsity problem in Thomas T. (2006). Designing recommender systems destination prediction. The VLDB Journal. for e-commerce: an integration approach. ACM 24(2): 219-243. 534
File đính kèm:
- mot_so_phuong_phap_goi_y_va_ung_dung_trong_thuong_mai_dien_t.pdf