Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn

TÓM TẮT

Các hệ thống tư vấn hay hệ trợ lý ảo (chatbots) đã và đang được nghiên cứu và phát triển

trong vài thập niên gần đây bởi những sự thuận lợi của chúng trong việc tương tác giữa

người và máy. Ngày nay, các hệ trợ lý ảo này đã được áp dụng trong nhiều lĩnh vực trên

thực tế như thương mại điện tử, chăm sóc sức khỏe, y tế, du lịch và giáo dục. Một trong

những giai đoạn đầu tiên, quan trọng nhất mà ảnh hưởng đến chất lượng kết quả đầu ra

của các hệ thống này là làm sao hiểu được chủ đề từ thông điệp/câu văn bản mà người sử

dụng đưa vào. Do đó, trong bài báo này, chúng tôi tìm hiểu một số phương pháp xác định

chủ đề từ một câu văn bản cho trước và đưa ra đánh giá về tính hiệu quả của các phương

pháp này

Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn trang 1

Trang 1

Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn trang 2

Trang 2

Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn trang 3

Trang 3

Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn trang 4

Trang 4

Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn trang 5

Trang 5

Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn trang 6

Trang 6

Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn trang 7

Trang 7

Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn trang 8

Trang 8

Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn trang 9

Trang 9

Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 12 trang xuanhieu 9640
Bạn đang xem 10 trang mẫu của tài liệu "Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn

Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn
g để học thông tin ngữ nghĩa thứ tự các từ theo ngữ cảnh. Ravuri và 
cộng sự [22] đã sử dụng RNN và LSTM (Long Short Term Memory) giải quyết bài toán 
phân loại chủ đề. Các thí nghiệm chỉ ra rằng RNN cho kết quả tốt với câu văn bản ngắn 
và LSTM cho kết quả tốt với câu văn bản dài. Hiện tại, một số công ty như Google, 
Microsoft, đã xây dựng các API sử dụng phương pháp học truyền thống và học sâu 
để hỗ trợ người sử dụng trong bài toán xử lý ngôn ngữ nói chung và xác định chủ đề 
của câu văn bản nói riêng như Dialogflow, Rasa, Luis,... Nghiên cứu [6] sử dụng công 
cụ Dialogflow để xác định chủ đề của thông điệp người dùng đưa vào dưới dạng câu 
văn bản tiếng việt trong hệ trợ lý ảo hỗ trợ học và quản lý sinh viên của một trường Đại 
học. 
Xét thấy, mỗi mô hình học sâu đều có ưu điểm và nhược điểm riêng, các nhà 
nghiên cứu thường đưa ra phương pháp kết hợp giữa các mô hình. Chẳng hạn, Tran OT 
và cộng sự [23] đã đưa ra một phương pháp học sâu sử dụng hai kiến trúc mạng LSTMs 
và CNNs để trích chọn các đặc trưng ngữ nghĩa một cách tự động. Các đặc trưng này 
được sử dụng để phân loại chủ đề văn bản. Các tác giả trong bài báo [24] đã đưa ra 
framework TOP-ID (Towards OPen Intent Discovery) với cách tiếp cận 2 giai đoạn, sử 
dụng mô hình gồm LSTM hai chiều và CRF. Hệ thống tự động xác định các chủ đề không 
cần tri thức của lớp chủ đề được định nghĩa trong tập ngữ liệu huấn luyện. Điều này có 
nghĩa TOP-ID không bị giới hạn bởi tập các chủ đề được định nghĩa trước, hệ thống có 
thể nhận ra các chủ đề chưa từng gặp trước đó. 
3. SO SÁNH VÀ ĐÁNH GIÁ CÁC CÁCH TIẾP CẬN 
Phương pháp đối sánh chuỗi khá đơn giản và dễ cài đặt, chúng ta có thể thấy 
ngay nhược điểm của phương pháp này là việc đối sánh chuỗi dễ dàng dẫn đến việc 
nhận dạng sai nếu trong hai chuỗi đang so sánh có ký tự hay từ không giống nhau dẫn 
đến hai chuỗi đó khác nhau. Với ví dụ tập mẫu của chủ đề “Chào hỏi” như trên, nếu 
thông điệp đầu vào của người dùng là “Chào”, thì hệ thống không nhận diện được chủ 
đề. Ngoài ra, đối với phương pháp này, chương trình cần phải lưu nhiều câu văn bản 
mẫu tương ứng với mỗi chủ đề để hệ thống có thể đưa ra câu trả lời đúng. 
Trong khi đó, các phương pháp dựa trên luật đòi hỏi bộ cơ sở tri thức được xây 
dựng sẵn, bao gồm các mẫu câu và câu trả lời (chủ đề) tương ứng. Cơ chế làm việc của 
các phương pháp này là tìm mẫu câu phù hợp nhất ứng với thông điệp đầu vào để đưa 
ra chủ đề tương ứng đã được xác định trước. Các phương pháp này cho ra kết quả chính 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021) 
53 
xác nếu thông điệp đầu vào có mẫu trùng khớp với mẫu trong cơ sở tri thức. Các hệ 
thống dựa trên luật không có khả năng học mà chỉ thực hiện theo ngữ cảnh hay kịch bản 
được thiết kế sẵn, do đó hệ thống sẽ không đưa ra được câu trả lời trong trường hợp 
thông điệp đầu vào không có dạng mẫu trong cơ sở tri thức. Thật vậy, giả sử chúng ta 
có cơ sở tri thức chỉ chứa luật với mẫu “Hi” như trong Hình 2. Như vậy, nếu người sử 
dụng nhập vào thông điệp “Hello” thì chương trình sẽ không đưa ra được câu trả lời 
tương ứng bởi vì mẫu của thông điệp này không có trong cơ sở tri thức. Do đó, các hệ 
thống này sẽ cho kết quả tốt nếu cơ sở tri thức chứa nhiều luật. Hiện nay, công nghệ 
AIML vẫn được sử dụng phổ biến trong các hệ trợ lý ảo. Cụ thể, hệ trợ lý ảo Mitsuku[25] 
được xây dựng bằng công nghệ AIML đã 5 lần giành giải Loebner Prize vào những năm 
2013, 2016, 2017, 2018 và 2019. Ngoài ra, công nghệ AIML được phát triển thành các gói 
mã nguồn mở[26] thuận tiện cho người sử dụng. Với đặc điểm này, các phương pháp 
dựa trên luật được sử dụng để xây dựng các trợ lý ảo dạng kịch bản mà trong đó các câu 
hỏi và câu trả lời được thiết kế sẵn một cách có trình tự, người sử dụng có thể lựa chọn 
câu hỏi có sẵn hoặc trả lời các câu hỏi mà chương trình đưa ra. Các mô hình trợ lý ảo này 
thường được sử dụng trong lĩnh vực thương mại điện tử như đặt hàng, giao tiếp với 
khác hàng hay đưa ra các khuyến nghị khi mua hàng. 
Hai phương pháp vừa trình bày ở trên chỉ thực hiện việc đối sánh chuỗi và mẫu 
của thông điệp đầu vào sao cho trùng khớp với cơ sở tri thức đã xây dựng sẵn và hoàn 
toàn không hiểu được ngôn ngữ tự nhiên của câu văn bản. Trong khi đó, các phương 
pháp học máy kết hợp sử dụng ngôn ngữ tự nhiên cho phép xây dựng các trợ lý ảo thông 
minh, có khả năng hiểu được thông điệp đầu vào bất kỳ thông qua việc trích xuất thông 
tin bằng các phương pháp xử lý ngôn ngữ tự nhiên và huấn luyện (training). Tuy nhiên, 
những phương pháp học máy này đòi hỏi tập dữ liệu huấn luyện (training data) đầu 
vào là tập ngữ liệu gồm các mẫu câu được gán lớp chủ đề tương ứng. Các phương pháp 
học máy truyền thống cho ra kết quả tốt khi có đủ tập dữ liệu huấn luyện và tập đặc 
trưng dữ liệu được lựa chọn tốt. Thông thường tập các đặc trưng được trích chọn bằng 
tay, phụ thuộc vào các chuyên gia nên đòi hỏi chi phí cao. Ngoài ra, đối với các thông 
điệp đầu vào không chuẩn và nhập nhằng, phương pháp học truyền thống không đưa 
ra được kết quả chính xác vì không hiểu sâu ngữ nghĩa bên trong của câu văn bản. Trong 
khi đó, các phương pháp học sâu cho ra kết quả tốt hơn hẳn khi tập dữ liệu đủ lớn. Bên 
cạnh đó, các phương pháp học sâu tự trích chọn đặc trưng trong quá trình học (học biểu 
diễn đặc trưng) trước khi tham gia vào quá trình phân lớp. Tuy nhiên, các thực nghiệm 
chỉ ra rằng, trong trường hợp dữ liệu không đủ lớn thì phương pháp học truyền thống 
cho ra kết quả tốt hơn. 
Tóm lại, phương pháp dựa vào luật có nhược điểm ít linh hoạt nghĩa là nếu mẫu 
câu đầu vào không tồn tại trong cơ sở tri thức thì hệ thống sẽ không đưa ra kết quả. Tuy 
nhiên ưu điểm của phương pháp này cho ra kết quả khá chính xác khi mẫu câu thông 
điệp đầu vào khớp với mẫu câu trong cơ sở tri thức. Ưu điểm của các phương pháp học 
Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn 
54 
máy là khả năng hiểu ngữ nghĩa thông điệp người sử dụng đưa vào, có khả năng học từ 
dữ liệu mới. Tuy nhiên các phương pháp học máy đòi hỏi dữ liệu huấn luyện phải đủ 
lớn, cần thời gian huấn luyện. Trong trường hợp tập huấn luyện không đầy đủ, hệ thống 
có thể cho ra kết quả sai. 
4. KẾT LUẬN 
Bài báo trình bày một số cách tiếp cận được sử dụng cho bài toán xác định chủ 
đề của thông điệp người dùng dưới dạng câu văn bản. Trong bài báo này, chúng tôi 
cũng đã đưa ra so sánh, đánh giá ưu và nhược điểm của mỗi phương pháp. Tùy theo dữ 
liệu đầu vào, yêu cầu trợ lý ảo được thiết kế kiểu gì mà chúng ta chọn phương pháp cho 
phù hợp. 
Bài toán xác định chủ đề của một câu văn bản được áp dụng trong trong nhiều 
lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và trợ lý ảo nói riêng. Các trợ lý ảo thông 
thường hướng đến việc xác định chủ đề người dùng trên một lĩnh vực cụ thể chẳng hạn 
như thương mại điện tử, y tế, giáo dục, Việc xây dựng trợ lý ảo linh hoạt, có thể hiểu 
được hầu hết các thông điệp người dùng dưới dạng câu văn bản thậm chí câu văn bản 
không đầy đủ (ngôn nghữ chat) để đưa ra chủ đề hay ý định người dùng muốn nói gì 
(đặc biệt là câu văn bản có nhiều chủ đề trong đó) là một bài toán vẫn đang còn nhiều 
thách thức. Dựa vào các phân tích đánh giá một số cách tiếp cận đã trình bày ở đây, 
chúng tôi hướng đến xây dựng hệ trợ lý ảo tư vấn thông tin đào tạo Đại học cho các sinh 
viên trong trường vào thời gian đến. 
TÀI LIỆU THAM KHẢO 
[1]. Laranjo L, Dunn AG, Tong HL, et al (2018). Conversational agents in healthcare: a systematic 
review, J Am Med Inform Assoc., Vol 25, pp. 1248–1258 
[2]. Kim J, Park SY, Lionel P R (2013). Conversational Agents for Health and Wellbeing: Review 
and Future Agendas, Proc. Identifying Challenges and Opportunities in Human–AI Collaboration 
in Healthcare. Austin, Texas USA 
[3]. Schaffer S, Gustke O, Oldemeier J, Reithinger N (2018). Towards Chatbots in the museum, 
Proc. CEUR Workshop., pp. 1–7 
[4]. Varitimiadis S, Kotis K, Tzortzakakis A, et al (2020). Towards implementing an AI chatbot 
platform for museums, Pro. 2nd International Conference on Cultural Informatics, 
Communication & Media Studies., Vol 1, p. 1-15 
[5]. [Quoc Nguyen D, Quoc Nguyen D, Bao Pham S (2012). A Vietnamese Text-Based 
Conversational Agent, (eds) Advanced Research in Applied Artificial Intelligence. Springer, 
Berlin, Heidelberg. pp 699–708 
[6]. Hien H, Pham-Nguyen C, Nam L, et al (2018). Intelligent Assistants in Higher-Education 
Environments: The FIT-EBot, a Chatbot for Administrative and Learning Support, Proc. of 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021) 
55 
the Ninth International Symposium on Information and Communication Technology. Danang City, 
Vietnam, pp. 69–76 
[7]. Boundris D, Atwell E (2005). "Using FAQs and Chatbots for e-learning at the University of 
Leeds", Master Thesis, Information Systems, University of Leeds, West Yorkshire, England 
[8]. Anusha Vegesna, Pranjal Jain, Dhruv Porwal (2018). Ontology based Chatbot (For E-
commerce Website)., Int J Comput Appl., Vol. 179, pp. 51–55 
[9]. Chai J, Horvath V, Nicolov N, et al (2001). Natural Language Sales Assistant -- A Web-Based 
Dialog System for Online Sales, Proc. the Thirteenth Innovative Applications of Artificial 
Intelligence Conference, Seattle, Washington, USA, pp. 19–26 
[10]. Weizenbaum J (1966). ELIZA—a computer program for the study of natural language 
communication between man and machine, Comun ACM., Vol 9, pp. 36–45. 
[11]. Bruno Marietto M das G, Aguiar RV, Barbosa G de O, et al (2013). Artificial Intelligence 
Markup Language: A Brief Tutorial, Int J Comput Sci Eng Surv., Vol 4, pp. 1–20 
[12]. Shah H (2006). A.L.I.C.E.: an ACE in Digitaland, tripleC., Vol 4, pp. 284–292 
[13]. O’Shea K, Bandar Z, Crockett K (2010). A Conversational Agent Framework using Semantic 
Analysis, Int J Intell Comput Res., Vol 1, pp. 10–19 
[14]. Graesser A, Lu S, Jackson G, et al (2004). AutoTutor: a Tutor with Dialogue in Natural 
Language, Behav Res Methods,. Vol 36, pp. 180–192. 
[15]. Traum D (2008). Talking to Virtual Humans: Dialogue Models and Methodologies for 
Embodied Conversational Agents, Proc. Modeling Communication with Robots and Virtual 
Humans. Lecture Notes in Computer Science. Springer, Berlin, Heidelberg, pp. 296–309 
[16]. [McGill M, Sammut C, Westendorp J, Kadous M. FrameScript: A Multi-modal Scripting 
Language, Sch Comput Sci Eng UNSW Copyr © 2003-2008 
[17]. McCallum A, Nigam K (1998). A Comparison of Event Models for Naive Bayes Text 
Classification, Proc. AAAI Workshop., pp. 41–48 
[18]. Mendoza M, Zamora J (2009). Identifying the Intent of a User Query Using Support Vector 
Machines, Proc. Karlgren J, Tarhio J, Hyyrö H (eds) String Processing and Information Retrieval. 
Springer, Berlin, Heidelberg, pp. 131–142 
[19]. Genkin A, Lewis D, Madigan D (2007). Large-Scale Bayesian Logistic Regression for Text 
Categorization, Technometrics,. Vol. 49, pp. 291–304 
[20]. [Ngo L (2016). Identifying User Intents in Vietnamese Spoken Language Commands and Its 
Application in Smart Mobile Voice Interaction, Intelligent Information and Database Systems. 
ACIIDS 2016. Lecture Notes in Computer Science, Springer, Berlin, Heidelberg. 
[21]. Hashemi HB, Asiaee A, Kraft R (2016). Query Intent Detection using Convolutional Neural 
Networks. Proc. International Conference on Web Search and Data Mining, Workshop on Query 
Understanding. ACM. 
[22]. Ravuri S, Stolcke A (2015). Recurrent Neural Network and LSTM Models for Lexical 
Utterance Classification, Proc. Interspeech. International Speech Communication Association, 
Dresden., pp 135–139 
Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn 
56 
[23]. Tran OT, Luong TC (2020). Understanding what the users say in chatbots: A case study for 
the Vietnamese languag, Eng Appl Artif Intell,. Vol. 87, pp. 1–10 
[24]. [Vedula N, Lipka N, Maneriker P, Parthasarathy S (2019) Towards Open Intent Discovery 
for Conversational Text. ArXiv190408524 Cs 
[25]. https://www.pandorabots.com/mitsuku/ 
[26]. [https://www.devdungeon.com/content/ai-chat-bot-python-aiml#enter-python 
A REVIEW OF METHODS FOR DETECTING INTENT OF A TEXT MESSAGE 
IN CHATBOTS 
Doan Thi Hong Phuoc, Nguyen Van Trung, Le Van Tuong Lan 
Faculty of Information Technology, University of Sciences, Hue University 
Email: dthphuoc@husc.edu.vn; nvtrung@husc.edu.vn; lvtlan@husc.edu.vn 
ABSTRACT 
Chatbots, are known as virtual assistants, have been investigated and developed in 
recent decades because of their benefits in the interaction between human and 
machine. Nowadays, these virtual assistants have been applied in many fields such 
as e-commerce, health care, tourism or education. One of the first and most 
important phases that affects to the outcome’s quality of these systems is how to 
understand the intent of user’s text message. Therefore, in this paper, we studied 
methods for detecting intent of a given text message and proposed an evaluation of 
the effect between these methods. 
Keywords: chatbot, intent detection, , text message. 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021) 
57 
Đoàn Thị Hồng Phước sinh ngày 12/07/1977 tại Thừa Thiên Huế. Năm 
1999, bà tốt nghiệp cử nhân chuyên ngành Tin học tại trường Đại học 
Khoa học, Đại học Huế. Năm 2004, bà nhận bằng thạc sĩ chuyên ngành 
Công nghệ thông tin tại trường Đại học Khoa học, Đại học Huế. Năm 
2019, bà nhận học vị tiến sĩ chuyên ngành Khoa học máy tính tại Đại học 
KhonKaen, Thái Lan. Hiện nay, bà là giảng viên của khoa Công nghệ 
thông tin, trường Đại học Khoa học, Đại học Huế. 
Lĩnh vực nghiên cứu: Học máy, Xử lý ngôn ngữ tự nhiên và Khai phá dữ 
liệu văn bản. 
Nguyễn Văn Trung sinh ngày 25/10/1981 tại Thừa Thiên Huế. Năm 2003 
ông tốt nghiệp cử nhân chuyên ngành Tin học tại trường Đại học Khoa 
học, Đại học Huế. Năm 2006 ông nhận bằng thạc sĩ chuyên ngành Công 
nghệ Thông tin tại trường Đại học Khoa học, Đại học Huế. Năm 2018 ông 
nhận học vị Tiến sĩ chuyên ngành Khoa học Máy tính tại trường Đại học 
Khoa học, Đại học Huế. Hiện nay ông công tác tại Khoa Công nghệ 
Thông tin, trường Đại học Khoa học, Đại học Huế. 
Lĩnh vực nghiên cứu: Các hệ thống thông tin, Quản lý và biểu diễn tri thức, 
Web ngữ nghĩa, Linked Data, Công nghệ phần mềm. 
Lê Văn Tường Lân sinh ngày 10/11/1974 tại Thừa Thiên Huế. Năm 1996, 
ông tốt nghiệp Đại học ngành Toán - Tin tại Trường Đại học Khoa học, 
Đại học Huế. Ông nhận bằng thạc sỹ Công nghệ thông tin tại Trường Đại 
học Bách Khoa Hà Nội năm 2002 và nhận học vị Tiến sĩ ngành Khoa học 
máy tính tại Trường Đại học Khoa học, Đại học Huế năm 2018. Hiện ông 
công tác tại Trường Đại học Khoa học, Đại học Huế. 
Lĩnh vực nghiên cứu: Lập trình ứng dụng, Cơ sở dữ liệu, Công nghệ phần 
mềm, Khai phá dữ liệu. 
Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn 
58 

File đính kèm:

  • pdfmot_so_phuong_phap_xac_dinh_chu_de_cua_cau_van_ban_trong_he.pdf