Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn

TÓM TẮT

Các hệ thống tư vấn hay hệ trợ lý ảo (chatbots) đã và đang được nghiên cứu và phát triển

trong vài thập niên gần đây bởi những sự thuận lợi của chúng trong việc tương tác giữa

người và máy. Ngày nay, các hệ trợ lý ảo này đã được áp dụng trong nhiều lĩnh vực trên

thực tế như thương mại điện tử, chăm sóc sức khỏe, y tế, du lịch và giáo dục. Một trong

những giai đoạn đầu tiên, quan trọng nhất mà ảnh hưởng đến chất lượng kết quả đầu ra

của các hệ thống này là làm sao hiểu được chủ đề từ thông điệp/câu văn bản mà người sử

dụng đưa vào. Do đó, trong bài báo này, chúng tôi tìm hiểu một số phương pháp xác định

chủ đề từ một câu văn bản cho trước và đưa ra đánh giá về tính hiệu quả của các phương

pháp này

Download

Trang 1

Trang 2

Trang 3

Trang 4

Trang 5

Trang 6

Trang 7

Trang 8

Trang 9

Trang 10

Tải về để xem bản đầy đủ

12 trang xuanhieu 22840 Free

Download

Bạn đang xem 10 trang mẫu của tài liệu "Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn

g để học thông tin ngữ nghĩa thứ tự các từ theo ngữ cảnh. Ravuri và
cộng sự [22] đã sử dụng RNN và LSTM (Long Short Term Memory) giải quyết bài toán
phân loại chủ đề. Các thí nghiệm chỉ ra rằng RNN cho kết quả tốt với câu văn bản ngắn
và LSTM cho kết quả tốt với câu văn bản dài. Hiện tại, một số công ty như Google,
Microsoft, đã xây dựng các API sử dụng phương pháp học truyền thống và học sâu
để hỗ trợ người sử dụng trong bài toán xử lý ngôn ngữ nói chung và xác định chủ đề
của câu văn bản nói riêng như Dialogflow, Rasa, Luis,... Nghiên cứu [6] sử dụng công
cụ Dialogflow để xác định chủ đề của thông điệp người dùng đưa vào dưới dạng câu
văn bản tiếng việt trong hệ trợ lý ảo hỗ trợ học và quản lý sinh viên của một trường Đại
học.
Xét thấy, mỗi mô hình học sâu đều có ưu điểm và nhược điểm riêng, các nhà
nghiên cứu thường đưa ra phương pháp kết hợp giữa các mô hình. Chẳng hạn, Tran OT
và cộng sự [23] đã đưa ra một phương pháp học sâu sử dụng hai kiến trúc mạng LSTMs
và CNNs để trích chọn các đặc trưng ngữ nghĩa một cách tự động. Các đặc trưng này
được sử dụng để phân loại chủ đề văn bản. Các tác giả trong bài báo [24] đã đưa ra
framework TOP-ID (Towards OPen Intent Discovery) với cách tiếp cận 2 giai đoạn, sử
dụng mô hình gồm LSTM hai chiều và CRF. Hệ thống tự động xác định các chủ đề không
cần tri thức của lớp chủ đề được định nghĩa trong tập ngữ liệu huấn luyện. Điều này có
nghĩa TOP-ID không bị giới hạn bởi tập các chủ đề được định nghĩa trước, hệ thống có
thể nhận ra các chủ đề chưa từng gặp trước đó.
3. SO SÁNH VÀ ĐÁNH GIÁ CÁC CÁCH TIẾP CẬN
Phương pháp đối sánh chuỗi khá đơn giản và dễ cài đặt, chúng ta có thể thấy
ngay nhược điểm của phương pháp này là việc đối sánh chuỗi dễ dàng dẫn đến việc
nhận dạng sai nếu trong hai chuỗi đang so sánh có ký tự hay từ không giống nhau dẫn
đến hai chuỗi đó khác nhau. Với ví dụ tập mẫu của chủ đề “Chào hỏi” như trên, nếu
thông điệp đầu vào của người dùng là “Chào”, thì hệ thống không nhận diện được chủ
đề. Ngoài ra, đối với phương pháp này, chương trình cần phải lưu nhiều câu văn bản
mẫu tương ứng với mỗi chủ đề để hệ thống có thể đưa ra câu trả lời đúng.
Trong khi đó, các phương pháp dựa trên luật đòi hỏi bộ cơ sở tri thức được xây
dựng sẵn, bao gồm các mẫu câu và câu trả lời (chủ đề) tương ứng. Cơ chế làm việc của
các phương pháp này là tìm mẫu câu phù hợp nhất ứng với thông điệp đầu vào để đưa
ra chủ đề tương ứng đã được xác định trước. Các phương pháp này cho ra kết quả chính
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021)
53
xác nếu thông điệp đầu vào có mẫu trùng khớp với mẫu trong cơ sở tri thức. Các hệ
thống dựa trên luật không có khả năng học mà chỉ thực hiện theo ngữ cảnh hay kịch bản
được thiết kế sẵn, do đó hệ thống sẽ không đưa ra được câu trả lời trong trường hợp
thông điệp đầu vào không có dạng mẫu trong cơ sở tri thức. Thật vậy, giả sử chúng ta
có cơ sở tri thức chỉ chứa luật với mẫu “Hi” như trong Hình 2. Như vậy, nếu người sử
dụng nhập vào thông điệp “Hello” thì chương trình sẽ không đưa ra được câu trả lời
tương ứng bởi vì mẫu của thông điệp này không có trong cơ sở tri thức. Do đó, các hệ
thống này sẽ cho kết quả tốt nếu cơ sở tri thức chứa nhiều luật. Hiện nay, công nghệ
AIML vẫn được sử dụng phổ biến trong các hệ trợ lý ảo. Cụ thể, hệ trợ lý ảo Mitsuku[25]
được xây dựng bằng công nghệ AIML đã 5 lần giành giải Loebner Prize vào những năm
2013, 2016, 2017, 2018 và 2019. Ngoài ra, công nghệ AIML được phát triển thành các gói
mã nguồn mở[26] thuận tiện cho người sử dụng. Với đặc điểm này, các phương pháp
dựa trên luật được sử dụng để xây dựng các trợ lý ảo dạng kịch bản mà trong đó các câu
hỏi và câu trả lời được thiết kế sẵn một cách có trình tự, người sử dụng có thể lựa chọn
câu hỏi có sẵn hoặc trả lời các câu hỏi mà chương trình đưa ra. Các mô hình trợ lý ảo này
thường được sử dụng trong lĩnh vực thương mại điện tử như đặt hàng, giao tiếp với
khác hàng hay đưa ra các khuyến nghị khi mua hàng.
Hai phương pháp vừa trình bày ở trên chỉ thực hiện việc đối sánh chuỗi và mẫu
của thông điệp đầu vào sao cho trùng khớp với cơ sở tri thức đã xây dựng sẵn và hoàn
toàn không hiểu được ngôn ngữ tự nhiên của câu văn bản. Trong khi đó, các phương
pháp học máy kết hợp sử dụng ngôn ngữ tự nhiên cho phép xây dựng các trợ lý ảo thông
minh, có khả năng hiểu được thông điệp đầu vào bất kỳ thông qua việc trích xuất thông
tin bằng các phương pháp xử lý ngôn ngữ tự nhiên và huấn luyện (training). Tuy nhiên,
những phương pháp học máy này đòi hỏi tập dữ liệu huấn luyện (training data) đầu
vào là tập ngữ liệu gồm các mẫu câu được gán lớp chủ đề tương ứng. Các phương pháp
học máy truyền thống cho ra kết quả tốt khi có đủ tập dữ liệu huấn luyện và tập đặc
trưng dữ liệu được lựa chọn tốt. Thông thường tập các đặc trưng được trích chọn bằng
tay, phụ thuộc vào các chuyên gia nên đòi hỏi chi phí cao. Ngoài ra, đối với các thông
điệp đầu vào không chuẩn và nhập nhằng, phương pháp học truyền thống không đưa
ra được kết quả chính xác vì không hiểu sâu ngữ nghĩa bên trong của câu văn bản. Trong
khi đó, các phương pháp học sâu cho ra kết quả tốt hơn hẳn khi tập dữ liệu đủ lớn. Bên
cạnh đó, các phương pháp học sâu tự trích chọn đặc trưng trong quá trình học (học biểu
diễn đặc trưng) trước khi tham gia vào quá trình phân lớp. Tuy nhiên, các thực nghiệm
chỉ ra rằng, trong trường hợp dữ liệu không đủ lớn thì phương pháp học truyền thống
cho ra kết quả tốt hơn.
Tóm lại, phương pháp dựa vào luật có nhược điểm ít linh hoạt nghĩa là nếu mẫu
câu đầu vào không tồn tại trong cơ sở tri thức thì hệ thống sẽ không đưa ra kết quả. Tuy
nhiên ưu điểm của phương pháp này cho ra kết quả khá chính xác khi mẫu câu thông
điệp đầu vào khớp với mẫu câu trong cơ sở tri thức. Ưu điểm của các phương pháp học
Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn
54
máy là khả năng hiểu ngữ nghĩa thông điệp người sử dụng đưa vào, có khả năng học từ
dữ liệu mới. Tuy nhiên các phương pháp học máy đòi hỏi dữ liệu huấn luyện phải đủ
lớn, cần thời gian huấn luyện. Trong trường hợp tập huấn luyện không đầy đủ, hệ thống
có thể cho ra kết quả sai.
4. KẾT LUẬN
Bài báo trình bày một số cách tiếp cận được sử dụng cho bài toán xác định chủ
đề của thông điệp người dùng dưới dạng câu văn bản. Trong bài báo này, chúng tôi
cũng đã đưa ra so sánh, đánh giá ưu và nhược điểm của mỗi phương pháp. Tùy theo dữ
liệu đầu vào, yêu cầu trợ lý ảo được thiết kế kiểu gì mà chúng ta chọn phương pháp cho
phù hợp.
Bài toán xác định chủ đề của một câu văn bản được áp dụng trong trong nhiều
lĩnh vực xử lý ngôn ngữ tự nhiên nói chung và trợ lý ảo nói riêng. Các trợ lý ảo thông
thường hướng đến việc xác định chủ đề người dùng trên một lĩnh vực cụ thể chẳng hạn
như thương mại điện tử, y tế, giáo dục, Việc xây dựng trợ lý ảo linh hoạt, có thể hiểu
được hầu hết các thông điệp người dùng dưới dạng câu văn bản thậm chí câu văn bản
không đầy đủ (ngôn nghữ chat) để đưa ra chủ đề hay ý định người dùng muốn nói gì
(đặc biệt là câu văn bản có nhiều chủ đề trong đó) là một bài toán vẫn đang còn nhiều
thách thức. Dựa vào các phân tích đánh giá một số cách tiếp cận đã trình bày ở đây,
chúng tôi hướng đến xây dựng hệ trợ lý ảo tư vấn thông tin đào tạo Đại học cho các sinh
viên trong trường vào thời gian đến.
TÀI LIỆU THAM KHẢO
[1]. Laranjo L, Dunn AG, Tong HL, et al (2018). Conversational agents in healthcare: a systematic
review, J Am Med Inform Assoc., Vol 25, pp. 1248–1258
[2]. Kim J, Park SY, Lionel P R (2013). Conversational Agents for Health and Wellbeing: Review
and Future Agendas, Proc. Identifying Challenges and Opportunities in Human–AI Collaboration
in Healthcare. Austin, Texas USA
[3]. Schaﬀer S, Gustke O, Oldemeier J, Reithinger N (2018). Towards Chatbots in the museum,
Proc. CEUR Workshop., pp. 1–7
[4]. Varitimiadis S, Kotis K, Tzortzakakis A, et al (2020). Towards implementing an AI chatbot
platform for museums, Pro. 2nd International Conference on Cultural Informatics,
Communication & Media Studies., Vol 1, p. 1-15
[5]. [Quoc Nguyen D, Quoc Nguyen D, Bao Pham S (2012). A Vietnamese Text-Based
Conversational Agent, (eds) Advanced Research in Applied Artificial Intelligence. Springer,
Berlin, Heidelberg. pp 699–708
[6]. Hien H, Pham-Nguyen C, Nam L, et al (2018). Intelligent Assistants in Higher-Education
Environments: The FIT-EBot, a Chatbot for Administrative and Learning Support, Proc. of
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021)
55
the Ninth International Symposium on Information and Communication Technology. Danang City,
Vietnam, pp. 69–76
[7]. Boundris D, Atwell E (2005). "Using FAQs and Chatbots for e-learning at the University of
Leeds", Master Thesis, Information Systems, University of Leeds, West Yorkshire, England
[8]. Anusha Vegesna, Pranjal Jain, Dhruv Porwal (2018). Ontology based Chatbot (For E-
commerce Website)., Int J Comput Appl., Vol. 179, pp. 51–55
[9]. Chai J, Horvath V, Nicolov N, et al (2001). Natural Language Sales Assistant -- A Web-Based
Dialog System for Online Sales, Proc. the Thirteenth Innovative Applications of Artificial
Intelligence Conference, Seattle, Washington, USA, pp. 19–26
[10]. Weizenbaum J (1966). ELIZA—a computer program for the study of natural language
communication between man and machine, Comun ACM., Vol 9, pp. 36–45.
[11]. Bruno Marietto M das G, Aguiar RV, Barbosa G de O, et al (2013). Artificial Intelligence
Markup Language: A Brief Tutorial, Int J Comput Sci Eng Surv., Vol 4, pp. 1–20
[12]. Shah H (2006). A.L.I.C.E.: an ACE in Digitaland, tripleC., Vol 4, pp. 284–292
[13]. O’Shea K, Bandar Z, Crockett K (2010). A Conversational Agent Framework using Semantic
Analysis, Int J Intell Comput Res., Vol 1, pp. 10–19
[14]. Graesser A, Lu S, Jackson G, et al (2004). AutoTutor: a Tutor with Dialogue in Natural
Language, Behav Res Methods,. Vol 36, pp. 180–192.
[15]. Traum D (2008). Talking to Virtual Humans: Dialogue Models and Methodologies for
Embodied Conversational Agents, Proc. Modeling Communication with Robots and Virtual
Humans. Lecture Notes in Computer Science. Springer, Berlin, Heidelberg, pp. 296–309
[16]. [McGill M, Sammut C, Westendorp J, Kadous M. FrameScript: A Multi-modal Scripting
Language, Sch Comput Sci Eng UNSW Copyr © 2003-2008
[17]. McCallum A, Nigam K (1998). A Comparison of Event Models for Naive Bayes Text
Classiﬁcation, Proc. AAAI Workshop., pp. 41–48
[18]. Mendoza M, Zamora J (2009). Identifying the Intent of a User Query Using Support Vector
Machines, Proc. Karlgren J, Tarhio J, Hyyrö H (eds) String Processing and Information Retrieval.
Springer, Berlin, Heidelberg, pp. 131–142
[19]. Genkin A, Lewis D, Madigan D (2007). Large-Scale Bayesian Logistic Regression for Text
Categorization, Technometrics,. Vol. 49, pp. 291–304
[20]. [Ngo L (2016). Identifying User Intents in Vietnamese Spoken Language Commands and Its
Application in Smart Mobile Voice Interaction, Intelligent Information and Database Systems.
ACIIDS 2016. Lecture Notes in Computer Science, Springer, Berlin, Heidelberg.
[21]. Hashemi HB, Asiaee A, Kraft R (2016). Query Intent Detection using Convolutional Neural
Networks. Proc. International Conference on Web Search and Data Mining, Workshop on Query
Understanding. ACM.
[22]. Ravuri S, Stolcke A (2015). Recurrent Neural Network and LSTM Models for Lexical
Utterance Classiﬁcation, Proc. Interspeech. International Speech Communication Association,
Dresden., pp 135–139
Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn
56
[23]. Tran OT, Luong TC (2020). Understanding what the users say in chatbots: A case study for
the Vietnamese languag, Eng Appl Artif Intell,. Vol. 87, pp. 1–10
[24]. [Vedula N, Lipka N, Maneriker P, Parthasarathy S (2019) Towards Open Intent Discovery
for Conversational Text. ArXiv190408524 Cs
[25]. https://www.pandorabots.com/mitsuku/
[26]. [https://www.devdungeon.com/content/ai-chat-bot-python-aiml#enter-python
A REVIEW OF METHODS FOR DETECTING INTENT OF A TEXT MESSAGE
IN CHATBOTS
Doan Thi Hong Phuoc, Nguyen Van Trung, Le Van Tuong Lan
Faculty of Information Technology, University of Sciences, Hue University
Email: [email protected]; [email protected]; [email protected]
ABSTRACT
Chatbots, are known as virtual assistants, have been investigated and developed in
recent decades because of their benefits in the interaction between human and
machine. Nowadays, these virtual assistants have been applied in many fields such
as e-commerce, health care, tourism or education. One of the first and most
important phases that affects to the outcome’s quality of these systems is how to
understand the intent of user’s text message. Therefore, in this paper, we studied
methods for detecting intent of a given text message and proposed an evaluation of
the effect between these methods.
Keywords: chatbot, intent detection, , text message.
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 18, Số 1 (2021)
57
Đoàn Thị Hồng Phước sinh ngày 12/07/1977 tại Thừa Thiên Huế. Năm
1999, bà tốt nghiệp cử nhân chuyên ngành Tin học tại trường Đại học
Khoa học, Đại học Huế. Năm 2004, bà nhận bằng thạc sĩ chuyên ngành
Công nghệ thông tin tại trường Đại học Khoa học, Đại học Huế. Năm
2019, bà nhận học vị tiến sĩ chuyên ngành Khoa học máy tính tại Đại học
KhonKaen, Thái Lan. Hiện nay, bà là giảng viên của khoa Công nghệ
thông tin, trường Đại học Khoa học, Đại học Huế.
Lĩnh vực nghiên cứu: Học máy, Xử lý ngôn ngữ tự nhiên và Khai phá dữ
liệu văn bản.
Nguyễn Văn Trung sinh ngày 25/10/1981 tại Thừa Thiên Huế. Năm 2003
ông tốt nghiệp cử nhân chuyên ngành Tin học tại trường Đại học Khoa
học, Đại học Huế. Năm 2006 ông nhận bằng thạc sĩ chuyên ngành Công
nghệ Thông tin tại trường Đại học Khoa học, Đại học Huế. Năm 2018 ông
nhận học vị Tiến sĩ chuyên ngành Khoa học Máy tính tại trường Đại học
Khoa học, Đại học Huế. Hiện nay ông công tác tại Khoa Công nghệ
Thông tin, trường Đại học Khoa học, Đại học Huế.
Lĩnh vực nghiên cứu: Các hệ thống thông tin, Quản lý và biểu diễn tri thức,
Web ngữ nghĩa, Linked Data, Công nghệ phần mềm.
Lê Văn Tường Lân sinh ngày 10/11/1974 tại Thừa Thiên Huế. Năm 1996,
ông tốt nghiệp Đại học ngành Toán - Tin tại Trường Đại học Khoa học,
Đại học Huế. Ông nhận bằng thạc sỹ Công nghệ thông tin tại Trường Đại
học Bách Khoa Hà Nội năm 2002 và nhận học vị Tiến sĩ ngành Khoa học
máy tính tại Trường Đại học Khoa học, Đại học Huế năm 2018. Hiện ông
công tác tại Trường Đại học Khoa học, Đại học Huế.
Lĩnh vực nghiên cứu: Lập trình ứng dụng, Cơ sở dữ liệu, Công nghệ phần
mềm, Khai phá dữ liệu.
Một số phương pháp xác định chủ đề của câu văn bản trong hệ tư vấn
58

File đính kèm:

mot_so_phuong_phap_xac_dinh_chu_de_cua_cau_van_ban_trong_he.pdf