End-to-End Trainable Chatbot for Restaurant Recommendations
Task-oriented chatbots can be used to automate a specific task, such as finding a restaurant and making a reservation. Implementing such a conversational system can be difficult, requiring domain knowledge and handcrafted rules. The focus of this thesis was to evaluate the possibility of using a neu...
Main Author: | |
---|---|
Format: | Others |
Language: | English |
Published: |
KTH, Skolan för datavetenskap och kommunikation (CSC)
2017
|
Subjects: | |
Online Access: | http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-213982 |
id |
ndltd-UPSALLA1-oai-DiVA.org-kth-213982 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UPSALLA1-oai-DiVA.org-kth-2139822018-01-14T05:11:14ZEnd-to-End Trainable Chatbot for Restaurant RecommendationsengNeuronnätsbaserad chatbot för restaurangrekommendationerStrigér, AmandaKTH, Skolan för datavetenskap och kommunikation (CSC)2017chatbotsmachine learningdeep learningsequence to sequence learningconversation systemsend-to-end trainabletask-oriented chatbotComputer SciencesDatavetenskap (datalogi)Task-oriented chatbots can be used to automate a specific task, such as finding a restaurant and making a reservation. Implementing such a conversational system can be difficult, requiring domain knowledge and handcrafted rules. The focus of this thesis was to evaluate the possibility of using a neural network-based model to create an end-to-end trainable chatbot that can automate a restaurant reservation service. For this purpose, a sequence-to-sequence model was implemented and trained on dialog data. The strengths and limitations of the system were evaluated and the prediction accuracy of the system was compared against several baselines. With our relatively simple model, we were able to achieve results comparable to the most advanced baseline model. The evaluation has shown some promising strengths of the system but also significant flaws that cannot be overlooked. The current model cannot be used as a standalone system to successfully conduct full conversations with the goal of making a restaurant reservation. The review has, however, contributed with a thorough examination of the current system, and shown where future work ought to be focused. Chatbotar kan användas för att automatisera enkla uppgifter, som att hitta en restaurang och boka ett bord. Att skapa ett sådant konversationssystem kan dock vara svårt, tidskrävande, och kräva mycket domänkunskap. I denna uppsats undersöks om det är möjligt att använda ett neuralt nätverk för att skapa en chatbot som kan lära sig att automatisera en tjänst som hjälper användaren hitta en restaurang och boka ett bord. För att undersöka detta implementerades en så kallad ``sequence-to-sequence''-modell som sedan tränades på domänspecifik dialogdata. Systemets styrkor och svagheter utvärderades och dess förmåga att generera korrekta svar jämfördes med flera andra modeller. Vår relativt enkla modell uppnådde liknande resultat som den mest avancerade av de andra modellerna. Resultaten visar modellens styrkor, men påvisar även signifikanta brister. Dessa brister gör att systemet, i sig självt, inte kan användas för att skapa en chatbot som kan hjälpa en användare att hitta en passande restaurang. Utvärderingen har dock bidragit med en grundlig undersökning av vilka fel som görs, vilket kan underlätta framtida arbete inom området. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-213982application/pdfinfo:eu-repo/semantics/openAccess |
collection |
NDLTD |
language |
English |
format |
Others
|
sources |
NDLTD |
topic |
chatbots machine learning deep learning sequence to sequence learning conversation systems end-to-end trainable task-oriented chatbot Computer Sciences Datavetenskap (datalogi) |
spellingShingle |
chatbots machine learning deep learning sequence to sequence learning conversation systems end-to-end trainable task-oriented chatbot Computer Sciences Datavetenskap (datalogi) Strigér, Amanda End-to-End Trainable Chatbot for Restaurant Recommendations |
description |
Task-oriented chatbots can be used to automate a specific task, such as finding a restaurant and making a reservation. Implementing such a conversational system can be difficult, requiring domain knowledge and handcrafted rules. The focus of this thesis was to evaluate the possibility of using a neural network-based model to create an end-to-end trainable chatbot that can automate a restaurant reservation service. For this purpose, a sequence-to-sequence model was implemented and trained on dialog data. The strengths and limitations of the system were evaluated and the prediction accuracy of the system was compared against several baselines. With our relatively simple model, we were able to achieve results comparable to the most advanced baseline model. The evaluation has shown some promising strengths of the system but also significant flaws that cannot be overlooked. The current model cannot be used as a standalone system to successfully conduct full conversations with the goal of making a restaurant reservation. The review has, however, contributed with a thorough examination of the current system, and shown where future work ought to be focused. === Chatbotar kan användas för att automatisera enkla uppgifter, som att hitta en restaurang och boka ett bord. Att skapa ett sådant konversationssystem kan dock vara svårt, tidskrävande, och kräva mycket domänkunskap. I denna uppsats undersöks om det är möjligt att använda ett neuralt nätverk för att skapa en chatbot som kan lära sig att automatisera en tjänst som hjälper användaren hitta en restaurang och boka ett bord. För att undersöka detta implementerades en så kallad ``sequence-to-sequence''-modell som sedan tränades på domänspecifik dialogdata. Systemets styrkor och svagheter utvärderades och dess förmåga att generera korrekta svar jämfördes med flera andra modeller. Vår relativt enkla modell uppnådde liknande resultat som den mest avancerade av de andra modellerna. Resultaten visar modellens styrkor, men påvisar även signifikanta brister. Dessa brister gör att systemet, i sig självt, inte kan användas för att skapa en chatbot som kan hjälpa en användare att hitta en passande restaurang. Utvärderingen har dock bidragit med en grundlig undersökning av vilka fel som görs, vilket kan underlätta framtida arbete inom området. |
author |
Strigér, Amanda |
author_facet |
Strigér, Amanda |
author_sort |
Strigér, Amanda |
title |
End-to-End Trainable Chatbot for Restaurant Recommendations |
title_short |
End-to-End Trainable Chatbot for Restaurant Recommendations |
title_full |
End-to-End Trainable Chatbot for Restaurant Recommendations |
title_fullStr |
End-to-End Trainable Chatbot for Restaurant Recommendations |
title_full_unstemmed |
End-to-End Trainable Chatbot for Restaurant Recommendations |
title_sort |
end-to-end trainable chatbot for restaurant recommendations |
publisher |
KTH, Skolan för datavetenskap och kommunikation (CSC) |
publishDate |
2017 |
url |
http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-213982 |
work_keys_str_mv |
AT strigeramanda endtoendtrainablechatbotforrestaurantrecommendations AT strigeramanda neuronnatsbaseradchatbotforrestaurangrekommendationer |
_version_ |
1718609799299465216 |