Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk

Att manuellt välja en eller flera meningar ur en filmrecension att använda som citat kan vara en tidskrävande uppgift. Denna rapport utvärderar övervakade maskininlärningsmodeller för att skapa en prototyp som automatiskt kan välja lämpliga citat ur recensioner. Utifrån resultatet av en litteraturst...

Full description

Bibliographic Details
Main Authors: Hällgren, Clara, Kristiansson, Alexander
Format: Others
Language:Swedish
Published: KTH, Hälsoinformatik och logistik 2021
Subjects:
ATS
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-296565
id ndltd-UPSALLA1-oai-DiVA.org-kth-296565
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-2965652021-06-10T05:24:35ZMaskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverksweMachine learning for automatic extraction of quotes from reviews : Using BERT, Inter-Sentence Transformer, and artificial neural networksHällgren, ClaraKristiansson, AlexanderKTH, Hälsoinformatik och logistikKTH, Hälsoinformatik och logistik2021Machine LearningBERTATSAutomatic Text SummaryExtractive SummaryInter-Sentence TransformerArtificial Neural Network.MaskininlärningBERTATSautomatisk textsummeringextraktiv summeringInter-Sentence Transformerartificiella neuronnät.Computer EngineeringDatorteknikAtt manuellt välja en eller flera meningar ur en filmrecension att använda som citat kan vara en tidskrävande uppgift. Denna rapport utvärderar övervakade maskininlärningsmodeller för att skapa en prototyp som automatiskt kan välja lämpliga citat ur recensioner. Utifrån resultatet av en litteraturstudie valdes två modeller att implementera och utvärdera på data bestående av filmrecensioner och tillhörande manuellt valda citat. Av arbetets två implementerade modeller, BERT med Inter-Sentence Transformer och BERT med ett artificiellt neuronnät, visade den sistnämnda marginellt bättre resultat. Modellerna utvärderades med ROUGE och jämfördes med tidigare studiers toppresultat inom automatisk textsummering. Slutsatsen är att de modeller som utvärderades inte presterar tillräckligt väl inom problemområdet för att motivera en driftsättning utan ytterligare utvecklingsarbete. Dock visar resultaten att det finns potential i att de utvärderade tillvägagångssätten delvis kan ersätta manuella val av citat i framtiden.   To choose a number of sentences from a movie review to use as a quote can be time consuming if done manually. This thesis evaluates supervised machine learning models to create a prototype that automatically can choose such quotes. The thesis chose, based on a literature study, two models to implement and evaluate on data consisting of movie reviews and their respective corresponding manually chosen quotes. Out of the thesis two implemented models, BERT with Inter-Sentence Transformer and BERT with an artificial neural network, the latter showed marginally better results. The models were evaluated with ROUGE and was compared with state-of-the-art models regarding automatic text summarization. The conclusion is that the models that were evaluated do not perform well enough for the problem to motivate full deployment without further development efforts. However, the results show that there is potential that the evaluated methods can partially replace manual labour when choosing quotes.              Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-296565TRITA-CBH-GRU ; 2021:040application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language Swedish
format Others
sources NDLTD
topic Machine Learning
BERT
ATS
Automatic Text Summary
Extractive Summary
Inter-Sentence Transformer
Artificial Neural Network.
Maskininlärning
BERT
ATS
automatisk textsummering
extraktiv summering
Inter-Sentence Transformer
artificiella neuronnät.
Computer Engineering
Datorteknik
spellingShingle Machine Learning
BERT
ATS
Automatic Text Summary
Extractive Summary
Inter-Sentence Transformer
Artificial Neural Network.
Maskininlärning
BERT
ATS
automatisk textsummering
extraktiv summering
Inter-Sentence Transformer
artificiella neuronnät.
Computer Engineering
Datorteknik
Hällgren, Clara
Kristiansson, Alexander
Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk
description Att manuellt välja en eller flera meningar ur en filmrecension att använda som citat kan vara en tidskrävande uppgift. Denna rapport utvärderar övervakade maskininlärningsmodeller för att skapa en prototyp som automatiskt kan välja lämpliga citat ur recensioner. Utifrån resultatet av en litteraturstudie valdes två modeller att implementera och utvärdera på data bestående av filmrecensioner och tillhörande manuellt valda citat. Av arbetets två implementerade modeller, BERT med Inter-Sentence Transformer och BERT med ett artificiellt neuronnät, visade den sistnämnda marginellt bättre resultat. Modellerna utvärderades med ROUGE och jämfördes med tidigare studiers toppresultat inom automatisk textsummering. Slutsatsen är att de modeller som utvärderades inte presterar tillräckligt väl inom problemområdet för att motivera en driftsättning utan ytterligare utvecklingsarbete. Dock visar resultaten att det finns potential i att de utvärderade tillvägagångssätten delvis kan ersätta manuella val av citat i framtiden.   === To choose a number of sentences from a movie review to use as a quote can be time consuming if done manually. This thesis evaluates supervised machine learning models to create a prototype that automatically can choose such quotes. The thesis chose, based on a literature study, two models to implement and evaluate on data consisting of movie reviews and their respective corresponding manually chosen quotes. Out of the thesis two implemented models, BERT with Inter-Sentence Transformer and BERT with an artificial neural network, the latter showed marginally better results. The models were evaluated with ROUGE and was compared with state-of-the-art models regarding automatic text summarization. The conclusion is that the models that were evaluated do not perform well enough for the problem to motivate full deployment without further development efforts. However, the results show that there is potential that the evaluated methods can partially replace manual labour when choosing quotes.             
author Hällgren, Clara
Kristiansson, Alexander
author_facet Hällgren, Clara
Kristiansson, Alexander
author_sort Hällgren, Clara
title Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk
title_short Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk
title_full Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk
title_fullStr Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk
title_full_unstemmed Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk
title_sort maskininlärning för automatisk extrahering av citat från recensioner : med användning av bert, inter-sentence transformer och artificiella neuronnätverk
publisher KTH, Hälsoinformatik och logistik
publishDate 2021
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-296565
work_keys_str_mv AT hallgrenclara maskininlarningforautomatiskextraheringavcitatfranrecensionermedanvandningavbertintersentencetransformerochartificiellaneuronnatverk
AT kristianssonalexander maskininlarningforautomatiskextraheringavcitatfranrecensionermedanvandningavbertintersentencetransformerochartificiellaneuronnatverk
AT hallgrenclara machinelearningforautomaticextractionofquotesfromreviewsusingbertintersentencetransformerandartificialneuralnetworks
AT kristianssonalexander machinelearningforautomaticextractionofquotesfromreviewsusingbertintersentencetransformerandartificialneuralnetworks
_version_ 1719409649527029760