Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk
Att manuellt välja en eller flera meningar ur en filmrecension att använda som citat kan vara en tidskrävande uppgift. Denna rapport utvärderar övervakade maskininlärningsmodeller för att skapa en prototyp som automatiskt kan välja lämpliga citat ur recensioner. Utifrån resultatet av en litteraturst...
Main Authors: | , |
---|---|
Format: | Others |
Language: | Swedish |
Published: |
KTH, Hälsoinformatik och logistik
2021
|
Subjects: | |
Online Access: | http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-296565 |
id |
ndltd-UPSALLA1-oai-DiVA.org-kth-296565 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UPSALLA1-oai-DiVA.org-kth-2965652021-06-10T05:24:35ZMaskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverksweMachine learning for automatic extraction of quotes from reviews : Using BERT, Inter-Sentence Transformer, and artificial neural networksHällgren, ClaraKristiansson, AlexanderKTH, Hälsoinformatik och logistikKTH, Hälsoinformatik och logistik2021Machine LearningBERTATSAutomatic Text SummaryExtractive SummaryInter-Sentence TransformerArtificial Neural Network.MaskininlärningBERTATSautomatisk textsummeringextraktiv summeringInter-Sentence Transformerartificiella neuronnät.Computer EngineeringDatorteknikAtt manuellt välja en eller flera meningar ur en filmrecension att använda som citat kan vara en tidskrävande uppgift. Denna rapport utvärderar övervakade maskininlärningsmodeller för att skapa en prototyp som automatiskt kan välja lämpliga citat ur recensioner. Utifrån resultatet av en litteraturstudie valdes två modeller att implementera och utvärdera på data bestående av filmrecensioner och tillhörande manuellt valda citat. Av arbetets två implementerade modeller, BERT med Inter-Sentence Transformer och BERT med ett artificiellt neuronnät, visade den sistnämnda marginellt bättre resultat. Modellerna utvärderades med ROUGE och jämfördes med tidigare studiers toppresultat inom automatisk textsummering. Slutsatsen är att de modeller som utvärderades inte presterar tillräckligt väl inom problemområdet för att motivera en driftsättning utan ytterligare utvecklingsarbete. Dock visar resultaten att det finns potential i att de utvärderade tillvägagångssätten delvis kan ersätta manuella val av citat i framtiden. To choose a number of sentences from a movie review to use as a quote can be time consuming if done manually. This thesis evaluates supervised machine learning models to create a prototype that automatically can choose such quotes. The thesis chose, based on a literature study, two models to implement and evaluate on data consisting of movie reviews and their respective corresponding manually chosen quotes. Out of the thesis two implemented models, BERT with Inter-Sentence Transformer and BERT with an artificial neural network, the latter showed marginally better results. The models were evaluated with ROUGE and was compared with state-of-the-art models regarding automatic text summarization. The conclusion is that the models that were evaluated do not perform well enough for the problem to motivate full deployment without further development efforts. However, the results show that there is potential that the evaluated methods can partially replace manual labour when choosing quotes. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-296565TRITA-CBH-GRU ; 2021:040application/pdfinfo:eu-repo/semantics/openAccess |
collection |
NDLTD |
language |
Swedish |
format |
Others
|
sources |
NDLTD |
topic |
Machine Learning BERT ATS Automatic Text Summary Extractive Summary Inter-Sentence Transformer Artificial Neural Network. Maskininlärning BERT ATS automatisk textsummering extraktiv summering Inter-Sentence Transformer artificiella neuronnät. Computer Engineering Datorteknik |
spellingShingle |
Machine Learning BERT ATS Automatic Text Summary Extractive Summary Inter-Sentence Transformer Artificial Neural Network. Maskininlärning BERT ATS automatisk textsummering extraktiv summering Inter-Sentence Transformer artificiella neuronnät. Computer Engineering Datorteknik Hällgren, Clara Kristiansson, Alexander Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk |
description |
Att manuellt välja en eller flera meningar ur en filmrecension att använda som citat kan vara en tidskrävande uppgift. Denna rapport utvärderar övervakade maskininlärningsmodeller för att skapa en prototyp som automatiskt kan välja lämpliga citat ur recensioner. Utifrån resultatet av en litteraturstudie valdes två modeller att implementera och utvärdera på data bestående av filmrecensioner och tillhörande manuellt valda citat. Av arbetets två implementerade modeller, BERT med Inter-Sentence Transformer och BERT med ett artificiellt neuronnät, visade den sistnämnda marginellt bättre resultat. Modellerna utvärderades med ROUGE och jämfördes med tidigare studiers toppresultat inom automatisk textsummering. Slutsatsen är att de modeller som utvärderades inte presterar tillräckligt väl inom problemområdet för att motivera en driftsättning utan ytterligare utvecklingsarbete. Dock visar resultaten att det finns potential i att de utvärderade tillvägagångssätten delvis kan ersätta manuella val av citat i framtiden. === To choose a number of sentences from a movie review to use as a quote can be time consuming if done manually. This thesis evaluates supervised machine learning models to create a prototype that automatically can choose such quotes. The thesis chose, based on a literature study, two models to implement and evaluate on data consisting of movie reviews and their respective corresponding manually chosen quotes. Out of the thesis two implemented models, BERT with Inter-Sentence Transformer and BERT with an artificial neural network, the latter showed marginally better results. The models were evaluated with ROUGE and was compared with state-of-the-art models regarding automatic text summarization. The conclusion is that the models that were evaluated do not perform well enough for the problem to motivate full deployment without further development efforts. However, the results show that there is potential that the evaluated methods can partially replace manual labour when choosing quotes. |
author |
Hällgren, Clara Kristiansson, Alexander |
author_facet |
Hällgren, Clara Kristiansson, Alexander |
author_sort |
Hällgren, Clara |
title |
Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk |
title_short |
Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk |
title_full |
Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk |
title_fullStr |
Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk |
title_full_unstemmed |
Maskininlärning för automatisk extrahering av citat från recensioner : Med användning av BERT, Inter-Sentence Transformer och artificiella neuronnätverk |
title_sort |
maskininlärning för automatisk extrahering av citat från recensioner : med användning av bert, inter-sentence transformer och artificiella neuronnätverk |
publisher |
KTH, Hälsoinformatik och logistik |
publishDate |
2021 |
url |
http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-296565 |
work_keys_str_mv |
AT hallgrenclara maskininlarningforautomatiskextraheringavcitatfranrecensionermedanvandningavbertintersentencetransformerochartificiellaneuronnatverk AT kristianssonalexander maskininlarningforautomatiskextraheringavcitatfranrecensionermedanvandningavbertintersentencetransformerochartificiellaneuronnatverk AT hallgrenclara machinelearningforautomaticextractionofquotesfromreviewsusingbertintersentencetransformerandartificialneuralnetworks AT kristianssonalexander machinelearningforautomaticextractionofquotesfromreviewsusingbertintersentencetransformerandartificialneuralnetworks |
_version_ |
1719409649527029760 |