Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο

Η παρούσα διπλωματική εργασία πραγματεύεται το θέμα της αυτόματης εξαγωγής περίληψης από κείμενο ελληνικής γλώσσας. Η ανάκτηση πληροφορίας είναι ένας τομέας της επεξεργασίας φυσικής γλώσσας η οποία αποτελεί υποτομέα της Τεχνητής Νοημοσύνης. Σκοπός της είναι η ανάκτηση σημαντικών πληροφοριών από μεγά...

Full description

Bibliographic Details
Main Author: Κυριάκου, Ερωτόκριτος
Other Authors: Φακωτάκης, Νίκος
Language:gr
Published: 2009
Subjects:
Online Access:http://nemertes.lis.upatras.gr/jspui/handle/10889/2097
id ndltd-upatras.gr-oai-nemertes-10889-2097
record_format oai_dc
spelling ndltd-upatras.gr-oai-nemertes-10889-20972015-10-30T05:02:42Z Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο Κυριάκου, Ερωτόκριτος Φακωτάκης, Νίκος Kyriakou, Erotokritos Σγάρμπας, Κυριάκος Φακωτάκης, Νίκος Περίληψη Σύνοψη Απόσπασμα 025.402 85 Summarization Abstraction Extraction Η παρούσα διπλωματική εργασία πραγματεύεται το θέμα της αυτόματης εξαγωγής περίληψης από κείμενο ελληνικής γλώσσας. Η ανάκτηση πληροφορίας είναι ένας τομέας της επεξεργασίας φυσικής γλώσσας η οποία αποτελεί υποτομέα της Τεχνητής Νοημοσύνης. Σκοπός της είναι η ανάκτηση σημαντικών πληροφοριών από μεγάλες συλλογές δεδομένων. Ο συγκεκριμένος τομέας που συγκεντρώνεται στην εξαγωγή συνοπτικών περιλήψεων από κείμενα καλείται Αυτόματη Εξαγωγή Περίληψης Κειμένου. Το πρόγραμμα αφαιρεί τις πλεονάζουσες πληροφορίες από το κείμενο εισόδου και παράγει ένα μικρότερο, απαλλαγμένο από πλεονασμούς, κείμενο εξόδου. Το κείμενο αυτό είναι ένα extract από το αρχικό κείμενο. Με αυτό εννοούμε ότι καμία από τις νέες προτάσεις δεν παράγεται από την αρχή, αντ' αυτού, αρχικές μη τροποποιημένες προτάσεις χρησιμοποιούνται για να σχηματιστεί η περίληψη. Οι πιο σημαντικές προτάσεις επιλέγονται με την εφαρμογή κριτήριων που έχουν ειδικά σχεδιαστεί για να βαθμολογήσουν τη κάθε πρόταση. Το αποτέλεσμα συγκρίνεται με «ανθρώπινα» κατασκευασμένες περιλήψεις και με κάποια γνωστά προγράμματα αυτόματης σύνοψης κειμένου. This diploma dissertation is about automatic text summarization for the Greek language. Information retrieval is a field of natural language processing which is a subfield of Artificial Intelligence. Its purpose is to retrieve important information out of large collections of data. The specific domain that concentrates on text-data and the extraction of short summaries is called automatic text summarization. A computer program that summarizes a text. The summarizer removes redundant information from the input text and produces a shorter non-redundant output text. The output text is an extract from the original text. With extract, we mean that no sentence is produced from scratch, but instead original sentences are used to form the summary. The most important sentences are chosen by application of some criteria that are specially designed to rank each sentence. The results are compared to human made summaries and to some well-known summarization programs. 2009-10-20T08:01:10Z 2009-10-20T08:01:10Z 2009-07-22 2009-10-20T08:01:10Z Thesis http://nemertes.lis.upatras.gr/jspui/handle/10889/2097 gr 0
collection NDLTD
language gr
sources NDLTD
topic Περίληψη
Σύνοψη
Απόσπασμα
025.402 85
Summarization
Abstraction
Extraction
spellingShingle Περίληψη
Σύνοψη
Απόσπασμα
025.402 85
Summarization
Abstraction
Extraction
Κυριάκου, Ερωτόκριτος
Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
description Η παρούσα διπλωματική εργασία πραγματεύεται το θέμα της αυτόματης εξαγωγής περίληψης από κείμενο ελληνικής γλώσσας. Η ανάκτηση πληροφορίας είναι ένας τομέας της επεξεργασίας φυσικής γλώσσας η οποία αποτελεί υποτομέα της Τεχνητής Νοημοσύνης. Σκοπός της είναι η ανάκτηση σημαντικών πληροφοριών από μεγάλες συλλογές δεδομένων. Ο συγκεκριμένος τομέας που συγκεντρώνεται στην εξαγωγή συνοπτικών περιλήψεων από κείμενα καλείται Αυτόματη Εξαγωγή Περίληψης Κειμένου. Το πρόγραμμα αφαιρεί τις πλεονάζουσες πληροφορίες από το κείμενο εισόδου και παράγει ένα μικρότερο, απαλλαγμένο από πλεονασμούς, κείμενο εξόδου. Το κείμενο αυτό είναι ένα extract από το αρχικό κείμενο. Με αυτό εννοούμε ότι καμία από τις νέες προτάσεις δεν παράγεται από την αρχή, αντ' αυτού, αρχικές μη τροποποιημένες προτάσεις χρησιμοποιούνται για να σχηματιστεί η περίληψη. Οι πιο σημαντικές προτάσεις επιλέγονται με την εφαρμογή κριτήριων που έχουν ειδικά σχεδιαστεί για να βαθμολογήσουν τη κάθε πρόταση. Το αποτέλεσμα συγκρίνεται με «ανθρώπινα» κατασκευασμένες περιλήψεις και με κάποια γνωστά προγράμματα αυτόματης σύνοψης κειμένου. === This diploma dissertation is about automatic text summarization for the Greek language. Information retrieval is a field of natural language processing which is a subfield of Artificial Intelligence. Its purpose is to retrieve important information out of large collections of data. The specific domain that concentrates on text-data and the extraction of short summaries is called automatic text summarization. A computer program that summarizes a text. The summarizer removes redundant information from the input text and produces a shorter non-redundant output text. The output text is an extract from the original text. With extract, we mean that no sentence is produced from scratch, but instead original sentences are used to form the summary. The most important sentences are chosen by application of some criteria that are specially designed to rank each sentence. The results are compared to human made summaries and to some well-known summarization programs.
author2 Φακωτάκης, Νίκος
author_facet Φακωτάκης, Νίκος
Κυριάκου, Ερωτόκριτος
author Κυριάκου, Ερωτόκριτος
author_sort Κυριάκου, Ερωτόκριτος
title Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
title_short Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
title_full Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
title_fullStr Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
title_full_unstemmed Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
title_sort αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
publishDate 2009
url http://nemertes.lis.upatras.gr/jspui/handle/10889/2097
work_keys_str_mv AT kyriakouerōtokritos automatēexagōgēperilēpsēsapoellēnikokeimeno
_version_ 1718117524822818816