Recuperação de informação com auxílio de extratos automáticos.

Made available in DSpace on 2016-06-02T19:05:17Z (GMT). No. of bitstreams: 1 DissWSBJ.pdf: 1130582 bytes, checksum: cddbd8f8a11a6e29a95cea9e62612f2b (MD5) Previous issue date: 2006-05-08 === Financiadora de Estudos e Projetos === This dissertation investigates the use of Automatic Summarization (A...

Full description

Bibliographic Details
Main Author:	Batista Junior, Wilson dos Santos
Other Authors:	Rino, Lúcia Helena Machado
Format:	Others
Language:	Portuguese
Published:	Universidade Federal de São Carlos 2016
Subjects:	Inteligência artificial Processamento da linguagem natural Sumarização automática Sistemas de recuperação da informação CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Online Access:	https://repositorio.ufscar.br/handle/ufscar/314

id	ndltd-IBICT-oai-repositorio.ufscar.br-ufscar-314
record_format	oai_dc
collection	NDLTD
language	Portuguese
format	Others
sources	NDLTD
topic	Inteligência artificial Processamento da linguagem natural Sumarização automática Sistemas de recuperação da informação CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
spellingShingle	Inteligência artificial Processamento da linguagem natural Sumarização automática Sistemas de recuperação da informação CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Batista Junior, Wilson dos Santos Recuperação de informação com auxílio de extratos automáticos.
description	Made available in DSpace on 2016-06-02T19:05:17Z (GMT). No. of bitstreams: 1 DissWSBJ.pdf: 1130582 bytes, checksum: cddbd8f8a11a6e29a95cea9e62612f2b (MD5) Previous issue date: 2006-05-08 === Financiadora de Estudos e Projetos === This dissertation investigates the use of Automatic Summarization (AS) techniques on Information Retrieval (IR), two areas that have attracted growing attention due to the continuous growth of information repositories in digital format. The main goal of this work is to verify the contribution of extracts generated automatically in two stages of the IR: indexing and Pseudo Relevance Feedback (PRF). In general, the main goal of both phases is to find the most descriptive terms of a given document. This goal in turn is strongly related to that of the AS techniques to summarize the main parts of a document which justifies the study. In order to verify the effectiveness of the AS techniques, we have developed five systems that use extracts generated by a summarizing system that was considered useful in the task of indicating the content of documents to human readers. These systems were assessed through a set of documents written in Portuguese to test IR. In general, the results show that the generated extracts were not useful for indexing, presenting worse performance compared to when using a full document for IR. In the PRF case, however, the results obtained using specific extracts were better than those obtained by a system that does not embed PRF. The best results were obtained when using query-biased multi-documents extracts, indicating that this type of extract may be useful for PRF. === Este trabalho de mestrado investiga a aplicação de técnicas de Sumarização Automática (SA) na Recuperação de Informação (RI), duas áreas que, devido ao crescente número de repositórios de informação digital disponíveis, têm se mostrado muito importantes para a captura de informações. O intuito do trabalho é verificar a contribuição de extratos gerados automaticamente em duas etapas da RI: a indexação e a realimentação de pseudo-relevantes. O principal objetivo dessas duas etapas é encontrar os termos mais descritivos de um documento. Esse objetivo é relacionado fortemente com o objetivo principal da SA que é condensar as principais partes do documento, o que justifica o emprego. Para verificar a efetividade das técnicas de SA, foram construídos cinco sistemas que utilizam extratos gerados por um sistema de sumarização que foi considerado útil na tarefa de indicar aos leitores humanos o conteúdo de documentos. Esses sistemas foram avaliados com uma coleção de documentos para testes em RI, escritos em português. Em geral, os resultados apontam que os extratos gerados não foram úteis para a indexação, apresentando desempenho inferior à recuperação que usou o conteúdo completo dos documentos na indexação. No caso da realimentação de pseudo-relevantes, os resultados dos sistemas que utilizam extratos específicos foram superiores aos de um sistema sem esta realimentação em muitos casos. Os melhores resultados foram obtidos pelos extratos específicos multi-documentos, mostrando que esse tipo de extrato pode ser útil para a realimentação de pseudo-relevantes.
author2	Rino, Lúcia Helena Machado
author_facet	Rino, Lúcia Helena Machado Batista Junior, Wilson dos Santos
author	Batista Junior, Wilson dos Santos
author_sort	Batista Junior, Wilson dos Santos
title	Recuperação de informação com auxílio de extratos automáticos.
title_short	Recuperação de informação com auxílio de extratos automáticos.
title_full	Recuperação de informação com auxílio de extratos automáticos.
title_fullStr	Recuperação de informação com auxílio de extratos automáticos.
title_full_unstemmed	Recuperação de informação com auxílio de extratos automáticos.
title_sort	recuperação de informação com auxílio de extratos automáticos.
publisher	Universidade Federal de São Carlos
publishDate	2016
url	https://repositorio.ufscar.br/handle/ufscar/314
work_keys_str_mv	AT batistajuniorwilsondossantos recuperacaodeinformacaocomauxiliodeextratosautomaticos
_version_	1718648361125412864
spelling	ndltd-IBICT-oai-repositorio.ufscar.br-ufscar-3142018-05-23T20:01:00Z Recuperação de informação com auxílio de extratos automáticos. Batista Junior, Wilson dos Santos Rino, Lúcia Helena Machado Inteligência artificial Processamento da linguagem natural Sumarização automática Sistemas de recuperação da informação CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Made available in DSpace on 2016-06-02T19:05:17Z (GMT). No. of bitstreams: 1 DissWSBJ.pdf: 1130582 bytes, checksum: cddbd8f8a11a6e29a95cea9e62612f2b (MD5) Previous issue date: 2006-05-08 Financiadora de Estudos e Projetos This dissertation investigates the use of Automatic Summarization (AS) techniques on Information Retrieval (IR), two areas that have attracted growing attention due to the continuous growth of information repositories in digital format. The main goal of this work is to verify the contribution of extracts generated automatically in two stages of the IR: indexing and Pseudo Relevance Feedback (PRF). In general, the main goal of both phases is to find the most descriptive terms of a given document. This goal in turn is strongly related to that of the AS techniques to summarize the main parts of a document which justifies the study. In order to verify the effectiveness of the AS techniques, we have developed five systems that use extracts generated by a summarizing system that was considered useful in the task of indicating the content of documents to human readers. These systems were assessed through a set of documents written in Portuguese to test IR. In general, the results show that the generated extracts were not useful for indexing, presenting worse performance compared to when using a full document for IR. In the PRF case, however, the results obtained using specific extracts were better than those obtained by a system that does not embed PRF. The best results were obtained when using query-biased multi-documents extracts, indicating that this type of extract may be useful for PRF. Este trabalho de mestrado investiga a aplicação de técnicas de Sumarização Automática (SA) na Recuperação de Informação (RI), duas áreas que, devido ao crescente número de repositórios de informação digital disponíveis, têm se mostrado muito importantes para a captura de informações. O intuito do trabalho é verificar a contribuição de extratos gerados automaticamente em duas etapas da RI: a indexação e a realimentação de pseudo-relevantes. O principal objetivo dessas duas etapas é encontrar os termos mais descritivos de um documento. Esse objetivo é relacionado fortemente com o objetivo principal da SA que é condensar as principais partes do documento, o que justifica o emprego. Para verificar a efetividade das técnicas de SA, foram construídos cinco sistemas que utilizam extratos gerados por um sistema de sumarização que foi considerado útil na tarefa de indicar aos leitores humanos o conteúdo de documentos. Esses sistemas foram avaliados com uma coleção de documentos para testes em RI, escritos em português. Em geral, os resultados apontam que os extratos gerados não foram úteis para a indexação, apresentando desempenho inferior à recuperação que usou o conteúdo completo dos documentos na indexação. No caso da realimentação de pseudo-relevantes, os resultados dos sistemas que utilizam extratos específicos foram superiores aos de um sistema sem esta realimentação em muitos casos. Os melhores resultados foram obtidos pelos extratos específicos multi-documentos, mostrando que esse tipo de extrato pode ser útil para a realimentação de pseudo-relevantes. 2016-06-02T19:05:17Z 2007-10-19 2016-06-02T19:05:17Z 2006-05-08 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis BATISTA JUNIOR, Wilson dos Santos. Recuperação de informação com auxílio de extratos automáticos.. 2006. 139 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2006. https://repositorio.ufscar.br/handle/ufscar/314 por info:eu-repo/semantics/openAccess application/pdf Universidade Federal de São Carlos Programa de Pós-graduação em Ciência da Computação UFSCar BR reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos instacron:UFSCAR

Recuperação de informação com auxílio de extratos automáticos.

Similar Items