Análise de abordagens automáticas de anotação semântica para textos ruidosos e seus impactos na similaridade entre vídeos
Submitted by Geandra Rodrigues (geandrar@gmail.com) on 2018-01-29T16:52:29Z No. of bitstreams: 0 === Rejected by Adriana Oliveira (adriana.oliveira@ufjf.edu.br), reason: on 2018-01-30T14:50:12Z (GMT) === Submitted by Geandra Rodrigues (geandrar@gmail.com) on 2018-01-30T16:08:06Z No. of bitstreams:...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
Universidade Federal de Juiz de Fora (UFJF)
2018
|
Subjects: | |
Online Access: | https://repositorio.ufjf.br/jspui/handle/ufjf/6473 |
id |
ndltd-IBICT-oai-hermes.cpd.ufjf.br-ufjf-6473 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Recuperação de informação Repositório de videos Categorização de texto ruidoso Processamento de linguagem natural Information retrieval Video repository Noisy text categorization Natural language processing |
spellingShingle |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Recuperação de informação Repositório de videos Categorização de texto ruidoso Processamento de linguagem natural Information retrieval Video repository Noisy text categorization Natural language processing Dias, Laura Lima Análise de abordagens automáticas de anotação semântica para textos ruidosos e seus impactos na similaridade entre vídeos |
description |
Submitted by Geandra Rodrigues (geandrar@gmail.com) on 2018-01-29T16:52:29Z
No. of bitstreams: 0 === Rejected by Adriana Oliveira (adriana.oliveira@ufjf.edu.br), reason: on 2018-01-30T14:50:12Z (GMT) === Submitted by Geandra Rodrigues (geandrar@gmail.com) on 2018-01-30T16:08:06Z
No. of bitstreams: 0 === Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2018-03-21T19:26:08Z (GMT) No. of bitstreams: 0 === Made available in DSpace on 2018-03-21T19:26:08Z (GMT). No. of bitstreams: 0
Previous issue date: 2017-08-31 === CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior === Com o acúmulo de informações digitais armazenadas ao longo do tempo, alguns esforços precisam ser aplicados para facilitar a busca e indexação de conteúdos. Recursos como vídeos e áudios, por sua vez, são mais difíceis de serem tratados por mecanismos de busca. A anotação de vídeos é uma forma considerável de resumo do vídeo, busca e classificação. A parcela de vídeos que possui anotações atribuídas pelo próprio autor na maioria das vezes é muito pequena e pouco significativa, e anotar vídeos manualmente é bastante trabalhoso quando trata-se de bases legadas. Por esse motivo, automatizar esse processo tem sido desejado no campo da Recuperação de Informação. Em repositórios de videoaulas, onde a maior parte da informação se concentra na fala do professor, esse processo pode ser realizado através de anotações automáticas de transcritos gerados por sistemas de Reconhecimento Automático de Fala. Contudo, essa técnica produz textos ruidosos, dificultando a tarefa de anotação semântica automática. Entre muitas técnicas de Processamento de Linguagem de Natural utilizadas para anotação, não é trivial a escolha da técnica mais adequada a um determinado cenário, principalmente quando trata-se de anotar textos com ruídos. Essa pesquisa propõe analisar um conjunto de diferentes técnicas utilizadas para anotação automática e verificar o seu impacto em um mesmo cenário, o cenário de similaridade entre vídeos. === With the accumulation of digital information stored over time, some efforts need to be applied to facilitate search and indexing of content. Resources such as videos and audios, in turn, are more difficult to handle with by search engines. Video annotation is a considerable form of video summary, search and classification. The share of videos that have annotations attributed by the author most often is very small and not very significant, and annotating videos manually is very laborious when dealing with legacy bases. For this reason, automating this process has been desired in the field of Information Retrieval. In video lecture repositories, where most of the information is focused on the teacher’s speech, this process can be performed through automatic annotations of transcripts gene-rated by Automatic Speech Recognition systems. However, this technique produces noisy texts, making the task of automatic semantic annotation difficult. Among many Natural Language Processing techniques used for annotation, it is not trivial to choose the most appropriate technique for a given scenario, especially when writing annotated texts. This research proposes to analyze a set of different techniques used for automatic annotation and verify their impact in the same scenario, the scenario of similarity between videos. |
author2 |
Barrére, Eduardo |
author_facet |
Barrére, Eduardo Dias, Laura Lima |
author |
Dias, Laura Lima |
author_sort |
Dias, Laura Lima |
title |
Análise de abordagens automáticas de anotação semântica para textos ruidosos e seus impactos na similaridade entre vídeos |
title_short |
Análise de abordagens automáticas de anotação semântica para textos ruidosos e seus impactos na similaridade entre vídeos |
title_full |
Análise de abordagens automáticas de anotação semântica para textos ruidosos e seus impactos na similaridade entre vídeos |
title_fullStr |
Análise de abordagens automáticas de anotação semântica para textos ruidosos e seus impactos na similaridade entre vídeos |
title_full_unstemmed |
Análise de abordagens automáticas de anotação semântica para textos ruidosos e seus impactos na similaridade entre vídeos |
title_sort |
análise de abordagens automáticas de anotação semântica para textos ruidosos e seus impactos na similaridade entre vídeos |
publisher |
Universidade Federal de Juiz de Fora (UFJF) |
publishDate |
2018 |
url |
https://repositorio.ufjf.br/jspui/handle/ufjf/6473 |
work_keys_str_mv |
AT diaslauralima analisedeabordagensautomaticasdeanotacaosemanticaparatextosruidososeseusimpactosnasimilaridadeentrevideos |
_version_ |
1718887121767366656 |
spelling |
ndltd-IBICT-oai-hermes.cpd.ufjf.br-ufjf-64732019-01-21T21:42:59Z Análise de abordagens automáticas de anotação semântica para textos ruidosos e seus impactos na similaridade entre vídeos Dias, Laura Lima Barrére, Eduardo Souza, Jairo Francisco de Moreno, Marcelo Ferreira Santos, Celso Alberto Saibel CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Recuperação de informação Repositório de videos Categorização de texto ruidoso Processamento de linguagem natural Information retrieval Video repository Noisy text categorization Natural language processing Submitted by Geandra Rodrigues (geandrar@gmail.com) on 2018-01-29T16:52:29Z No. of bitstreams: 0 Rejected by Adriana Oliveira (adriana.oliveira@ufjf.edu.br), reason: on 2018-01-30T14:50:12Z (GMT) Submitted by Geandra Rodrigues (geandrar@gmail.com) on 2018-01-30T16:08:06Z No. of bitstreams: 0 Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2018-03-21T19:26:08Z (GMT) No. of bitstreams: 0 Made available in DSpace on 2018-03-21T19:26:08Z (GMT). No. of bitstreams: 0 Previous issue date: 2017-08-31 CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior Com o acúmulo de informações digitais armazenadas ao longo do tempo, alguns esforços precisam ser aplicados para facilitar a busca e indexação de conteúdos. Recursos como vídeos e áudios, por sua vez, são mais difíceis de serem tratados por mecanismos de busca. A anotação de vídeos é uma forma considerável de resumo do vídeo, busca e classificação. A parcela de vídeos que possui anotações atribuídas pelo próprio autor na maioria das vezes é muito pequena e pouco significativa, e anotar vídeos manualmente é bastante trabalhoso quando trata-se de bases legadas. Por esse motivo, automatizar esse processo tem sido desejado no campo da Recuperação de Informação. Em repositórios de videoaulas, onde a maior parte da informação se concentra na fala do professor, esse processo pode ser realizado através de anotações automáticas de transcritos gerados por sistemas de Reconhecimento Automático de Fala. Contudo, essa técnica produz textos ruidosos, dificultando a tarefa de anotação semântica automática. Entre muitas técnicas de Processamento de Linguagem de Natural utilizadas para anotação, não é trivial a escolha da técnica mais adequada a um determinado cenário, principalmente quando trata-se de anotar textos com ruídos. Essa pesquisa propõe analisar um conjunto de diferentes técnicas utilizadas para anotação automática e verificar o seu impacto em um mesmo cenário, o cenário de similaridade entre vídeos. With the accumulation of digital information stored over time, some efforts need to be applied to facilitate search and indexing of content. Resources such as videos and audios, in turn, are more difficult to handle with by search engines. Video annotation is a considerable form of video summary, search and classification. The share of videos that have annotations attributed by the author most often is very small and not very significant, and annotating videos manually is very laborious when dealing with legacy bases. For this reason, automating this process has been desired in the field of Information Retrieval. In video lecture repositories, where most of the information is focused on the teacher’s speech, this process can be performed through automatic annotations of transcripts gene-rated by Automatic Speech Recognition systems. However, this technique produces noisy texts, making the task of automatic semantic annotation difficult. Among many Natural Language Processing techniques used for annotation, it is not trivial to choose the most appropriate technique for a given scenario, especially when writing annotated texts. This research proposes to analyze a set of different techniques used for automatic annotation and verify their impact in the same scenario, the scenario of similarity between videos. 2018-03-21T19:26:08Z 2018-10-01 2018-03-21T19:26:08Z 2017-08-31 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis https://repositorio.ufjf.br/jspui/handle/ufjf/6473 por info:eu-repo/semantics/embargoedAccess Universidade Federal de Juiz de Fora (UFJF) Programa de Pós-graduação em Ciência da Computação UFJF Brasil ICE – Instituto de Ciências Exatas reponame:Repositório Institucional da UFJF instname:Universidade Federal de Juiz de Fora instacron:UFJF |