Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español

Actualmente, existe información que debe estar disponible para todos los habitantes de nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las razones por...

Full description

Bibliographic Details
Main Author:	Galarreta Asian, Ana Paula
Other Authors:	Melgar Sasieta, Héctor Andrés
Format:	Dissertation
Language:	Spanish
Published:	Pontificia Universidad Católica del Perú 2017
Subjects:	Traductores > Programas para computadoras Traductores > Métodos estadísticos Traductores > Shipibo-Conibo Traductores > Lenguas indígenas Traductores > Español
Online Access:	http://hdl.handle.net/20.500.12404/8325

id	ndltd-PUCP-oai-tesis.pucp.edu.pe-20.500.12404-8325
record_format	oai_dc
spelling	ndltd-PUCP-oai-tesis.pucp.edu.pe-20.500.12404-83252020-11-15T17:25:52Z Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español Galarreta Asian, Ana Paula Melgar Sasieta, Héctor Andrés Oncevay Marcos, Félix Arturo Traductores--Programas para computadoras Traductores--Métodos estadísticos Traductores--Shipibo-Conibo Traductores--Lenguas indígenas Traductores--Español Actualmente, existe información que debe estar disponible para todos los habitantes de nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las razones por las que no se traducen estos textos a otras lenguas habladas en nuestro país es porque el proceso es costoso y requiere de mucho tiempo. Por este motivo se propone desarrollar un traductor automático basado en colecciones de textos, también llamados corpus, que utilice métodos estadísticos y pueda servir de apoyo una plataforma de software de traducción automática de texto entre el español y el shipibo-konibo. Para implementar un método estadístico, es necesario contar con corpus paralelos en los idiomas a traducir. Esto representa un problema, pues existen muy pocos textos escritos en shipibokonibo, y la mayoría de estos no cuenta con una traducción al español. Por este motivo es necesario construir corpus paralelos en base a dos procesos: la traducción de textos del shipibo-konibo al español (y viceversa) y la alineación semi-automática de los textos bilingües disponibles. Con los corpus paralelos obtenidos, se puede entrenar y validar un traductor automático, a fin de encontrar los parámetros que generan las mejores traducciones. Además, en base a los resultados obtenidos, se determinará la etapa en la que el traductor estadístico se integrará a la plataforma de software de traducción automática que será implementada por investigadores del Grupo de Reconocimiento de Patrones e Inteligencia Artificial Aplicada (GRPIAA) y el departamento de lingüística de la PUCP. Tesis 2017-03-31T21:15:54Z 2017-03-31T21:15:54Z 2017 2017-03-31 info:eu-repo/semantics/masterThesis http://hdl.handle.net/20.500.12404/8325 spa Atribución-NoComercial-SinDerivadas 2.5 Perú info:eu-repo/semantics/openAccess application/pdf Pontificia Universidad Católica del Perú Pontificia Universidad Católica del Perú Repositorio de Tesis - PUCP
collection	NDLTD
language	Spanish
format	Dissertation
sources	NDLTD
topic	Traductores--Programas para computadoras Traductores--Métodos estadísticos Traductores--Shipibo-Conibo Traductores--Lenguas indígenas Traductores--Español
spellingShingle	Traductores--Programas para computadoras Traductores--Métodos estadísticos Traductores--Shipibo-Conibo Traductores--Lenguas indígenas Traductores--Español Galarreta Asian, Ana Paula Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español
description	Actualmente, existe información que debe estar disponible para todos los habitantes de nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las razones por las que no se traducen estos textos a otras lenguas habladas en nuestro país es porque el proceso es costoso y requiere de mucho tiempo. Por este motivo se propone desarrollar un traductor automático basado en colecciones de textos, también llamados corpus, que utilice métodos estadísticos y pueda servir de apoyo una plataforma de software de traducción automática de texto entre el español y el shipibo-konibo. Para implementar un método estadístico, es necesario contar con corpus paralelos en los idiomas a traducir. Esto representa un problema, pues existen muy pocos textos escritos en shipibokonibo, y la mayoría de estos no cuenta con una traducción al español. Por este motivo es necesario construir corpus paralelos en base a dos procesos: la traducción de textos del shipibo-konibo al español (y viceversa) y la alineación semi-automática de los textos bilingües disponibles. Con los corpus paralelos obtenidos, se puede entrenar y validar un traductor automático, a fin de encontrar los parámetros que generan las mejores traducciones. Además, en base a los resultados obtenidos, se determinará la etapa en la que el traductor estadístico se integrará a la plataforma de software de traducción automática que será implementada por investigadores del Grupo de Reconocimiento de Patrones e Inteligencia Artificial Aplicada (GRPIAA) y el departamento de lingüística de la PUCP. === Tesis
author2	Melgar Sasieta, Héctor Andrés
author_facet	Melgar Sasieta, Héctor Andrés Galarreta Asian, Ana Paula
author	Galarreta Asian, Ana Paula
author_sort	Galarreta Asian, Ana Paula
title	Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español
title_short	Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español
title_full	Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español
title_fullStr	Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español
title_full_unstemmed	Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español
title_sort	generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español
publisher	Pontificia Universidad Católica del Perú
publishDate	2017
url	http://hdl.handle.net/20.500.12404/8325
work_keys_str_mv	AT galarretaasiananapaula generaciondecorpusparalelosparalaimplementaciondeuntraductorautomaticoestadisticoentreshipibokoniboyespanol
_version_	1719357720596840448

Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español

Similar Items