Um software de reconhecimento de voz para português brasileiro

Submitted by Irvana Coutinho (irvana@ufpa.br) on 2011-03-30T16:52:26Z No. of bitstreams: 2 SILVA, Carlos Patrick PPGEngenharia Física.pdf: 982046 bytes, checksum: 68542ba7f1da016c6efc9c8d70c80030 (MD5) license_rdf: 22876 bytes, checksum: 0a4e855daae7a181424315bc63e71991 (MD5) === Made available i...

Full description

Bibliographic Details
Main Author: SILVA, Carlos Patrick Alves da
Other Authors: KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
Language:Portuguese
Published: Universidade Federal do Pará 2011
Subjects:
Online Access:http://www.repositorio.ufpa.br:8080/jspui/handle/2011/2074
id ndltd-IBICT-oai-repositorio.ufpa.br-2011-2074
record_format oai_dc
spelling ndltd-IBICT-oai-repositorio.ufpa.br-2011-20742019-02-03T15:59:32Z Um software de reconhecimento de voz para português brasileiro SILVA, Carlos Patrick Alves da KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO Sistema de reconhecimento de voz Língua portuguesa Processamento de dados Fonética Submitted by Irvana Coutinho (irvana@ufpa.br) on 2011-03-30T16:52:26Z No. of bitstreams: 2 SILVA, Carlos Patrick PPGEngenharia Física.pdf: 982046 bytes, checksum: 68542ba7f1da016c6efc9c8d70c80030 (MD5) license_rdf: 22876 bytes, checksum: 0a4e855daae7a181424315bc63e71991 (MD5) Made available in DSpace on 2011-03-30T16:52:26Z (GMT). No. of bitstreams: 2 SILVA, Carlos Patrick PPGEngenharia Física.pdf: 982046 bytes, checksum: 68542ba7f1da016c6efc9c8d70c80030 (MD5) license_rdf: 22876 bytes, checksum: 0a4e855daae7a181424315bc63e71991 (MD5) Previous issue date: 2010 CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior This work describes a speech recognition software for Brazilian Portuguese. The main objective is to build a system for large vocabulary continuous speech recognition, able to be used in real-time applications. The concepts, characteristics and all steps needed for the construction of such systems are presented. Several resources were produced and made available: acoustic and language models, new voice and text corpora. The text corpus has been built through the extraction and automatic formatting of text from newspapers on the Internet. In addition, two voice corpora were produced, one based on audiobooks and another specifically developed to simulate real-time tests. This work also proposes the use of speaker adaptation techniques for solving the acoustic mismatch problem between speech corpora. Finally, an application programming interface is presented in order to facilitate using the open-source Julius speech decoder. Performance tests are also presented, comparing the developed system with a commercial software. Descreve a implementação de um software de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. São apresentados os principais conceitos e características de tais sistemas, além de todos os passos necessários para construção. Como parte desse trabalho foram produzidos e disponibilizados vários recursos: modelos acústicos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na Internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de problemas de descasamento acústico entre corpora de voz. Por último, é apresentada uma interface de programação de aplicativos que busca facilitar a utilização do decodificador Julius. Testes de desempenho são apresentados, comparando os sistemas desenvolvidos e um software comercial. 2011-03-30T16:52:26Z 2011-03-30T16:52:26Z 2010-06-17 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis SILVA, Carlos Patrick Alves da. Um Software de reconhecimento de voz para português brasileiro. 2010. 74 f. Dissertação (Mestrado) - Universidade Federal do Pará, Instituto de Tecnologia, Belém, 2010. Programa de Pós-Graduação em Engenharia Elétrica. http://www.repositorio.ufpa.br:8080/jspui/handle/2011/2074 por info:eu-repo/semantics/openAccess Universidade Federal do Pará Programa de Pós-Graduação em Engenharia Elétrica UFPA Brasil Instituto de Tecnologia reponame:Repositório Institucional da UFPA instname:Universidade Federal do Pará instacron:UFPA
collection NDLTD
language Portuguese
sources NDLTD
topic CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Sistema de reconhecimento de voz
Língua portuguesa
Processamento de dados
Fonética
spellingShingle CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Sistema de reconhecimento de voz
Língua portuguesa
Processamento de dados
Fonética
SILVA, Carlos Patrick Alves da
Um software de reconhecimento de voz para português brasileiro
description Submitted by Irvana Coutinho (irvana@ufpa.br) on 2011-03-30T16:52:26Z No. of bitstreams: 2 SILVA, Carlos Patrick PPGEngenharia Física.pdf: 982046 bytes, checksum: 68542ba7f1da016c6efc9c8d70c80030 (MD5) license_rdf: 22876 bytes, checksum: 0a4e855daae7a181424315bc63e71991 (MD5) === Made available in DSpace on 2011-03-30T16:52:26Z (GMT). No. of bitstreams: 2 SILVA, Carlos Patrick PPGEngenharia Física.pdf: 982046 bytes, checksum: 68542ba7f1da016c6efc9c8d70c80030 (MD5) license_rdf: 22876 bytes, checksum: 0a4e855daae7a181424315bc63e71991 (MD5) Previous issue date: 2010 === CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico === CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior === This work describes a speech recognition software for Brazilian Portuguese. The main objective is to build a system for large vocabulary continuous speech recognition, able to be used in real-time applications. The concepts, characteristics and all steps needed for the construction of such systems are presented. Several resources were produced and made available: acoustic and language models, new voice and text corpora. The text corpus has been built through the extraction and automatic formatting of text from newspapers on the Internet. In addition, two voice corpora were produced, one based on audiobooks and another specifically developed to simulate real-time tests. This work also proposes the use of speaker adaptation techniques for solving the acoustic mismatch problem between speech corpora. Finally, an application programming interface is presented in order to facilitate using the open-source Julius speech decoder. Performance tests are also presented, comparing the developed system with a commercial software. === Descreve a implementação de um software de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. São apresentados os principais conceitos e características de tais sistemas, além de todos os passos necessários para construção. Como parte desse trabalho foram produzidos e disponibilizados vários recursos: modelos acústicos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na Internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de problemas de descasamento acústico entre corpora de voz. Por último, é apresentada uma interface de programação de aplicativos que busca facilitar a utilização do decodificador Julius. Testes de desempenho são apresentados, comparando os sistemas desenvolvidos e um software comercial.
author2 KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
author_facet KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
SILVA, Carlos Patrick Alves da
author SILVA, Carlos Patrick Alves da
author_sort SILVA, Carlos Patrick Alves da
title Um software de reconhecimento de voz para português brasileiro
title_short Um software de reconhecimento de voz para português brasileiro
title_full Um software de reconhecimento de voz para português brasileiro
title_fullStr Um software de reconhecimento de voz para português brasileiro
title_full_unstemmed Um software de reconhecimento de voz para português brasileiro
title_sort um software de reconhecimento de voz para português brasileiro
publisher Universidade Federal do Pará
publishDate 2011
url http://www.repositorio.ufpa.br:8080/jspui/handle/2011/2074
work_keys_str_mv AT silvacarlospatrickalvesda umsoftwaredereconhecimentodevozparaportuguesbrasileiro
_version_ 1718970414636466176