Validação estatística dos critérios de segmentação da fala espontânea no corpus C-ORAL-BRASIL
Este artigo apresenta o processo empregado no corpus C-ORALBRASIL,bem como os resultados estatísticos da segmentação dafala espontânea encontrados nesse corpus. Exploramos especialmentea validação estatística dos critérios para a segmentação da fala emenunciados e unidades tonais com base na Teoria...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Universidade Federal de Minas Gerais
2012-11-01
|
Series: | Revista de Estudos da Linguagem |
Subjects: | |
Online Access: | http://periodicos.letras.ufmg.br/index.php/relin/article/view/2532 |
Summary: | Este artigo apresenta o processo empregado no corpus C-ORALBRASIL,bem como os resultados estatísticos da segmentação dafala espontânea encontrados nesse corpus. Exploramos especialmentea validação estatística dos critérios para a segmentação da fala emenunciados e unidades tonais com base na Teoria da Língua em Ato.A validação teve por objetivo assegurar que o produto final tivesse amaior uniformidade possível quanto à segmentação da fala. Apósum ano, realizamos novos testes de validação, para reavaliação dogrupo principal de transcritores no momento da revisão do corpus.Os resultados da validação estatística ao final da fase de treinamentoindicam alta confiabilidade quanto à segmentação do corpus, e areavaliação indicou um grau ainda maior de acordo entre ostranscritores. O principal objetivo deste processo, a confiabilidade euniformidade das transcrições, foi obtido. |
---|---|
ISSN: | 0104-0588 2237-2083 |