Validação estatística dos critérios de segmentação da fala espontânea no corpus C-ORAL-BRASIL

Este artigo apresenta o processo empregado no corpus C-ORALBRASIL,bem como os resultados estatísticos da segmentação dafala espontânea encontrados nesse corpus. Exploramos especialmentea validação estatística dos critérios para a segmentação da fala emenunciados e unidades tonais com base na Teoria...

Full description

Bibliographic Details
Main Authors: Tommaso Raso, Maryualê Malvessi Mittmann
Format: Article
Language:English
Published: Universidade Federal de Minas Gerais 2012-11-01
Series:Revista de Estudos da Linguagem
Subjects:
Online Access:http://periodicos.letras.ufmg.br/index.php/relin/article/view/2532
Description
Summary:Este artigo apresenta o processo empregado no corpus C-ORALBRASIL,bem como os resultados estatísticos da segmentação dafala espontânea encontrados nesse corpus. Exploramos especialmentea validação estatística dos critérios para a segmentação da fala emenunciados e unidades tonais com base na Teoria da Língua em Ato.A validação teve por objetivo assegurar que o produto final tivesse amaior uniformidade possível quanto à segmentação da fala. Apósum ano, realizamos novos testes de validação, para reavaliação dogrupo principal de transcritores no momento da revisão do corpus.Os resultados da validação estatística ao final da fase de treinamentoindicam alta confiabilidade quanto à segmentação do corpus, e areavaliação indicou um grau ainda maior de acordo entre ostranscritores. O principal objetivo deste processo, a confiabilidade euniformidade das transcrições, foi obtido.
ISSN:0104-0588
2237-2083