Reconhecimento de Actos de Diálogo Hierárquicos e Multi-Etiqueta em Dados em Espanhol

Os actos de diálogo revelam a intenção por trás das palavras pronunciadas. Por isso, o seu reconhecimento automático é importante para um sistema de diálogo que tenta entender o seu interlocutor. O estudo apresentado neste artigo aborda essa tarefa no corpus DIHANA, cujo esquema de anotação de acto...

Full description

Bibliographic Details
Main Authors: Eugénio Ribeiro, Ricardo Ribeiro, David Martins de Matos
Format: Article
Language:Catalan
Published: Universidade do Minho & Universidade de Vigo 2019-07-01
Series:Linguamática
Online Access:https://www.linguamatica.com/index.php/linguamatica/article/view/278
id doaj-c731038569c34632b32bd0d85f319908
record_format Article
spelling doaj-c731038569c34632b32bd0d85f3199082020-11-24T21:50:23ZcatUniversidade do Minho & Universidade de VigoLinguamática1647-08182019-07-0111110.21814/lm.11.1.278Reconhecimento de Actos de Diálogo Hierárquicos e Multi-Etiqueta em Dados em EspanholEugénio Ribeiro0Ricardo RibeiroDavid Martins de MatosInstituto Superior Técnico, Universidade de Lisboa / L2F - Spoken Language Systems Lab - INESC-ID Lisboa Os actos de diálogo revelam a intenção por trás das palavras pronunciadas. Por isso, o seu reconhecimento automático é importante para um sistema de diálogo que tenta entender o seu interlocutor. O estudo apresentado neste artigo aborda essa tarefa no corpus DIHANA, cujo esquema de anotação de actos de diálogo em três níveis coloca problemas que não foram explorados em estudos recentes. Além do problema hierárquico, os dois níveis inferiores colocam problemas de classificação multi-etiqueta. Além disso, cada nível da hierarquia refere-se a um aspecto diferente relativo à intenção do orador, tanto em termos da estrutura do diálogo, como da tarefa. Por outro lado, uma vez que os diálogos são em espanhol, este corpus permite-nos avaliar se as melhores abordagens para dados em inglês generalizam para uma língua diferente. Mais especificamente, comparamos o desempenho de diferentes abordagens de representação de segmentos, com foco tanto em sequências como em padrões de palavras, e avaliamos a importância do histórico do diálogo e das relações entre os múltiplos níveis da hierarquia. No que diz respeito ao problema de classificação de etiqueta única colocado pelo nível superior, mostramos que as conclusões obtidas a partir de dados em inglês se mantêm em dados em espanhol. Para além disso, mostramos que as abordagens podem ser adaptadas para cenários multi-etiqueta. Por fim, combinando hierarquicamente os melhores classificadores para cada nível, obtemos os melhores resultados reportados para este corpus. https://www.linguamatica.com/index.php/linguamatica/article/view/278
collection DOAJ
language Catalan
format Article
sources DOAJ
author Eugénio Ribeiro
Ricardo Ribeiro
David Martins de Matos
spellingShingle Eugénio Ribeiro
Ricardo Ribeiro
David Martins de Matos
Reconhecimento de Actos de Diálogo Hierárquicos e Multi-Etiqueta em Dados em Espanhol
Linguamática
author_facet Eugénio Ribeiro
Ricardo Ribeiro
David Martins de Matos
author_sort Eugénio Ribeiro
title Reconhecimento de Actos de Diálogo Hierárquicos e Multi-Etiqueta em Dados em Espanhol
title_short Reconhecimento de Actos de Diálogo Hierárquicos e Multi-Etiqueta em Dados em Espanhol
title_full Reconhecimento de Actos de Diálogo Hierárquicos e Multi-Etiqueta em Dados em Espanhol
title_fullStr Reconhecimento de Actos de Diálogo Hierárquicos e Multi-Etiqueta em Dados em Espanhol
title_full_unstemmed Reconhecimento de Actos de Diálogo Hierárquicos e Multi-Etiqueta em Dados em Espanhol
title_sort reconhecimento de actos de diálogo hierárquicos e multi-etiqueta em dados em espanhol
publisher Universidade do Minho & Universidade de Vigo
series Linguamática
issn 1647-0818
publishDate 2019-07-01
description Os actos de diálogo revelam a intenção por trás das palavras pronunciadas. Por isso, o seu reconhecimento automático é importante para um sistema de diálogo que tenta entender o seu interlocutor. O estudo apresentado neste artigo aborda essa tarefa no corpus DIHANA, cujo esquema de anotação de actos de diálogo em três níveis coloca problemas que não foram explorados em estudos recentes. Além do problema hierárquico, os dois níveis inferiores colocam problemas de classificação multi-etiqueta. Além disso, cada nível da hierarquia refere-se a um aspecto diferente relativo à intenção do orador, tanto em termos da estrutura do diálogo, como da tarefa. Por outro lado, uma vez que os diálogos são em espanhol, este corpus permite-nos avaliar se as melhores abordagens para dados em inglês generalizam para uma língua diferente. Mais especificamente, comparamos o desempenho de diferentes abordagens de representação de segmentos, com foco tanto em sequências como em padrões de palavras, e avaliamos a importância do histórico do diálogo e das relações entre os múltiplos níveis da hierarquia. No que diz respeito ao problema de classificação de etiqueta única colocado pelo nível superior, mostramos que as conclusões obtidas a partir de dados em inglês se mantêm em dados em espanhol. Para além disso, mostramos que as abordagens podem ser adaptadas para cenários multi-etiqueta. Por fim, combinando hierarquicamente os melhores classificadores para cada nível, obtemos os melhores resultados reportados para este corpus.
url https://www.linguamatica.com/index.php/linguamatica/article/view/278
work_keys_str_mv AT eugenioribeiro reconhecimentodeactosdedialogohierarquicosemultietiquetaemdadosemespanhol
AT ricardoribeiro reconhecimentodeactosdedialogohierarquicosemultietiquetaemdadosemespanhol
AT davidmartinsdematos reconhecimentodeactosdedialogohierarquicosemultietiquetaemdadosemespanhol
_version_ 1725884438326280192