Entropia informacional e aprendizagem de sequências

Experiências armazenadas acerca de regularidades passadas permitem a previsão do ambiente e, consequentemente, a possibilidade de ações antecipadas. Esta capacidade cognitiva é expressa em modelos de aprendizagem de sequências, que são capazes de acessar a previsibilidade das sequências de eventos e...

Full description

Bibliographic Details
Main Author: Pavão, Rodrigo
Other Authors: Helene, André Frazão
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 2011
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/41/41135/tde-21092011-135012/
Description
Summary:Experiências armazenadas acerca de regularidades passadas permitem a previsão do ambiente e, consequentemente, a possibilidade de ações antecipadas. Esta capacidade cognitiva é expressa em modelos de aprendizagem de sequências, que são capazes de acessar a previsibilidade das sequências de eventos e gerar descrições do desempenho em protocolos experimentais como a tarefa de tempo de reação serial. Nos experimentos 1, 2 e 3 deste trabalho, a abordagem informacional foi aplicada à descrição do desempenho na tarefa de tempo de reação serial. A relação entre medidas de entropia e desempenho na tarefa de tempo de reação serial envolvendo diferentes tipos de sequência foi investigada nos Experimentos 1a e 1b. As medidas de entropia foram feitas pelo processamento das frequências de eventos das sequências (i.e., pares, trios, quadras etc). Os resultados revelaram que a entropia informacional das sequências é um bom descritor do desempenho: (1) sequências de baixa entropia são realizadas mais rapidamente e são mais frequentemente reconhecidas ao final da sessão do que as de alta entropia; (2) uma curva sigmóide relaciona valores de entropia aos de tempo de reação: parâmetros \"min\" (tempo de reação com a previsão total), \"max\" (tempo de reação sem previsão) e \"x50\" (valor de entropia relacionada ao limiar de previsão); (3) o treinamento torna previsíveis sequências de alta entropia (o \"x50\" aumenta com o treinamento); e (4) com o treinamento, mais elementos prévios da sequência passam a ser utilizados para a previsão do próximo elemento. A relação entre desempenho e expectativas probabilísticas geradas durante o treinamento foi investigada no Experimento 2. Esse experimento envolveu múltiplas combinações de sequências de treino e teste, aplicadas a voluntários em sessões únicas. A diferença entre as previsibilidades das sequências de teste e treino foi quantificada pela distância de Kullback-Leibler: pequenas distâncias indicam que o treino proporciona boa previsão sobre o teste. Desconsiderando os efeitos de entropia (descrito no Experimento 1), a distância de Kullback-Leibler entre as sequências de teste e treino está relacionada ao desempenho: (1) distâncias pequenas levam à manutenção das expectativas (prévias) e tempos de reação curtos; (2) distâncias grandes levam à negligência das previsões e tempos de reação intermediários; e (3) distâncias intermediárias estão relacionadas a um conflito entre as estratégias de manutenção e negligência das expectativas, e geram tempos de reação elevados. Portanto, a flexibilidade das previsões ocorre em distâncias pequenas; uma estratégia alternativa, de negligência das previsões, é adotada em distâncias grandes. A estratégia desenvolvida nos Experimentos 1a e 1b foi útil para avaliar, no Experimento 3, a equivalência funcional entre treinamento imaginativo e real na aprendizagem de sequências. Este experimento envolveu voluntários testados na tarefa de tempo de reação serial ao longo de várias sessões de treinamento imaginativo e real. Os desempenhos durante o treinamento imaginativo e real foram descritos e comparados; o experimento mostrou também que a previsibilidade da sequência acessada por meio do treinamento imaginativo pode ser expressa posteriormente no desempenho real da tarefa. No entanto, o limite de previsibilidade das sequências acessado pelo treinamento imaginativo é inferior ao limite acessado por treinamento real, descrita pelo menor \"x50\" do (1) treinamento imaginativo em relação ao treinamento real e (2) desempenho real após o treinamento imaginativo em relação ao desempenho real após o treinamento real. Em conclusão, é possível afirmar que o modelo de entropia informacional é capaz de descrever a variabilidade do desempenho na tarefa de tempo de reação serial. Estes achados apóiam a existência de um princípio geral de acesso à previsibilidade para explicação da aprendizagem e memória. === Stored experiences of past regularities allow the prediction of the environment and, consequently, the possibility of anticipatory actions. This cognitive capacity is expressed in models of sequence learning, which are able to access the predictability of sequences of events and to generate descriptions of performance on experimental protocols as serial reaction time task. In Experiments 1, 2 and 3 of this work the informational framework was applied to the description of performance in serial reaction time task. The relationship between entropy measures and performance on serial reaction time task involving multiple sequence types was investigated on Experiments 1a and 1b. The entropy measures were done by processing the frequencies of events of the sequences (i.e. pairs, triads, quads etc). The results revealed that information entropy of the sequences is an impressively good descriptor of performance: (1) low entropy sequences were performed more rapidly and were more frequently recognized in the end of the session than the high entropy ones; (2) a sigmoid curve relates entropy to reaction time: parameters \"min\" (reaction time with total prediction), \"max\" (reaction time with no prediction) and \"x50\" (entropy value related to threshold of prediction); (3) training makes high entropy sequences predictable (the \"x50\" increases with training); and (4) with training, more previous elements of sequence are used for prediction of the next one. The relationship between performance and probabilistic expectancies generated during training was investigated on Experiment 2. This experiment involved multiple arrangements of training and testing sequences, applied to volunteers on single sessions. The difference between the predictabilities of testing and training sequences was quantified by the Kullback-Leibler divergence: small divergence indicates that training provides good prediction on testing. Disregarding the entropy effects (described on Experiment 1), Kullback-Leibler divergence between training and testing sequences is related to performance: (1) short divergences lead to (previous) predictions maintenance and low reaction times; (2) large divergences lead to predictions negligence and intermediate reaction times; and (3) intermediate divergences are related to conflict between the strategies of maintenance and negligence of predictions, and generate high reaction times. Therefore, the flexibility of predictions occurs on short divergences; an alternative strategy, of predictions negligence, is adopted on large divergences. The strategy developed on Experiments 1a and 1b was useful to evaluate, on Experiment 3, the functional equivalence between imagery and actual training on sequence learning. This experiment involved volunteers tested on serial reaction time task along multiple imagery and actual training sessions. Performances on both imagery and actual training were described and compared; the experiment also showed that the sequence predictability accessed on imagery training can be expressed on posterior actual performance. However, the limit of sequence predictability accessed by imagery training is lower than the limit accessed by actual training, described by the lower \"x50\" of (1) imagery training compared to actual training and (2) actual performance after imagery training compared to actual performance after actual training. In conclusion, it is possible to state that the entropy model is able to describe the variability of performance on serial reaction time task. These findings support the existence of a general principle of accessing the predictability to explain learning and memory.