Temporal discounting of expected value of reward in the medial intraparietal cortex

Previous work has shown that expected value of reward associated with a reach modulates neurons in the medial intraparietal cortex (MIP) and that this reward signal can be decoded. In this study, we investigated the reliability of reward coding in MIP by examining how given reward magnitudes are enc...

Full description

Bibliographic Details
Main Author: Tsoulfas, Georgios
Other Authors: Wissam Musallam (Internal/Supervisor)
Format: Others
Language:en
Published: McGill University 2011
Subjects:
Online Access:http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=103657
id ndltd-LACETR-oai-collectionscanada.gc.ca-QMM.103657
record_format oai_dc
collection NDLTD
language en
format Others
sources NDLTD
topic Biology - Physiology
spellingShingle Biology - Physiology
Tsoulfas, Georgios
Temporal discounting of expected value of reward in the medial intraparietal cortex
description Previous work has shown that expected value of reward associated with a reach modulates neurons in the medial intraparietal cortex (MIP) and that this reward signal can be decoded. In this study, we investigated the reliability of reward coding in MIP by examining how given reward magnitudes are encoded when presented in different contexts. We are interested in determining how prior knowledge of reward is used to interpret information about the reward in the current trial. We recorded from single neurons in MIP while two rhesus macaque monkeys performed a memory reach task under two conditions. In the first condition, high and low reward values were randomly interleaved trial by trial (variable reward schedule), while in the second condition only one of these reward values was delivered for a block of trials (constant reward schedule). For both reward schedules, the reward magnitude was indicated by a cue preceding the delay period of each trial. Each recording session consisted of a variable reward schedule as well as a small and large constant reward schedule. For the same reward, the firing rate of neurons in the delay period changed significantly between the constant and variable reward schedule conditions. A model that discounts past acquired rewards and formulates a weighted history of reward for the present trial is proposed to explain the observed differences in firing rate between contexts. We identify neurons that fire in accordance to a temporal discount of reward, with significant correlation (R2 > 0.25) between the model and experimental data, suggesting that the neuronal activation within MIP is modulated both by current expected value of reward and discounted past reward magnitudes. === De précédents travaux ont démontré que l'espérance face à la valeur de la récompense associée à une tâche d'atteinte, affecte l'activité des neurones du cortex intraparietal médial (MIP) et que ce signal de récompense peut-être décodé. Dans cette étude, nous nous attaquons à la fiabilité de l'encodage de la récompense dans la région MIP en examinant comment la quantification de la récompense est encodée quand elle est présentée dans différents contextes. Nous sommes intéressés à savoir si la connaissance acquise au cours des essais précédents est utilisée pour interpréter l'information a propos de la récompense de l'essai courant. Nous avons échantillonné l'activité de neurones, un à un, alors que deux singes, macaque rhésus, performaient une tâche d'atteinte avec délai, sous deux conditions de remise de récompense. Soumis à première condition, les grandes et petites quantités de récompense ont été enchainées de façon aléatoire (ordonnancement de récompense aléatoire), alors que sous la deuxième condition un seul format de récompense a été maintenu pour toute la durée du bloc d'essais (ordonnancement de récompense constant). Pour les deux types d'ordonnancement, la quantité de récompense était indiquée par un signal précédent la période de délai de chaque essai. Chaque séance d'enregistrement comprend un bloc d'ordonnancement aléatoire, un bloc de grandes récompenses constantes et un bloc de petites récompenses constantes. Pour la même récompense, le taux de mise à feu des neurones dans la période de délai ont été affecté de façon significative par l'ordonnancement des récompenses. Un modèle est proposé pour expliquer la différence dans les taux de mises à feu. Nous identifions les neurones qui font feu en accord avec une réduction temporelle de la récompense, avec une corrélation significative (R2 > 0.25) entre le model et les données expérimentales, suggérant que l'activité neuronale dans MIP est fonction à la fois de l'espérance de la valeur de la récompense présente et de la réduction temporelle des récompenses passées.
author2 Wissam Musallam (Internal/Supervisor)
author_facet Wissam Musallam (Internal/Supervisor)
Tsoulfas, Georgios
author Tsoulfas, Georgios
author_sort Tsoulfas, Georgios
title Temporal discounting of expected value of reward in the medial intraparietal cortex
title_short Temporal discounting of expected value of reward in the medial intraparietal cortex
title_full Temporal discounting of expected value of reward in the medial intraparietal cortex
title_fullStr Temporal discounting of expected value of reward in the medial intraparietal cortex
title_full_unstemmed Temporal discounting of expected value of reward in the medial intraparietal cortex
title_sort temporal discounting of expected value of reward in the medial intraparietal cortex
publisher McGill University
publishDate 2011
url http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=103657
work_keys_str_mv AT tsoulfasgeorgios temporaldiscountingofexpectedvalueofrewardinthemedialintraparietalcortex
_version_ 1716642783640420352
spelling ndltd-LACETR-oai-collectionscanada.gc.ca-QMM.1036572014-02-13T03:59:16ZTemporal discounting of expected value of reward in the medial intraparietal cortexTsoulfas, GeorgiosBiology - PhysiologyPrevious work has shown that expected value of reward associated with a reach modulates neurons in the medial intraparietal cortex (MIP) and that this reward signal can be decoded. In this study, we investigated the reliability of reward coding in MIP by examining how given reward magnitudes are encoded when presented in different contexts. We are interested in determining how prior knowledge of reward is used to interpret information about the reward in the current trial. We recorded from single neurons in MIP while two rhesus macaque monkeys performed a memory reach task under two conditions. In the first condition, high and low reward values were randomly interleaved trial by trial (variable reward schedule), while in the second condition only one of these reward values was delivered for a block of trials (constant reward schedule). For both reward schedules, the reward magnitude was indicated by a cue preceding the delay period of each trial. Each recording session consisted of a variable reward schedule as well as a small and large constant reward schedule. For the same reward, the firing rate of neurons in the delay period changed significantly between the constant and variable reward schedule conditions. A model that discounts past acquired rewards and formulates a weighted history of reward for the present trial is proposed to explain the observed differences in firing rate between contexts. We identify neurons that fire in accordance to a temporal discount of reward, with significant correlation (R2 > 0.25) between the model and experimental data, suggesting that the neuronal activation within MIP is modulated both by current expected value of reward and discounted past reward magnitudes. De précédents travaux ont démontré que l'espérance face à la valeur de la récompense associée à une tâche d'atteinte, affecte l'activité des neurones du cortex intraparietal médial (MIP) et que ce signal de récompense peut-être décodé. Dans cette étude, nous nous attaquons à la fiabilité de l'encodage de la récompense dans la région MIP en examinant comment la quantification de la récompense est encodée quand elle est présentée dans différents contextes. Nous sommes intéressés à savoir si la connaissance acquise au cours des essais précédents est utilisée pour interpréter l'information a propos de la récompense de l'essai courant. Nous avons échantillonné l'activité de neurones, un à un, alors que deux singes, macaque rhésus, performaient une tâche d'atteinte avec délai, sous deux conditions de remise de récompense. Soumis à première condition, les grandes et petites quantités de récompense ont été enchainées de façon aléatoire (ordonnancement de récompense aléatoire), alors que sous la deuxième condition un seul format de récompense a été maintenu pour toute la durée du bloc d'essais (ordonnancement de récompense constant). Pour les deux types d'ordonnancement, la quantité de récompense était indiquée par un signal précédent la période de délai de chaque essai. Chaque séance d'enregistrement comprend un bloc d'ordonnancement aléatoire, un bloc de grandes récompenses constantes et un bloc de petites récompenses constantes. Pour la même récompense, le taux de mise à feu des neurones dans la période de délai ont été affecté de façon significative par l'ordonnancement des récompenses. Un modèle est proposé pour expliquer la différence dans les taux de mises à feu. Nous identifions les neurones qui font feu en accord avec une réduction temporelle de la récompense, avec une corrélation significative (R2 > 0.25) entre le model et les données expérimentales, suggérant que l'activité neuronale dans MIP est fonction à la fois de l'espérance de la valeur de la récompense présente et de la réduction temporelle des récompenses passées.McGill UniversityWissam Musallam (Internal/Supervisor)2011Electronic Thesis or Dissertationapplication/pdfenElectronically-submitted theses.All items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.Master of Science (Department of Physiology) http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=103657