Learning dynamics and decision paradigms in social-ecological dilemmas

Kollektives Handeln ist erforderlich um nachhaltige Entwicklungspfade in gekoppelten sozial-ökologischen Systemen zu erschließen, fernab von gefährlichen Kippelementen. Ohne anderen Modellierungsprinzipien ihren Nutzen abzuerkennen, schlägt diese Dissertation die Agent-Umwelt Schnittstelle als die m...

Full description

Bibliographic Details
Main Author: Barfuss, Wolfram
Other Authors: Kurths, Jürgen
Format: Doctoral Thesis
Language:English
Published: Humboldt-Universität zu Berlin 2019
Subjects:
Online Access:http://edoc.hu-berlin.de/18452/20896
http://nbn-resolving.de/urn:nbn:de:kobv:11-110-18452/20896-5
http://dx.doi.org/10.18452/20127
id ndltd-HUMBOLT-oai-edoc.hu-berlin.de-18452-20896
record_format oai_dc
collection NDLTD
language English
format Doctoral Thesis
sources NDLTD
topic Verstärkendes Lernen
Multiagenten Systeme
Nichtlineare Dynamik
Markov-Entscheidungsprobleme
Sozial-Ökologische Systeme
Soziale Dilemmata
Nachhaltigkeit
Reinforcement Learning
Multiagent Systems
Nonlinear Dynamics
Markov Decision Processes
Social-Ecological Systems
Social Dilemmas
Sustainability
530 Physik
QH 253
ddc:530
spellingShingle Verstärkendes Lernen
Multiagenten Systeme
Nichtlineare Dynamik
Markov-Entscheidungsprobleme
Sozial-Ökologische Systeme
Soziale Dilemmata
Nachhaltigkeit
Reinforcement Learning
Multiagent Systems
Nonlinear Dynamics
Markov Decision Processes
Social-Ecological Systems
Social Dilemmas
Sustainability
530 Physik
QH 253
ddc:530
Barfuss, Wolfram
Learning dynamics and decision paradigms in social-ecological dilemmas
description Kollektives Handeln ist erforderlich um nachhaltige Entwicklungspfade in gekoppelten sozial-ökologischen Systemen zu erschließen, fernab von gefährlichen Kippelementen. Ohne anderen Modellierungsprinzipien ihren Nutzen abzuerkennen, schlägt diese Dissertation die Agent-Umwelt Schnittstelle als die mathematische Grundlage für das Modellieren sozial-ökologischer Systeme vor. Zuerst erweitert diese Arbeit eine Methode aus der Literatur der statistischen Physik über Lerndynamiken, um einen deterministischen Grenzübergang von etablierten Verstärkungslernalgorithmen aus der Forschung zu künstlicher Intelligenz herzuleiten. Die resultierenden Lerndynamiken zeigen eine große Bandbreite verschiedener dynamischer Regime wie z.B. Fixpunkte, Grenzzyklen oder deterministisches Chaos. Zweitens werden die hergeleiteten Lerngleichungen auf eine neu eingeführte Umwelt, das Ökologisches Öffentliches Gut, angewendet,. Sie modelliert ein gekoppeltes sozial-ökologisches Dilemma und erweitert damit etablierte soziale Dilemmaspiele um ein ökologisches Kippelement. Bekannte theoretische und empirische Ergebnisse werden reproduziert und neuartige, qualitativ verschiedene Parameterregime aufgezeigt, darunter eines, in dem diese belohnungsoptimierenden Lern-Agenten es vorziehen, gemeinsam unter einem Kollaps der Umwelt zu leiden, als in einer florierenden Umwelt zu kooperieren. Drittens stellt diese Arbeit das Optimierungsparadigma der Lern-Agenten in Frage. Die drei Entscheidungsparadimen ökonomischen Optimierung, Nachhaltigkeit und Sicherheit werden systematisch miteinander verglichen, während sie auf das Management eines umweltlichen Kippelements angewendet werden. Es wird gezeigt, dass kein Paradigma garantiert, Anforderungen anderer Paradigmen zu erfüllen, sowie dass das Fehlen eines Meisterparadigmas von besonderer Bedeutung für das Klimasystem ist, da dieses sich am Rand zwischen Parameterbereichen befinden kann, wo ökonomische Optimierung weder nachhaltig noch sicher wird. === Collective action is required to enter sustainable development pathways in coupled social-ecological systems, safely away from dangerous tipping elements. Without denying the usefulness of other model design principles, this thesis proposes the agent-environment interface as the mathematical foundation for the design of social-ecological system models. First, this work refines techniques from the statistical physics literature on learning dynamics to derive a deterministic limit of established reinforcement learning algorithms from artificial intelligence research. Illustrations of the resulting learning dynamics reveal a wide range of different dynamical regimes, such as fixed points, periodic orbits and deterministic chaos. Second, the derived multi-state learning equations are applied to a newly introduced environment, the Ecological Public Good. It models a coupled social-ecological dilemma, extending established repeated social dilemma games by an ecological tipping element. Known theoretical and empirical results are reproduced and novel qualitatively different parameter regimes are discovered, including one in which these reward-optimizing agents prefer to collectively suffer in environmental collapse rather than cooperating in a prosperous environment. Third, this thesis challenges the reward optimizing paradigm of the learning equations. It presents a novel formal comparison of the three decision paradigms of economic optimization, sustainability and safety for the governance of an environmental tipping element. It is shown that no paradigm guarantees fulfilling requirements imposed by another paradigm. Further, the absence of a master paradigm is shown to be of special relevance for governing the climate system, since the latter may reside at the edge between parameter regimes where economic welfare optimization becomes neither sustainable nor safe.
author2 Kurths, Jürgen
author_facet Kurths, Jürgen
Barfuss, Wolfram
author Barfuss, Wolfram
author_sort Barfuss, Wolfram
title Learning dynamics and decision paradigms in social-ecological dilemmas
title_short Learning dynamics and decision paradigms in social-ecological dilemmas
title_full Learning dynamics and decision paradigms in social-ecological dilemmas
title_fullStr Learning dynamics and decision paradigms in social-ecological dilemmas
title_full_unstemmed Learning dynamics and decision paradigms in social-ecological dilemmas
title_sort learning dynamics and decision paradigms in social-ecological dilemmas
publisher Humboldt-Universität zu Berlin
publishDate 2019
url http://edoc.hu-berlin.de/18452/20896
http://nbn-resolving.de/urn:nbn:de:kobv:11-110-18452/20896-5
http://dx.doi.org/10.18452/20127
work_keys_str_mv AT barfusswolfram learningdynamicsanddecisionparadigmsinsocialecologicaldilemmas
_version_ 1719319004791701504
spelling ndltd-HUMBOLT-oai-edoc.hu-berlin.de-18452-208962020-06-12T03:08:27Z Learning dynamics and decision paradigms in social-ecological dilemmas Barfuss, Wolfram Kurths, Jürgen Perc, Matjaž Klemm, Konstantin Verstärkendes Lernen Multiagenten Systeme Nichtlineare Dynamik Markov-Entscheidungsprobleme Sozial-Ökologische Systeme Soziale Dilemmata Nachhaltigkeit Reinforcement Learning Multiagent Systems Nonlinear Dynamics Markov Decision Processes Social-Ecological Systems Social Dilemmas Sustainability 530 Physik QH 253 ddc:530 Kollektives Handeln ist erforderlich um nachhaltige Entwicklungspfade in gekoppelten sozial-ökologischen Systemen zu erschließen, fernab von gefährlichen Kippelementen. Ohne anderen Modellierungsprinzipien ihren Nutzen abzuerkennen, schlägt diese Dissertation die Agent-Umwelt Schnittstelle als die mathematische Grundlage für das Modellieren sozial-ökologischer Systeme vor. Zuerst erweitert diese Arbeit eine Methode aus der Literatur der statistischen Physik über Lerndynamiken, um einen deterministischen Grenzübergang von etablierten Verstärkungslernalgorithmen aus der Forschung zu künstlicher Intelligenz herzuleiten. Die resultierenden Lerndynamiken zeigen eine große Bandbreite verschiedener dynamischer Regime wie z.B. Fixpunkte, Grenzzyklen oder deterministisches Chaos. Zweitens werden die hergeleiteten Lerngleichungen auf eine neu eingeführte Umwelt, das Ökologisches Öffentliches Gut, angewendet,. Sie modelliert ein gekoppeltes sozial-ökologisches Dilemma und erweitert damit etablierte soziale Dilemmaspiele um ein ökologisches Kippelement. Bekannte theoretische und empirische Ergebnisse werden reproduziert und neuartige, qualitativ verschiedene Parameterregime aufgezeigt, darunter eines, in dem diese belohnungsoptimierenden Lern-Agenten es vorziehen, gemeinsam unter einem Kollaps der Umwelt zu leiden, als in einer florierenden Umwelt zu kooperieren. Drittens stellt diese Arbeit das Optimierungsparadigma der Lern-Agenten in Frage. Die drei Entscheidungsparadimen ökonomischen Optimierung, Nachhaltigkeit und Sicherheit werden systematisch miteinander verglichen, während sie auf das Management eines umweltlichen Kippelements angewendet werden. Es wird gezeigt, dass kein Paradigma garantiert, Anforderungen anderer Paradigmen zu erfüllen, sowie dass das Fehlen eines Meisterparadigmas von besonderer Bedeutung für das Klimasystem ist, da dieses sich am Rand zwischen Parameterbereichen befinden kann, wo ökonomische Optimierung weder nachhaltig noch sicher wird. Collective action is required to enter sustainable development pathways in coupled social-ecological systems, safely away from dangerous tipping elements. Without denying the usefulness of other model design principles, this thesis proposes the agent-environment interface as the mathematical foundation for the design of social-ecological system models. First, this work refines techniques from the statistical physics literature on learning dynamics to derive a deterministic limit of established reinforcement learning algorithms from artificial intelligence research. Illustrations of the resulting learning dynamics reveal a wide range of different dynamical regimes, such as fixed points, periodic orbits and deterministic chaos. Second, the derived multi-state learning equations are applied to a newly introduced environment, the Ecological Public Good. It models a coupled social-ecological dilemma, extending established repeated social dilemma games by an ecological tipping element. Known theoretical and empirical results are reproduced and novel qualitatively different parameter regimes are discovered, including one in which these reward-optimizing agents prefer to collectively suffer in environmental collapse rather than cooperating in a prosperous environment. Third, this thesis challenges the reward optimizing paradigm of the learning equations. It presents a novel formal comparison of the three decision paradigms of economic optimization, sustainability and safety for the governance of an environmental tipping element. It is shown that no paradigm guarantees fulfilling requirements imposed by another paradigm. Further, the absence of a master paradigm is shown to be of special relevance for governing the climate system, since the latter may reside at the edge between parameter regimes where economic welfare optimization becomes neither sustainable nor safe. 2019-07-10 doctoralThesis doc-type:doctoralThesis http://edoc.hu-berlin.de/18452/20896 urn:nbn:de:kobv:11-110-18452/20896-5 http://dx.doi.org/10.18452/20127 eng (CC BY 3.0 DE) Namensnennung 3.0 Deutschland http://creativecommons.org/licenses/by/3.0/de/ application/pdf Humboldt-Universität zu Berlin