Learning dynamics and decision paradigms in social-ecological dilemmas
Kollektives Handeln ist erforderlich um nachhaltige Entwicklungspfade in gekoppelten sozial-ökologischen Systemen zu erschließen, fernab von gefährlichen Kippelementen. Ohne anderen Modellierungsprinzipien ihren Nutzen abzuerkennen, schlägt diese Dissertation die Agent-Umwelt Schnittstelle als die m...
Main Author: | |
---|---|
Other Authors: | |
Format: | Doctoral Thesis |
Language: | English |
Published: |
Humboldt-Universität zu Berlin
2019
|
Subjects: | |
Online Access: | http://edoc.hu-berlin.de/18452/20896 http://nbn-resolving.de/urn:nbn:de:kobv:11-110-18452/20896-5 http://dx.doi.org/10.18452/20127 |
id |
ndltd-HUMBOLT-oai-edoc.hu-berlin.de-18452-20896 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
English |
format |
Doctoral Thesis |
sources |
NDLTD |
topic |
Verstärkendes Lernen Multiagenten Systeme Nichtlineare Dynamik Markov-Entscheidungsprobleme Sozial-Ökologische Systeme Soziale Dilemmata Nachhaltigkeit Reinforcement Learning Multiagent Systems Nonlinear Dynamics Markov Decision Processes Social-Ecological Systems Social Dilemmas Sustainability 530 Physik QH 253 ddc:530 |
spellingShingle |
Verstärkendes Lernen Multiagenten Systeme Nichtlineare Dynamik Markov-Entscheidungsprobleme Sozial-Ökologische Systeme Soziale Dilemmata Nachhaltigkeit Reinforcement Learning Multiagent Systems Nonlinear Dynamics Markov Decision Processes Social-Ecological Systems Social Dilemmas Sustainability 530 Physik QH 253 ddc:530 Barfuss, Wolfram Learning dynamics and decision paradigms in social-ecological dilemmas |
description |
Kollektives Handeln ist erforderlich um nachhaltige Entwicklungspfade in gekoppelten sozial-ökologischen Systemen zu erschließen, fernab von gefährlichen Kippelementen. Ohne anderen Modellierungsprinzipien ihren Nutzen abzuerkennen, schlägt diese Dissertation die Agent-Umwelt Schnittstelle als die mathematische Grundlage für das Modellieren sozial-ökologischer Systeme vor.
Zuerst erweitert diese Arbeit eine Methode aus der Literatur der statistischen Physik über Lerndynamiken, um einen deterministischen Grenzübergang von etablierten Verstärkungslernalgorithmen aus der Forschung zu künstlicher Intelligenz herzuleiten. Die resultierenden Lerndynamiken zeigen eine große Bandbreite verschiedener dynamischer Regime wie z.B. Fixpunkte, Grenzzyklen oder deterministisches Chaos.
Zweitens werden die hergeleiteten Lerngleichungen auf eine neu eingeführte Umwelt, das Ökologisches Öffentliches Gut, angewendet,. Sie modelliert ein gekoppeltes sozial-ökologisches Dilemma und erweitert damit etablierte soziale Dilemmaspiele um ein ökologisches Kippelement. Bekannte theoretische und empirische Ergebnisse werden reproduziert und neuartige, qualitativ verschiedene Parameterregime aufgezeigt, darunter eines, in dem diese belohnungsoptimierenden Lern-Agenten es vorziehen, gemeinsam unter einem Kollaps der Umwelt zu leiden, als in einer florierenden Umwelt zu kooperieren.
Drittens stellt diese Arbeit das Optimierungsparadigma der Lern-Agenten in Frage. Die drei Entscheidungsparadimen ökonomischen Optimierung, Nachhaltigkeit und Sicherheit werden systematisch miteinander verglichen, während sie auf das Management eines umweltlichen Kippelements angewendet werden. Es wird gezeigt, dass kein Paradigma garantiert, Anforderungen anderer Paradigmen zu erfüllen, sowie dass das Fehlen eines Meisterparadigmas von besonderer Bedeutung für das Klimasystem ist, da dieses sich am Rand zwischen Parameterbereichen befinden kann, wo ökonomische Optimierung weder nachhaltig noch sicher wird. === Collective action is required to enter sustainable development pathways in coupled social-ecological systems, safely away from dangerous tipping elements. Without denying the usefulness of other model design principles, this thesis proposes the agent-environment interface as the mathematical foundation for the design of social-ecological system models.
First, this work refines techniques from the statistical physics literature on learning dynamics to derive a deterministic limit of established reinforcement learning algorithms from artificial intelligence research. Illustrations of the resulting learning dynamics reveal a wide range of different dynamical regimes, such as fixed points, periodic orbits and deterministic chaos.
Second, the derived multi-state learning equations are applied to a newly introduced environment, the Ecological Public Good. It models a coupled social-ecological dilemma, extending established repeated social dilemma games by an ecological tipping element. Known theoretical and empirical results are reproduced and novel qualitatively different parameter regimes are discovered, including one in which these reward-optimizing agents prefer to collectively suffer in environmental collapse rather than cooperating in a prosperous environment.
Third, this thesis challenges the reward optimizing paradigm of the learning equations. It presents a novel formal comparison of the three decision paradigms of economic optimization, sustainability and safety for the governance of an environmental tipping element. It is shown that no paradigm guarantees fulfilling requirements imposed by another paradigm. Further, the absence of a master paradigm is shown to be of special relevance for governing the climate system, since the latter may reside at the edge between parameter regimes where economic welfare optimization becomes neither sustainable nor safe. |
author2 |
Kurths, Jürgen |
author_facet |
Kurths, Jürgen Barfuss, Wolfram |
author |
Barfuss, Wolfram |
author_sort |
Barfuss, Wolfram |
title |
Learning dynamics and decision paradigms in social-ecological dilemmas |
title_short |
Learning dynamics and decision paradigms in social-ecological dilemmas |
title_full |
Learning dynamics and decision paradigms in social-ecological dilemmas |
title_fullStr |
Learning dynamics and decision paradigms in social-ecological dilemmas |
title_full_unstemmed |
Learning dynamics and decision paradigms in social-ecological dilemmas |
title_sort |
learning dynamics and decision paradigms in social-ecological dilemmas |
publisher |
Humboldt-Universität zu Berlin |
publishDate |
2019 |
url |
http://edoc.hu-berlin.de/18452/20896 http://nbn-resolving.de/urn:nbn:de:kobv:11-110-18452/20896-5 http://dx.doi.org/10.18452/20127 |
work_keys_str_mv |
AT barfusswolfram learningdynamicsanddecisionparadigmsinsocialecologicaldilemmas |
_version_ |
1719319004791701504 |
spelling |
ndltd-HUMBOLT-oai-edoc.hu-berlin.de-18452-208962020-06-12T03:08:27Z Learning dynamics and decision paradigms in social-ecological dilemmas Barfuss, Wolfram Kurths, Jürgen Perc, Matjaž Klemm, Konstantin Verstärkendes Lernen Multiagenten Systeme Nichtlineare Dynamik Markov-Entscheidungsprobleme Sozial-Ökologische Systeme Soziale Dilemmata Nachhaltigkeit Reinforcement Learning Multiagent Systems Nonlinear Dynamics Markov Decision Processes Social-Ecological Systems Social Dilemmas Sustainability 530 Physik QH 253 ddc:530 Kollektives Handeln ist erforderlich um nachhaltige Entwicklungspfade in gekoppelten sozial-ökologischen Systemen zu erschließen, fernab von gefährlichen Kippelementen. Ohne anderen Modellierungsprinzipien ihren Nutzen abzuerkennen, schlägt diese Dissertation die Agent-Umwelt Schnittstelle als die mathematische Grundlage für das Modellieren sozial-ökologischer Systeme vor. Zuerst erweitert diese Arbeit eine Methode aus der Literatur der statistischen Physik über Lerndynamiken, um einen deterministischen Grenzübergang von etablierten Verstärkungslernalgorithmen aus der Forschung zu künstlicher Intelligenz herzuleiten. Die resultierenden Lerndynamiken zeigen eine große Bandbreite verschiedener dynamischer Regime wie z.B. Fixpunkte, Grenzzyklen oder deterministisches Chaos. Zweitens werden die hergeleiteten Lerngleichungen auf eine neu eingeführte Umwelt, das Ökologisches Öffentliches Gut, angewendet,. Sie modelliert ein gekoppeltes sozial-ökologisches Dilemma und erweitert damit etablierte soziale Dilemmaspiele um ein ökologisches Kippelement. Bekannte theoretische und empirische Ergebnisse werden reproduziert und neuartige, qualitativ verschiedene Parameterregime aufgezeigt, darunter eines, in dem diese belohnungsoptimierenden Lern-Agenten es vorziehen, gemeinsam unter einem Kollaps der Umwelt zu leiden, als in einer florierenden Umwelt zu kooperieren. Drittens stellt diese Arbeit das Optimierungsparadigma der Lern-Agenten in Frage. Die drei Entscheidungsparadimen ökonomischen Optimierung, Nachhaltigkeit und Sicherheit werden systematisch miteinander verglichen, während sie auf das Management eines umweltlichen Kippelements angewendet werden. Es wird gezeigt, dass kein Paradigma garantiert, Anforderungen anderer Paradigmen zu erfüllen, sowie dass das Fehlen eines Meisterparadigmas von besonderer Bedeutung für das Klimasystem ist, da dieses sich am Rand zwischen Parameterbereichen befinden kann, wo ökonomische Optimierung weder nachhaltig noch sicher wird. Collective action is required to enter sustainable development pathways in coupled social-ecological systems, safely away from dangerous tipping elements. Without denying the usefulness of other model design principles, this thesis proposes the agent-environment interface as the mathematical foundation for the design of social-ecological system models. First, this work refines techniques from the statistical physics literature on learning dynamics to derive a deterministic limit of established reinforcement learning algorithms from artificial intelligence research. Illustrations of the resulting learning dynamics reveal a wide range of different dynamical regimes, such as fixed points, periodic orbits and deterministic chaos. Second, the derived multi-state learning equations are applied to a newly introduced environment, the Ecological Public Good. It models a coupled social-ecological dilemma, extending established repeated social dilemma games by an ecological tipping element. Known theoretical and empirical results are reproduced and novel qualitatively different parameter regimes are discovered, including one in which these reward-optimizing agents prefer to collectively suffer in environmental collapse rather than cooperating in a prosperous environment. Third, this thesis challenges the reward optimizing paradigm of the learning equations. It presents a novel formal comparison of the three decision paradigms of economic optimization, sustainability and safety for the governance of an environmental tipping element. It is shown that no paradigm guarantees fulfilling requirements imposed by another paradigm. Further, the absence of a master paradigm is shown to be of special relevance for governing the climate system, since the latter may reside at the edge between parameter regimes where economic welfare optimization becomes neither sustainable nor safe. 2019-07-10 doctoralThesis doc-type:doctoralThesis http://edoc.hu-berlin.de/18452/20896 urn:nbn:de:kobv:11-110-18452/20896-5 http://dx.doi.org/10.18452/20127 eng (CC BY 3.0 DE) Namensnennung 3.0 Deutschland http://creativecommons.org/licenses/by/3.0/de/ application/pdf Humboldt-Universität zu Berlin |