FAULT TOLERANCE IN DISTRIBUTED SYSTEMS

Esta dissertação aborda o problema da recuperação de erros em sistemas distribuídos. Inicialmente, é feita uma breve análise sobre a origem deste problema e as soluções encontradas. Alguns métodos de resolução são então apresentados. Para a simulação do sistema distribuído foi desenvolvido um n...

Full description

Bibliographic Details
Main Author: ALEXANDRE DE REZENDE ABIBE
Other Authors: JULIUS CESAR BARRETO LEITE
Language:Portuguese
Published: PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO 1988
Online Access:http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=9411@1
http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=9411@2
id ndltd-IBICT-oai-MAXWELL.puc-rio.br-9411
record_format oai_dc
spelling ndltd-IBICT-oai-MAXWELL.puc-rio.br-94112019-03-01T15:36:39Z FAULT TOLERANCE IN DISTRIBUTED SYSTEMS RECUPERAÇÃO DE ERROS EM SISTEMAS DE PROCESSOS DISTRIBUÍDOS ALEXANDRE DE REZENDE ABIBE JULIUS CESAR BARRETO LEITE MOISES HENRIQUE SZWARCMAN ORLANDO GOMES LOQUES FILHO JULIUS CESAR BARRETO LEITE JORGE LOPES DE SOUZA LEAO Esta dissertação aborda o problema da recuperação de erros em sistemas distribuídos. Inicialmente, é feita uma breve análise sobre a origem deste problema e as soluções encontradas. Alguns métodos de resolução são então apresentados. Para a simulação do sistema distribuído foi desenvolvido um núcleo multi-tarefa numa máquina compatível com o PC-IBM-XT, utilizando o MS-DOS (versão 3.0 ou acima) como servidor. Finalmente, são apresentadas duas propostas. A primeira visa fornecer a um processo recursos que possibilitem a recuperação por retorno. A segunda utiliza redundância em um conjunto de processos em diferentes estações para garantir que o sistema como um todo continue operativo, mesmo com uma estação de falha This dissertation deals with the problem of fault tolerance in distributed systems. Initially, a brief analysis on the origins of this problem and its solutions is made. Some of the resolutions methods are then presented. In order to simulate a distributed system, a multi tasking operating system kernel was developed in an IBM PC-XT compatible machine, making use of the MS-DOS (version 3.0 or above) as a server. Finally, two proposals are presented. The first, is intended to supply a process with resources that allow recovery in case of algorithmic faults, making use of the backward error recovery method. The second, uses redundancy in a set of processes over different stations in order to warrant that the system as a whole keeps operative, even with a faulty s 1988-04-28 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=9411@1 http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=9411@2 por info:eu-repo/semantics/openAccess PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO PPG EM ENGENHARIA ELÉTRICA PUC-Rio BR reponame:Repositório Institucional da PUC_RIO instname:Pontifícia Universidade Católica do Rio de Janeiro instacron:PUC_RIO
collection NDLTD
language Portuguese
sources NDLTD
description Esta dissertação aborda o problema da recuperação de erros em sistemas distribuídos. Inicialmente, é feita uma breve análise sobre a origem deste problema e as soluções encontradas. Alguns métodos de resolução são então apresentados. Para a simulação do sistema distribuído foi desenvolvido um núcleo multi-tarefa numa máquina compatível com o PC-IBM-XT, utilizando o MS-DOS (versão 3.0 ou acima) como servidor. Finalmente, são apresentadas duas propostas. A primeira visa fornecer a um processo recursos que possibilitem a recuperação por retorno. A segunda utiliza redundância em um conjunto de processos em diferentes estações para garantir que o sistema como um todo continue operativo, mesmo com uma estação de falha === This dissertation deals with the problem of fault tolerance in distributed systems. Initially, a brief analysis on the origins of this problem and its solutions is made. Some of the resolutions methods are then presented. In order to simulate a distributed system, a multi tasking operating system kernel was developed in an IBM PC-XT compatible machine, making use of the MS-DOS (version 3.0 or above) as a server. Finally, two proposals are presented. The first, is intended to supply a process with resources that allow recovery in case of algorithmic faults, making use of the backward error recovery method. The second, uses redundancy in a set of processes over different stations in order to warrant that the system as a whole keeps operative, even with a faulty s
author2 JULIUS CESAR BARRETO LEITE
author_facet JULIUS CESAR BARRETO LEITE
ALEXANDRE DE REZENDE ABIBE
author ALEXANDRE DE REZENDE ABIBE
spellingShingle ALEXANDRE DE REZENDE ABIBE
FAULT TOLERANCE IN DISTRIBUTED SYSTEMS
author_sort ALEXANDRE DE REZENDE ABIBE
title FAULT TOLERANCE IN DISTRIBUTED SYSTEMS
title_short FAULT TOLERANCE IN DISTRIBUTED SYSTEMS
title_full FAULT TOLERANCE IN DISTRIBUTED SYSTEMS
title_fullStr FAULT TOLERANCE IN DISTRIBUTED SYSTEMS
title_full_unstemmed FAULT TOLERANCE IN DISTRIBUTED SYSTEMS
title_sort fault tolerance in distributed systems
publisher PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
publishDate 1988
url http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=9411@1
http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=9411@2
work_keys_str_mv AT alexandrederezendeabibe faulttoleranceindistributedsystems
AT alexandrederezendeabibe recuperacaodeerrosemsistemasdeprocessosdistribuidos
_version_ 1718986917923520512