FAULT TOLERANCE IN DISTRIBUTED SYSTEMS
Esta dissertação aborda o problema da recuperação de erros em sistemas distribuídos. Inicialmente, é feita uma breve análise sobre a origem deste problema e as soluções encontradas. Alguns métodos de resolução são então apresentados. Para a simulação do sistema distribuído foi desenvolvido um n...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
1988
|
Online Access: | http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=9411@1 http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=9411@2 |
Summary: | Esta dissertação aborda o problema da recuperação de erros
em sistemas distribuídos. Inicialmente, é feita uma breve
análise sobre a origem deste problema e as soluções
encontradas. Alguns métodos de resolução são então
apresentados. Para a simulação do sistema distribuído foi
desenvolvido um núcleo multi-tarefa numa máquina
compatível com o PC-IBM-XT, utilizando o MS-DOS (versão
3.0 ou acima) como servidor. Finalmente, são apresentadas
duas propostas. A primeira visa fornecer a um processo
recursos que possibilitem a recuperação por retorno. A
segunda utiliza redundância em um conjunto de processos em
diferentes estações para garantir que o sistema como um
todo continue operativo, mesmo com uma estação de falha === This dissertation deals with the problem of fault
tolerance in distributed systems. Initially, a brief
analysis on the origins of this problem and its solutions
is made. Some of the resolutions methods are then
presented. In order to simulate a distributed system, a
multi tasking operating system kernel was developed in an
IBM PC-XT compatible machine, making use of the MS-DOS
(version 3.0 or above) as a server. Finally, two proposals
are presented. The first, is intended to supply a process
with resources that allow recovery in case of algorithmic
faults, making use of the backward error recovery method.
The second, uses redundancy in a set of processes over
different stations in order to warrant that the system as
a whole keeps operative, even with a faulty s |
---|