Gerência de redes distribuída e confiável baseada em grupos de agentes
=== Network management systems are essential when parts of the network are non-operational. Particularly, fault management applications must be able to work correctly in the presence of network faults. Access to the management data of a crashed or unreachable network element may help to determine w...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | Portuguese |
Published: |
Universidade Federal de Minas Gerais
2004
|
Online Access: | http://hdl.handle.net/1843/RVMR-6VZMN3 |
id |
ndltd-IBICT-oai-bibliotecadigital.ufmg.br-MTD2BR-RVMR-6VZMN3 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
Portuguese |
format |
Others
|
sources |
NDLTD |
description |
=== Network management systems are essential when parts of the network are non-operational. Particularly, fault management applications must be able to work correctly in the presence of network faults. Access to the management data of a crashed or unreachable network element may help to determine why it is faulty. However, most network monitoringsystems only allow the examination of managed objects of fault-free agents. This work presents a strategy for the construction of highly available network management systems. The strategy employs data replication, a distributed and hierarchical organizational model,and the clustering approach, which allows a logical division of networks, in order to reduce the overhead of messages exchanged among network elements. The rst contribution of this thesis is the denition of an agent clustering architecture for object replication. The architecture is structured in three layers. The lower layer corresponds to typical agents at the network elements, which keep management objects at their local MIB's (Management Information Base). The middle layer corresponds tomanagement entities called cluster managers that have the task of monitoring agent's managed objects and replicating them in other clusters. The upper layer corresponds to the manager entity that denes each cluster of agents as well as the relationship among clusters. A cluster of agents provides fault-tolerant object functionality. In this way,replicated managed objects of a crashed or unreachable agent that belongs to a given cluster may be accessed through its cluster manager or one of its peer cluster managers. The second contribution of this thesis is an SNMP agent clustering framework for the Internet community. This SNMP framework describes a set of management objects that supports the replication of managed objects. The MIB called ReplicMiB specieshow to dene cluster members, replicated objects, and peer clusters of a given cluster. Furthermore, it introduces the compliance statements for the SNMP manager and cluster manager entities, i.e. which management objects need to be implemented in these SNMPentities. An example of the framework usage is introduced along with the description of the MIB objects.The third contribution of this thesis is a fault management tool based on the SNMP agent clustering framework. The tool extends the functionalities of SNMP agents to object replication and enables the access to management data replicated in the fault-free SNMP agents. The tool was built using the NET-SNMP package and the Ensemble group communication toolkit. Changes in the internal structure allow the SNMP agents to play the role of cluster managers. A group application called mcluster provides the insfrastructure for reliable communication among cluster managers and ensures the consistency of replicated managed objects. An extensive evaluation of the tool deployed at a local area network was carried out. The evaluation consisted of a resource consumption analysis, a performance analysis, and a brief study of the availability of managed objects in failure situations. === Sistemas de gerência de redes são essenciais principalmente quando partes de uma rede não estão operacionais. Em particular, aplicações de gerência de redes devem funcionar corretamente na presença de falhas na rede. O acesso aos dados de gerência de um elemento de rede falho ou inacessível pode ajudar a determinar o motivo de sua falha. Contudo, a maioria dos sistemas de monitoramento de redes apenas permite o acesso aos objetos de gerência de agentes livres de falhas. Este trabalho apresenta uma estratégia para a construção de sistemas de gerência de redes altamente disponíveis. A estratégia emprega replicação de dados, um modelo organizacional hierárquico e distribuído, e a uso da abordagem de agrupamento, que permite uma divisão lógica das redes, a fim de reduzir a sobrecarga de mensagens trocada entre os elementos da rede. A primeira contribuição da tese é a definição de uma arquitetura de agrupamento de agentes para a replicação de objetos de gerência. A arquitetura é estruturada em três camadas. A camada inferior corresponde aos tradicionais agentes nos elementos da rede, que mantêm os objetos de gerência nas suas MIB´s (Management Information Base) locais. A camada intermediária corresponde as entidades de gerência chamadas gerentes de cluster que têm a tarefa de monitorar os objetos de gerência dos agentes e replicar tais objetos em outros gerentes de cluster. A camada superior corresponde a entidade gerente que define cada cluster de agentes assim como a relação entre esses clusters. Um cluster de agentes oferece funcionalidade de objetos tolerante a falhas. Desta maneira, objetos de gerência replicados de um agente falho ou inalcançável que a pertença a um dado cluster podem ser acessados através de seu gerente de cluster ou através de um dos seus clusters pares.A segunda contribuição da tese é um framework de agrupamento de agentes SNMP para a comunidade Internet. Este framework SNMP descreve a conjunto de objetos de gerência que suporta a replicação dos objetos de gerência. A MIB chamada ReplicMIB especifica como definir os membros de cluster, os objetos replicados, e os clusters pares de um dado cluster. Um exemplo quanto ao uso do framework é mostrado junto com a descrição dos objetos da MIB. A terceira contribuição da tese é uma ferramenta de gerência de falhas baseada no framework no framework de agrupamento de agentes SNMP. A ferramenta estende as funcionalidades dos agentes SNMP a fim de replicar objetos de gerência, e também possibilita o acesso aos dados de gerência replicados em agentes SNMP livres de falhas. A ferramenta foi construída usando os softwares de domínio público NET-SNMP e Ensemble. Modificações na estrutura interna permitem que os agentes SNMP atuem como gerentes de cluster. Uma aplicação de comunicação de grupo chamada mcluster garante a infraestrutura para uma comunicação confiável entre os gerentes de cluster e assegura assim a consistência dos objetos de gerência replicados. Uma extensiva avaliação desta ferramenta foi realizada numa rede local. A avaliação consistiu de uma análise dos recursos consumidos, uma análise de desempenho, e um breve estudo da disponibilidade dos objetos de gerência em situações de falhas. |
author2 |
Jose Marcos Silva Nogueira |
author_facet |
Jose Marcos Silva Nogueira Aldri Luiz dos Santos |
author |
Aldri Luiz dos Santos |
spellingShingle |
Aldri Luiz dos Santos Gerência de redes distribuída e confiável baseada em grupos de agentes |
author_sort |
Aldri Luiz dos Santos |
title |
Gerência de redes distribuída e confiável baseada em grupos de agentes |
title_short |
Gerência de redes distribuída e confiável baseada em grupos de agentes |
title_full |
Gerência de redes distribuída e confiável baseada em grupos de agentes |
title_fullStr |
Gerência de redes distribuída e confiável baseada em grupos de agentes |
title_full_unstemmed |
Gerência de redes distribuída e confiável baseada em grupos de agentes |
title_sort |
gerência de redes distribuída e confiável baseada em grupos de agentes |
publisher |
Universidade Federal de Minas Gerais |
publishDate |
2004 |
url |
http://hdl.handle.net/1843/RVMR-6VZMN3 |
work_keys_str_mv |
AT aldriluizdossantos gerenciaderedesdistribuidaeconfiavelbaseadaemgruposdeagentes |
_version_ |
1718844311110418432 |
spelling |
ndltd-IBICT-oai-bibliotecadigital.ufmg.br-MTD2BR-RVMR-6VZMN32019-01-21T17:55:02Z Gerência de redes distribuída e confiável baseada em grupos de agentes Aldri Luiz dos Santos Jose Marcos Silva Nogueira Antonio Alfredo Ferreira Loureiro Dorgival Olavo Guedes Neto Network management systems are essential when parts of the network are non-operational. Particularly, fault management applications must be able to work correctly in the presence of network faults. Access to the management data of a crashed or unreachable network element may help to determine why it is faulty. However, most network monitoringsystems only allow the examination of managed objects of fault-free agents. This work presents a strategy for the construction of highly available network management systems. The strategy employs data replication, a distributed and hierarchical organizational model,and the clustering approach, which allows a logical division of networks, in order to reduce the overhead of messages exchanged among network elements. The rst contribution of this thesis is the denition of an agent clustering architecture for object replication. The architecture is structured in three layers. The lower layer corresponds to typical agents at the network elements, which keep management objects at their local MIB's (Management Information Base). The middle layer corresponds tomanagement entities called cluster managers that have the task of monitoring agent's managed objects and replicating them in other clusters. The upper layer corresponds to the manager entity that denes each cluster of agents as well as the relationship among clusters. A cluster of agents provides fault-tolerant object functionality. In this way,replicated managed objects of a crashed or unreachable agent that belongs to a given cluster may be accessed through its cluster manager or one of its peer cluster managers. The second contribution of this thesis is an SNMP agent clustering framework for the Internet community. This SNMP framework describes a set of management objects that supports the replication of managed objects. The MIB called ReplicMiB specieshow to dene cluster members, replicated objects, and peer clusters of a given cluster. Furthermore, it introduces the compliance statements for the SNMP manager and cluster manager entities, i.e. which management objects need to be implemented in these SNMPentities. An example of the framework usage is introduced along with the description of the MIB objects.The third contribution of this thesis is a fault management tool based on the SNMP agent clustering framework. The tool extends the functionalities of SNMP agents to object replication and enables the access to management data replicated in the fault-free SNMP agents. The tool was built using the NET-SNMP package and the Ensemble group communication toolkit. Changes in the internal structure allow the SNMP agents to play the role of cluster managers. A group application called mcluster provides the insfrastructure for reliable communication among cluster managers and ensures the consistency of replicated managed objects. An extensive evaluation of the tool deployed at a local area network was carried out. The evaluation consisted of a resource consumption analysis, a performance analysis, and a brief study of the availability of managed objects in failure situations. Sistemas de gerência de redes são essenciais principalmente quando partes de uma rede não estão operacionais. Em particular, aplicações de gerência de redes devem funcionar corretamente na presença de falhas na rede. O acesso aos dados de gerência de um elemento de rede falho ou inacessível pode ajudar a determinar o motivo de sua falha. Contudo, a maioria dos sistemas de monitoramento de redes apenas permite o acesso aos objetos de gerência de agentes livres de falhas. Este trabalho apresenta uma estratégia para a construção de sistemas de gerência de redes altamente disponíveis. A estratégia emprega replicação de dados, um modelo organizacional hierárquico e distribuído, e a uso da abordagem de agrupamento, que permite uma divisão lógica das redes, a fim de reduzir a sobrecarga de mensagens trocada entre os elementos da rede. A primeira contribuição da tese é a definição de uma arquitetura de agrupamento de agentes para a replicação de objetos de gerência. A arquitetura é estruturada em três camadas. A camada inferior corresponde aos tradicionais agentes nos elementos da rede, que mantêm os objetos de gerência nas suas MIB´s (Management Information Base) locais. A camada intermediária corresponde as entidades de gerência chamadas gerentes de cluster que têm a tarefa de monitorar os objetos de gerência dos agentes e replicar tais objetos em outros gerentes de cluster. A camada superior corresponde a entidade gerente que define cada cluster de agentes assim como a relação entre esses clusters. Um cluster de agentes oferece funcionalidade de objetos tolerante a falhas. Desta maneira, objetos de gerência replicados de um agente falho ou inalcançável que a pertença a um dado cluster podem ser acessados através de seu gerente de cluster ou através de um dos seus clusters pares.A segunda contribuição da tese é um framework de agrupamento de agentes SNMP para a comunidade Internet. Este framework SNMP descreve a conjunto de objetos de gerência que suporta a replicação dos objetos de gerência. A MIB chamada ReplicMIB especifica como definir os membros de cluster, os objetos replicados, e os clusters pares de um dado cluster. Um exemplo quanto ao uso do framework é mostrado junto com a descrição dos objetos da MIB. A terceira contribuição da tese é uma ferramenta de gerência de falhas baseada no framework no framework de agrupamento de agentes SNMP. A ferramenta estende as funcionalidades dos agentes SNMP a fim de replicar objetos de gerência, e também possibilita o acesso aos dados de gerência replicados em agentes SNMP livres de falhas. A ferramenta foi construída usando os softwares de domínio público NET-SNMP e Ensemble. Modificações na estrutura interna permitem que os agentes SNMP atuem como gerentes de cluster. Uma aplicação de comunicação de grupo chamada mcluster garante a infraestrutura para uma comunicação confiável entre os gerentes de cluster e assegura assim a consistência dos objetos de gerência replicados. Uma extensiva avaliação desta ferramenta foi realizada numa rede local. A avaliação consistiu de uma análise dos recursos consumidos, uma análise de desempenho, e um breve estudo da disponibilidade dos objetos de gerência em situações de falhas. 2004-04-18 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis http://hdl.handle.net/1843/RVMR-6VZMN3 por info:eu-repo/semantics/openAccess text/html Universidade Federal de Minas Gerais 32001010004P6 - CIÊNCIA DA COMPUTAÇÃO UFMG BR reponame:Biblioteca Digital de Teses e Dissertações da UFMG instname:Universidade Federal de Minas Gerais instacron:UFMG |