id ndltd-DRESDEN-oai-qucosa-de-qucosa-18621
record_format oai_dc
spelling ndltd-DRESDEN-oai-qucosa-de-qucosa-186212021-03-30T05:05:54Z Efficient Broadcast for Multicast-Capable Interconnection Networks urn:nbn:de:swb:ch1-200601822 eng The broadcast function MPI_Bcast() from the MPI-1.1 standard is one of the most heavily used collective operations for the message passing programming paradigm. This diploma thesis makes use of a feature called "Multicast", which is supported by several network technologies (like Ethernet or InfiniBand), to create an efficient MPI_Bcast() implementation, especially for large communicators and small-sized messages. A preceding analysis of existing real-world applications leads to an algorithm which does not only perform well for synthetical benchmarks but also even better for a wide class of parallel applications. The finally derived broadcast has been implemented for the open source MPI library "Open MPI" using IP multicast. The achieved results prove that the new broadcast is usually always better than existing point-to-point implementations, as soon as the number of MPI processes exceeds the 8 node boundary. The performance gain reaches a factor of 4.9 on 342 nodes, because the new algorithm scales practically independently of the number of involved processes. Die Broadcastfunktion MPI_Bcast() aus dem MPI-1.1 Standard ist eine der meistgenutzten kollektiven Kommunikationsoperationen des nachrichtenbasierten Programmierparadigmas. Diese Diplomarbeit nutzt die Multicastfähigkeit, die von mehreren Netzwerktechnologien (wie Ethernet oder InfiniBand) bereitgestellt wird, um eine effiziente MPI_Bcast() Implementation zu erschaffen, insbesondere für große Kommunikatoren und kleinere Nachrichtengrößen. Eine vorhergehende Analyse von existierenden parallelen Anwendungen führte dazu, dass der neue Algorithmus nicht nur bei synthetischen Benchmarks gut abschneidet, sondern sein Potential bei echten Anwendungen noch besser entfalten kann. Der letztendlich daraus entstandene Broadcast wurde für die Open-Source MPI Bibliothek "Open MPI" entwickelt und basiert auf IP Multicast. Die erreichten Ergebnisse belegen, dass der neue Broadcast üblicherweise immer besser als jegliche Punkt-zu-Punkt Implementierungen ist, sobald die Anzahl von MPI Prozessen die Grenze von 8 Knoten überschreitet. Der Geschwindigkeitszuwachs erreicht einen Faktor von 4,9 bei 342 Knoten, da der neue Algorithmus praktisch unabhängig von der Knotenzahl skaliert. info:eu-repo/classification/ddc/004 ddc:004 Benchmark Broadcastingverfahren Cluster <Rechnernetz> Ethernet Hochleistungsrechnen MPI <Schnittstelle> Multicastingverfahren Open Source Wissenschaftliches Rechnen Collective Operations Kollektive Operationen MPI_Bcast Open MPI Siebert, Christian Rehm, Wolfgang Hoefler, Torsten Technische Universität Chemnitz 2006-11-20 2006-09-30 info:eu-repo/semantics/openAccess doc-type:masterThesis info:eu-repo/semantics/masterThesis doc-type:Text https://monarch.qucosa.de/id/qucosa%3A18621 https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-0/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-1/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-2/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-3/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-4/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-5/
collection NDLTD
language English
format Dissertation
sources NDLTD
topic info:eu-repo/classification/ddc/004
ddc:004
Benchmark
Broadcastingverfahren
Cluster <Rechnernetz>
Ethernet
Hochleistungsrechnen
MPI <Schnittstelle>
Multicastingverfahren
Open Source
Wissenschaftliches Rechnen
Collective Operations
Kollektive Operationen
MPI_Bcast
Open MPI
spellingShingle info:eu-repo/classification/ddc/004
ddc:004
Benchmark
Broadcastingverfahren
Cluster <Rechnernetz>
Ethernet
Hochleistungsrechnen
MPI <Schnittstelle>
Multicastingverfahren
Open Source
Wissenschaftliches Rechnen
Collective Operations
Kollektive Operationen
MPI_Bcast
Open MPI
Siebert, Christian
Efficient Broadcast for Multicast-Capable Interconnection Networks
description The broadcast function MPI_Bcast() from the MPI-1.1 standard is one of the most heavily used collective operations for the message passing programming paradigm. This diploma thesis makes use of a feature called "Multicast", which is supported by several network technologies (like Ethernet or InfiniBand), to create an efficient MPI_Bcast() implementation, especially for large communicators and small-sized messages. A preceding analysis of existing real-world applications leads to an algorithm which does not only perform well for synthetical benchmarks but also even better for a wide class of parallel applications. The finally derived broadcast has been implemented for the open source MPI library "Open MPI" using IP multicast. The achieved results prove that the new broadcast is usually always better than existing point-to-point implementations, as soon as the number of MPI processes exceeds the 8 node boundary. The performance gain reaches a factor of 4.9 on 342 nodes, because the new algorithm scales practically independently of the number of involved processes. === Die Broadcastfunktion MPI_Bcast() aus dem MPI-1.1 Standard ist eine der meistgenutzten kollektiven Kommunikationsoperationen des nachrichtenbasierten Programmierparadigmas. Diese Diplomarbeit nutzt die Multicastfähigkeit, die von mehreren Netzwerktechnologien (wie Ethernet oder InfiniBand) bereitgestellt wird, um eine effiziente MPI_Bcast() Implementation zu erschaffen, insbesondere für große Kommunikatoren und kleinere Nachrichtengrößen. Eine vorhergehende Analyse von existierenden parallelen Anwendungen führte dazu, dass der neue Algorithmus nicht nur bei synthetischen Benchmarks gut abschneidet, sondern sein Potential bei echten Anwendungen noch besser entfalten kann. Der letztendlich daraus entstandene Broadcast wurde für die Open-Source MPI Bibliothek "Open MPI" entwickelt und basiert auf IP Multicast. Die erreichten Ergebnisse belegen, dass der neue Broadcast üblicherweise immer besser als jegliche Punkt-zu-Punkt Implementierungen ist, sobald die Anzahl von MPI Prozessen die Grenze von 8 Knoten überschreitet. Der Geschwindigkeitszuwachs erreicht einen Faktor von 4,9 bei 342 Knoten, da der neue Algorithmus praktisch unabhängig von der Knotenzahl skaliert.
author2 Rehm, Wolfgang
author_facet Rehm, Wolfgang
Siebert, Christian
author Siebert, Christian
author_sort Siebert, Christian
title Efficient Broadcast for Multicast-Capable Interconnection Networks
title_short Efficient Broadcast for Multicast-Capable Interconnection Networks
title_full Efficient Broadcast for Multicast-Capable Interconnection Networks
title_fullStr Efficient Broadcast for Multicast-Capable Interconnection Networks
title_full_unstemmed Efficient Broadcast for Multicast-Capable Interconnection Networks
title_sort efficient broadcast for multicast-capable interconnection networks
publishDate 2006
url http://nbn-resolving.de/urn:nbn:de:swb:ch1-200601822
https://monarch.qucosa.de/id/qucosa%3A18621
https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-0/
https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-1/
https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-2/
https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-3/
https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-4/
https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-5/
work_keys_str_mv AT siebertchristian efficientbroadcastformulticastcapableinterconnectionnetworks
_version_ 1719392823577411584