Efficient Broadcast for Multicast-Capable Interconnection Networks
The broadcast function MPI_Bcast() from the MPI-1.1 standard is one of the most heavily used collective operations for the message passing programming paradigm. This diploma thesis makes use of a feature called "Multicast", which is supported by several network technologies (like Ethernet...
Main Author: | |
---|---|
Other Authors: | |
Format: | Dissertation |
Language: | English |
Published: |
2006
|
Subjects: | |
Online Access: | http://nbn-resolving.de/urn:nbn:de:swb:ch1-200601822 https://monarch.qucosa.de/id/qucosa%3A18621 https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-0/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-1/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-2/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-3/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-4/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-5/ |
id |
ndltd-DRESDEN-oai-qucosa-de-qucosa-18621 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-DRESDEN-oai-qucosa-de-qucosa-186212021-03-30T05:05:54Z Efficient Broadcast for Multicast-Capable Interconnection Networks urn:nbn:de:swb:ch1-200601822 eng The broadcast function MPI_Bcast() from the MPI-1.1 standard is one of the most heavily used collective operations for the message passing programming paradigm. This diploma thesis makes use of a feature called "Multicast", which is supported by several network technologies (like Ethernet or InfiniBand), to create an efficient MPI_Bcast() implementation, especially for large communicators and small-sized messages. A preceding analysis of existing real-world applications leads to an algorithm which does not only perform well for synthetical benchmarks but also even better for a wide class of parallel applications. The finally derived broadcast has been implemented for the open source MPI library "Open MPI" using IP multicast. The achieved results prove that the new broadcast is usually always better than existing point-to-point implementations, as soon as the number of MPI processes exceeds the 8 node boundary. The performance gain reaches a factor of 4.9 on 342 nodes, because the new algorithm scales practically independently of the number of involved processes. Die Broadcastfunktion MPI_Bcast() aus dem MPI-1.1 Standard ist eine der meistgenutzten kollektiven Kommunikationsoperationen des nachrichtenbasierten Programmierparadigmas. Diese Diplomarbeit nutzt die Multicastfähigkeit, die von mehreren Netzwerktechnologien (wie Ethernet oder InfiniBand) bereitgestellt wird, um eine effiziente MPI_Bcast() Implementation zu erschaffen, insbesondere für große Kommunikatoren und kleinere Nachrichtengrößen. Eine vorhergehende Analyse von existierenden parallelen Anwendungen führte dazu, dass der neue Algorithmus nicht nur bei synthetischen Benchmarks gut abschneidet, sondern sein Potential bei echten Anwendungen noch besser entfalten kann. Der letztendlich daraus entstandene Broadcast wurde für die Open-Source MPI Bibliothek "Open MPI" entwickelt und basiert auf IP Multicast. Die erreichten Ergebnisse belegen, dass der neue Broadcast üblicherweise immer besser als jegliche Punkt-zu-Punkt Implementierungen ist, sobald die Anzahl von MPI Prozessen die Grenze von 8 Knoten überschreitet. Der Geschwindigkeitszuwachs erreicht einen Faktor von 4,9 bei 342 Knoten, da der neue Algorithmus praktisch unabhängig von der Knotenzahl skaliert. info:eu-repo/classification/ddc/004 ddc:004 Benchmark Broadcastingverfahren Cluster <Rechnernetz> Ethernet Hochleistungsrechnen MPI <Schnittstelle> Multicastingverfahren Open Source Wissenschaftliches Rechnen Collective Operations Kollektive Operationen MPI_Bcast Open MPI Siebert, Christian Rehm, Wolfgang Hoefler, Torsten Technische Universität Chemnitz 2006-11-20 2006-09-30 info:eu-repo/semantics/openAccess doc-type:masterThesis info:eu-repo/semantics/masterThesis doc-type:Text https://monarch.qucosa.de/id/qucosa%3A18621 https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-0/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-1/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-2/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-3/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-4/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-5/ |
collection |
NDLTD |
language |
English |
format |
Dissertation |
sources |
NDLTD |
topic |
info:eu-repo/classification/ddc/004 ddc:004 Benchmark Broadcastingverfahren Cluster <Rechnernetz> Ethernet Hochleistungsrechnen MPI <Schnittstelle> Multicastingverfahren Open Source Wissenschaftliches Rechnen Collective Operations Kollektive Operationen MPI_Bcast Open MPI |
spellingShingle |
info:eu-repo/classification/ddc/004 ddc:004 Benchmark Broadcastingverfahren Cluster <Rechnernetz> Ethernet Hochleistungsrechnen MPI <Schnittstelle> Multicastingverfahren Open Source Wissenschaftliches Rechnen Collective Operations Kollektive Operationen MPI_Bcast Open MPI Siebert, Christian Efficient Broadcast for Multicast-Capable Interconnection Networks |
description |
The broadcast function MPI_Bcast() from the
MPI-1.1 standard is one of the most heavily
used collective operations for the message
passing programming paradigm.
This diploma thesis makes use of a feature called
"Multicast", which is supported by several
network technologies (like Ethernet or
InfiniBand), to create an efficient MPI_Bcast()
implementation, especially for large communicators
and small-sized messages.
A preceding analysis of existing real-world
applications leads to an algorithm which does not
only perform well for synthetical benchmarks
but also even better for a wide class of
parallel applications. The finally derived
broadcast has been implemented for the
open source MPI library "Open MPI" using
IP multicast.
The achieved results prove that
the new broadcast is usually always better
than existing point-to-point implementations,
as soon as the number of MPI processes exceeds the
8 node boundary. The performance gain reaches
a factor of 4.9 on 342 nodes, because the
new algorithm scales practically independently
of the number of involved processes. === Die Broadcastfunktion MPI_Bcast() aus dem MPI-1.1
Standard ist eine der meistgenutzten kollektiven
Kommunikationsoperationen des nachrichtenbasierten
Programmierparadigmas.
Diese Diplomarbeit nutzt die Multicastfähigkeit,
die von mehreren Netzwerktechnologien (wie Ethernet
oder InfiniBand) bereitgestellt wird, um eine
effiziente MPI_Bcast() Implementation zu erschaffen,
insbesondere für große Kommunikatoren und kleinere
Nachrichtengrößen.
Eine vorhergehende Analyse von existierenden
parallelen Anwendungen führte dazu, dass der neue
Algorithmus nicht nur bei synthetischen Benchmarks
gut abschneidet, sondern sein Potential bei echten
Anwendungen noch besser entfalten kann. Der
letztendlich daraus entstandene Broadcast wurde
für die Open-Source MPI Bibliothek "Open MPI"
entwickelt und basiert auf IP Multicast.
Die erreichten Ergebnisse belegen, dass der neue
Broadcast üblicherweise immer besser als jegliche
Punkt-zu-Punkt Implementierungen ist, sobald die
Anzahl von MPI Prozessen die Grenze von 8 Knoten
überschreitet. Der Geschwindigkeitszuwachs
erreicht einen Faktor von 4,9 bei 342 Knoten,
da der neue Algorithmus praktisch unabhängig
von der Knotenzahl skaliert. |
author2 |
Rehm, Wolfgang |
author_facet |
Rehm, Wolfgang Siebert, Christian |
author |
Siebert, Christian |
author_sort |
Siebert, Christian |
title |
Efficient Broadcast for Multicast-Capable Interconnection Networks |
title_short |
Efficient Broadcast for Multicast-Capable Interconnection Networks |
title_full |
Efficient Broadcast for Multicast-Capable Interconnection Networks |
title_fullStr |
Efficient Broadcast for Multicast-Capable Interconnection Networks |
title_full_unstemmed |
Efficient Broadcast for Multicast-Capable Interconnection Networks |
title_sort |
efficient broadcast for multicast-capable interconnection networks |
publishDate |
2006 |
url |
http://nbn-resolving.de/urn:nbn:de:swb:ch1-200601822 https://monarch.qucosa.de/id/qucosa%3A18621 https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-0/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-1/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-2/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-3/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-4/ https://monarch.qucosa.de/api/qucosa%3A18621/attachment/ATT-5/ |
work_keys_str_mv |
AT siebertchristian efficientbroadcastformulticastcapableinterconnectionnetworks |
_version_ |
1719392823577411584 |