Améliorer la performance séquentielle à l’ère des processeurs massivement multicœurs

L'omniprésence des ordinateurs et la demande de toujours plus de puissance poussent les architectes processeur à chercher des moyens d'augmenter les performances de ces processeurs. La tendance actuelle est de répliquer sur une même puce plusieurs cœurs d'exécution pour paralléliser l...

Full description

Bibliographic Details
Main Author:	Prémillieu, Nathanaël
Other Authors:	Rennes 1
Language:	fr
Published:	2013
Subjects:	Architecture des processeurs Prédiction de branchements Reconvergence Indépendance de contrôle Instructions prédiquées Rejeu sélectif Processor architecture Branch prediction Reconvergence : control independence Predicated instructions Selective replay
Online Access:	http://www.theses.fr/2013REN1S071/document

id	ndltd-theses.fr-2013REN1S071
record_format	oai_dc
collection	NDLTD
language	fr
sources	NDLTD
topic	Architecture des processeurs Prédiction de branchements Reconvergence Indépendance de contrôle Instructions prédiquées Rejeu sélectif Processor architecture Branch prediction Reconvergence : control independence Predicated instructions Selective replay
spellingShingle	Architecture des processeurs Prédiction de branchements Reconvergence Indépendance de contrôle Instructions prédiquées Rejeu sélectif Processor architecture Branch prediction Reconvergence : control independence Predicated instructions Selective replay Prémillieu, Nathanaël Améliorer la performance séquentielle à l’ère des processeurs massivement multicœurs
description	L'omniprésence des ordinateurs et la demande de toujours plus de puissance poussent les architectes processeur à chercher des moyens d'augmenter les performances de ces processeurs. La tendance actuelle est de répliquer sur une même puce plusieurs cœurs d'exécution pour paralléliser l'exécution. Si elle se poursuit, les processeurs deviendront massivement multicoeurs avec plusieurs centaines voire un millier de cœurs disponibles. Cependant, la loi d'Amdahl nous rappelle que l'augmentation de la performance séquentielle sera toujours nécessaire pour améliorer les performances globales. Une voie essentielle pour accroître la performance séquentielle est de perfectionner le traitement des branchements, ceux-ci limitant le parallélisme d'instructions. La prédiction de branchements est la solution la plus étudiée, dont l'intérêt dépend essentiellement de la précision du prédicteur. Au cours des dernières années, cette précision a été continuellement améliorée et a atteint un seuil qu'il semble difficile de dépasser. Une autre solution est d'éliminer les branchements et de les remplacer par une construction reposant sur des instructions prédiquées. L'exécution des instructions prédiquées pose cependant plusieurs problèmes dans les processeurs à exécution dans le désordre, en particulier celui des définitions multiples. Les travaux présentés dans cette thèse explorent ces deux aspects du traitement des branchements. La première partie s'intéresse à la prédiction de branchements. Une solution pour améliorer celle-ci sans augmenter la précision est de réduire le coût d'une mauvaise prédiction. Cela est possible en exploitant la reconvergence de flot de contrôle et l'indépendance de contrôle pour récupérer une partie du travail fait par le processeur sur le mauvais chemin sur les instructions communes aux deux chemins pour éviter de le refaire sur le bon chemin. La deuxième partie s'intéresse aux instructions prédiquées. Nous proposons une solution au problème des définitions multiples qui passe par la prédiction sélective de la valeur des prédicats. Un mécanisme de rejeu sélectif est utilisé pour réduire le coût d'une mauvaise prédiction de prédicat. === Computers are everywhere and the need for always more computation power has pushed the processor architects to find new ways to increase performance. The today's tendency is to replicate execution core on the same die to parallelize the execution. If it goes on, processors will become manycores featuring hundred to a thousand cores. However, Amdahl's law reminds us that increasing the sequential performance will always be vital to increase global performance. A perfect way to increase sequential performance is to improve how branches are executed because they limit instruction level parallelism. The branch prediction is the most studied solution, its interest greatly depending on its accuracy. In the last years, this accuracy has been continuously improved up to reach a hardly exceeding limit. An other solution is to suppress the branches by replacing them with a construct based on predicated instructions. However, the execution of predicated instructions on out-of-order processors comes up with several problems like the multiple definition problem. This study investigates these two aspects of the branch treatment. The first part is about branch prediction. A way to improve it without increasing the accuracy is to reduce the coast of a branch misprediction. This is possible by exploiting control flow reconvergence and control independence. The work done on the wrong path on instructions common to the two paths is saved to be reused on the correct path. The second part is about predicated instructions. We propose a solution to the multiple definition problem by selectively predicting the predicate values. A selective replay mechanism is used to reduce the cost of a predicate misprediction.
author2	Rennes 1
author_facet	Rennes 1 Prémillieu, Nathanaël
author	Prémillieu, Nathanaël
author_sort	Prémillieu, Nathanaël
title	Améliorer la performance séquentielle à l’ère des processeurs massivement multicœurs
title_short	Améliorer la performance séquentielle à l’ère des processeurs massivement multicœurs
title_full	Améliorer la performance séquentielle à l’ère des processeurs massivement multicœurs
title_fullStr	Améliorer la performance séquentielle à l’ère des processeurs massivement multicœurs
title_full_unstemmed	Améliorer la performance séquentielle à l’ère des processeurs massivement multicœurs
title_sort	améliorer la performance séquentielle à l’ère des processeurs massivement multicœurs
publishDate	2013
url	http://www.theses.fr/2013REN1S071/document
work_keys_str_mv	AT premillieunathanael ameliorerlaperformancesequentiellealeredesprocesseursmassivementmulticœurs AT premillieunathanael increasesequentialperformanceinthemanycoreera
_version_	1718479282609586176
spelling	ndltd-theses.fr-2013REN1S0712017-06-29T04:34:25Z Améliorer la performance séquentielle à l’ère des processeurs massivement multicœurs Increase Sequential Performance in the Manycore Era Architecture des processeurs Prédiction de branchements Reconvergence Indépendance de contrôle Instructions prédiquées Rejeu sélectif Processor architecture Branch prediction Reconvergence : control independence Predicated instructions Selective replay L'omniprésence des ordinateurs et la demande de toujours plus de puissance poussent les architectes processeur à chercher des moyens d'augmenter les performances de ces processeurs. La tendance actuelle est de répliquer sur une même puce plusieurs cœurs d'exécution pour paralléliser l'exécution. Si elle se poursuit, les processeurs deviendront massivement multicoeurs avec plusieurs centaines voire un millier de cœurs disponibles. Cependant, la loi d'Amdahl nous rappelle que l'augmentation de la performance séquentielle sera toujours nécessaire pour améliorer les performances globales. Une voie essentielle pour accroître la performance séquentielle est de perfectionner le traitement des branchements, ceux-ci limitant le parallélisme d'instructions. La prédiction de branchements est la solution la plus étudiée, dont l'intérêt dépend essentiellement de la précision du prédicteur. Au cours des dernières années, cette précision a été continuellement améliorée et a atteint un seuil qu'il semble difficile de dépasser. Une autre solution est d'éliminer les branchements et de les remplacer par une construction reposant sur des instructions prédiquées. L'exécution des instructions prédiquées pose cependant plusieurs problèmes dans les processeurs à exécution dans le désordre, en particulier celui des définitions multiples. Les travaux présentés dans cette thèse explorent ces deux aspects du traitement des branchements. La première partie s'intéresse à la prédiction de branchements. Une solution pour améliorer celle-ci sans augmenter la précision est de réduire le coût d'une mauvaise prédiction. Cela est possible en exploitant la reconvergence de flot de contrôle et l'indépendance de contrôle pour récupérer une partie du travail fait par le processeur sur le mauvais chemin sur les instructions communes aux deux chemins pour éviter de le refaire sur le bon chemin. La deuxième partie s'intéresse aux instructions prédiquées. Nous proposons une solution au problème des définitions multiples qui passe par la prédiction sélective de la valeur des prédicats. Un mécanisme de rejeu sélectif est utilisé pour réduire le coût d'une mauvaise prédiction de prédicat. Computers are everywhere and the need for always more computation power has pushed the processor architects to find new ways to increase performance. The today's tendency is to replicate execution core on the same die to parallelize the execution. If it goes on, processors will become manycores featuring hundred to a thousand cores. However, Amdahl's law reminds us that increasing the sequential performance will always be vital to increase global performance. A perfect way to increase sequential performance is to improve how branches are executed because they limit instruction level parallelism. The branch prediction is the most studied solution, its interest greatly depending on its accuracy. In the last years, this accuracy has been continuously improved up to reach a hardly exceeding limit. An other solution is to suppress the branches by replacing them with a construct based on predicated instructions. However, the execution of predicated instructions on out-of-order processors comes up with several problems like the multiple definition problem. This study investigates these two aspects of the branch treatment. The first part is about branch prediction. A way to improve it without increasing the accuracy is to reduce the coast of a branch misprediction. This is possible by exploiting control flow reconvergence and control independence. The work done on the wrong path on instructions common to the two paths is saved to be reused on the correct path. The second part is about predicated instructions. We propose a solution to the multiple definition problem by selectively predicting the predicate values. A selective replay mechanism is used to reduce the cost of a predicate misprediction. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2013REN1S071/document Prémillieu, Nathanaël 2013-12-03 Rennes 1 Seznec, André

Améliorer la performance séquentielle à l’ère des processeurs massivement multicœurs

Similar Items