Décrypter la réponse thérapeutique des tumeurs en intégrant des données moléculaires, pharmacologiques et cliniques à l’aide de méthodes statistiques et informatiques

Le cancer est la cause la plus fréquente de décès dans le monde, avec 8,2 millions de décès par an. Des études génomiques à grande échelle ont montré que chaque tumeur est caractérisée par un profil génomique unique, conduisant au développement de la médecine de précision, où le traitement est adapt...

Full description

Bibliographic Details
Main Author: Carene, Dimitri
Other Authors: Paris Saclay
Language:fr
Published: 2019
Subjects:
Online Access:http://www.theses.fr/2019SACLS589
Description
Summary:Le cancer est la cause la plus fréquente de décès dans le monde, avec 8,2 millions de décès par an. Des études génomiques à grande échelle ont montré que chaque tumeur est caractérisée par un profil génomique unique, conduisant au développement de la médecine de précision, où le traitement est adapté aux altérations génomiques de la tumeur du patient. Dans le cancer du sein précoce HR+/HER2-, les caractéristiques clinicopathologiques des patientes, bien qu’elles aient une valeur pronostique claire, ne sont pas suffisantes pour expliquer entièrement le risque de rechute à distance. L'objectif principal de ce projet de thèse était de déterminer les altérations génomiques impliquées dans la rechute à distance, en plus des paramètres cliniques des patientes, en utilisant des méthodes statistiques et informatiques. Ce projet a été réalisé à partir de données cliniques et génomiques (nombre de copies et mutations) issues des études PACS04 et METABRIC.Dans la première partie de mon projet de thèse, j’ai tout d’abord évalué la valeur pronostique du nombre de copies de gènes prédéfinis (FGFR1, Fibroblast Growth Factor Receptor 1 ; CCND1, Cyclin D1 ; ZNF217, Zinc Finger protein 217 ; ERBB2 ou HER2, Humain Epidermal Growth Factor) ainsi qu’un panel de mutations de gènes « driver ». Les résultats de l’étude PACS04 ont montrés que l’amplification de FGFR1 augmente le risque de rechute à distance alors que les mutations de MAP3K1 diminuent le risque de rechute. Ensuite, un score génomique fondé sur FGFR1 et MAP3K1 a été créé et a permis de déceler trois niveaux de risques de rechute à distance : risque faible (patientes ayant une mutation du gène MAP3K1), risque modéré (patientes n’ayant pas d’altération du nombre de copies de FGFR1 et n’ayant pas de mutation de MAP3K1) et risque élevé (patientes ayant une amplification de FGFR1 et n’ayant pas de mutation de MAP3K1). Enfin, ce score génomique a été validé sur une base de données publique, METABRIC. Dans la seconde partie de mon projet de thèse, de nouveaux biomarqueurs génomiques pronostiques de la survie ont pu être identifiés grâce aux méthodes pénalisées de type LASSO, prenant en compte la structure en bloc des données.Mots-clés : Altération du nombre de copies, mutations, cancer du sein, biomarqueurs, méthode de sélection de variables, réduction de dimension, modèle de Cox === Cancer is the most frequent cause of death in the world, with 8.2 million death / year. Large-scale genome studies have shown that each cancer is characterized by a unique genomic profile. This has led to the development of precision medicine, which aims at targeting treatment using tumor genomic alterations that are patient-specific. In hormone-receptor positive/human epidermal growth factor receptor-2 negative early breast cancer, clinicopathologic characteristics are not sufficient to fully explain the risk of distant relapse, despite their well-established prognostic value. The main objective of this thesis project was to use statistical and computational methods to assess to what extent genomic alterations are involved in distant breast cancer relapse in addition to classic prognostic clinicopathologic parameters. This project used clinical and genomic data (i.e., copy numbers and driver gene mutations) from the PACS04 and METABRIC trial.In the first part of my thesis project, I first evaluated prognostic value of copy numbers of predefined genes including FGFR1, Fibroblast Growth Factor Receptor 1; CCND1, Cyclin D1; ZNF217, Zinc Finger Protein 217; ERBB2 or HER2, Human Epidermal Growth Factor, as well as a panel of driver gene mutations. Results from the PACS04 trial showed that FGFR1 amplification increases the risk of distant relapse, whereas mutations of MAP3K1 decrease the risk of relapse. Second, a genomic score based on FGFR1 and MAP3K1, allowed to identify three levels of risk of distant relapse: low risk (patients with a MAP3K1 mutation), moderate risk (patients without FGFR1 copy number aberration and without MAP3K1 mutation) and high risk (patients with FGFR1 amplification and without MAP3K1 mutation). Finally, this genomic score was validated in METABRIC, a publicly available database. In the second part of my thesis project, new prognostic genomic biomarkers of survival were identified using penalized methods of LASSO type, taking into account the block structure of the data.Keywords: Copy number aberrations (CNA), mutations, breast cancer (BC), biomarkers, variable selection methods, dimension reduction, cox regression