Summary: | Cette thèse étudie trois sujets relevant de la biologie structurale, de lagénétique et de l'immunologie.Premièrement, nous développons de nouveaux prédicteurs de l'affinité deliaison de complexes protéiques, produisant des résultats de niveau ``état del'art''. Nous calculons d'abord 12 variables modélisant diverses propriétésstructurales des complexes. Nous générons et évaluons des estimateursutilisant des sous ensembles de ces variables, de façon à identifier les plusperformants. Le logiciel associé est distribué dans la Structural BioinformaticsLibrary.Deuxièmement, nous proposons de nouvelles analyses de complexes Ig-Ag.D'une part nous concevons un classificateur distinguant les types de ligand desIg. D'autre part, nous montrons que le modèle précédent prédit fidèlementl'affinité de complexes Ig-Ag. Enfin, nous quantifions la contribution des CDR3de la chaine lourde à l'affinité de liaison, et montrons qu'il contribuesignificativement plus que les autres CDR.Enfin, nous nous intéressons à la modélisation de la diversité des répertoiresde chaîne lourde des Igs, à partir de données de séquençage de CDR3, dans unmodèle de vaccin chez le poisson. Nous analysons les répertoires dans troisconditions: naifs, vaccinés et vaccinés + infectés. Nous comparons lesrépertoires de deux individus en utilisant la « earth-mover distance », laquelleexploite la correspondance entre clonotypes de deux répertoires, révélant ainsides informations inaccessibles aux méthodes basées sur les indices dediversité.Dépôt de thèseDonnées complémentairesPour caractériser la notion de réponse immunitaire publique / privée, nousquantifions le chevauchement des clonotypes exprimés entre individus de lamême ou de différentes conditions === This thesis investigates three topics at the cross-roads of structural biology,genetics and immunology.First, we develop a pipeline to design and select binding affinity predictors forprotein complexes, yielding state-of-the art results. The first step is the designand computation of 12 different variables accounting for geometric andphysico-chemical properties of the complexes. The second step is thegeneration and evaluation of models using subsets of these variables, followedby the selection of the best performing ones. The corresponding software isdistributed within the Structural Bioinformatics Library.Second, we provide an analysis of the interface properties of Ig-Ag complexes.In particular, we design a classifier using two descriptors, which is able todistinguish ligand types. We also apply the previous binding affinity predictionmodel to Ig-Ag complexes and obtain accurate predictions. We then develop aquantitative model for the contribution of VH CDR3 to the binding affinity andinteraction specificity, and show that it contributes significantly more thanother CDRs.Third, we model the diversity of VH CDR3 repertoires from Ig RNA sequencingdata in a fish vaccination model. We analyze repertoires from three conditions:naive, vaccinated and vaccinated + infected fish. Comparison of the repertoiresof two individuals uses the earth-mover distance (EMD). By exploiting amapping between the clonotypes of the repertoires, we show that EMD revealsinformation beyond classical methods based on diversity indexes. Tocharacterize the notion of public / private immune response, we quantify theoverlap of clonotypes between individuals of the same or different conditions
|