Summary: | Les génomes eucaryotes sont très complexes et peuvent être très grands. Par exemple, le génome humain contient environ de 20 000 à 25 000 gènes codant pour des protéines. L'expression de ces gènes doit être strictement régulée à de nombreux niveaux (tels que l'organisation de la chromatine, la transcription des gènes, le traitement et l'exportation de l'ARN messager ainsi que la traduction) pour le bon fonctionnement de la machinerie cellulaire. De nombreuses protéines et complexes protéiques sont impliqués dans ces processus essentiels de régulation, tels que les remodeleurs de la chromatine, les activateurs, co-activateurs et répresseurs de la transcription et particulièrement la machinerie générale de transcription. Chez les eucaryotes, la transcription de gènes codant pour des protéines est appelée transcription génique de classe II, elle est catalysée par l'ARN polymérase II (Pol II). La transcription des gènes par la polymérase II nécessite l'interaction coopérative de plusieurs protéines et complexes protéiques afin de faciliter l'assemblage d'un complexe de pré-initiation (PIC) au promoteur de base. Le complexe de pré-initiation comprend l'ARN polymérase II et les facteurs de transcription généraux (GTFs) - TFIIA, TFIIB, TFIID, TFIIE, TFIIF et TFIIH ainsi que le complexe de Médiateur et une grande variété de co-activateurs transcriptionnels.Une étape fondamentale dans l'assemblage d'un complexe de pré-initiation est la reconnaissance du promoteur de base par le facteur de transcription général TFIID. TFIID est un complexe multi protéique d'environ 1,6 MDa. Chez l'homme, il comprend une vingtaine de sous-unités constituées de 14 protéines différentes - la protéine de liaison à la boite tata (TBP) et ses facteurs associés (TAFs 1 à 13). Une série d'études sur la TFIID humaine et ses sous-ensembles ont été réalisés depuis sa découverte il y a plus de 20 ans, cherchant à comprendre la structure et le mécanisme de ces facteurs de transcription général essentiel, cependant l'architecture de TFIID, ses activités, ses fonctions, ses rouages et ses mécanismes d'assemblage cellulaire reste largement incompris à ce jour.Cette thèse décrit les études biochimiques que nous avons effectuées sur trois sous-ensembles distincts de TFIID humain. Nous avons utilisé un certain nombre de techniques de biologie structurale : la cristallographie, la spectroscopie à résonance magnétique nucléaire (RMN) et la diffusion des rayons X aux petits angles (SAXs), pour étudier le complexe formé par les facteurs humains, associés à la protéine de liaison à la boite tata, TAF1 et TAF7. Ces études structurelles fournissent un aperçu détaillé sur l'interface d'interaction complexe de TAF1/TAF7, misent de concert avec des données disponibles dans la littérature, elles mettent en évidence la nature dynamique de l'interaction TAF1/TAF7 dans le complexe de TFIID humain.Dans une deuxième étude, nous avons analysé un complexe formé par TAF11, TAF13 et TBP en utilisant un panel de méthodes biophysiques et biochimiques : l'analyse électrophorétique de retard sur gel (EMSA), l'ultracentrifugation analytique (AUC), la chromatographie d'exclusion stérique (SEC) analyse, le pull-down, la spectrométrie de masse native et la spectrométrie de masse chimique à réticulation (CLMS). Ce complexe fait penser au complexe TAF1/TBP qui imite la boite tata.De plus, dans le cadre des efforts en cours au sein du laboratoire du Pr Imre Berger afin de déterminer la structure de l'holo-TFIID humaine, nous avons reconstitué un grand sous-ensemble de TFIID (900 KDa) appelé 9TAF, qui est composé de neuf différents facteurs associés de TBP. Nous avons effectué des études d'électro-microscopie par coloration négative sur le complexe 9TAF qui nous ont fourni des informations à faible résolution. Ces études ouvrent la voie à de futures études de cryo-EM sur le complexe 9TAF pour obtenir un modèle de plus haute resolution. === Eukaryotic genomes are highly complex and can be very large. For example, the human genome contains approximately 20,000-25,000 protein coding genes. Expression of these genes needs to be tightly regulated at many levels, including chromatin organization, gene transcription, mRNA processing and export and translation, for proper functioning of cellular machinery. Many proteins and protein complexes are involved in these essential regulatory processes, examples include chromatin remodelers, transcriptional activators and coactivators, transcriptional repressors and notably the general transcription machinery. Transcription of protein coding genes in eukaryotes is called Class II gene transcription, and is catalyzed by RNA polymerase II (Pol II). Gene transcription by Pol II requires the cooperative interaction of multiple proteins and protein complexes to facilitate the assembly of a preinitiation complex (PIC) at the core promoter. The PIC comprises Pol II and the General Transcription Factors (GTFs)- TFIIA, TFIIB, TFIID, TFIIE, TFIIF, and TFIIH, together with the Mediator complex and a large variety of transcriptional coactivators.A fundamental step in PIC assembly is recognition of the core promoter by GTF TFIID, a magdalton sized multiprotein complex. In humans, TFIID comprises about twenty subunits made up of 14 different proteins – the TATA box binding protein (TBP) and its associated factors (TAFs, numbered 1 to 13). A range of studies on human TFIID and its subassemblies have been carried out since its discovery more than two decades ago, to understand the structure and mechanism of this essential GTF, but the architecture of TFIID, its activities, its functions, its inner workings and the mechanisms of its cellular assembly have eluded detailed understanding to date.This thesis describes biochemical, biophysical, structural and functional studies carried out on three distinct human TFIID subassemblies. We used a number of structural biology techniques, including crystallization, nuclear magnetic resonance (NMR) spectroscopy and small angle X-ray scattering (SAXS) to analyse a complex formed by the human TBP associated factors TAF1 and TAF7. These structural studies provide detailed insights into the intricate interaction interface formed by TAF1 and TAF7, and, together with other data available from the literature, highlight the dynamic nature of the TAF1/TAF7 interaction in the human TFIID complex.In a second study, we analyzed a novel complex formed by TAF11, TAF13 and TBP using a range of biophysical and biochemical methods including electrophoretic mobility shift assay (EMSA), analytical ultracentrifugation (AUC), size exclusion chromatography (SEC) analysis, pull-down assay, native mass-spectroscopy and chemical cross-linking mass spectroscopy (CLMS). This complex is reminiscent of a so-called TATA-box mimicry discovered previously in a TAF1/TBP complex.As part of the ongoing efforts in the Berger laboratory to determine the structure of human holo-TFIID, we furthermore produced and purified a large (~900 kDa) TFIID subassembly called 9TAF, which is composed of nine different TBP associated factors. We carried out negative stain EM studies and random conical tilt (RCT) analysis on 9TAF to obtain low resolution structural information. These studies set the stage for future cryo-EM studies of this 9TAF complex to obtain a high(er) resolution model to decipher the inner workings of human TFIID.
|