Allele-specific analyses of gene expression and chromatin state yield new insights into cis-regulatory mechanisms and their role in complex disease

Cis-regulatory variants are predicted to mediate the majority of the known common genetic associations to complex disease, yet the specific causal variants and the corresponding cis-regulatory mechanisms have thus far been poorly characterized. We attempted to address this by using allele-specific a...

Full description

Bibliographic Details
Main Author: Light, Nicholas
Other Authors: Tomi Markku Pastinen (Internal/Supervisor)
Format: Others
Language:en
Published: McGill University 2014
Subjects:
Online Access:http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=121378
id ndltd-LACETR-oai-collectionscanada.gc.ca-QMM.121378
record_format oai_dc
collection NDLTD
language en
format Others
sources NDLTD
topic Biology - Genetics
spellingShingle Biology - Genetics
Light, Nicholas
Allele-specific analyses of gene expression and chromatin state yield new insights into cis-regulatory mechanisms and their role in complex disease
description Cis-regulatory variants are predicted to mediate the majority of the known common genetic associations to complex disease, yet the specific causal variants and the corresponding cis-regulatory mechanisms have thus far been poorly characterized. We attempted to address this by using allele-specific analyses of gene expression and chromatin marks assessed in diverse populations of human cells. The first chapter of this thesis is a review of the literature. The second chapter describes an allele-specific (AS) expression study we performed using 4 large population cohorts of human cells. We mapped SNPs associated to differential allelic-expression (AE) of protein coding and non-coding (nc) genes in 3 distinct cell-types (lymphoblasts, monocytes, and fibroblasts) revealing that ~60-70% of cis-rSNPs originally mapped in each cell-type show strong evidence of tissue-independence. We observed cell-type specificity of cis-regulatory SNPs to be reflective of chromatin activity from the same cell-type using ChIP-seq for active histone marks. We find the same proportion of cis-regulated transcripts between lincRNAs and classical genes, indicating shared regulatory mechanisms. Lastly, cis-regulatory variants were enriched for SNPs in high LD with genome-wide association study (GWAS) hits. The third chapter builds on the allelic-expression work described in the second chapter through the allele-specific assessment of chromatin state via ChIP –genotyping in 20 human cell lines, providing the first genome-wide maps of allelic imbalance for five histone marks. We performed parallel analyses of input DNA and histone modification chromatin immunoprecipitates (ChIP) on high-density Illumina genotyping arrays. AS-ChIP SNPs were combined into allelic chromatin domains with validation performed using high-confidence AS sites generated using ChIP-seq. We observed a characteristic pattern of allelic-imbalance for each histone-modification we tested (H3K4me1, H3K4me3, H3K27ac, H3K27me3, and H3K36me3) around allele-specifically expressed transcripts. Notably, we found H3K4me1 to be significantly anti-correlated with H3K4me3 and allelic expression (AE) at transcription start sites, indicating H3K4me1/H3K4me3 anti-correlation at the TSS as a marker of AE. Finally, we identified regions of allelic-chromatin strongly suggestive of allelic transcription in previously unannotated regions. Altogether, our work reinforces the power of allelic analyses for investigating cis-regulatory mechanisms of disease-associated regulatory variants. === La majorité des variant communs associés aux maladies complexes sont prédis pour être régulateurs en cis (cis-rSNPs), cependant le variant causal ainsi que les mécanismes impliqués sont rarement connus. Nous avons essayé de résoudre ce problème par l'analyse de données d'expression allélique (AS) de gènes et de marques chromatiniennes dans différentes populations cellulaires humaines. Le premier chapitre de cette thèse est une revue de la littérature. Le seconde chapitre décrit la cartographie de SNPs associés à des différences d'expression allélique de gène codant et non-codant dans 3 types cellulaires (lymphoblastes, monocytes et fibroblastes). Cette étude révèle que jusqu'a 60/70% des cis-rSNPs cartographiés ont une action tissus-indépendante. Nous avons observé une corrélation entre l'activité spécifique d'un cis-rSNP et la structure chromatinienne d'un même type cellulaire. Nous avons également retrouvé la même proportion de lincRNA et de gène classiques dont l'expression était régulée en cis suggérant des mécanismes régulateurs commun. Enfin, nous avons mis en évidence un enrichissement des cis-rSNPs en fort linkage desequilibrium avec des variant associés à des maladies complexes. Le troisième chapitre présente une étude des états chromatiniens réalisée à partir d'expériences d'immunoprécipitation de la chromatine (ChIP) suivie de génotypage dans 20 lignées cellulaires humaines et basée sur les précédents résultats d'expression allélique. Nous avons ainsi généré la première carte à l'échelle du génome des déséquilibres allélique de 5 marques d'histones. Nous avons analysés en parallèle l'input et l'ADN associé aux différentes modifications d'histone immunoprécipités sur puces de génotypage Illumina à haute densité permettant ainsi l'évaluation d'un possible biais allélique pour les SNPs hétérozygotes (=AS-ChIP SNPs). Les données des variants AS-ChIPs pour chaque marque d'histone ont été combinées pour former des domaines chromatiniens avec biais allélique et validés par des expériences complémentaires de ChIP-seq. Nous avons observés des profils de déséquilibre allélique spécifique à chaque marque d'histone testé (H3K4me1, H3K4me3, H3K27ac, H3K27me3, and H3K36me3) dans le voisinage des transcrits régulés de façon allèle-spécifique. Notamment, nous avons mis en évidence que le signal de H3K4me1 était négativement et significativement corrélé avec H3K4me3 et le niveau d'expression des gènes aux sites d'initiation de la transcription (TSS). Ces résultats suggèrent que la corrélation négative entre H3K4me1 et H3K4me3 aux TSS pourrait être un marqueur de déséquilibre d'expression allélique. Enfin, nous avons identifiés des régions intergéniques dont les modifications d'histones présentent des déséquilibres allélique suggérant l'existence d'une transcription allèle-spécifique non-cartographié. Pour résumer, notre étude valide la puissance des techniques utilisant les différences allélique dans l'étude des mécanismes régulateur en cis des variant associés aux maladies complexes.
author2 Tomi Markku Pastinen (Internal/Supervisor)
author_facet Tomi Markku Pastinen (Internal/Supervisor)
Light, Nicholas
author Light, Nicholas
author_sort Light, Nicholas
title Allele-specific analyses of gene expression and chromatin state yield new insights into cis-regulatory mechanisms and their role in complex disease
title_short Allele-specific analyses of gene expression and chromatin state yield new insights into cis-regulatory mechanisms and their role in complex disease
title_full Allele-specific analyses of gene expression and chromatin state yield new insights into cis-regulatory mechanisms and their role in complex disease
title_fullStr Allele-specific analyses of gene expression and chromatin state yield new insights into cis-regulatory mechanisms and their role in complex disease
title_full_unstemmed Allele-specific analyses of gene expression and chromatin state yield new insights into cis-regulatory mechanisms and their role in complex disease
title_sort allele-specific analyses of gene expression and chromatin state yield new insights into cis-regulatory mechanisms and their role in complex disease
publisher McGill University
publishDate 2014
url http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=121378
work_keys_str_mv AT lightnicholas allelespecificanalysesofgeneexpressionandchromatinstateyieldnewinsightsintocisregulatorymechanismsandtheirroleincomplexdisease
_version_ 1716667649507721216
spelling ndltd-LACETR-oai-collectionscanada.gc.ca-QMM.1213782014-05-23T03:53:43ZAllele-specific analyses of gene expression and chromatin state yield new insights into cis-regulatory mechanisms and their role in complex diseaseLight, NicholasBiology - GeneticsCis-regulatory variants are predicted to mediate the majority of the known common genetic associations to complex disease, yet the specific causal variants and the corresponding cis-regulatory mechanisms have thus far been poorly characterized. We attempted to address this by using allele-specific analyses of gene expression and chromatin marks assessed in diverse populations of human cells. The first chapter of this thesis is a review of the literature. The second chapter describes an allele-specific (AS) expression study we performed using 4 large population cohorts of human cells. We mapped SNPs associated to differential allelic-expression (AE) of protein coding and non-coding (nc) genes in 3 distinct cell-types (lymphoblasts, monocytes, and fibroblasts) revealing that ~60-70% of cis-rSNPs originally mapped in each cell-type show strong evidence of tissue-independence. We observed cell-type specificity of cis-regulatory SNPs to be reflective of chromatin activity from the same cell-type using ChIP-seq for active histone marks. We find the same proportion of cis-regulated transcripts between lincRNAs and classical genes, indicating shared regulatory mechanisms. Lastly, cis-regulatory variants were enriched for SNPs in high LD with genome-wide association study (GWAS) hits. The third chapter builds on the allelic-expression work described in the second chapter through the allele-specific assessment of chromatin state via ChIP –genotyping in 20 human cell lines, providing the first genome-wide maps of allelic imbalance for five histone marks. We performed parallel analyses of input DNA and histone modification chromatin immunoprecipitates (ChIP) on high-density Illumina genotyping arrays. AS-ChIP SNPs were combined into allelic chromatin domains with validation performed using high-confidence AS sites generated using ChIP-seq. We observed a characteristic pattern of allelic-imbalance for each histone-modification we tested (H3K4me1, H3K4me3, H3K27ac, H3K27me3, and H3K36me3) around allele-specifically expressed transcripts. Notably, we found H3K4me1 to be significantly anti-correlated with H3K4me3 and allelic expression (AE) at transcription start sites, indicating H3K4me1/H3K4me3 anti-correlation at the TSS as a marker of AE. Finally, we identified regions of allelic-chromatin strongly suggestive of allelic transcription in previously unannotated regions. Altogether, our work reinforces the power of allelic analyses for investigating cis-regulatory mechanisms of disease-associated regulatory variants.La majorité des variant communs associés aux maladies complexes sont prédis pour être régulateurs en cis (cis-rSNPs), cependant le variant causal ainsi que les mécanismes impliqués sont rarement connus. Nous avons essayé de résoudre ce problème par l'analyse de données d'expression allélique (AS) de gènes et de marques chromatiniennes dans différentes populations cellulaires humaines. Le premier chapitre de cette thèse est une revue de la littérature. Le seconde chapitre décrit la cartographie de SNPs associés à des différences d'expression allélique de gène codant et non-codant dans 3 types cellulaires (lymphoblastes, monocytes et fibroblastes). Cette étude révèle que jusqu'a 60/70% des cis-rSNPs cartographiés ont une action tissus-indépendante. Nous avons observé une corrélation entre l'activité spécifique d'un cis-rSNP et la structure chromatinienne d'un même type cellulaire. Nous avons également retrouvé la même proportion de lincRNA et de gène classiques dont l'expression était régulée en cis suggérant des mécanismes régulateurs commun. Enfin, nous avons mis en évidence un enrichissement des cis-rSNPs en fort linkage desequilibrium avec des variant associés à des maladies complexes. Le troisième chapitre présente une étude des états chromatiniens réalisée à partir d'expériences d'immunoprécipitation de la chromatine (ChIP) suivie de génotypage dans 20 lignées cellulaires humaines et basée sur les précédents résultats d'expression allélique. Nous avons ainsi généré la première carte à l'échelle du génome des déséquilibres allélique de 5 marques d'histones. Nous avons analysés en parallèle l'input et l'ADN associé aux différentes modifications d'histone immunoprécipités sur puces de génotypage Illumina à haute densité permettant ainsi l'évaluation d'un possible biais allélique pour les SNPs hétérozygotes (=AS-ChIP SNPs). Les données des variants AS-ChIPs pour chaque marque d'histone ont été combinées pour former des domaines chromatiniens avec biais allélique et validés par des expériences complémentaires de ChIP-seq. Nous avons observés des profils de déséquilibre allélique spécifique à chaque marque d'histone testé (H3K4me1, H3K4me3, H3K27ac, H3K27me3, and H3K36me3) dans le voisinage des transcrits régulés de façon allèle-spécifique. Notamment, nous avons mis en évidence que le signal de H3K4me1 était négativement et significativement corrélé avec H3K4me3 et le niveau d'expression des gènes aux sites d'initiation de la transcription (TSS). Ces résultats suggèrent que la corrélation négative entre H3K4me1 et H3K4me3 aux TSS pourrait être un marqueur de déséquilibre d'expression allélique. Enfin, nous avons identifiés des régions intergéniques dont les modifications d'histones présentent des déséquilibres allélique suggérant l'existence d'une transcription allèle-spécifique non-cartographié. Pour résumer, notre étude valide la puissance des techniques utilisant les différences allélique dans l'étude des mécanismes régulateur en cis des variant associés aux maladies complexes.McGill UniversityTomi Markku Pastinen (Internal/Supervisor)2014Electronic Thesis or Dissertationapplication/pdfenElectronically-submitted thesesAll items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.Master of Science (Department of Human Genetics) http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=121378