Summary: | O genoma humano tem um tamano aproximado de 3,2 Gb e aproximadamente 74% das suas sequências são transcritas em RNAs. Destes transcritos, cerca de 33 mil não são traduzidos em proteínas, desempenhando seu papel funcional na célula na forma de RNAs. Dentre os trancritos que não codificam proteínas estão os lncRNAs, os pseudogenes e os circRNAs. Inicialmente considerados como ruídos transcricionais, esses RNAs têm chamado cada vez mais a atenção da comunidade científica e têm sido atribuídos a um série de funções celulares. Apesar do crescente número de trabalhos enfocando estes RNAs, pouco se sabe sobre essas moléculas em células-tronco embrionárias (CTEs) humanas, tanto no que se refere ao conjunto de moléculas expressas quanto sobre a função por elas desempenhada. Nesse sentido, este trabalho teve como objetivo identificar os lncRNAs, pseudogenes e circRNAs expressos em células-tronco embrionárias humanas a partir de dados de RNA-seq depositados no banco de dados GEO e inferir, através de ferramentas de bioinformática, as possíveis funções desempenhadas por estas moléculas no estado tronco. As análises revelaram, ao todo 1182 ncRNAs pertencentes as três classes em estudo (lncRNA, n=317; pseudogene, n=585; e circRNA, n=280) no conjunto de dados principal. Quando este foi comparado a outros conjuntos de dados, 87 lncRNAs, 51 pseudogenes e 10 circRNAs foram detectados como transcritos comuns. Dentre os lncRNAs e os pseudogenes, 15 foram selecionados para inferência de função pela abordagem de guilty by association. Foi possível associar RNA selecionados a processos como splicing, organização de cromatina, mitose, ciclo celular, biogênese de ribossomos, reparo de DNA e resposta ao dano, apoptose, organização do citoesqueleto, desenvolvimento embrionário e regulação da diferenciação celular. Além disso, alguns dos RNAs em estudo mostraram-se fortes candidatos a atuarem como competidores endógenos de mRNAs expressos em CTEs. Análises de correlação, de força de ligação ao miRNA e do tipo de seed do sítio de ligação apontaram os pares de mRNAs e ncRNAs AHCY-RP11-253E3.3, F2RL1-EEF1A1P6, HSPD1-SNHG5, INO80-RP11-20D14.6, PARP1-RP11-20D14.6 e PRIM2-GAS5, juntamente com o RNA circular circ-HIPK3, como os RNAs com maior potencial para competirem pelos miRNAs expressos em CTEs. Estes resultados voltam a atenção da pesquisa básica para uma parte pouco conhecida da biologia das CTEs e direcionam futuros experimentos visando a elucidação da função de ncRNAs nesse contexto celular. Ensaios de modulação da expressão dos ncRNAs e a observação concomitante da respostas dos RNAs e proteínas a eles relacionados são o próximo passo para desvendar os mecanismos moleculares através dos quais estes RNAs desempenham seus papeis em CTEs. === The human genome has an average size of 3.2 Gb and approximately 74% of its sequences are transcribed into RNAs. From this transcripts, around 33 thousand are not translated into proteins, performing their cellular roles as RNAs molecules. Among the non-protein coding transcripts are the lncRNAs, the pseudogenes and the circRNAs. Inicially thought to be transcription noise, these molecules have been drawing attention of the scientific comunity and several cellular functions have been attributed to them. Although the rising number of studies focusing on these RNAs, little is known about them in human embryonic stem cells (ESCs), includind the set of expressed non-coding RNAs (ncRNA) and their functions. In this sense, this study aimed to identify lncRNAs, pseudogenes and circRNAs expressed in human ESCs from RNA-seq data deposited in GEO public database and infer, through bioinformatic tools, the possible functions played by these molecules in the stem state. The analyzis revealed 1182 ncRNAs belonging to the three classes (lncRNA, n=317; pseudogene, n=585; and circRNA, n=280) studied in the main dataset. When compared to other datasets, 87 lncRNAs, 51 pseudogenes and 10 circRNAs were detected as common to all datasets. Among the lncRNAs and the pseudogenes, 15 were selected for function inference through the guilty by association method. It was possible to associate the selected RNAs to cellular processes as RNA splicing, chromatin organization, mitosis, cell cycle, ribosome biogenesis, DNA repair and DNA damage response, apoptosis, cytoskeletton organization, embryonic development and regulation of cell differentiation. Moreover, some of the RNAs showed to be strong candidates to act as endogenous competitors of the ESCs-expressed mRNAs. Pearson correlation analysis and investigation of the miRNA seed type and binding strenght indicate the following ncRNA-mRNA pairs AHCY-RP11-253E3.3, F2RL1-EEF1A1P6, HSPD1-SNHG5, INO80-RP11-20D14.6, PARP1-RP11-20D14.6 e PRIM2-GAS5, together with the circular RNA circ-HIPK3, as the RNAs with major potential to act as competing endogenous RNAs in ESCs. These results shift the attentions to a poorly known part of ESCs biology and give directions to future experiments aiming to elucidate the ncRNAs function in this cellular context. ncRNAs expression modulation assays and the concomitant observation of the positively correlated mRNAs response to these alterations are the next step in the unraveling of the specific molecular mechanisms through which ncRNAs exert their roles in ESCs.
|