Estudo de propriedades físico-químicas e de critérios para obtenção e validação de modelos QSAR para séries de análogos de semicarbazonas com atividade antichagásica, retiradas da literatura

O desenvolvimento tecnológico observado nos últimos anos e o avanço na aquisição de dados para os sistemas tanto químicos como biológicos tem gerado um grande número de informações. Como consequência, nos últimos anos, procuram-se ferramentas, fundamentalmente matemáticas, que permitam decodific...

Full description

Bibliographic Details
Main Author: Marcus Tullius Scotti
Other Authors: Antônia Tavares do Amaral
Language:Portuguese
Published: Universidade de São Paulo 2005
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/46/46135/tde-01032007-112133/
id ndltd-IBICT-oai-teses.usp.br-tde-01032007-112133
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic Análogos de semicarbazonas
Compostos antichagásico
QSAR
Antichagasic activity
Antichagasic compounds
QSAR
Similar semicarbazones
spellingShingle Análogos de semicarbazonas
Compostos antichagásico
QSAR
Antichagasic activity
Antichagasic compounds
QSAR
Similar semicarbazones
Marcus Tullius Scotti
Estudo de propriedades físico-químicas e de critérios para obtenção e validação de modelos QSAR para séries de análogos de semicarbazonas com atividade antichagásica, retiradas da literatura
description O desenvolvimento tecnológico observado nos últimos anos e o avanço na aquisição de dados para os sistemas tanto químicos como biológicos tem gerado um grande número de informações. Como consequência, nos últimos anos, procuram-se ferramentas, fundamentalmente matemáticas, que permitam decodificar este volume imenso de informações, em termos estruturais e biológicos. Embora diversos parâmetros estatísticos e métodos de seleção de modelos e de variáveis tenham sido descritos, mais recentemente, são encontradas propostas de novas ferramentas visando assegurar tanto a qualidade de predição do modelo como a elucidação de algum mecanismo a partir do modelo gerado. Com relação aos estudos de compostos antichagásicos, é grande o número de dados disponíveis, na literatura, nos diferentes aspectos pesquisados.A cruzipaína, também chamada de cruzaína, é a principal cisteína protease do Trypanosoma cruzi e sua inibição tem se mostrado capaz de inibir o desenvolvimento intracelular do protozoário. Neste trabalho foram selecionados da literatura original 90 compostos, incluindo-se 29 alfa-(N)-heterocíclica carboxaldeído tiossemicarbazonas substituídas, com atividade inibitória frente a ribonucleotídeo redutase (IRNR) (série I; compostos I.1. a I.29); 37 tiossemicarbazonas substituídas na cadeia lateral e no anel aromático (série II; compostos II.1 a II.37) e, 61 compostos estruturalmente diferentes (série III; compostos II.1 a III.61, sendo 45 tiossemicarbazonas das quais 37 da série II e, 16 derivados de isatinas). As séries II e III apresentam atividade inibitória frente à cruzaína, uma cisteína protease do T.cruzi. E a série I, embora, apresente atividade inibitória frente a ribonucleotídeo redutase (IRNR) de células H.Ep.-2, é, no entanto, estruturalmente similar às séries II e III. E, ainda mais, os modelos gerados nesta dissertação para a série I foram incluídos na tese de doutorado de H.Ishiki. Cada uma das séries foi dividida em 3 séries de treinamento (A, B e C) com suas correspondentes séries de teste. A seguir, a partir das estruturas representadas em 3 dimensões das moléculas, foram gerados 1497 descritores através do programa DRAGON (v. 3.0) para cada série (I, II e III). Estes descritores foram submetidos a um pré-tratamento de dados, excluindo-se aqueles que não contribuiriam para as análises PLS - Partial Least Squares (mínimos quadrados parciais). Através das análises PLS foram selecionados os descritores mais significativos das equações de regressão linear, que a seguir foram submetidos a uma análise de freqüência, ou seja, foram selecionados os descritores presentes em pelo menos em 2 dos 3 modelos obtidos das séries de treinamento (A, B e C). A partir destes descritores selecionados foram obtidos modelos de QSAR clássico com 5 descritores que foram validados por três filtros. Estes modelos de QSAR validados, apresentaram valores de coeficiente de correlação (r) e do quadrado do coeficiente de predição interna (Qcv2) maiores que 0,9 e 0,7 respectivamente. === It has been observed an enormous improvement in the methods concerning data generation, leading to a large amount of information, especially for chemical and biological systems. Through these developments, it becomes relevant to have reliable methods, mainly new mathematical tools, for structure-activity relationship (SAR) data examination, which means that there is a need for developing datasets screening tools. Although a huge number of descriptors and methods for selection have been described in the literature, it becomes a crucial aspect to develop new concepts and tools that assure selection of relevant information as well as a high predictive power for the generated QSAR models. Concerning antichagasic compounds, in the literature, there is a huge number of data in anti Chagas disease drug research fields. Cruzain, known also as cruzipain, is the major cysteine protease of T. cruzi. The protease is expressed in all life cycle stages of the parasite. Therefore, cruzain is essential for replication of the intracellular parasite. Thus, cruzain is an appealing target for new antitrypanosomal chemotherapy. In this work, it has been taken from selected literature 90 compounds, including 29 substituted alpha-(N)- heterocyclic carboxaldehyde thiosemicarbazones, (set I, compounds I.1 to I. 29) and 37 substituted thiosemicarbazones (set II, compounds II.1 to II.37) and 61 structurally different compounds (set III, compounds II.1 to III.61, namely 45 thiosemicarbazones (37 from set II) and 16 isatin derivatives). Sets II and III showed inhibitory activity against cruzain, a cysteine protease of T. cruzi. Although set I compounds showed inhibitory activity against ribonucleotide reductase enzyme of H.Ep.-2 cells they have been included in this study taking into account that they are structurally similar to sets II and III, studied by H. Ishiki in his PhD thesis. Each set was divided in 3 training sets (A, B and C) with its corresponding test sets. Initially, 1497 descriptors have been obtained by means of DRAGON program (v.3.0) using 3D structures of sets I, II and III compounds. In a second step to reduce the data size, all descriptors have been submitted to a pre-treatment, including the use of different filters, followed by PLS analyses with external validation. Relevant descriptors have been selected using PLS followed by frequency analysis. That means, it has been selected descriptors, which were present at least in 2 or 3 models, generated from training sets (A, B an C). These descriptors have been used to generate QSAR models with up to 5 descriptors. The QSAR models had been validated by three filters. Values of correlation coefficient (r) and the squared correlation coefficient of internal predictions (Qcv2) were higher than 0.9 and 0.7, respectively, for the validated QSAR models.
author2 Antônia Tavares do Amaral
author_facet Antônia Tavares do Amaral
Marcus Tullius Scotti
author Marcus Tullius Scotti
author_sort Marcus Tullius Scotti
title Estudo de propriedades físico-químicas e de critérios para obtenção e validação de modelos QSAR para séries de análogos de semicarbazonas com atividade antichagásica, retiradas da literatura
title_short Estudo de propriedades físico-químicas e de critérios para obtenção e validação de modelos QSAR para séries de análogos de semicarbazonas com atividade antichagásica, retiradas da literatura
title_full Estudo de propriedades físico-químicas e de critérios para obtenção e validação de modelos QSAR para séries de análogos de semicarbazonas com atividade antichagásica, retiradas da literatura
title_fullStr Estudo de propriedades físico-químicas e de critérios para obtenção e validação de modelos QSAR para séries de análogos de semicarbazonas com atividade antichagásica, retiradas da literatura
title_full_unstemmed Estudo de propriedades físico-químicas e de critérios para obtenção e validação de modelos QSAR para séries de análogos de semicarbazonas com atividade antichagásica, retiradas da literatura
title_sort estudo de propriedades físico-químicas e de critérios para obtenção e validação de modelos qsar para séries de análogos de semicarbazonas com atividade antichagásica, retiradas da literatura
publisher Universidade de São Paulo
publishDate 2005
url http://www.teses.usp.br/teses/disponiveis/46/46135/tde-01032007-112133/
work_keys_str_mv AT marcustulliusscotti estudodepropriedadesfisicoquimicasedecriteriosparaobtencaoevalidacaodemodelosqsarparaseriesdeanalogosdesemicarbazonascomatividadeantichagasicaretiradasdaliteratura
AT marcustulliusscotti studyofphysiochemicalpropertiesandcriteriaforobtainingandvalidationofqsarmodelsofsimilarsemicarbazonassetwithantichagasicactivityselectedofliterature
_version_ 1718920063078105088
spelling ndltd-IBICT-oai-teses.usp.br-tde-01032007-1121332019-01-22T00:20:58Z Estudo de propriedades físico-químicas e de critérios para obtenção e validação de modelos QSAR para séries de análogos de semicarbazonas com atividade antichagásica, retiradas da literatura Study of physiochemical properties and criteria for obtaining and validation of QSAR models of similar semicarbazonas set with antichagasic activity, selected of literature Marcus Tullius Scotti Antônia Tavares do Amaral Roy Edward Bruns Yuji Takahata Análogos de semicarbazonas Compostos antichagásico QSAR Antichagasic activity Antichagasic compounds QSAR Similar semicarbazones O desenvolvimento tecnológico observado nos últimos anos e o avanço na aquisição de dados para os sistemas tanto químicos como biológicos tem gerado um grande número de informações. Como consequência, nos últimos anos, procuram-se ferramentas, fundamentalmente matemáticas, que permitam decodificar este volume imenso de informações, em termos estruturais e biológicos. Embora diversos parâmetros estatísticos e métodos de seleção de modelos e de variáveis tenham sido descritos, mais recentemente, são encontradas propostas de novas ferramentas visando assegurar tanto a qualidade de predição do modelo como a elucidação de algum mecanismo a partir do modelo gerado. Com relação aos estudos de compostos antichagásicos, é grande o número de dados disponíveis, na literatura, nos diferentes aspectos pesquisados.A cruzipaína, também chamada de cruzaína, é a principal cisteína protease do Trypanosoma cruzi e sua inibição tem se mostrado capaz de inibir o desenvolvimento intracelular do protozoário. Neste trabalho foram selecionados da literatura original 90 compostos, incluindo-se 29 alfa-(N)-heterocíclica carboxaldeído tiossemicarbazonas substituídas, com atividade inibitória frente a ribonucleotídeo redutase (IRNR) (série I; compostos I.1. a I.29); 37 tiossemicarbazonas substituídas na cadeia lateral e no anel aromático (série II; compostos II.1 a II.37) e, 61 compostos estruturalmente diferentes (série III; compostos II.1 a III.61, sendo 45 tiossemicarbazonas das quais 37 da série II e, 16 derivados de isatinas). As séries II e III apresentam atividade inibitória frente à cruzaína, uma cisteína protease do T.cruzi. E a série I, embora, apresente atividade inibitória frente a ribonucleotídeo redutase (IRNR) de células H.Ep.-2, é, no entanto, estruturalmente similar às séries II e III. E, ainda mais, os modelos gerados nesta dissertação para a série I foram incluídos na tese de doutorado de H.Ishiki. Cada uma das séries foi dividida em 3 séries de treinamento (A, B e C) com suas correspondentes séries de teste. A seguir, a partir das estruturas representadas em 3 dimensões das moléculas, foram gerados 1497 descritores através do programa DRAGON (v. 3.0) para cada série (I, II e III). Estes descritores foram submetidos a um pré-tratamento de dados, excluindo-se aqueles que não contribuiriam para as análises PLS - Partial Least Squares (mínimos quadrados parciais). Através das análises PLS foram selecionados os descritores mais significativos das equações de regressão linear, que a seguir foram submetidos a uma análise de freqüência, ou seja, foram selecionados os descritores presentes em pelo menos em 2 dos 3 modelos obtidos das séries de treinamento (A, B e C). A partir destes descritores selecionados foram obtidos modelos de QSAR clássico com 5 descritores que foram validados por três filtros. Estes modelos de QSAR validados, apresentaram valores de coeficiente de correlação (r) e do quadrado do coeficiente de predição interna (Qcv2) maiores que 0,9 e 0,7 respectivamente. It has been observed an enormous improvement in the methods concerning data generation, leading to a large amount of information, especially for chemical and biological systems. Through these developments, it becomes relevant to have reliable methods, mainly new mathematical tools, for structure-activity relationship (SAR) data examination, which means that there is a need for developing datasets screening tools. Although a huge number of descriptors and methods for selection have been described in the literature, it becomes a crucial aspect to develop new concepts and tools that assure selection of relevant information as well as a high predictive power for the generated QSAR models. Concerning antichagasic compounds, in the literature, there is a huge number of data in anti Chagas disease drug research fields. Cruzain, known also as cruzipain, is the major cysteine protease of T. cruzi. The protease is expressed in all life cycle stages of the parasite. Therefore, cruzain is essential for replication of the intracellular parasite. Thus, cruzain is an appealing target for new antitrypanosomal chemotherapy. In this work, it has been taken from selected literature 90 compounds, including 29 substituted alpha-(N)- heterocyclic carboxaldehyde thiosemicarbazones, (set I, compounds I.1 to I. 29) and 37 substituted thiosemicarbazones (set II, compounds II.1 to II.37) and 61 structurally different compounds (set III, compounds II.1 to III.61, namely 45 thiosemicarbazones (37 from set II) and 16 isatin derivatives). Sets II and III showed inhibitory activity against cruzain, a cysteine protease of T. cruzi. Although set I compounds showed inhibitory activity against ribonucleotide reductase enzyme of H.Ep.-2 cells they have been included in this study taking into account that they are structurally similar to sets II and III, studied by H. Ishiki in his PhD thesis. Each set was divided in 3 training sets (A, B and C) with its corresponding test sets. Initially, 1497 descriptors have been obtained by means of DRAGON program (v.3.0) using 3D structures of sets I, II and III compounds. In a second step to reduce the data size, all descriptors have been submitted to a pre-treatment, including the use of different filters, followed by PLS analyses with external validation. Relevant descriptors have been selected using PLS followed by frequency analysis. That means, it has been selected descriptors, which were present at least in 2 or 3 models, generated from training sets (A, B an C). These descriptors have been used to generate QSAR models with up to 5 descriptors. The QSAR models had been validated by three filters. Values of correlation coefficient (r) and the squared correlation coefficient of internal predictions (Qcv2) were higher than 0.9 and 0.7, respectively, for the validated QSAR models. 2005-05-05 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.teses.usp.br/teses/disponiveis/46/46135/tde-01032007-112133/ por info:eu-repo/semantics/openAccess Universidade de São Paulo Química USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP