FILOGENÔMICA E ORIGEM DAS REDES METABÓLICAS MODERNAS.

Metabolismo é um conjunto complexo de reações químicas mediado por atividades enzimáticas e processos de transporte que converte metabólitos em moléculas capazes de auxiliar e fazer a manutenção da vida. Um estudo realizado por Anollés et al (2007) analisou filogeneticamente os processos de recrutamento e atividades enzimáticas e descobriu que eles estão associados a nove arquiteturas ancestrais com dobras proteicas amplamente distribuídas nos três domínios da biologia. O estudo mostra que diversificação enzimática ocorreu logo no início da atividade pré-biótica, quando a vida ainda era baseada em polímeros proteicos. Esta e outras evidências sugerem fortemente que o metabolismo se originou em enzimas com a P-loop hydrolase fold no metabolismo de nucleotídeos, ou seja, em vias bioquímicas relacionadas a sub-rede metabólica de purinas. Por conseguinte, a primeira incorporação enzimática de um ancestral pré-biotico foi relacionada com a síntese de nucleótidos ainda no RNA-world.

p-loop

A dobra alfa/beta-hidrolase é uma família de enzimas hidrolíticas comuns e de origem filogenética amplamente diferenciada, bem como suas funções catalíticas. Acredita-se que essas enzimas divergiram em um antepassado comum, preservando o arranjo dos resíduos catalíticos. Todos têm uma tríade catalítica, os elementos de que são suportados em dobras, que são as características estruturais mais bem conservadas. Este domínio catalítico é encontrado em uma gama muito ampla de enzimas que não partilham sequências óbvias. A dobra hydrolase alpha/beta inclui proteases, lipases, peroxidases, esterases, epóxido hidrolases e dehalogenases.

Uma hipótese amplamente aceita é que as atividades catalíticas promíscuas em proteínas forneceram uma vantagem seletiva na historia da vida, e posteriormente foram recrutadas para realizar novas funções metabólicas (Ycas, 1974 & Jensen, 1976), desenvolvendo assim especificidade metabólica.

Evidências consideráveis ​​suportam um cenário de recrutamento de enzimas homólogas e que estão espalhadas por diversas vias metabólicas atuais (Schmidt, 2003). Por exemplo, enzimas com estrutura dobráveis α/β que catalisam reações semelhantes ocorrem em todas as sub-redes metabólicas (Copley, 2000 & Nagano et al, 2001) e um pequeno conjunto de famílias estruturais domina o metabolismo de pequenas moléculas em Escherichia coli (Teichmann, 2001 & Rison, 2002). A hipótese de recrutamento assume que um núcleo enzimático ativo com enzimas multifuncionais são atraídos para a inovação metabólica.

A estrutura de domínio é geralmente mantida por longos períodos de tempo evolutivo, por conseguinte, a descoberta de um projeto arquitetônico constitui um evento importante e raro na história evolutiva. O repertório de arquiteturas em proteomas pode ser considerado como uma coleção de marcas históricas ou “fósseis moleculares” que carregam uma história filogenética considerável.

O metabolismo é um palimpsesto que recapitula vias bioquímicas ancestrais, (Benner et al, 1989) químicas pré-bióticas (Morowitz, 1999), e a arquitetura proteína que preservou projetos estruturais antigos como “fósseis bioquímicos”.

O estudo de Anollés descobriu que o metabolismo antigo surgiu muito cedo na história da vida, ainda no mundo das proteínas. Dobras, ou Folds aparecem cedo na evolução e foram amplamente compartilhadas não só por proteomas em todos os organismos que foram totalmente seqüenciados, mas também por muitas sub-redes metabólicas. Ao pesquisar a presença, abundância e ocorrência dessas dobras no metabolismo, foi possível reconstruir árvores filogenéticas que descrevem a evolução de sub-redes e classificar padrões de recrutamento enzimático e seu local de origem no metabolismo.

O estudo se concentrou em descrever a evolução de 776 dobras definidas pela classificação estrutural de proteínas (CEP). De todas essas dobras, apenas 16 são onipresentes em todos os seres vivos, e nove delas apareceram na base da árvore.

As nove dobras antigas e basais estão contidas em superfamílias (Wang et al, 2006). Elas representam arquiteturas antigas de fundamental importância, codificadas em um núcleo genético que estão presentes até mesmo em organismos parasitas com genomas muito reduzidos.

A reconstrução filogenômica das relações evolutivas dessas dobras ancestrais mostrou também que a enzima P-loop-NTPase foi a arquitetura mais antiga, seguido pela DNA/RNAbinding three-helical bundle fold, seguido por enzimas multifuncionais de duas dobras amplamente divididos no metabolismo (a TIM α/β barrel  e NAD(P)-binding Rossmann). A enzima P-loop hidrolase fold representa um circuito único que também foi encontrada como uma superfamília basal de enzimas (Wang et al, 2006).

As relações filogenéticas na árvore de nove dobras antigas foram congruentes com os da árvore global de arquiteturas. Todas arquiteturas onipresentes arquiteturas também foram amplamente distribuídas por todo o metabolismo. Também foram identificadas enzimas metabólicas com um ou mais domínios com estruturas que correspondem as nove dobras antigas em 105 das 133 sub-redes. Isso sugere que durante a evolução das arquiteturas antigas, houve uma explosão de inovação enzimática a partir de redes metabólicas primordiais se estendeu por todo o metabolismo moderno.

A análise filogenética da estrutura identifica sub-redes metabólicas antigas. Em seguida, concentrou-se na presença dos nove dobras ancestrais em sub-redes metabólicas e desenvolveu um método filogenético para fazer inferências sobre a história de sub-redes.

Escala: P-loop-containing nucleoside triphosphate hydrolase fold (c.37); DNA/RNAbinding three-helical bundle fold (a.4), TIM α/β barrel (c.1) and the NAD(P)-binding Rossmann (c.2) Reconstrução da árvore filogenômica da arquitetura das dobras proteicas usando dados de um censo de domínio de 185 genomas totalmente seqüenciados representando os três super-domínios de vida. A árvore representa as relações evolutivas de 776 dobras foi consistente com filogenias geradas a partir de um conjunto de 32 proteomas. Foram identificados 16 dobras compartilhadas pelos genomas analisados (c.37, a.4, c.1, c.2, D.58. C.23, C.55, B.40, c.66, C.47, d.15, a.2, d.142, b.34, a.5, e c.120)  Foi criada uma árvore filogenômica de nove dobras mais antigas e amplamente partilhadas e identificadas. As atividades enzimáticas associadas a estas nove dobras ancestrais descrevem variabilidade na reação química, indicando quatro níveis diferentes de classificações: classe (A, uma das seis categorias gerais de enzimas), subclasse (B, indicando o tipo de composto químico ou grupo envolvido na reação), sub-subclasse (C, que descreve o tipo de reação), e o identificador de série (D, identificação das enzimas individuais).  As atividades enzimáticas redescobertas foram plotados no diagramas de barras (topo) que mostra a gama de distribuição de dobras únicas em Archaea (A), bactérias (B), e Eukarya (E) na árvore (barras vermelhas), Essas dobras compartilhadas por procariontes (barra-de-rosa) e por outros super-domínios. O limite superior para a diversificação do organismo é mostrado pela coloração vermelha dos ramos da árvore.

Escala: P-loop-containing nucleoside triphosphate hydrolase fold (c.37); DNA/RNAbinding three-helical bundle fold (a.4), TIM α/β barrel (c.1) and the NAD(P)-binding Rossmann (c.2)
Reconstrução da árvore filogenômica da arquitetura das dobras proteicas usando dados de um censo de domínio de 185 genomas totalmente seqüenciados representando os três super-domínios de vida. A árvore representa as relações evolutivas de 776 dobras foi consistente com filogenias geradas a partir de um conjunto de 32 proteomas. Foram identificados 16 dobras compartilhadas pelos genomas analisados (c.37, a.4, c.1, c.2, D.58. C.23, C.55, B.40, c.66, C.47, d.15, a.2, d.142, b.34, a.5, e c.120)
Foi criada uma árvore filogenômica de nove dobras mais antigas e amplamente partilhadas e identificadas. As atividades enzimáticas associadas a estas nove dobras ancestrais descrevem variabilidade na reação química, indicando quatro níveis diferentes de classificações: classe (A, uma das seis categorias gerais de enzimas), subclasse (B, indicando o tipo de composto químico ou grupo envolvido na reação), sub-subclasse (C, que descreve o tipo de reação), e o identificador de série (D, identificação das enzimas individuais).
As atividades enzimáticas redescobertas foram plotados no diagramas de barras (topo) que mostra a gama de distribuição de dobras únicas em Archaea (A), bactérias (B), e Eukarya (E) na árvore (barras vermelhas), Essas dobras compartilhadas por procariontes (barra-de-rosa) e por outros super-domínios. O limite superior para a diversificação do organismo é mostrado pela coloração vermelha dos ramos da árvore.

Duas sub-redes ligadas a derivados energéticos destacam-se na lista, oxygenic mitochondrial ATP synthesis (NRG 00193) e oxygenic photosynthesis (NRG 00195), sugerindo essas funções importantes apareceram tarde na evolução, bem após a descoberta da maioria das atividades enzimáticas. Isto é consistente com os registros moleculares e geológicos que sugerem que a vida alcança uma complexidade considerável antes do aparecimento do oxigênio na atmosfera, e com distribuição de enzimas nas vias aeróbicas que sugere que a adaptação ao oxigênio ocorreu após as grandes divergências procariotas na árvore da vida (Raymond, 2006).

A conclusão do estudo é que o metabolismo surgiu originalmente a partir de sub-redes metabólicas da síntese de nucleotídeos. Embora o recrutamento enzimático possa apagar padrões históricos de atividade enzimática das redes, o uso de “vórtices de sub-redes” revelam padrões de origem e evolução no metabolismo. Na evolução da rede, as enzimas assumem reações antigas (pré-bióticos) e neste processo, uma cópia de um domínio da proteína usada em um contexto metabólico começa a funcionar em um novo contexto, realizando sua função. Este processo sobrepõe-se com a invenção de novas arquiteturas, começando com um estado rudimentar antigo, e a cada etapa vem contribuindo com novas funções e novas oportunidades para o recrutamento. Embora os domínios doadores receptores existentes possam diferir, assume-se pelos resultados que o recrutamento faz uma canalização estrutural (Fontana, 2002) necessária para garantir a manutenção da arquitetura das dobras. Obviamente, a mudança é custosa, e as aquisições são mais plausíveis entre os subníveis.

Assim, é possível assumir que o metabolismo moderno se originou no metabolismo de nucleotídeos, provavelmente em vias de metabolismo das purinas. Isto é de grande importância, pois a primeira incorporação enzimática de uma via bioquímica ou processos metabólicos antigos (pré-biótico) estão relacionados com a síntese de nucleotídeos em um mundo em que o RNA era o único catalisador geneticamente codificado (Gilbert, 1989). Embora o mundo do RNA tenha um poder explicativo considerável, determinando por que o RNA é o cerne da tradução (Orgel, 2005), ainda pouco se sabe como este mundo foi transferido para a bioquímica moderna (Penny, 2005). Temos apenas uma ideia sobre a estabilidade do DNA sobre o RNA na capacidade de armazenar as informações genéticas (Veja).

A origem da síntese de proteínas deve ter sido o primeiro passo em direção a um mundo de ribonucleoproteína, e a transição provavelmente foi impulsionada pela capacidade catalítica superior de polipeptídeos e, em seguida, a proteínas. Os resultados de Anollés sugerem que o metabolismo moderno desenvolvido no início do mundo proteico tinham origens que beneficiaram a formação de blocos de construção para o mundo do RNA.

.

Dicionário enzimático

Como o texto trata de enzimas muito específicas, eis uma pequena definição.

P-loop-NTPase

A reação mais comum catalisada por enzimas P-loop NTPase é a hidrólise da ligação de fosfato beta-gama do trifosfato de nucleosídeo (NTP). A energia a partir dessa hidrolise  é tipicamente utilizada para induzir mudanças conformacionais em outras moléculas, o que constitui a base das funções biológicas da maioria das P-loop-NTPase. Ela mostra preferência por substrato para ATP ou GTP.

P-loop-NTPase

P-loop-NTPase

P-loop-NTPase são caracterizadas por duas assinaturas de seqüências conservadas, a The Walker A (uma propriedade) e a The Walker B se ligam, respectivamente aos beta e gama fosfato do NTP e ao cátion Mg2+

Domínios P-loop-NTPase de ATPase pertencem a uma das duas divisões principais. A divisão da cinase de GTPase (KG) inclui as quinases e GTPases, e a divisão do ASCE, é caracterizada por uma cadeia adicional que está localizado entre o cordão da P-loop e a cadeia B Walker. A maioria dos membros da divisão ASCE utilizar ATP e membros deste grupo incluem AAA +, ABC, PILT, Hera-ftsk, superfamília 1/2(SF1/2) helicases, e as superfamílias RecA / ATP-sintase de ATPases (InterPro)

DNA/RNA binding three-helical bundle fold

É um domínio de ligação do DNA (DBD), que reconhece dupla ou uma cadeia simples. Um DBD pode reconhecer uma sequência específica de DNA (uma sequência de reconhecimento) ou possui afinidade geral para DNA. Alguns domínios de ligação de DNA também pode incluir ácidos nucleicos na sua estrutura dobrada.

Proteínas de ligação em sequencias específicas de DNA estão entre as mais importantes classes de proteínas reguladoras de genes, controlando as alterações na transcrição que fundamentam a muitos aspectos da biologia.

RNAbinding three-helical bundle fold

RNAbinding three-helical bundle fold

Análises de bioinformática indicam que a família Wor3 surgiu mais recentemente no tempo evolutivo a partir de domínios de ligação do DNA; ele é restrito a um pequeno número de fungos, que incluem os principais fitopatógenos de seres humanos. Estas observações mostram que as novas famílias de proteínas especificas de ligação do DNA pode ser restrita a pequenos clados e sugerem que dependem de profunda conservação de genes que codificam para os reguladores de transcrição.

A regulação da expressão de genes por proteínas especificas de ligação de DNA é subjacente muitos processos biológicos, especialmente de respostas ambientais em organismos unicelulares, e para o desenvolvimento de estruturas multicelulares em animais e plantas. Entre 5% e 10% da capacidade de codificação da maioria dos genomas é dedicado a estas proteínas, e podem ser dispostos em várias famílias e superfamílias baseadas nas suas sequências de aminoácidos e os motivos estruturais através dos quais o DNA é reconhecido (Lohse et al, 2013).

TIM α/β barrel 

Em biologia molecular da TIM barrel é uma proteína dobrável conservada consistindo de oito α-hélices paralelas e oito β-costas que se alternam ao longo da cadeia peptídica.

tim

TIM α/β barrel

A estrutura é chamada de triosefosfato isomerase, uma enzima metabólica conservada. TIM são uma das dobras proteicas mais comuns. Uma das características mais intrigantes entre os membros desta classe de proteínas é que, embora todos eles exibam a mesma dobra terciária, há muito pouca semelhança de sequências entre elas. Pelo menos 15 famílias distintas de enzimas utilizam esta estrutura para gerar uma geometria local ativo apropriada,que sempre ocorre na extremidade C-terminal de oito cadeias beta paralelas.

TIM são consideradas dobras de proteínas α/β, porque incluem um padrão alternado de α-hélices e β-costas em um único domínio. Em um TIM hélice geralmente formam um solenóide que se curva ao redor para fechar sobre si mesma em uma forma de rosca. Os cordões-β paralelos formam a parede interior da rosca ao passo que as α-hélices formam a parede exterior da rosca (Ochoa, 2009).

NAD(P)-binding Rossmann

NAD(P)-binding Rossmann

NAD(P)-binding Rossmann

A dobra Rossmann é um mecanismo estrutural encontrada em proteínas que se ligam a nucleotideos, especialmente o co-factor NAD. A estrutura com duas repetições é composta por seis cadeias beta paralelas ligadas a dois pares de hélices alfa da ordem topológica beta-alfa-beta-alfa-beta. Cada dobra Rossmann pode ligar um nucleótido. Domínios de ligação de dinucleótidos como NAD consistem de dois pares de dobras de Rossmann que ligam cada porção de nucleotídeos da molécula do co-factor. Dobras únicas de Rossmann podem ligar mononucleotídeos como o co-fator FMN.

O nome é dado devido a Michael Rossmann, que começou por salientar que este é um motivo frequente das ligações proteicas de nucleotídeos, como desidrogenases (Rossmann, 1973).

Victor Rossetti

Palavras chave: NetNature, Rossetti, Metabolismo, Filogenômica, Proteinas, DNA, RNA, RNA-World, Origem da vida.

 .

Referências

Anollés, G. C†‡, Hee Shin Kim†, and Jay E. Mittenthal. The origin of modern metabolic networks inferred from phylogenomic analysis of protein architecture. PLOS ONE 9358–9363 ?
PNAS, May 29, 2007 vol. 104 no. 22

Benner SA, Ellington AD, Tauer A (1989) Proc Natl Acad Sci USA 86:7054–7058.

Copley RR, Bork P (2000) J Mol Biol 303:627–640.

Fontana W (2002) BioEssays 24:1164–1177.

Gilbert W (1989) Nature 319:618.

Jensen RA (1976) Annu Rev Microbiol 30:409–425.

Matthew B. Lohse,a,1 Aaron D. Hernday,a,1,2 Polly M. Fordyce,b,c Liron Noiman,a,d Trevor R. Sorrells,a,d Victor Hanson-Smith,a Clarissa J. Nobile,a Joseph L. DeRisi,b,c and Alexander D. Johnsona,b,3. Identification and characterization of a previously undescribed family of sequence-specific DNA-binding domains. Proc Natl Acad Sci U S A. May 7, 2013; 110(19): 7660–7665.

Morowitz HJ (1992) Beginning of Cellular Life (Yale Univ Press, New Haven, CT).

Nagano N, Orengo CA, Thornton JM (2002) J Mol Biol 321:741–765.

Ochoa-Leyva, A. et al. (2009). “Protein design through systematic catalytic loop exchange in the (beta/alpha)8 fold.”. J Mol. Biol 387 (10): 949–964.

Orgel LE (2005) Crit Rev Biochem Mol Biol 39:99–123.

Penny D (2005) Biol Phyl 20:633–671.

Rao S, Rossmann M (1973). “Comparison of super-secondary structures in proteins”. J Mol Biol 76 (2): 241–56.

Raymond J, Segre ` D (2006) Science 311:1764–1767.

Rison SCG, Teichmann SA, Thornton JM (2002) J Mol Biol 318:911–932.

Schmidt S, Sunyaev S, Bork P, Dandekar T (2003) Trends Biochem Sci 28:336–341.

Teichmann SA, Rison SC, Thornton JM, Riley M, Gough J, Cothia C (2001) J Mol Biol 311:693–708.

Wang M, Boca SM, Kalelkar R, Mittenthal JE, Caetano-Anolle ´s GA (2006) Complexity 12:27–40

Ycas M (1974) J Theor Biol 44:145–160.

InterPro. Protein sequence analysis & classification

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s