ORIGEM DE INFORMAÇÃO GENÉTICA E O CÓDIGO DA VIDA.

O código genético é o conjunto de regras pelas quais informações codificadas estão dentro do material genético. O código genético é altamente semelhante em todos os organismos, ele define sequências triplas de nucleotídeos, os chamados códons, que quimicamente determinam quais aminoácidos serão inseridos durante a síntese de proteínas. Assim, não é possível discorrer sobre informação genética sem falar sobre a origem da química do código genético.

Euglena

Euglena

Em sistemas vivos as partes químicas correspondem ao hardware e as informações (genéticas e epigenéticas) correspondem ao software (Davies, 1999). Dois pontos são importantes neste tema: as regras e as informações. Quando dizemos que o código genético é o conjunto de regras estamos nos referindo a um componente químico estrutural, os códons, que assim foram estabelecidos pela evolução química do processo e que veremos mais adiante. O código corresponde a reações que ocorrem entre as sequências e as enzimas (de RNAs, copiadas do DNA), cujo produto final é uma proteína. Essas regras químicas da vida presentes nas células foram, em um passado bem distante, estabelecidas em outro contexto molecular segundo a hipótese do RNA-World/Pré-RNA-World (Orgel, 2000).

O outro componente do processo é a informação, codificada nesses códons. Para Shannon, pai da teoria da informação, a informação é a redução na “incerteza” onde a entropia é a medida de qualquer dependência estocástica que existe em uma situação particular. Na biologia molecular, informação genética remete para a funcionalidade inerente dos produtos dos genes: ou seja, como eles interagem com o ambiente bioquímico em que operam (Shannon, 1948). É através desses processos estocásticos a complexidade biológica pode aumentar.

Entender a informação genética e sua origem não é difícil, mas alguns grupos anti-ciência tendem a complica-lo na tentativa de invalidar a teoria da evolução de Darwin. Na visão destes grupos, se há informação deve haver um programador envolvido, sugerindo uma clássica inversão do contexto subordinado a uma visão teleológica, engenheirada. Nem tudo que existe é propositalmente configurado, nem tudo que tem simetria, é belo ou complexo é sinônimo de engenharia. A lógica deles é simples: se um computador tem uma programação, logo (note o silogismo) a vida também deve ter um. O problema desta afirmação é que ela acaba colocando como equivalente um computador (que sabidamente foi programado) e uma pressuposição (sem qualquer validade empírica) de que a vida também é em seus mais profundos níveis, engenheirada. Esta falsa analogia, fraca, é conduzida por uma falsa premissa, porque uma vida e um computador são concepções complemente distintas; a) um computador não é considerado vivo, não passa por competições para sobre viver, não é auto-poiético e tem sabidamente seus códigos criados sem qualquer tipo de processo de seleção, ao passo que; uma forma de vida, como o euglenozoário da imagem acima, não é um computador, nem estático, tão pouco isolado de uma dinâmica ecológica como é um computador concebido para uma função específica de um programador. Pelo contrário, uma euglena se desloca por movimentação flagelar, se reproduz (cissiparidade) e quando exposta a situações adversas, em que a fotossíntese seja dificultada pela falta de iluminação, podem adquirir características de protozoários e se alimentar, como um ser heterótrofo. Um ser vivo, ou um ecossistema vivo, é auto-sustentável, heterótrofo ou/e autótrofo; nenhum computador tem essas características. Ele é, essencialmente dependente de seu programador, diferente da vida. Não existe comparação coerente entre um computador a uma forma de vida; ambos foram forjados por processos distintos sob dinâmicas distintas e preenchem papéis distintos.

Mas o que eles têm em comum?

Informação!

Nem toda informação é criada por intencionalidade.  A vida passa por processos de seleção e por isto a informação é restrita, é modelada segundo a dinâmica do ambiente no qual o animal esta inserido, pois essa dinâmica é que vai definir qual fenótipo vai para a geração seguinte, e qual será punido com a morte. Quando a seleção natural atua, ela reduz incertezas dos processos estocásticos, ou seja, se uma informação traz “certeza” sobre funcionalidade dos produtos dos genes expressos no fenótipo de uma euglena, então ela é mantida pela seleção natural. Se alterações nas regras (código genético) alteram a informação (produtos dos genes) de tal modo que as “incertezas” aumentem e interfiram sobre a certeza e funcionalidade dos produtos dos genes no fenótipo de uma euglena, ela certamente morrerá.

O que é esta “incerteza” no fenótipo de uma euglena?

Qualquer coisa que não favoreça a luta pela sobrevivência; redução da síntese de paramilo (armazenamento energético), flagelos mal formados, falhas na síntese de astaxantina, incapacidade de formar colônias que em um contexto favoreceria sua sobrevivência…

Computadores não passam por esta seleção. Um erro de programação pode ser corrigido pelo programador sem que o computador seja punido com a morte. Se há punição de fenótipos, consequentemente, há de informações que os codificaram. Se há genes e seus produtos que configuraram vantagens a esses seres unicelulares, tal informação mantém-se; mas não de modo fixista.

Eventuais alterações nas regras químicas configuram alterações de informação.  Conforme ligeiras modificações gradualmente ocorreram a partir de mutações (alterando configurações moleculares, enzimáticas ou mesmo estruturas anatômicas, morfologia ou comportamentos), as que corrompem a informação punem o indivíduo com a morte, as neutras ou benéficas vão sendo mantidas ao longo das gerações. Informações de genes, ou, produtos de informações corrompidas em que incerteza informacional aumenta não configuram mais produtos (e fenótipos) vantajosos.

Por isto a teoria de informação de Shannon se encaixa, em sua definição, completamente com a concepção de informação genética sujeita a evolução. Igualmente é verdade quando ocorre a duplicação de um gene ou de trechos cromossômicos inteiros. Ambos podem acumular mutações distintas em genes duplicados e consequentemente seguir alterando e criando informações distintas que podem ter papeis evolutivos e biológicos distintos (recrutamento de enzimas a novas funções, alterações estruturas de proteína); ou, podem ter informação duplicada e uma consequente super-dosagem de um ou vários genes com suas respectivas informações.  Vejamos um exemplo de cada situação.

Hemoglobina

Hemoglobina

No primeiro caso, um exemplo bastante comum é o da hemoglobina. A hemoglobina humana é uma proteína quaternária. Uma análise de DNA mostrou que as 4 cadeias são parentes entre si. Duas delas são chamadas de α-hemoglobinas com 141 aminoácidos e duas de β-hemoglobinas com 146 aminoácidos. Os genes codificadores das α-hemoglobinas estão no cromossomo 11 e o das β-hemoglobinas no cromossomo 16. Em cada um desses cromossomos há pseudogenes de uma série de proteínas que podem vir um dia a serem produzidas ou que simplesmente sofreram falhas mutacionais. No cromossomo 11 há sete genes de globina, quatro deles são pseudogenes desativados por falhas de sequencia. Dois são de verdadeiras globinas utilizadas no adulto. Uma codifica uma globina utilizada somente no estágio de desenvolvimento embrionário, a versão ζ-globina. O agrupamento beta (β) no cromossomo 16 tem seis genes, alguns desativados e um deles utilizado no embrião. Uma análise feita cuidadosamente em cada uma dos pares de base mostrou que cada gene é homologo do outro, formando uma família de genes (Dawkins, 2008).

Lagarta e monarca que se alimenta de serralha

Lagarta e monarca que se alimenta de serralha

No segundo caso, há uma super-dosagem de genes. Um estudo de com 14 espécies de insetos de três ordens distintas com mais de 300 milhões ano de evolução mostrou uma clara interação molecular na relação planta/hospedeiro. A planta serralha produz uma toxina que desativa proteínas-chave nos insetos que as comem. Esta proteína ajuda no transporte de íons que são importantes para a contração muscular e funções nervosas. Para contornar essa toxina, estes insetos (de diferentes ordens) sofreram o mesmo conjunto de mutações genéticas que alteram a proteína de modo a desarticular a ação da toxina. Por outro lado, quatro espécies de outros insetos, independentemente, encontraram uma segunda solução para o dilema. Em vez de alterar a proteína, a evolução duplicou o gene responsável pela produção da proteína-chave. Dessa forma, a proteína original ainda pode fazer seu papel, transportar íons, e a cópia extra é livre para alterar sua seqüência de aminoácidos em uma variedade de lugares tornando-as cada vez mais resistentes à toxina (Zhen et al, 2012).

Em conclusão, novas informações genéticas são criadas pelas mutações que alteram uma informação já presente, ficam fixadas pela seleção natural aquelas que são vantajosas e que conferem aptidão. Este processo vai fluindo entre as gerações, de tal forma que somente as informações com menos incertezas sem mantém no fluxo da vida, uma vez que informação corrompida não aumenta aptidão.

Código genético pode evoluir.

A ideia de que algumas sequências de DNA não podem ser produzidas por processos naturais devido à informação que contêm não tem suporte empírico da genética moderna. De fato, o exato oposto ocorre, e isto fica explícito nas pesquisas publicadas por Adami pesquisas de bioquímica e engenharia genéticas. A informação genética está armazenada em sequências de nucleotídeos que foram quimicamente ligados em conjunto para formar uma molécula de DNA. A genética, bioinformática, bioquímica e biologia molecular concordam de modo unanime que os processos naturais podem sofrer alterações em suas bases nitrogenadas e alterar o produto de seus genes (Adami, 2000).

Desde a descoberta de alguns códons de reatribuição (um códon que é alterado independentemente do seu contexto RNAm) em genes mitocondriais humanos (Barrell et al, 1977), uma variedade de outros desvios do código genético padrão foram identificados em bactérias, arquebactérias, genomas nucleares de eucariotos e, especialmente, os genomas de organelas, apresentando mais de 20 códigos genéticos alternativa (Santos et al, 2004). Por exemplo, códon CUG (normalmente codifica para leucina) no fungo Candida zeylanoides é decodificado como uma leucina em 3-5% dos casos, mas pode formar a serina em 95-97% dos casos. Isto deu credibilidade a este cenário (Suzuki et al, 1997), pois cria ambiguidade química e pode levar a uma competição  entre os RNAs dessas duas variantes.

Codigo genetico

Código genético

Todos os códigos alternativos derivam a partir do código do padrão (Knight et al, 2001). Sabendo também que muitos dos mesmos códons são transferidos (em comparação com o código padrão) em linhagens independentes (por exemplo, a alteração mais frequente é a reatribuição do códon de parada UGA para triptofano), esta conclusão implica que não devem ter predisposições para certas mudanças; e pelo menos em uma destas alterações foi relatada alguma vantagem seletiva (Santos et al, 1999).

Os mecanismos subjacentes deste códon de reatribuição inclui tipicamente mutações em genes de RNAt, onde uma única substituição de nucleotídeo afeta diretamente descodificação (Giege et al, 1998) e leva a modificação da base (Matsuyama et al, 1998), e da edição do RNA (Knight et al, 2001).

Outra via de evolução de código é o recrutamento de aminoácidos não-padrão inseridos no processo. A descoberta do amino ácido 21a, a selenocisteína, e a maquinaria molecular complexo que está envolvida na incorporação da selenocisteína em proteínas (Allmang & Krol, 2006) foi inicialmente considerada como uma prova de que o repertório de aminoácidos é extremamente difícil mudar. Com o avanço das pesquisas descobriu-se um segundo aminoácido não-canônica, a pirrolisina, e, mais importante, a existência de um RNAt específico  revelou a maleabilidade adicional da pirrolisina no código (Krzycki, 2005).

Muito além das variações do código padrão descobertas em organismos com genomas minimizados, muitas tentativas experimentais sobre modificação e expansão do código genético foram feitas, ou estão sendo feitas. Um recente método tem sido desenvolvido para codificar a incorporação de aminoácidos não naturais em genomas (Veja aqui um exemplo) através do recrutamento de qualquer um dos códons de paragem ou de uma série códons para um aminoácido particular. A aplicação desta metodologia já permitiu a incorporação de proteínas de E. coli de mais de 30 aminoácidos não naturais, em uma demonstração impressionante da maleabilidade potencial do código (Wang etal, 2006).

Existem três teorias que explicam a origem e evolução do código genético e tomam como evidência a ambiguidade dos códons como referência, demonstrando que um decréscimo significativo do de códons ricos em bases G-C, de modo que a mudança de códon pode ser impulsionada por uma combinação de mecanismos evolutivos (Massey et al, 2003). Tais mecanismos muitas vezes agem sob a pressão culminando na minimização do genoma, especialmente, em organelas e bactérias parasitas, tais como micoplasmas (Massey et al, 2007). As experiências sobre a incorporação de aminoácidos não-naturais, e variantes naturais e a plasticidade do código genético indica que o código genético tem capacidade de evoluir.

Todos estes desvios envolvem apenas alguns codões, de modo que nas suas características principais, a estrutura do código parece não ter mudado através de toda a história de vida ou, mais precisamente, desde o momento do último ancestral comum universal da vida, o LUCA. Esta universalidade do código genético e a não-aleatoriedade de sua estrutura exige explicação evolutiva. A teoria de expansão do código proposta por Crick (que afirma que a alocação de aminoácidos em códons é dada de modo acidental e aminoácidos relacionados ainda esperariam por códons relacionados) pode ser considerada uma explicação padrão que não requer quaisquer mecanismos especiais, e só é baseada na existência de um LUCA com um sistema de tradução avançado mas impreciso em sua decodificação, que assemelha-se a uma forma moderna (Woese, 1977).

Esta explicação é muitas vezes considerada insatisfatória, pois sob os fundamentos epistemológicos mais gerais, não é explicação, e porque a existência de variantes adicionais de códigos experimentalmente revelou flexibilidade. De fato, parece haver maneiras na qual alterações ao código padrão ocorrem, no entanto, as mesmas modificações limitadas parecem ter evoluído de forma independente em diversas linhagens sugerindo que a estrutura do código poderia ser não-acidental.

As três teorias para a explicação da origem e evolução do código não se excluem e têm sido feito várias tentativas de atribuição de elementos físicos/químicos do padrão de aminoácidos no código genético padrão, ou ainda, uma combinação deles. As idéias centrais de cada uma dessas teorias foram formuladas durante a era clássica de biologia molecular, não muito tempo depois que o código foi decifrado.

A primeira explicação da origem do código vem da teoria estereoquímica (que ja foi comentada aqui) afirma que as atribuições de códons para aminoácidos particulares são determinadas por uma afinidade físico-química que existe entre os aminoácidos e os tripletos de nucleotídeos. Assim, sob esta classe de modelos, a estrutura específica do código não é de todo acidental. O primeiro modelo estereoquímica foi desenvolvido em 1954 pela Gamov, imediatamente após a estrutura de DNA ser definida por Cricks e Watson. Gamow propôs um mecanismo explícito de relacionar aminoácidos com fendas em forma de losango formada por vários nucleotídeos no DNA. Após o código ser decifrado, novos modelos mais realistas estereoquímicos (Dunnill, 1966), foram considerando esta proposta improvável devido à falha de experiências diretas para identificar interações específicas entre os aminoácidos e tripletos (Crick, 1968). No entanto, a capacidade de atração inerente da teoria estereoquímica que, se for válida como esta demonstrando, faz com que seja muito mais fácil de ver como a evolução código foi iniciada. Há também a correlação entre os nucleotídeos e a hidrofobicidade da primeira e segunda posição do códon e até mesmo entre as forças de Van der Waals dos grupos amina que estão livres e interagem com o hidrogênio do códon e anticódon. Em todos estes casos (exceto o último), foram obtidos provas de uma interação direta entre o aminoácido e RNA. Em laboratório, experiências de amplificação e seleção in vitro isolaram sítios de RNA com ligação a vários aminoácidos como a arginina, valina e isoleucina. Acredita-se que no RNA-World (a alguns bilhões de anos) os aminoácidos eram ligados entre si por interações covalentes e não por ribozimas primitivas. As ribozimas que catalisavam reações de pequenos peptídios que passaram a sintetizar diferentes complexos proteicos de RNAt e RNAm muito semelhante ao aparato enzimático existente atualmente na tradução.

A segunda explicação parte da teoria da evolução adaptativa do código e postula que a estrutura do código genético foi moldada sob forças seletivos que fez o código maximamente robusto, isto é, minimizar o efeito de erros sobre a estrutura e função das proteínas sintetizadas. Destaca-se aqui, também a hipótese de “mutação letal” (Epstein, 1966) na qual o código padrão evoluiu para minimizar o efeito de mutações pontuais, que é uma lei puramente química e não uma variação aleatória ou a atuação da seleção natural; e a hipótese de “minimização de erros de tradução” (Woese, 1965) que propõe que a mais importante pressão na evolução do código de seleção foi de minimização do efeito das leituras errôneas.

Uma combinação dos dois tipos de forças é também possível. O código genético atribuiu aminoácidos com propriedades semelhantes a códons que diferem apenas uma base, especialmente na terceira posição. Se notarmos, o quadro de aminoácidos e seus respectivos códons tem a primeira e a segunda base idênticas. Isso quer dizer que aminoácidos como a alanina sempre vão começar com as bases GC.  Carl Woese propôs a teoria de erros de tradução já que nas fases iniciais de decodificação do códon as ligações químicas eram muito instáveis e ineficientes. Essas propriedades de aminoácidos são evidências fortes que dão apoio à teoria adaptativa (Woese, 1965). A hipótese de minimização de erros de tradução também recebeu algum apoio estatístico a partir de simulações (Alff-Steinberger, 1969), que mais tarde se tornou uma das principais ferramentas para analisar o grau de otimização do código padrão.

A terceira proposta de explicação da origem e evolução do código genético vem da teoria da co-evolução e postula que a estrutura do código padrão reflete as vias de biossíntese de aminoácidos (Wong, 1975). De acordo com este cenário, o código co-evoluiu com as vias de biossíntese dos  aminoácidos, isto é, durante a evolução do código, subconjuntos de códons de precursores de aminoácidos foram modificados para codificar os aminoácidos como produto. Embora a idéia básica da hipótese de co-evolução seja a mesma que a do cenário de extensão do código, a identificação explícita de pares de precursores-produtos de aminoácidos tem forte suporte estatístico para o que foi inferido (Wong, 1975) por Crick. Assim, a teoria da co-evolução ganhou ampla aceitação.

Desta forma, quando olhamos para uma euglena, um rotífero ou um muflão-da-Índia, seu código genético e as informações contidas nos genes (e produtos) são fruto de bilhões de anos de evolução química e consequente seleção de informação. Informações corrompidas por erros químicos/incertezas não podem aumentar o fitness e são punidas (Adami et al2000), informações vantajosas e neutras são mantidas. Todos esses organismos se apresentam como fruto de mecanismos de minimização de erros, co-evolução de de vias químicas e afinidades biquímicas criando estruturas moleculares cujo produto favorece a sobrevivência das diversas formas de vida.

Saiba mais em:

O que é vida?

O que é informação genética?

Algoritmo da vida – O fluxo de informação genética

DNA ou RNA? eis a questão – Por que o DNA (e não o RNA) é a molécula que armazena a informação genética?

Pré-Bióticidade – A síntese do cianoacetileno, cianoacetaldeído e bases pirimídicas e púricas

Victor Rossetti

Palavras chave: NetNature, Rossetti, Informação genética, Código genético, Evolução, DNA, RNA, Genes, Proteína.

.

Referências

Adami, C. Ofria, C. Collier. C, C. Evolution of biological complexity PNAS, April 25, 2000 u vol. 97 u no. 9 u 4463–4468
Allmang C, Krol A. Selenoprotein synthesis: UGA does not end the story. Biochimie. 2006;88(11):1561–1571.
Alff-Steinberger C. The Genetic Code and Error Transmission. Proceedings of the National Academy of Sciences. 1969;64(2):584–591
Barrell BG, Bankier AT, Drouin J. A different genetic code in human mitochondria. Nature. 1979;282(5735):189–194.
Crick FH. The origin of the genetic code. J Mol Biol. 1968;38(3):367–79.
Dawkins, R. A grande história da evolução. ED. Companhia das letras. 2008.
Dunnill P. Triplet nucleotide-amino-acid pairing; a stereochemical basis for the division between protein and non-protein amino-acids. Nature. 1966;210(5042):1267–1268.
Epstein CJ. Role of the amino-acid “code” and of selection for conformation in the evolution of proteins. Nature. 1966;210(5031):25–28.
Giege R, Sissler M, Florentz C. Universal rules and idiosyncratic features in tRNA identity. Nucleic Acids Research. 1998;26(22):5017–5035
Knight RD, Freeland SJ, Landweber LF. Rewiring the keyboard: evolvability of the genetic code. Nat Rev Genet. 2001;2:49–58
Koonin, E. V; Novozhilov, A. S. Origin and evolution of the genetic code: the universal enigma. IUBMB Life. 2009 February ; 61(2): 99–111.
Krzycki JA. The direct genetic encoding of pyrrolysine. Curr Opin Microbiol. 2005;8(6):706–712.
Matsuyama S, Ueda T, Crain PF, McCloskey JA, Watanabe K. A novel wobble rule found in starfish mitochondria. Presence of 7-methylguanosine at the anticodon wobble position expands decoding capability of tRNA. Journal of Biological Chemistry. 1998;273(6):3363–3368.
Massey SE, Moura G, Beltrao P, Almeida R, Garey JR, Tuite MF, Santos MAS. Comparative Evolutionary Genomics Unveils the Molecular Mechanism of Reassignment of the CTG Codon in Candida spp. Genome Research. 2003;13(4):544–557.
Massey SE, Garey JR. A Comparative Genomics Analysis of Codon Reassignments Reveals a Link with Mitochondrial Proteome Size and a Mechanism of Genetic Code Change Via Suppressor tRNAs. Journal of Molecular Evolution. 2007;64(4):399–410.
Orgel, Leslie (November 2000). “A Simpler Nucleic Acid“. Science 290 (5495): 1306–7.
Santos MAS, Moura G, Massey SE, Tuite MF. Driving change: the evolution of alternative genetic codes. Trends Genet. 2004;20(2):95–102
Santos MAS, Cheesman C, Costa V, Moradas-Ferreira P, Tuite MF. Selective advantages created by codon ambiguity allowed for the evolution of an alternative genetic code in Candida spp. Molecular Microbiology. 1999;31(3):937–947.
Shannon CE. 1948 A mathematical theory of communication. Bell Syst. Tech. J. 27, 379–423.
Suzuki T, Ueda T, Watanabe K. The “polysemous” codon — a codon with multiple amino acid assignment caused by dual specificity of tRNA identity. The EMBO Journal. 1997;16:1122–1134.
Wang L, Xie J, Schultz PG. Expanding the genetic code. Annu Rev Biophys Biomol Struct. 2006;35:225–249.
Woese CR. On the evolution of the genetic code. Proc Natl Acad Sci USA. 1965;54(6):1546–1552.
Woese CR, Fox GE. The concept of cellular evolution. J Mol Evol. 1977;10(1):1–6.
Wong JTF. A Co-Evolution Theory of the Genetic Code. Proceedings of the National Academy of Sciences. 1975;72(5):1909–1912.
Zhen, Matthew L. Aardema, Edgar M. Medina3, Molly Schumer, Peter Andolfatto, Parallel Molecular Evolution in an Herbivore Community. Science 28 September 2012:  Vol. 337 no. 6102 pp. 1634-1637

One thought on “ORIGEM DE INFORMAÇÃO GENÉTICA E O CÓDIGO DA VIDA.

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s