ALGORITMO DA VIDA – O FLUXO DE INFORMAÇÃO GENÉTICA

Das muitas questões abertas a cerca de como a vida surgiu da não-vida, o maior desafio é “varar” o abismo entre a química complexa e a simplicidade biológica da primeira forma de vida. Até o menor Mycoplasma é incomensuravelmente mais complexo do que qualquer rede de reação química engenheirada no laboratório com a tecnologia que temos disponível atualmente.

Sem título

Não sabemos se o estado de vida é unicamente uma química muito complexa, ou se há algo de fato fundamentalmente distinto que esta contido na matéria viva. Talvez sem uma definição específica para a vida, o problema de como ela começou não esteja tão perto de uma conclusão, mas o primeiro passo foi dado por Schrodinger.

Construir um sistema químico simples capaz de evoluir segundo a perspectiva darwiniana e posteriormente seguir o mesmo caminho é o grande dilema sobre a origem da vida (Joyce, 2012). O que temos de evidência aponta para um período longo da evolução darwiniana na qual este simples e humilde replicador acabou por fim ser transformando em uma complexa entidade suficiente para que indiscutivelmente se torne o que chamamos de organismo vivo (Joyce, 200). A evolução darwiniana se aplica a tudo, desde programas simples de software, replicadores moleculares, memes, sistemas tão complexos como a vida multicelular e até mesmo potencialmente ao cérebro humano (Fernando et al, 2012), mas a evolução não explica a origem da vida, e sim a diversidade de formas de vida através da luta pela sobrevivência.

A maneira pela qual a informação flui através (e entre) das células e suas respectivas estruturas é completamente diferente de qualquer outra coisa observada na natureza. Se a vida é mais do que apenas uma química complexa espera-se que suas propriedades de gestão de informação exclusivas possam ser um grande indicativo de distinção (Nurse, 2008). Infelizmente, a forma como as informações operam em biologia não é facilmente caracterizada (Kuppers,1990). Da mesma forma com que as informações segundo Shannon são úteis para a informação biológica qualidades como a funcionalidade e contextualidade diferenciam informação de uma coleção de meros fragmentos informacionais.

O conteúdo de informação de DNA é geralmente definido pela medida sequencial de Shannon. Porém, o genoma é apenas uma pequena parte da história, pois os DNA não é um modelo para um organismo: nenhuma informação é processada ativamente somente pelo DNA (Noble, 2008).

Pelo contrário, o DNA é um repositório passivo para a transcrição dos dados armazenados no RNA, alguns (mas não todos) dos quais passam a ser traduzido em proteínas.

A informação biologicamente relevante é armazenada no DNA, portanto, tem muito pouco a ver com a sua natureza química específica, além de que é um polímero linear digital. O material genético poderia facilmente ser uma variedade diferente de ácido nucleico (ou uma molécula completamente diferente), como já foi confirmado experimentalmente (Pinhero, 2012). É a funcionalidade dos RNA e proteínas que é biologicamente importante.

A funcionalidade de seqüências de RNA e proteína-expressa é claramente dependente de um pequeno subconjunto dessas moléculas é causalmente eficaz nas redes bioquímicas de uma célula cujo funcionamento depende de condições como salinidade do citoplasma ou pH inclui outras proteínas expressas, RNAs, metabolitos e uma série de outras moléculas, a distribuição espacial crucial para os seus respectivos papéis individuais. A característica mais importante da informação biológica é a sua funcionalidade, sujeita ao controle informacional e feedbacks, para que as dinâmicas que geralmente mudam com o tempo seja ao mesmo tempo uma função do estado atual e da história da o organismo (Gould & Lewontin, 1979).

Nesse contexto um dilema surge; quem veio primeiro, a herança genética ou o metabolismo?  Essa questão é fundamental porque um não pode funcionar sem o outro na atual condição da vida e essa dualidade se expressa através do sistema genoma-proteoma. O proteoma é o conjunto de proteínas e variantes de proteínas que podem ser encontrados dentro da célula.

A origem da vida, tende-se a se dividir em dois campos de pesquisa denominados “Genetic first” e “Metabolism first”.

Genética e metabolismo podem ser unificados sob um quadro conceitual único na qual o metabolismo atual como uma forma de processamento de informação analógica contrastando com a informação digital da genética. Eis o dilema.

Em sistemas vivos as partes químicas correspondem ao hardware e as informações (genéticas e epigenética) correspondem ao software (Davies, 1999) proporcionando ao desafio saber quem veio primeiro, a informação analógica ou digital, ou o hardware.

No paradigma Genetic first identifica-se a informação repositória digital como a característica mais importante dos primeiros sistemas vivos, estudada em abordagens biológicas sobre a origem da vida. A dualidade genótipo-fenótipo é que o mundo moderno “DNA-RNA-proteína” evoluiu de simples sistema precursor envolvendo apenas as principais espécies moleculares que atuaram tanto como papel de suporte de informação quanto de catalisador enzimático.

Nas formas de vida atuais o RNA é um mediador bioquímico que permite a tradução do DNA em proteínas. O RNA é único na medida em que pode preencher ambos os papéis, polímero genético e bioquímico-catalisador, com novas funções de expansão funcional de RNAs continuamente a serem descobertos.

Isto levou a famosa hipótese RNA-World onde toda a vida conhecida é resultado de uma população ancestral de organismos que utilizou RNA como seu único grande biopolímero antes do advento de DNA e proteínas (Gilbert, 1986). (Veja mais em DNA OU RNA? EIS A QUESTÃO – POR QUE O DNA (E NÃO O RNA) É A MOLÉCULA QUE ARMAZENA A INFORMAÇÃO GENÉTICA?)

Apesar da elegância conceitual do RNA-World a hipótese enfrenta problemas, principalmente por causa do imenso desafio de síntese de nucleotídeos de RNA em condições pré-bióticas plausíveis e a suscetibilidade de oligômeros de RNA em degradar-se por hidrólise (Levy, Miller, 1998). Essa dificuldade pode ser suprimida caso confirme-se que o RNA foi precedido por um polímero genético alternativo tal como o ácido nucleico peptídico, chamado de PNA (Cline, 1996) ou de ácido nucleico treose TNA (Orgel, 2000).  Parte deste dilema já foi resolvido, veja PRÉ-BIÓTICIDADE – A SÍNTESE DO CIANOACETILENO, CIANOACETALDEÍDO E BASES PIRIMÍDICAS E PÚRICAS.

Na origem pelo cenário da genetic first tem sido sugerido que a vida precoce podem ter sofrido um ”upgrade de hardware” com sucessivas “atualizações” que eventualmente proporcionou a transição de um polímero genético proto-RNA, podendo ser até um substrato inorgânico (Cairns-Smith, 1982 & Davies, 2004) em bioquímica baseada no RNA, numa fase posterior de sua história evolutiva. Este sistema, então, passou por atualizações de hardware adicional que culminou no sistema DNA-RNA-Proteína que observamos hoje.

O proteoma e quase todas as interações bioquímicas na célula processam a informação em formato analógico, ou seja, através de reações químicas que se baseiam em taxas contínuas. Isso significa que muito da informação digital armazenada no DNA deve primeiro ser transcrita e traduzida antes que se torne algoritmicamente significativas no contexto da célula onde é então processada como informação analógica, através de redes de interação de proteínas. Por causa da estrutura organizacional de sistemas capazes de processamento algorítmico/instrucional das informações não é um único sistema monomolecular, onde um único polímero desempenha o papel de catalisador e suporte informacional. De fato, é consistente com a organização do fluxo de informações em sistemas vivos, porque não existe a possibilidade de separar o armazenamento de informação de processamento de informação que, por si só é uma característica distintiva da vida moderna. Então, esses sistemas digitais representam uma forma bastante trivial de processamento de informação que não consegue captar a estrutura lógica da vida como a conhecemos (Walker & Davies, 2012).

Sob outra perspectiva, notamos que as condições geoquímicas na Terra primitiva geralmente favorecem um formato analógico para os primeiros sistemas vivos. Em sistemas químicos analógicos, a informação está contida em uma composição continuamente variável de um conjunto de moléculas, e não em uma seqüência discreta.

No cenário Metabolism first a origem da vida cai dentro deste quadro analógico, postulando que a vida primitiva foi baseada em ciclos metabólicos autocatalíticos que teriam sido construídos de forma semelhante a sistemas análogos de computador juntos que executam executar soluções para problemas específicos (Dyson, 1982 & Kauffman, 1993). Neste cenário, o edifício químico dos blocos (que variam de lipídios (Segre´ D, et al, 2001), a peptídeos (Huber  & Wachtershaüser, 1998), ou complexos de ferro-sulfureto (Wachtershauser, 1992) são geralmente mais facilmente sintetizados em condições abióticas do que qualquer polímero genético candidato conhecido, e portanto, poderiam ter sido muito mais abundantes na Terra com condições pré-bióticas. A informação hereditária, neste caso, passa a ser consolidada a partir das razões de composição das moléculas nos conjuntos organizados. Embora se sugere que esses “composomas” possam fornecer um mecanismo de herança primitiva (Segre´ D & Lancet, 1999), não é claro que eles possam evoluir pois as informações sobre a composição poderiam degradar ao longo de gerações sucessivas inibindo a capacidade de evolução aberta (Vasas et al, 2010).

Essa universalidade seria extremamente difícil de projetar em um sistema somente analógico devido aos grandes desafios associados à construção de redes de reações onde cada uma delas (programada) possa ser quimicamente ortogonal a todas as outras reações. Ortogonalidade é um conjunto relativamente pequeno de construções primitivas podem ser combinadas em um número relativamente pequeno de maneiras para construir as estruturas de dados e controle da linguagem. Por comparação, é relativamente fácil de conseguir interruptores digitalizados.

O controle é, portanto, muito mais fácil de conseguir em um sistema analógico com interruptores digitais do que em um sistema exclusivamente analógico (Walker & Davies, 2012).

Tendo todos estes elementos, sistemas exclusivamente analógicos não são capazes de adaptação da mesma maneira como são sistemas vivos. A vida moderna é um híbrido: memória digital e chaves digitais permitem o controle sobre muitos estados analógicos, e conseguinte, permitem adaptabilidade às mudanças das condições ambientais com o mesmo conjunto de ferramentas básicas. Essa é outra maneira de afirmar, em termos de informação, que os sistemas exclusivamente analógicos não são tão versáteis quanto os sistemas analógicos com controle de informação digital e, como tal, tem capacidade evolutiva muito limitada (Chandra et al, 2011).

Explicar a origem de ambos os aspectos da vida (hardware e software), é apenas parte de toda a história. Explicando o substrato da química da vida e dizer que ele é a solução para a origem da vida é como apontando para um naco de silício e/ou cobre como uma explicação para os acontecimentos dentro de um computador. Esta transição onde um sistema químico leva literalmente a uma vida propriamente dita é caracterizado por uma dinâmica informativa que se torna dissociada das regras da química local. O problema do “ovo ou a galinha” não é o verdadeiro ponto de discórdia. O quebra-cabeça esta essencialmente na organização causal ligada com a separação dos aspectos informativos e mecânicos em discursos causais paralelos. O verdadeiro desafio da origem da vida é explicar como os sistemas de controle de informações instrucionais surgem naturalmente e espontaneamente a partir de uma mera dinâmica molecular (Walker & Davies, 2012).

Isso nos leva a um análogo com os autômatos de Neumann. A natureza instrucional ou algorítmica da informação biológica foi há muito tempo identificada como uma propriedade chave, com uma primeira tentativa de formalização feita por von Neumann. O autômato de Turing tinha paralelos com o sistema nervoso central humano e sistemas computacionais que era capaz de construir dispositivos capazes de computar funções. Esse autômato com dispositivos hipotéticos era simples com alta capacidade de memória.

Autômato de Turin

Autômato de Turing

Por analogia, Neumann inventou uma abstração chamada Construtor Universal, uma máquina capaz de usar os materiais do seu ambiente para construir qualquer estrutura física possível (de acordo com as leis da física), incluindo a si mesma. Neumann propôs que, no caso da biologia o projeto deve desempenhar um papel duplo: não só deveria conter instruções algorítmicas para fazer um certo tipo de máquina (como o Construtor Universal) mas também deveria ser copiada integralmente como se fosse uma estrutura física, sem referência com as instruções nele contidas, e, assim, fazer referência a si mesmo de forma indireta. Este duplo papel hardware/software espelha precisamente o DNA, onde os genes atuam tanto passivamente como estruturas físicas a serem copiadas, e estão ativamente lendo-se como uma fonte de instruções algorítmicas (Walker & Davies, 2012).

Para implementar esse papel dualista, von Neumann anexa uma “unidade de supervisão” em seu autômato cuja tarefa é fiscalizar qual desses dois papéis deveria aparece em um determinado momento, garantindo assim que processo seja visto tanto como um algoritmo para ser lido quanto uma estrutura para ser copiada, dependendo do contexto. Desta forma, a organização do autômato von Neumann garante que as instruções permaneçam logicamente diferenciadas de sua representação física. Para ser funcional ao longo de gerações sucessivas, um autômato completo auto-replicante deve, ser constituído por três componentes básicos: um construtor universal, um diagrama instrucional e uma unidade de supervisão.

Para uma aproximação grosseira, toda a vida conhecida contém esses três componentes, o que é particularmente notável, considerando que von Neumann formulou suas idéias antes das descobertas da biologia molecular moderna, incluindo a estrutura do DNA e do Ribossomo. A partir dos insights fornecidos pela biologia molecular ao longo dos últimos 50 anos, agora podemos identificar que todas as funções conhecidas da vida, de uma maneira ou de outra apresentam processos semelhantes aos do autômato de von Neumann, onde o DNA fornece um algoritmo (parcial), os ribossomos funcionam como o núcleo do construtor universal e as enzimas DNA polimerases atuam fiscalizando a integridade da informação.

Por ser um análogo, existem diferenças importantes. O DNA não contém um plano para a construção de toda a célula, contém apenas pequenas partes de um algoritmo biológico muito maior, o que pode ser grosseiramente descrito como o controle distribuído “top-down” de um organismo. O algoritmo para a construção de um organismo é, portanto, não apenas armazenado em uma sequência digital linear, mas também no estado de todo o sistema (por exemplo, fatores epigenéticos tais como o nível de expressão genética, modificações pós-traducionais das proteínas, metilações, arquitetura da cromatina, distribuição no nucleosoma, fenótipo celular e elementos ambientais).

Sintese proteica

Esquema de transcrição de RNAm e tradução em proteínas funcionais

O algoritmo em si é, portanto, altamente descentralizado, distribuídos em todo o sistema cuja dinâmica ele codifica. Além disso, embora o ribossomo forneça uma aproximação grosseira de um construtor universal, este nas células vivas requer uma série de mecanismos distribuídos para a reprodução de uma célula inteira. Sendo assim, o construtor universal fornece uma visão fundamental sobre a natureza da vida, direcionando a atenção para a estrutura lógica de processamento de informação e controle e fluxo de informações em sistemas vivos.

Assim, sistemas vivos e não vivos diferem fundamentalmente na forma como a informação é organizada e flui através do sistema: sistemas biológicos são distintos porque as informações manipulam a matéria.

Isto leva a um contexto novo e diferente, a narrativa causal com influências causais correndo para cima e para baixo na hierarquia da estrutura dos sistemas. Na vida moderna, os genes podem ser regulados negativamente por cima, ou por sinais físicos e químicos do ambiente. Por exemplo, tensões mecânicas sobre uma célula podem afetar a expressão do gene.

Mecano-transdução, transdução elétrica e na transdução de sinal químico, processos biológicos constituem exemplos de causalidade “top-down” em que o sistema como um todo exerce controle causal sobre um subsistema, como um gene, através de um conjunto de dependentes de constritores. A distinção fundamental entre a origem da vida e outras transições emergentes é o início do controle da informação distribuída, que dependente do contexto permite do nexo de causalidade, em que uma entidade sistêmica abstrata e não-física (informação algorítmica) torne-se efetivamente um agente causal capaz de manipular sua substrato material de (Auletta, Ellis, Jaeger, 2008).

Isso tudo fornece uma definição bem definida para a transição da não-vida para a vida, com base no conceito “top-down” dentro de um quadro informativo.Faz sentido tentar explicar a origem da vida se ela resultou de processos de moderadamente de alta probabilidade, de modo que podemos razoavelmente esperar nos termos da ciência moderna.

A vantagem desta perspectiva é que ela fornece uma base para a identificação da origem da vida como uma transição bem definida. Sendo assim, ela fornece um novo pensamento em como a vida poderia ter surgido em um planeta sem vida, mudando a ênfase para as origens do controle da informação, em vez de um início a partir da evolução darwiniana ou do aparecimento de conjuntos autocatalíticos (sistemas digitais que não possuem controle de informações), que talvez possam ser importantes para a história da origem da vida não definem como ou quando a vida emerge como uma função da complexidade química. Sabemos então que sob esta perspectiva a evolução darwiniana não tem a capacidade de elucidar os mecanismos físicos subjacentes a transição da não-vida para a vida ou para distinguir um do outro de tal forma que a evolução de uma espécie ainda deve conduzir essa transição.

A evolução darwiniana em um sistema químico provavelmente não foi o passo crítico no surgimento da vida e como vimos, os sistemas de auto-replicantes pode fazer isso. O surgimento da vida provavelmente foi marcado por uma transição na capacidade de processamento de informações. Esta transição deve ser caracterizada por uma inversão no fluxo causal de informações a partir da base para cima em uma situação caracterizada pela causalidade bidirecional. Para entender isso mais aprofundadamente faz-se necessário então programas que incluam a identificação da arquitetura causal de redes bioquímicas conhecidas através da aplicação de medidas aos melhores candidatos a responder essas dúvidas focando-se especialmente em redes de regulação, em vias bioquímicas antigas para identificar as arquiteturas de rede mínimas necessárias para apoiar a relação causal informativa observada na vida existente (Walker & Davies, 2012).

Um dilema importante ainda não solucionado é estabelecer como o controle para determinar como a informação emerge em um ambiente de RNA-world, de cinética química, e como a mecanismos primitivos de controle podem evoluir e tornar-se cada vez mais refinados depois que a aquisição algorítmica ocorreu.

Victor Rossetti

Palavras Chave: NetNature, Rossetti, Informação genética, Hereditariedade, Genética, DNA, RNA, Proteínas, Shannon

.

Referências

Walker S. I and Paul C. W. Davies. The algorithmic origins of life. J R Soc Interface 10: 2012086
Dyson FJ. 1982 A model for the origin of life. J. Mol. Evol. 18, 344–350.
Kauffman S. 1993 The origins of order: self- organization and selection in evolution. Oxford, UK: Oxford University Press.
Segre´ D, Ben-Eli D, Deamer D, Lancet D. 2001 The lipid world. Orig. Life Evol. Biosph. 31, 119–145.
Huber C, Wa¨chtershaüser G. 1998 Peptides by activation of amino acids with CO on (Ni,Fe)S surfaces: implications for the origin of life. Science 281, 670–672.
Wachtershauser G. 1992 Groundworks for na evolutionary biochemistry: the iron–sulphur world.
Prog. Biophys. Mol. Biol. 58, 85–201.
Segre´ D, Lancet D. 1999 A statistical chemistry approach to the origin of life. Biochem. Mol. Biol. 12, 382–397.
Vasas V, Szathma´ry E, Santos M. 2010 Lack of evolvability in self-sustaining autocatalytic networks constraints metabolism-first scenarios for the origin of life. Proc. Natl Acad. Sci. USA 107, 1470–1475.
Chandra FA, Buzi G, Doyle JC. 2011 Glycolytic oscillations and limits on robust efficiency. Science 333, 187–192.
Auletta G, Ellis GFR, Jaeger L. 2008 Top-down causation by information control: from a
philosophical problem to a scientific research programme. J. R. Soc. Interface 5, 1159–1172.

One thought on “ALGORITMO DA VIDA – O FLUXO DE INFORMAÇÃO GENÉTICA

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s