Resumo: Tratamos o conjunto de letras ATCG (nucleotídeos ou pares de bases) do código genético como sequências binárias e passeios aleatórios e, então, estudamos tais séries com métodos não-lineares. Abordamos as sequências de nucleotídeos depositados no GenBank (http://www.ncbi.nih.gov/) do DNA cromossômico e mitocondrial tanto de organismos multicelulares (3% do genoma humano, genoma completo do verme Caenorhabditis elegans, etc) como também de bactérias, incluindo o genoma completo da Xylella fastidiosa, Xanthomonas citri e campestre. As análises multifractal e de correlação em um total de 500 milhões de nucleotídeos revelam estruturas ocultas na organização do genoma. As sequências não-codificantes do genoma, conhecidos “junk DNA,” são responsáveis pela auto-similaridade na distribuição dos genes nos organismos superiores, indicando a existência de uma regra simples nos clusters de genes. Ainda nos organismos multicelulares, encontramos uma correlação entre genes distantes em pelo menos 10 mil pares de bases. Essas estruturas estão ausentes em bactérias, demonstrando que a organização genética nos eucariotos superiores é mais complexa do que em bactérias. Além disso, reportamos que as palavras palindrômicas, comuns no genoma, formam um mosaico multifractal. Os palíndromos expressam o código genético dobrando a dupla hélice em loops, presentes na composição de moléculas como o RNA de transferência (tRNA), ribossomos (rRNA), etc.
Discussão