O novo trabalho, desenvolvido pelo consórcio internacional de investigadores T2T, está plasmado em seis artigos publicados na revista científica Science e em mais de uma dezena de artigos divulgados noutras publicações.

Máquinas de sequenciação mais sofisticadas e novos métodos de análise computacional permitiram decifrar as partes do genoma humano que tinham sido descartadas como lixo e sequenciar na totalidade, sem falhas, o material genético de células humanas, de uma ponta à outra dos cromossomas, de um telómero a outro – daí a designação do consórcio (Telomere to Telomere, Telómero para Telómero, T2T).

A sequenciação do genoma humano finalizada em 2003 por um outro consórcio internacional de cientistas “correspondia à sequenciação de todas as partes do genoma que não são altamente repetitivas”, esclareceu à Lusa a geneticista Luísa Pereira, do i3S – Instituto de Investigação e Inovação em Saúde da Universidade do Porto.

A investigadora, que coordena no i3S o grupo de trabalho sobre diversidade genética, explicou que a tecnologia da altura “só permitia estudar as bases (as letras) de pequenos segmentos (centenas de bases) e o genoma era reconstituído como um puzzle gigante destes pequenos fragmentos”.

Em 2017 passou a estar disponível tecnologia “que permite sequenciar de uma só vez fragmentos muito longos”, possibilitando “resolver zonas altamente repetitivas”, acrescentou Luísa Pereira, assinalando que o consórcio T2T, do qual não faz parte, usou duas máquinas de sequenciação com as quais obteve “uma resolução perfeita”. Uma das máquinas pode ler até um milhão de letras de ADN com uma “precisão modesta” e a outra “pode ler cerca de 20.000 letras com uma precisão quase perfeita”.

As lacunas preenchidas pela nova sequência do genoma humano incluem todos os braços curtos de cinco cromossomas e algumas das regiões mais complexas, como as que têm cópias extra de genes e ADN repetitivo dentro e em redor dos telómeros (extremidades dos cromossomas que os protegem) e dos centrómeros (estruturas centrais que separam os braços curto e longo dos cromossomas e estão envolvidas na divisão celular).

O trabalho do consórcio T2T pôs também a descoberto longos trechos de ADN que são duplicados no genoma e são conhecidos por desempenhar papéis importantes na evolução humana e na doença.

Para os cientistas que assinam o trabalho, ter uma sequência completa, sem falhas, dos cerca de três mil milhões de bases ou letras do ADN (moléculas de ácido desoxirribonucleico que contêm as instruções genéticas que transmitem as características herdadas dos pais) é fundamental para compreender as contribuições genéticas para certas doenças ou como o ADN nas pessoas difere, podendo vir a ser uma ferramenta útil na medicina personalizada.

“No futuro, quando alguém tiver o seu genoma sequenciado, poderemos identificar todas as variantes no seu ADN e usar essas informações para orientar melhor a sua saúde”, afirmou, citado em comunicado, o investigador Adam Phillippy, que trabalha no Instituto Nacional de Investigação do Genoma Humano, nos Estados Unidos, e que codirige o consórcio T2T.

O consórcio usou a sequência agora completa para descobrir mais de dois milhões de variantes adicionais no genoma humano, um trabalho que fornecerá informação mais precisa sobre as variantes em 622 genes clinicamente relevantes.

Segundo os cientistas, os resultados obtidos apontam, ainda, para “padrões mais complexos” de alteração de genes que podem ter ajudado a criar a espécie humana e a explicar a sua rápida evolução.

O genoma humano é composto por pouco mais de seis mil milhões de letras de ADN distribuídas por 23 pares de cromossomas (estruturas organizadas de células que contêm genes, responsáveis pela codificação da informação genética). Em cada um desses pares de cromossomas, um cromossoma provém do pai e o outro da mãe.

Para ler um genoma, os cientistas cortam todo o ADN em peças com centenas a milhares de letras. As máquinas de sequenciação leem as letras de cada peça e os cientistas tentam colocá-las na ordem certa como se estivessem a montar um puzzle. O desafio é que algumas regiões do genoma repetem as mesmas letras várias vezes.

Os investigadores do consórcio T2T sequenciaram cada cromossoma de uma extremidade à outra numa linha celular especial que tinha duas cópias idênticas de cada cromossoma (a maioria das células humanas tem duas cópias ligeiramente diferentes de cada cromossoma).

De acordo com um comunicado da universidade norte-americana da Califórnia, que faz parte do consórcio, foram adicionados quase 200 milhões de pares de bases de novas sequências de ADN, incluindo 99 genes que provavelmente codificam proteínas e quase 2.000 genes candidatos que precisam de ser melhor estudados.

O T2T está a trabalhar para sequenciar um genoma humano com diferentes cromossomas herdados do pai e da mãe e associou-se ao Consórcio de Referência do Pangenoma Humano para ler as sequências de ADN de 350 pessoas com o intuito de obter a descodificação completa do genoma humano mais diversificado possível.