Duplicação de genes - Gene duplication

A duplicação gênica (ou duplicação cromossômica ou amplificação gênica ) é o principal mecanismo por meio do qual um novo material genético é gerado durante a evolução molecular . Pode ser definido como qualquer duplicação de uma região do DNA que contém um gene . As duplicações gênicas podem surgir como produtos de vários tipos de erros na replicação do DNA e no maquinário de reparo , bem como por meio da captura fortuita por elementos genéticos egoístas. Fontes comuns de duplicação de genes incluem recombinação ectópica , evento de retrotransposição , aneuploidia , poliploidia e deslizamento de replicação .

Mecanismos de duplicação

Recombinação ectópica

As duplicações surgem de um evento denominado crossing-over desigual que ocorre durante a meiose entre cromossomos homólogos desalinhados. A chance de isso acontecer é função do grau de compartilhamento de elementos repetitivos entre dois cromossomos. Os produtos dessa recombinação são uma duplicação no local da troca e uma exclusão recíproca. A recombinação ectópica é tipicamente mediada pela similaridade de sequência nos pontos de quebra duplicados, que formam repetições diretas. Elementos genéticos repetitivos, como elementos transponíveis , oferecem uma fonte de DNA repetitivo que pode facilitar a recombinação, e são freqüentemente encontrados em pontos de quebra de duplicação em plantas e mamíferos.

Esquema de uma região de um cromossomo antes e depois de um evento de duplicação

Deslizamento de replicação

O deslizamento da replicação é um erro na replicação do DNA que pode produzir duplicações de sequências genéticas curtas. Durante a replicação, a DNA polimerase começa a copiar o DNA. Em algum ponto durante o processo de replicação, a polimerase se dissocia do DNA e a replicação é interrompida. Quando a polimerase se reconecta à fita de DNA, ela alinha a fita replicante em uma posição incorreta e, incidentalmente, copia a mesma seção mais de uma vez. O deslizamento da replicação também é frequentemente facilitado por sequências repetitivas, mas requer apenas algumas bases de similaridade.

Retrotransposição

Retrotransposons , principalmente L1 , podem ocasionalmente atuar no mRNA celular. As transcrições são transcritas reversamente para o DNA e inseridas em locais aleatórios no genoma, criando retrogenes. A sequência resultante geralmente carece de íntrons e geralmente contém sequências poli que também estão integradas ao genoma. Muitos retrogenes exibem mudanças na regulação gênica em comparação com suas sequências genéticas parentais, o que às vezes resulta em novas funções.

Aneuploidia

A aneuploidia ocorre quando a não disjunção em um único cromossomo resulta em um número anormal de cromossomos. A aneuploidia costuma ser prejudicial e, em mamíferos, costuma levar a abortos espontâneos (abortos espontâneos). Alguns indivíduos aneuploides são viáveis, por exemplo, a trissomia 21 em humanos, que leva à síndrome de Down . A aneuploidia freqüentemente altera a dosagem do gene de maneiras que são prejudiciais ao organismo; portanto, é improvável que se espalhe pelas populações.

Poliploidia

A poliploidia , ou duplicação do genoma completo, é um produto da não disjunção durante a meiose, que resulta em cópias adicionais de todo o genoma. A poliploidia é comum em plantas, mas também ocorreu em animais, com duas rodadas de duplicação do genoma completo ( evento 2R ) na linhagem de vertebrados levando aos humanos. Também ocorreu nas leveduras hemiascomicetas ∼100 mya.

Depois de uma duplicação do genoma inteiro, há um período relativamente curto de instabilidade do genoma, extensa perda de genes, níveis elevados de substituição de nucleotídeos e religação da rede regulatória. Além disso, os efeitos da dosagem do gene desempenham um papel significativo. Assim, a maioria das duplicatas é perdida em um curto período; no entanto, uma fração considerável das duplicatas sobrevive. Curiosamente, os genes envolvidos na regulação são preferencialmente retidos. Além disso, a retenção de genes reguladores, principalmente os genes Hox , levou à inovação adaptativa.

A evolução rápida e a divergência funcional foram observadas ao nível da transcrição de genes duplicados, geralmente por mutações pontuais em motivos curtos de ligação a fatores de transcrição. Além disso, a evolução rápida dos motivos de fosforilação de proteínas, geralmente incorporados em regiões intrinsecamente desordenadas de evolução rápida, é outro fator que contribui para a sobrevivência e rápida adaptação / neofuncionalização de genes duplicados. Assim, parece existir uma ligação entre a regulação gênica (pelo menos no nível pós-tradução) e a evolução do genoma.

A poliploidia também é uma fonte bem conhecida de especiação, uma vez que os descendentes, que têm diferentes números de cromossomos em comparação com as espécies parentais, muitas vezes são incapazes de cruzar com organismos não poliplóides. As duplicações do genoma inteiro são consideradas menos prejudiciais do que a aneuploidia, pois a dosagem relativa dos genes individuais deve ser a mesma.

Como um evento evolutivo

Destino evolucionário de genes duplicados

Taxa de duplicação de genes

Comparações de genomas demonstram que duplicações gênicas são comuns na maioria das espécies investigadas. Isso é indicado por números de cópias variáveis ​​(variação do número de cópias) no genoma de humanos ou moscas-das-frutas. No entanto, tem sido difícil medir a taxa em que essas duplicações ocorrem. Estudos recentes produziram uma primeira estimativa direta da taxa de duplicação do gene em todo o genoma em C. elegans , o primeiro eucarioto multicelular para o qual tal estimativa tornou-se disponível. A taxa de duplicação gênica em C. elegans é da ordem de 10-7 duplicações / gene / geração, ou seja, em uma população de 10 milhões de vermes, haverá uma duplicação gênica por geração. Esta taxa é duas ordens de magnitude maior do que a taxa espontânea de mutação pontual por sítio de nucleotídeo nesta espécie. Estudos mais antigos (indiretos) relataram taxas de duplicação específicas do locus em bactérias, Drosophila e humanos variando de 10 -3 a 10 -7 / gene / geração.

Neofuncionalização

As duplicações gênicas são uma fonte essencial de novidades genéticas que podem levar à inovação evolutiva. A duplicação cria redundância genética, em que a segunda cópia do gene geralmente está livre de pressão seletiva - ou seja, as mutações dele não têm efeitos deletérios para o organismo hospedeiro. Se uma cópia de um gene sofre uma mutação que afeta sua função original, a segunda cópia pode servir como uma 'peça sobressalente' e continuar a funcionar corretamente. Assim, genes duplicados acumulam mutações mais rápido do que um gene funcional de cópia única, ao longo de gerações de organismos, e é possível que uma das duas cópias desenvolva uma função nova e diferente. Alguns exemplos de tal neofuncionalização são a aparente mutação de um gene digestivo duplicado em uma família de peixes do gelo em um gene anticongelante e a duplicação levando a um novo gene de veneno de cobra e a síntese de 1 beta-hidroxitestosterona em porcos.

Acredita-se que a duplicação de genes desempenhe um papel importante na evolução ; esta postura é defendida por membros da comunidade científica há mais de 100 anos. Susumu Ohno foi um dos mais famosos desenvolvedores dessa teoria em seu livro clássico Evolution by gene duplication (1970). Ohno argumentou que a duplicação de genes é a força evolutiva mais importante desde o surgimento do ancestral comum universal . Os principais eventos de duplicação do genoma podem ser bastante comuns. Acredita-se que todo o genoma da levedura sofreu duplicação há cerca de 100 milhões de anos. As plantas são os duplicadores de genoma mais prolíficos. Por exemplo, o trigo é hexaplóide (uma espécie de poliplóide ), o que significa que possui seis cópias de seu genoma.

Subfuncionalização

Outro destino possível para genes duplicados é que ambas as cópias sejam igualmente livres para acumular mutações degenerativas, desde que quaisquer defeitos sejam complementados pela outra cópia. Isso leva a um modelo neutro de "subfuncionalização" ou DDC (duplicação-degeneração-complementação), no qual a funcionalidade do gene original é distribuída entre as duas cópias. Nenhum dos genes pode ser perdido, já que ambos agora desempenham funções importantes não redundantes, mas, em última análise, nenhum deles é capaz de alcançar uma nova funcionalidade.

A subfuncionalização pode ocorrer por meio de processos neutros nos quais as mutações se acumulam sem efeitos prejudiciais ou benéficos. No entanto, em alguns casos, a subfuncionalização pode ocorrer com benefícios adaptativos claros. Se um gene ancestral é pleiotrópico e executa duas funções, muitas vezes nenhuma dessas duas funções pode ser alterada sem afetar a outra função. Desta forma, particionar as funções ancestrais em dois genes separados pode permitir a especialização adaptativa de subfunções, proporcionando assim um benefício adaptativo.

Perda

Freqüentemente, a variação genômica resultante leva a distúrbios neurológicos dependentes da dosagem do gene, como a síndrome do tipo Rett e a doença de Pelizaeus-Merzbacher . Essas mutações prejudiciais são provavelmente perdidas da população e não serão preservadas ou desenvolverão novas funções. No entanto, muitas duplicações não são, de fato, prejudiciais ou benéficas, e essas sequências neutras podem ser perdidas ou podem se espalhar pela população por meio de flutuações aleatórias via deriva genética .

Identificação de duplicações em genomas sequenciados

Critérios e varreduras de genoma único

Os dois genes que existem após um evento de duplicação gênica são chamados de parálogos e geralmente codificam proteínas com função e / ou estrutura semelhante. Em contraste, os genes ortólogos estão presentes em diferentes espécies, cada qual originalmente derivado da mesma sequência ancestral. (Veja Homologia de sequências em genética ).

É importante (mas freqüentemente difícil) diferenciar entre parálogos e ortólogos na pesquisa biológica. Os experimentos sobre a função do gene humano podem frequentemente ser realizados em outras espécies se um homólogo de um gene humano puder ser encontrado no genoma dessa espécie, mas apenas se o homólogo for ortólogo. Se forem parálogos e resultaram de um evento de duplicação de genes, é provável que suas funções sejam muito diferentes. Uma ou mais cópias de genes duplicados que constituem uma família de genes podem ser afetadas pela inserção de elementos transponíveis que causam variação significativa entre eles em sua sequência e, finalmente, podem se tornar responsáveis ​​pela evolução divergente . Isso também pode render as chances e a taxa de conversão de genes entre os homólogos de duplicatas de genes devido a menos ou nenhuma semelhança em suas sequências.

Paralogs podem ser identificados em genomas únicos por meio de uma comparação de sequência de todos os modelos de genes anotados uns com os outros. Tal comparação pode ser realizada em sequências de aminoácidos traduzidas (por exemplo, BLASTp, tBLASTx) para identificar duplicações antigas ou em sequências de nucleotídeos de DNA (por exemplo, BLASTn, megablast) para identificar duplicações mais recentes. A maioria dos estudos para identificar duplicações gênicas requer best-hits recíprocos ou melhores-hits recíprocos difusos, onde cada paralog deve ser a melhor combinação do outro em uma comparação de sequência.

A maioria das duplicações de genes existem como repetições de cópias baixas (LCRs), em vez de sequências altamente repetitivas como elementos transponíveis. Eles são encontrados principalmente nas regiões pericentronômica , subtelomérica e intersticial de um cromossomo. Muitos LCRs, devido ao seu tamanho (> 1 KB), similaridade e orientação, são altamente suscetíveis a duplicações e exclusões.

Microarrays genômicos detectam duplicações

Tecnologias como microarranjos genômicos , também chamados de hibridização genômica comparativa de array (array CGH), são usados ​​para detectar anormalidades cromossômicas, como microduplicações, em um modo de alto rendimento a partir de amostras de DNA genômico. Em particular, a tecnologia de microarranjos de DNA pode monitorar simultaneamente os níveis de expressão de milhares de genes em muitos tratamentos ou condições experimentais, facilitando muito os estudos evolutivos da regulação gênica após a duplicação ou especiação de genes .

Sequenciamento de próxima geração

As duplicações de genes também podem ser identificadas por meio do uso de plataformas de sequenciamento de última geração. O meio mais simples de identificar duplicações nos dados de resequenciamento genômico é por meio do uso de leituras de sequenciamento de extremidades pareadas. Duplicações em tandem são indicadas por pares de leitura de sequenciamento que mapeiam em orientações anormais. Por meio de uma combinação de cobertura de sequência aumentada e orientação de mapeamento anormal, é possível identificar duplicações nos dados de sequenciamento genômico.

Como amplificação

A duplicação de genes não constitui necessariamente uma mudança duradoura no genoma de uma espécie. Na verdade, essas mudanças geralmente não duram além do organismo hospedeiro inicial. Do ponto de vista da genética molecular , a amplificação de genes é uma das muitas maneiras pelas quais um gene pode ser superexpresso . A amplificação genética pode ocorrer artificialmente, como com o uso da técnica de reação em cadeia da polimerase para amplificar fitas curtas de DNA in vitro usando enzimas , ou pode ocorrer naturalmente, conforme descrito acima. Se for uma duplicação natural, ainda pode ocorrer em uma célula somática , ao invés de uma célula germinativa (o que seria necessário para uma mudança evolutiva duradoura).

Papel no câncer

As duplicações de oncogenes são uma causa comum de muitos tipos de câncer . Nesses casos, a duplicação genética ocorre em uma célula somática e afeta apenas o genoma das próprias células cancerosas, não o organismo inteiro, muito menos qualquer prole subsequente.

Amplificações de oncogene comuns em cânceres humanos
Tipo de câncer
Amplificações de genes associados
Prevalência de
amplificação
no tipo de câncer
(porcentagem)
Câncer de mama MEU C 20%
ERBB2 ( HER2 ) 20%
CCND1 ( Cyclin D1 ) 15-20%
FGFR1 12%
FGFR2 12%
Câncer cervical MEU C 25–50%
ERBB2 20%
Câncer colorretal HRAS 30%
KRAS 20%
MYB 15-20%
Câncer de esôfago MEU C 40%
CCND1 25%
MDM2 13%
Câncer de intestino CCNE ( ciclina E ) 15%
KRAS 10%
CONHECEU 10%
Glioblastoma ERBB1 ( EGFR ) 33–50%
CDK4 15%
Câncer de cabeça e pescoço CCND1 50%
ERBB1 10%
MEU C 7–10%
Câncer hepatocelular CCND1 13%
Neuroblastoma MYCN 20–25%
cancro do ovário MEU C 20-30%
ERBB2 15-30%
AKT2 12%
Sarcoma MDM2 10-30%
CDK4 10%
Câncer de pulmão de pequenas células MEU C 15-20%

Veja também

Referências

links externos