Variação estrutural - Structural variation

A variação estrutural genômica é a variação na estrutura do cromossomo de um organismo . Consiste em muitos tipos de variação no genoma de uma espécie e geralmente inclui tipos microscópicos e submicroscópicos , como deleções, duplicações, variantes de número de cópias , inserções, inversões e translocações . Originalmente, uma variação de estrutura afeta um comprimento de sequência de cerca de 1kb a 3Mb, que é maior do que SNPs e menor do que a anormalidade cromossômica (embora as definições tenham alguma sobreposição). No entanto, a gama operacional de variantes estruturais foi ampliada para incluir eventos> 50pb. A definição de variação estrutural não implica nada sobre frequência ou efeitos fenotípicos. Muitas variantes estruturais estão associadas a doenças genéticas , mas muitas não. Pesquisas recentes sobre VSs indicam que os VSs são mais difíceis de detectar do que os SNPs. Aproximadamente 13% do genoma humano é definido como estruturalmente variante na população normal, e há pelo menos 240 genes que existem como polimorfismos de deleção homozigotos em populações humanas, sugerindo que esses genes são dispensáveis ​​em humanos. Evidências que se acumulam rapidamente indicam que as variações estruturais podem compreender milhões de nucleotídeos de heterogeneidade dentro de cada genoma e provavelmente darão uma contribuição importante para a diversidade humana e suscetibilidade a doenças.

Variação estrutural microscópica

Microscópico significa que pode ser detectado com microscópios ópticos , como aneuploidias , cromossomos marcadores , rearranjos brutos e variação no tamanho dos cromossomos. A frequência na população humana é considerada subestimada devido ao fato de que alguns deles não são realmente fáceis de identificar. Essas anormalidades estruturais existem em 1 a cada 375 nascidos vivos por informação putativa.

Variação estrutural submicroscópica

Variantes estruturais submicroscópicas são muito mais difíceis de detectar devido ao seu pequeno tamanho. O primeiro estudo em 2004 que usou microarranjos de DNA conseguiu detectar dezenas de loci genéticos que exibiam variação no número de cópias , deleções e duplicações , superiores a 100 quilobases no genoma humano. No entanto, até 2015, os estudos de sequenciamento do genoma completo podem detectar cerca de 5.000 variantes estruturais tão pequenas quanto 100 pares de bases, abrangendo aproximadamente 20 megabases em cada genoma individual. Essas variantes estruturais incluem deleções, duplicações em tandem, inversões , inserções de elementos móveis . A taxa de mutação também é muito maior do que as variantes estruturais microscópicas, estimadas por dois estudos em 16% e 20%, respectivamente, ambos provavelmente subestimados devido aos desafios de detectar com precisão as variantes estruturais. Também foi demonstrado que a geração de variantes estruturais espontâneas aumenta significativamente a probabilidade de gerar outras variantes espontâneas de nucleotídeo único ou indels dentro de 100 quilobases do evento de variação estrutural.

Variação do número de cópia

A variação do número de cópias (CNV) é uma grande categoria de variação estrutural, que inclui inserções , deleções e duplicações . Em estudos recentes, as variações do número de cópias são testadas em pessoas que não têm doenças genéticas, usando métodos usados ​​para genotipagem SNP quantitativa. Os resultados mostram que 28% das regiões suspeitas nos indivíduos realmente contêm variações no número de cópias. Além disso, os CNVs no genoma humano afetam mais nucleotídeos do que o polimorfismo de nucleotídeo único (SNP). Também é digno de nota que muitas das CNVs não estão em regiões de codificação. Porque CNV são geralmente causadas por recombinação desigual , sequências generalizadas semelhantes, tais como LINEs e SINEs pode ser um mecanismo comum de criação CNV.

Inversão

Existem várias inversões conhecidas que estão relacionadas a doenças humanas. Por exemplo, a inversão recorrente de 400kb no gene do fator VIII é uma causa comum de hemofilia A , e inversões menores que afetam a idunorato 2-sulfatase (IDS) causarão a síndrome de Hunter . Mais exemplos incluem a síndrome de Angelman e a síndrome de Sotos . No entanto, pesquisas recentes mostram que uma pessoa pode ter 56 inversões putativas, portanto, as inversões não-doença são mais comuns do que se supunha anteriormente. Também neste estudo é indicado que os pontos de interrupção de inversão são comumente associados a duplicações segmentares. Uma inversão de 900 kb no cromossomo 17 está sob seleção positiva e prevê-se que aumente sua frequência na população europeia.

Outras variantes estruturais

Variantes estruturais mais complexas podem ocorrer incluindo uma combinação das anteriores em um único evento. O tipo mais comum de variação estrutural complexa são duplicações não-tandem, onde a sequência é duplicada e inserida em orientação invertida ou direta em outra parte do genoma. Outras classes de variantes estruturais complexas incluem deleção-inversão-deleção, duplicação-inversão-duplicação e duplicação em tandem com deleção aninhada. Existem também translocações crípticas e dissomia uniparental segmentar (UPD). Há relatos crescentes dessas variações, mas são mais difíceis de detectar do que as variações tradicionais porque essas variantes são balanceadas e os métodos baseados em array ou PCR não são capazes de localizá-las.

Variação estrutural e fenótipos

Suspeita-se que algumas doenças genéticas sejam causadas por variações estruturais, mas a relação não é muito certa. Não é plausível dividir essas variantes em duas classes, como "normal" ou "doença", porque a produção real da mesma variante também variará. Além disso, algumas das variantes são realmente selecionadas positivamente (mencionadas acima). Uma série de estudos mostrou que o gene que interrompe os CNVs espontâneos ( de novo ) interrompe os genes aproximadamente quatro vezes mais freqüentemente no autismo do que nos controles e contribui para aproximadamente 5–10% dos casos. Variantes herdadas também contribuem para cerca de 5–10% dos casos de autismo.

As variações estruturais também têm sua função na genética de populações. Freqüências diferentes de uma mesma variação podem ser usadas como uma marca genética para inferir a relação entre populações em áreas diferentes. Uma comparação completa entre a variação estrutural de humanos e chimpanzés também sugeriu que algumas delas podem ser fixadas em uma espécie por causa de sua função adaptativa. Também há deleções relacionadas à resistência à malária e à AIDS . Além disso, acredita-se que alguns segmentos altamente variáveis ​​sejam causados ​​pela seleção de balanceamento, mas também existem estudos contra essa hipótese.

Banco de dados de variação estrutural

Alguns navegadores de genoma e bancos de dados bioinformáticos têm uma lista de variações estruturais do genoma humano com ênfase em CNVs e podem mostrá-los na página de navegação do genoma, por exemplo, UCSC Genome Browser . Na página que exibe uma parte do genoma, há "CNVs de células comuns" e "Var estrutural" que podem ser ativados. No NCBI, há uma página especial para variação estrutural. Nesse sistema, as coordenadas "internas" e "externas" são mostradas; ambos não são pontos de interrupção reais, mas supostos intervalos mínimos e máximos de sequência afetados pela variação estrutural. Os tipos são classificados como inserção, perda, ganho, inversão, LOH, evertida, transcr e UPD.

Métodos de detecção

Assinaturas e padrões de SVs para exclusão (A), inserção de nova sequência (B), inversão (C) e duplicação em tandem (D) na contagem de leitura (RC), par de leitura (RP), leitura dividida (SR), e métodos de montagem de novo (AS).

Novos métodos foram desenvolvidos para analisar a variação estrutural genética humana em altas resoluções. Os métodos usados ​​para testar o genoma são de uma forma direcionada específica ou de uma maneira ampla do genoma. Para testes abrangentes do genoma, as abordagens de hibridização genômica comparativa baseadas em array trazem as melhores varreduras genômicas para encontrar novas variantes de número de cópias. Essas técnicas usam fragmentos de DNA que são marcados de um genoma de interesse e são hibridizados, com outro genoma marcado de forma diferente, em matrizes manchadas com fragmentos de DNA clonados. Isso revela diferenças no número de cópias entre dois genomas.

Para exames de genoma direcionados, os melhores ensaios para verificar áreas específicas do genoma são principalmente baseados em PCR. O método baseado em PCR mais bem estabelecido é a reação em cadeia da polimerase quantitativa em tempo real (qPCR). Uma abordagem diferente é verificar especificamente certas áreas que circundam duplicações segmentais conhecidas, uma vez que geralmente são áreas de variação do número de cópias. Um método de genotipagem SNP que oferece intensidades de fluorescência independentes para dois alelos pode ser usado para direcionar os nucleotídeos entre duas cópias de uma duplicação segmentar. A partir disso, pode-se observar um aumento da intensidade de um dos alelos em relação ao outro.

Com o desenvolvimento da tecnologia de sequenciamento de próxima geração (NGS), quatro classes de estratégias para a detecção de variantes estruturais com dados NGS foram relatadas, com cada uma sendo baseada em padrões que são diagnósticos de diferentes classes de SV.

  • Os métodos de leitura de profundidade ou contagem de leitura assumem uma distribuição aleatória (por exemplo, distribuição de Poisson ) de leituras de sequenciamento de leitura curta. A divergência dessa distribuição é investigada para descobrir duplicações e exclusões. Regiões com duplicação mostrarão maior profundidade de leitura, enquanto aquelas com exclusão resultarão em menor profundidade de leitura.
  • Os métodos de leitura dividida permitem a detecção de inserções (incluindo inserções de elementos móveis ) e exclusões até a resolução de um único par de base. A presença de uma VS é identificada a partir do alinhamento descontínuo com o genoma de referência. Uma lacuna na leitura marca uma exclusão e na referência marca uma inserção.
  • Os métodos de pares de leitura examinam o comprimento e a orientação de leituras de extremidades emparelhadas a partir de dados de sequenciamento de leitura curta. Por exemplo, ler pares mais distantes do que o esperado indicam uma exclusão. Translocações, inversões e duplicações em tandem também podem ser descobertas usando pares de leitura.
  • A montagem da sequência de novo pode ser aplicada com leituras que são precisas o suficiente. Embora na prática o uso deste método seja limitado pelo comprimento das leituras de sequência, conjuntos de genoma baseados em leitura longa oferecem descoberta de variação estrutural para classes, como inserções que escapam à detecção ao usar outros métodos.

Veja também

Referências

links externos