Código genético expandido - Expanded genetic code

Não deve haver interferência entre o novo par tRNA / sintase e as moléculas existentes de tRNA / sintase, apenas com os ribossomos

Um código genético expandido é um código genético modificado artificialmente no qual um ou mais códons específicos foram realocados para codificar um aminoácido que não está entre os 22 aminoácidos proteinogênicos codificados naturalmente comuns .

Os principais pré-requisitos para expandir o código genético são:

  • o aminoácido não padrão para codificar,
  • um códon não utilizado para adotar,
  • um tRNA que reconhece este códon, e
  • uma sintetase de tRNA que reconhece apenas aquele tRNA e apenas o aminoácido não padrão.

Expandir o código genético é uma área de pesquisa da biologia sintética , uma disciplina biológica aplicada cujo objetivo é projetar sistemas vivos para fins úteis. A expansão do código genético enriquece o repertório de ferramentas úteis à disposição da ciência.

Em maio de 2019, pesquisadores, em um esforço marcante, relataram a criação de uma nova forma sintética (possivelmente artificial ) de vida viável , uma variante da bactéria Escherichia coli , reduzindo o número natural de 64 códons no genoma bacteriano para 61 códons (eliminando dois dos seis códons que codificam para serina e um dos três códons de parada) - dos quais 59 costumavam codificar 20 aminoácidos .

Introdução

Vale ressaltar que o código genético para todos os organismos é basicamente o mesmo, de modo que todos os seres vivos usam a mesma 'linguagem genética'. Em geral, a introdução de novos aminoácidos não naturais funcionais nas proteínas das células vivas quebra a universalidade da linguagem genética, que idealmente leva a formas de vida alternativas. As proteínas são produzidas graças às moléculas do sistema de tradução, que decodificam as mensagens de RNA em uma cadeia de aminoácidos. A tradução da informação genética contida no RNA mensageiro (mRNA) em uma proteína é catalisada pelos ribossomos . Os RNAs de transferência (tRNA) são usados ​​como chaves para decodificar o mRNA em seu polipeptídeo codificado . O tRNA reconhece um códon específico de três nucleotídeos no mRNA com uma sequência complementar chamada anticódon em uma de suas alças. Cada códon de três nucleotídeos é traduzido em um dos vinte aminoácidos de ocorrência natural. Há pelo menos um tRNA para qualquer códon e, às vezes, vários códons codificam para o mesmo aminoácido. Muitos tRNAs são compatíveis com vários códons. Uma enzima chamada aminoacil tRNA sintetase liga covalentemente o aminoácido ao tRNA apropriado. A maioria das células tem uma sintetase diferente para cada aminoácido (20 ou mais sintetases). Por outro lado, algumas bactérias têm menos de 20 aminoacil ARNt sintetases e introduzem o (s) aminoácido (s) "em falta" por modificação de um aminoácido estruturalmente relacionado por uma enzima aminotransferase . Uma característica explorada na expansão do código genético é o fato de que a aminoacil tRNA sintetase muitas vezes não reconhece o anticódon, mas outra parte do tRNA, o que significa que se o anticódon fosse mutado, a codificação desse aminoácido mudaria para um novo códon. No ribossomo, a informação no mRNA é traduzida em um aminoácido específico quando o códon do mRNA corresponde ao anticódon complementar de um tRNA, e o aminoácido anexado é adicionado a uma cadeia polipeptídica em crescimento. Quando é liberado do ribossomo, a cadeia polipeptídica se dobra em uma proteína funcional.

Para incorporar um novo aminoácido ao código genético, várias mudanças são necessárias. Primeiro, para a tradução bem-sucedida de um novo aminoácido, o códon ao qual o novo aminoácido é atribuído não pode já codificar para um dos 20 aminoácidos naturais. Normalmente, um códon sem sentido (códon de parada ) ou um códon de quatro bases são usados. Em segundo lugar, um novo par de tRNA e aminoacil tRNA sintetase são necessários, estes são chamados de conjunto ortogonal. O conjunto ortogonal não deve se cruzar com os conjuntos endógenos de tRNA e sintetase, embora ainda seja funcionalmente compatível com o ribossomo e outros componentes do aparelho de tradução. O sítio ativo da sintetase é modificado para aceitar apenas o novo aminoácido. Na maioria das vezes, uma biblioteca de sintetases mutantes é rastreada para uma que carregue o tRNA com o aminoácido desejado. A sintetase também é modificada para reconhecer apenas o tRNA ortogonal. O par de tRNA sintetase é frequentemente desenvolvido em outras bactérias ou células eucarióticas.

Nesta área de pesquisa, os 20 aminoácidos proteinogênicos codificados são referidos como aminoácidos padrão ou, alternativamente, como aminoácidos naturais ou canônicos, enquanto os aminoácidos adicionados são chamados de aminoácidos não padrão (NSAAs), ou aminoácidos não naturais ( uAAs; termo não usado em artigos que tratam de aminoácidos naturais não proteinogênicos, como fosfoserina ) ou aminoácidos não canônicos.

Aminoácidos não padrão

Tirosina e algumas variantes de tirosina sintética usadas para marcação de proteínas. Diferentes variantes de tirosina foram sintetizadas e podem ser incorporadas em proteínas usando um código genético expandido. As variantes representadas aqui são usadas para ligações químicas ou fotoquímicas. Isso significa que o AA incorporado reage especificamente com um determinado grupo químico (como hidrazidas, aminas, azidas ou tióis) ou pode ser ativado por UV para reticular com outros AAs.

O primeiro elemento do sistema é o aminoácido que é adicionado ao código genético de uma determinada linhagem de organismo.

Mais de 71 NSAAs diferentes foram adicionados a diferentes cepas de E. coli , leveduras ou células de mamíferos. Devido aos detalhes técnicos (síntese química mais fácil de NSAAs, menos diafonia e evolução mais fácil da aminoacil-tRNA sintase), os NSAAs são geralmente maiores do que os aminoácidos padrão e na maioria das vezes têm um núcleo de fenilalanina, mas com uma grande variedade de substituintes diferentes. Estes permitem que um grande repertório de novas funções, tais como a rotulagem (ver figura), como um repórter fluorescente ( por exemplo dansylalanine) ou para a produção de proteínas de translação em E. coli com eucarióticos modificações pós-translacionais ( por exemplo, fosfoserina, fosfotreonina, fosfotirosina e).

O trabalho de fundação foi relatado por Rolf Furtner, que usou sozinho o par de tRNA Phe / PheRS de levedura para incorporar p-iodofenilalanina em E. coli .

Os aminoácidos não naturais incorporados em proteínas incluem aminoácidos contendo átomos pesados ​​para facilitar certos estudos cristalográficos de raios-X; aminoácidos com novas propriedades estéricas / de embalagem e eletrônicas; aminoácidos de fotorreticulação que podem ser usados ​​para sondar as interações proteína-proteína in vitro ou in vivo; aminoácidos contendo ceto, acetileno, azida e boronato que podem ser usados ​​para introduzir seletivamente um grande número de sondas biofísicas, marcadores e novos grupos funcionais químicos em proteínas in vitro ou in vivo ; aminoácidos redox ativos para sondar e modular a transferência de elétrons; aminoácidos fotocaged e fotoisomerizable para fotorregular processos biológicos; aminoácidos de ligação a metais para catálise e detecção de íons metálicos; aminoácidos que contêm cadeias laterais ativas fluorescentes ou infravermelhas para sondar a estrutura e a dinâmica da proteína; α-hidroxiácidos e D- aminoácidos como sondas de conformação de backbone e interações de ligações de hidrogênio; e aminoácidos sulfatados e miméticos de aminoácidos fosforilados como sondas de modificações pós-tradução.

A disponibilidade do aminoácido não padrão requer que o organismo o importe do meio ou o biossintetize. No primeiro caso, o aminoácido não natural é primeiro sintetizado quimicamente em sua forma L opticamente pura . Em seguida, é adicionado ao meio de crescimento da célula. Uma biblioteca de compostos é geralmente testada para uso na incorporação do novo aminoácido, mas isso nem sempre é necessário, por exemplo, vários sistemas de transporte podem lidar com aminoácidos não naturais com cadeias laterais apolares. No segundo caso, uma via biossintética precisa ser projetada, por exemplo, uma cepa de E. coli que biossintetiza um novo aminoácido (p-aminofenilalanina) a partir de fontes básicas de carbono e o inclui em seu código genético. Outro exemplo: a produção de fosfoserina, um metabólito natural, e consequentemente exigia alteração do fluxo de sua via para aumentar sua produção.

Atribuição de códon

Outro elemento do sistema é um códon a ser alocado para o novo aminoácido.

Um grande problema para a expansão do código genético é que não existem códons livres. O código genético tem um layout não aleatório que mostra sinais reveladores de várias fases da evolução primordial; no entanto, desde então congelou no lugar e é quase universalmente conservado. No entanto, alguns códons são mais raros do que outros. De fato, em E. coli (e em todos os organismos) o uso de códons não é igual, mas apresenta vários códons raros (ver tabela), sendo o mais raro o códon de parada âmbar (UAG).

Supressão de códon âmbar

A possibilidade de redesignar códons foi percebida por Normanly et al. em 1990, quando uma cepa mutante viável de E. coli leu o códon de parada UAG ("âmbar") . Isso foi possível graças à raridade desse códon e ao fato de que o fator de liberação 1 sozinho faz com que o códon âmbar termine a tradução. Mais tarde, no laboratório de Schultz , a tRNATyr / tirosil-tRNA sintetase (TyrRS) de Methanococcus jannaschii , um archaebacterium, foi usada para introduzir uma tirosina em vez de STOP, o valor padrão do códon âmbar. Isso foi possível devido às diferenças entre as sintases bacterianas endógenas e as archaeal sintases ortólogas, que não se reconhecem. Posteriormente, o grupo desenvolveu o par tRNA / sintase ortogonal para utilizar o aminoácido não padrão O- metiltirosina. Isto foi seguido pela naftilalanina maior e a benzoilfenilalanina fotorreticulante, que provou a utilidade potencial do sistema.

O códon âmbar é o códon menos usado em Escherichia coli , mas sequestrá-lo resulta em uma perda substancial de aptidão. Um estudo, de fato, descobriu que havia pelo menos 83 peptídeos afetados pela leitura. Além disso, a marcação estava incompleta. Como consequência, várias cepas foram feitas para reduzir o custo de adaptação, incluindo a remoção de todos os códons âmbar do genoma. Na maioria das cepas de E. coli K-12 (viz. Escherichia coli (biologia molecular) para linhagens de cepas), existem 314 códons de parada UAG. Conseqüentemente, uma quantidade gigantesca de trabalho foi canalizada para substituí-los. Uma abordagem iniciada pelo grupo do Prof. George Church de Harvard, foi apelidada de MAGE em CAGE: isso dependia de uma transformação multiplex e subsequente recombinação de cepas para remover todos os códons UAG - a última parte apresentou um ponto de parada em um primeiro artigo, mas foi superar. Isso resultou na cepa de E. coli C321.ΔA, que não possui todos os códons UAG e RF1. Isso permitiu que um experimento fosse feito com essa cepa para torná-la "viciada" no aminoácido bifenilalanina, por meio da evolução de várias enzimas essenciais para exigi-lo estruturalmente, portanto, colocando seu código genético expandido sob seleção positiva.

Reatribuição de códon de sentido raro

Além do códon âmbar, códons de sentido raro também foram considerados para uso. O codon AGG codifica a arginina, mas uma cepa foi modificada com sucesso para torná-la codificadora para 6- N -aliloxicarbonil-lisina. Outro candidato é o códon AUA, que é incomum porque seu respectivo tRNA precisa se diferenciar do AUG que codifica a metionina (primordialmente, isoleucina, daí sua localização). Para fazer isso, o tRNA AUA tem uma base especial, a lisidina. A deleção da sintase ( tilS ) foi possível graças à substituição do tRNA nativo pelo do Mycoplasma mobile (sem lisidina). A redução da aptidão é um primeiro passo para pressionar a cepa a perder todas as instâncias de AUA, permitindo que ela seja usada para expansão do código genético.

Quatro códons de base

Outras abordagens incluem a adição de emparelhamento de base extra ou o uso de ribossomos ortólogos que aceitam, além do código genético tripleto regular, tRNAs com código quádruplo. Isso permitiu o uso simultâneo de dois aminoácidos não naturais, p- azidofenilalanina (pAzF) e N6 - [(2-propiniloxi) carbonil] lisina (CAK), que se reticulam por cicloadição de Huisgen . A decodificação quádrupla em cepas de tipo selvagem não recodificadas é muito ineficiente. Isso decorre do fato de que a interação entre tRNAs projetados com complexos ternários ou outros componentes de tradução não é tão favorável e forte como com elementos de tradução endógenos de células. Este problema pode ser superado pela engenharia e evolução específica do tRNA que pode decodificar códons quádruplos em cepas não recodificadas. Até 4 pares diferentes ortogonais de tRNA / tRNA sintetase podem ser gerados desta maneira.

par tRNA / sintetase

Outro elemento chave é o par tRNA / sintetase.

O conjunto ortólogo de sintetase e tRNA pode ser mutado e rastreado por meio de evolução direcionada para carregar o tRNA com um aminoácido diferente, até mesmo novo. Mutações no plasmídeo contendo o par podem ser introduzidas por PCR propenso a erros ou através de iniciadores degenerados para o sítio ativo da sintetase. A seleção envolve várias rodadas de um processo de duas etapas, onde o plasmídeo é transferido para células que expressam cloranfenicol acetiltransferase com um códon âmbar prematuro. Na presença de cloranfenicol tóxico e do aminoácido não natural, as células sobreviventes terão substituído o códon âmbar usando o tRNA ortogonal aminoacilado com os aminoácidos padrão ou não natural. Para remover o primeiro, o plasmídeo é inserido em células com um gene barnase (tóxico) com um códon âmbar prematuro, mas sem o aminoácido não natural, removendo todas as sintases ortogonais que não reconhecem especificamente o aminoácido não natural. Além da recodificação do tRNA para um códon diferente, eles podem ser mutados para reconhecer um códon de quatro bases, permitindo opções adicionais de codificação livre. O aminoácido não natural, como resultado, introduz diversas propriedades físico-químicas e biológicas a fim de ser usado como uma ferramenta para explorar a estrutura e função da proteína ou para criar uma proteína nova ou aprimorada para fins práticos.

Vários métodos para selecionar a sintetase que aceita apenas o aminoácido não natural foram desenvolvidos. Uma delas é usar uma combinação de seleção positiva e negativa

Conjuntos ortogonais em organismos modelo

Os pares ortogonais de sintetase e tRNA que funcionam para um organismo podem não funcionar para outro, uma vez que a sintetase pode aminoacilar erroneamente tRNAs endógenos ou o próprio tRNA ser erroneamente aminoacilado por uma sintetase endógena. Como resultado, os conjuntos criados até agora diferem entre os organismos.

Par Fonte E. coli Fermento Mamíferos Notas e referências
tRNA Tyr -TyrRS Methanococcus jannaschii sim Não Não
tRNA Lys –LysRS Pyrococcus horikoshii sim Não Não
tRNA Glu -GluRS Pyrococcus horikoshii sim Não Não
tRNA Leu –LeuRS tRNA: Halobacterium sp. mutante .
RS: Methanobacterium thermoautotrophicum
sim Não Não
tRNA Âmbar -PylRS Methanosarcina barkeri e Methanosarcina mazei sim sim sim
Âmbar de tRNA - 3-iodotirosil -RS RS: variante Methanocaldococcus jannaschii aaRS sim Não Não
tRNA Tyr / Amber -TyrRS Escherichia coli Não sim Não Relatado em 2003, mencionado em 2014 LeuRS
tRNA i Met -GlnRS tRNA:
RS humano : Escherichia coli
Não sim Não Comutado para o códon âmbar.
tRNA i fMet -TyrRS tRNA: Escherichia coli
RS: S. cerevisiae
sim sim Não Comutado para o códon âmbar.
tRNA Leu / Amber -LeuRS Escherichia coli Não sim sim Relatado em 2004 e mutado para ácido 2-aminooctanóico, o- metil tirosina e o- nitrobenzil cisteína. Evoluído em levedura para 4,5-dimetoxi-2-nitrobenzil serina, testado em camundongos e células de mamíferos com 4,5-dimetoxi-2-nitrobenzil-cisteína fotossensível.
tRNA Tyr -TyrRS Bacillus stearothermophilus Não Não sim
tRNA Trp -TrpRS Bacillus subtilis , RS modificado Não Não sim O novo AA é 5-OH Trp.

Em 2017, um camundongo projetado com um código genético estendido que pode produzir proteínas com aminoácidos não naturais foi relatado.

Ribossomos ortogonais

Da mesma forma que os tRNAs ortogonais e as aminoacil tRNA sintetases (aaRSs), os ribossomos ortogonais foram projetados para funcionar em paralelo aos ribossomos naturais. O ideal é que os ribossomos ortogonais usem transcritos de mRNA diferentes dos de suas contrapartes naturais e, em última análise, também devem usar um pool separado de tRNA. Isso deve aliviar parte da perda de adequação que atualmente ainda surge de técnicas como a supressão do códon âmbar. Além disso, os ribossomos ortogonais podem ser mutados e otimizados para tarefas específicas, como o reconhecimento de códons quádruplos. Essa otimização não é possível, ou altamente desvantajosa para ribossomos naturais.

o-ribossomo

Em 2005, três conjuntos de ribossomos foram publicados, os quais não reconheciam o mRNA natural, mas, em vez disso, traduziram um pool separado de mRNA ortogonal (o-mRNA). Isso foi conseguido alterando a sequência de reconhecimento do mRNA, a sequência Shine-Dalgarno , e a sequência de reconhecimento correspondente no rRNA 16S dos ribossomos, a chamada Sequência Anti-Shine-Darlgarno. Dessa forma, o emparelhamento de bases, que geralmente é perdido se qualquer uma das sequências sofrer mutação, permanece disponível. No entanto, as mutações no rRNA 16S não foram limitadas aos nucleotídeos de emparelhamento de bases da sequência clássica de Anti-Shine-Darlgarno.

Ribo-X

Em 2007, o grupo de Jason W. Chin apresentou um ribossomo ortogonal, que foi otimizado para supressão de códon âmbar. O rRNA 16S foi mutado de tal forma que se ligou ao fator de liberação RF1 com menos força do que o ribossomo natural. Este ribossomo não eliminou o problema de diminuição da aptidão das células causada pela supressão de códons de parada em proteínas naturais. No entanto, através da especificidade melhorada, aumentou significativamente os rendimentos da proteína alvo sintetizada corretamente (de ~ 20% para> 60% por cento para um códon âmbar a ser suprimido e forma <1% a> 20% para dois códons âmbar).

Ribo-Q

Em 2010, o grupo de Jason W. Chin apresentou mais uma versão otimizada do ribossomo ortogonal. O Ribo-Q é um rRNA 16S otimizado para reconhecer tRNAs, que têm anti-códons quádruplos para reconhecer códons quádruplos, em vez dos códons tripletos naturais. Com essa abordagem, o número de códons possíveis aumenta de 64 para 256. Mesmo considerando uma variedade de códons de parada, mais de 200 aminoácidos diferentes poderiam ser codificados dessa maneira.

Ribossomo grampeamento

Todos os ribossomos ortogonais descritos acima se concentram na otimização do rRNA 16S. Até agora, este rRNA 16S otimizado foi combinado com grandes subunidades naturais para formar ribossomos ortogonais. Se o 23S rRNA, o principal componente do RNA da grande subunidade ribossômica, também deve ser otimizado, deve-se ter certeza de que não houve diafonia na montagem dos ribossomos ortogonais e naturais (ver figura X B). Para garantir que o rRNA 23S otimizado só se formaria em ribossomos com o rRNA 16S otimizado, os dois rRNAs foram combinados em um transcrito. Ao inserir a sequência para o rRNA 23S em uma região de loop da sequência do rRNA 16S, ambas as subunidades ainda adotam dobras funcionais. Uma vez que os dois rRNAs estão ligados e, portanto, em proximidade constante, eles preferencialmente se ligam um ao outro, e não a outras subunidades ribossômicas flutuantes.

Centro de peptidil transferase projetado

Em 2014, foi demonstrado que, ao alterar o centro da peptidil transferase do rRNA 23S, os ribossomos poderiam ser criados, os quais atraem pools ortogonais de tRNA. A extremidade 3 'dos ​​tRNAs é universalmente conservada como CCA. As duas citidinas emparelham com duas guaninas o rRNA 23S para ligar o tRNA ao ribossomo. Essa interação é necessária para a fidelidade translacional. No entanto, ao co-mutar os nucleotídeos de ligação de tal forma, que eles ainda possam emparelhar, a fidelidade da tradução pode ser conservada. A extremidade 3 'do tRNA sofre mutação de CCA para CGA, enquanto dois nucleotídeos de citidina nos sítios A e P dos ribossomos sofrem mutação para guanidina. Isso leva a ribossomos que não aceitam tRNAs de ocorrência natural como substratos e a tRNAs, que não podem ser usados ​​como substrato por ribossomos naturais.
Para usar tais tRNAs com eficácia, eles teriam que ser aminoacilados por aaRSs ortogonais específicos. A maioria dos aaRSs de ocorrência natural reconhece a extremidade 3 'de seu tRNA correspondente. aaRSs para esses tRNAs com mutação 3 'ainda não estão disponíveis. Até agora, este sistema só demonstrou funcionar em um ambiente de tradução in vitro , onde a aminoacilação do tRNA ortogonal foi alcançada usando os chamados “flexizimas”.Flexizimas são ribozimas com atividade de tRNA-amino-aclilação.

Formulários

Com um código genético expandido, o aminoácido não natural pode ser geneticamente direcionado para qualquer local escolhido na proteína de interesse. A alta eficiência e fidelidade desse processo permite um melhor controle da colocação da modificação em relação à modificação da proteína pós-tradução, que, em geral, terá como alvo todos os aminoácidos do mesmo tipo, como o grupo tiol da cisteína e o grupo amino da lisina. Além disso, um código genético expandido permite que as modificações sejam realizadas in vivo . A capacidade de direcionar frações químicas sintetizadas em laboratório em proteínas permite muitos tipos de estudos que, de outra forma, seriam extremamente difíceis, como:

  • Sondagem da estrutura e função da proteína: usando aminoácidos com tamanho ligeiramente diferente, como O -metiltirosina ou dansilalanina em vez de tirosina, e inserindo frações repórter geneticamente codificadas (com mudança de cor e / ou spin-ativo) em locais de proteína selecionados, informações químicas sobre a estrutura e função da proteína pode ser medido.
  • Sondando o papel das modificações pós-tradução na estrutura e função da proteína: Ao usar aminoácidos que imitam modificações pós-tradução , como a fosfoserina, a proteína biologicamente ativa pode ser obtida e a natureza específica do local da incorporação de aminoácidos pode levar à informação sobre como a posição, a densidade e a distribuição da fosforilação da proteína afetam a função da proteína.
  • Identificação e regulação da atividade da proteína: Ao usar aminoácidos fotocaged, a função da proteína pode ser "ligada" ou desligada iluminando o organismo.
  • Mudando o modo de ação de uma proteína: pode-se começar com o gene de uma proteína que se liga a uma determinada sequência de DNA e, ao inserir um aminoácido quimicamente ativo no local de ligação, convertê-lo em uma proteína que corta o DNA, em vez de vinculando-o.
  • Melhorando a imunogenicidade e superando a autotolerância: Ao substituir tirosinas estrategicamente escolhidas por p- nitro fenilalanina, uma autoproteína tolerada pode se tornar imunogênica.
  • Destruição seletiva de componentes celulares selecionados: usando um código genético expandido, porções químicas destrutivas e não naturais (às vezes chamadas de "ogivas químicas") podem ser incorporadas em proteínas que têm como alvo componentes celulares específicos.
  • Produzindo proteína melhor: a evolução de bacteriófagos T7 em uma cepa de E. coli não evolutiva que codificou 3-iodotirosina no códon âmbar resultou em uma população mais ajustada do que o tipo selvagem, graças à presença de iodotirosina em seu proteoma
  • Sondagem de localização de proteínas e interação proteína-proteína em bactérias.

Futuro

A expansão do código genético ainda está em sua infância. A metodologia atual usa apenas um aminoácido não padrão de cada vez, enquanto idealmente múltiplos podem ser usados. Na verdade, o grupo de Jason Chin quebrou recentemente o recorde de uma cepa de E. coli geneticamente recodificada que pode incorporar simultaneamente até 4 aminoácidos não naturais. Além disso, foi desenvolvido um software que permite a combinação de ribossomos ortogonais e pares de tRNA / RS não naturais, a fim de melhorar o rendimento e a fidelidade da proteína.

Genoma sintético recodificado

Uma maneira de conseguir a codificação de vários aminoácidos não naturais é sintetizar um genoma reescrito. Em 2010, ao custo de US $ 40 milhões , foi construído um organismo, o Mycoplasma laboratorium , controlado por um genoma sintético, mas não recodificado. O primeiro organismo geneticamente recodificado foi criado por uma colaboração entre os laboratórios de George Church e Farren Isaacs, quando o tipo selvagem E.coli MG1655 foi recodificado de tal forma que todos os 321 códons de parada (UAG) conhecidos foram substituídos por códons e liberação de UAA sinônimos o fator 1 foi eliminado para eliminar a interação com o códon de parada exógeno e melhorar a síntese de proteína não natural. Em 2019, Escherichia coli Syn61 foi criada, com um genoma recodificado de 4 megabases consistindo em apenas 61 códons em vez dos 64 naturais. Além da eliminação do uso de códons raros, a especificidade do sistema precisa ser aumentada na mesma quantidade de tRNA reconhecer vários códons

Alfabeto genético expandido

Outra abordagem é expandir o número de nucleobases para aumentar a capacidade de codificação.

Um par de bases não naturais (UBP) é uma subunidade (ou nucleobase ) projetada de DNA que é criada em um laboratório e não ocorre na natureza. Uma demonstração de UBPs foi realizada in vitro pelo grupo de Ichiro Hirao no instituto RIKEN no Japão. Em 2002, eles desenvolveram um par de bases não natural entre 2-amino-8- (2-tienil) purina (s) e piridina-2-ona (y) que funciona in vitro na transcrição e tradução para a incorporação específica do local de não -aminoácidos padrão em proteínas. Em 2006, eles criaram 7- (2-tienil) imidazo [4,5-b] piridina (Ds) e pirrol-2-carbaldeído (Pa) como um terceiro par de bases para replicação e transcrição. Posteriormente, Ds e 4- [3- (6-aminohexanamido) -1-propinil] -2-nitropirrol (Px) foi descoberto como um par de alta fidelidade na amplificação por PCR. Em 2013, eles aplicaram o par Ds-Px para geração de aptâmero de DNA por seleção in vitro (SELEX) e demonstraram que a expansão do alfabeto genético aumenta significativamente as afinidades de aptâmero de DNA para proteínas-alvo.

Em 2012, um grupo de cientistas americanos liderados por Floyd Romesberg, biólogo químico do Scripps Research Institute em San Diego, Califórnia, publicou que sua equipe projetou um par de bases não naturais (UBP). Os dois novos nucleotídeos artificiais ou Unnatural Base Pair (UBP) foram denominados " d5SICS " e " dNaM ". Mais tecnicamente, esses nucleotídeos artificiais com nucleobases hidrofóbicas apresentam dois anéis aromáticos fundidos que formam um complexo (d5SICS-dNaM) ou par de bases no DNA. Em 2014, a mesma equipe do Scripps Research Institute relatou que sintetizou um trecho de DNA circular conhecido como um plasmídeo contendo pares de bases naturais de TA e CG, juntamente com o UBP de melhor desempenho que o laboratório de Romesberg havia projetado, e o inseriu em células do comum bactéria E. coli que replicou com sucesso os pares de bases não naturais ao longo de várias gerações. Este é o primeiro exemplo conhecido de um organismo vivo transmitindo um código genético expandido para as gerações subsequentes. Isso foi em parte conseguido pela adição de um gene de algas de suporte que expressa um transportador de trifosfato de nucleotídeo que importa eficientemente os trifosfatos de d5SICSTP e dNaMTP em bactérias E. coli . Em seguida, as vias de replicação bacteriana natural usam-nas para replicar com precisão o plasmídeo contendo d5SICS – dNaM.

A incorporação bem-sucedida de um terceiro par de bases em um microrganismo vivo é um avanço significativo em direção ao objetivo de expandir muito o número de aminoácidos que podem ser codificados pelo DNA, expandindo assim o potencial dos organismos vivos de produzir novas proteínas . As cadeias artificiais de DNA não codificam para nada ainda, mas os cientistas especulam que poderiam ser projetadas para fabricar novas proteínas que poderiam ter usos industriais ou farmacêuticos.

Em maio de 2014, os pesquisadores anunciaram que haviam introduzido com sucesso dois novos nucleotídeos artificiais no DNA bacteriano e, ao incluir nucleotídeos artificiais individuais no meio de cultura, conseguiram passar as bactérias 24 vezes; eles não criaram mRNA ou proteínas capazes de usar os nucleotídeos artificiais.

Métodos relacionados

Método de incorporação de pressão seletiva (SPI) para a produção de aloproteínas

Muitos estudos produziram proteínas com aminoácidos não padronizados, mas não alteraram o código genético. Essas proteínas, chamadas de aloproteína , são feitas incubando células com um aminoácido não natural na ausência de um aminoácido codificado semelhante para que o primeiro seja incorporado à proteína no lugar do último, por exemplo, ácido L -2-aminohexanóico ( Ahx) para metionina (Met).

Esses estudos baseiam-se na atividade promíscua natural da aminoacil tRNA sintetase para adicionar ao seu tRNA alvo um aminoácido não natural (ou seja, análogo) semelhante ao substrato natural, por exemplo, metionil-tRNA sintase que confunde isoleucina com metionina. Na cristalografia de proteínas, por exemplo, a adição de selenometionina ao meio de uma cultura de uma cepa auxotrófica de metionina resulta em proteínas contendo selenometionina em oposição à metionina ( viz. Dispersão anômala de múltiplos comprimentos de onda por motivo). Outro exemplo é que fotoleucina e fotometionina são adicionadas em vez de leucina e metionina para a proteína de marcação cruzada. Da mesma forma, alguns fungos tolerantes ao telúrio podem incorporar telurocisteína e telurometionina em suas proteínas, em vez de cisteína e metionina. O objetivo de expandir o código genético é mais radical, pois não substitui um aminoácido, mas adiciona um ou mais ao código. Por outro lado, as substituições em todo o proteoma são realizadas de forma mais eficiente por substituições globais de aminoácidos. Por exemplo, substituições globais em todo o proteoma de aminoácidos naturais com análogos fluorados foram tentadas em E. coli e B. subtilis . Uma substituição completa de triptofano com tienopirrol-alanina em resposta a 20899 códons UGG em E. coli foi relatada em 2015 por Budisa e Söll . Além disso, muitos fenômenos biológicos, como dobramento e estabilidade de proteínas, são baseados em efeitos sinérgicos em muitas posições na sequência da proteína.

Neste contexto, o método SPI gera variantes de proteínas recombinantes ou aloproteínas diretamente por substituição de aminoácidos naturais por contrapartes não naturais. Um hospedeiro de expressão auxotrófica de aminoácido é suplementado com um análogo de aminoácido durante a expressão da proteína alvo. Essa abordagem evita as armadilhas dos métodos baseados em supressão e é superior em termos de eficiência, reprodutibilidade e uma configuração experimental extremamente simples. Numerosos estudos demonstraram como a substituição global de aminoácidos canônicos por vários análogos isostéricos causou perturbações estruturais mínimas, mas mudanças dramáticas na termodinâmica, dobramento, propriedades espectrais de agregação e atividade enzimática.

síntese in vitro

A expansão do código genético descrita acima é in vivo . Uma alternativa é a mudança de codificação de experimentos de tradução in vitro . Isso requer o esgotamento de todos os tRNAs e a reintrodução seletiva de certos tRNAs aminoacilados, alguns quimicamente aminoacilados.

Síntese química

Existem várias técnicas para produzir peptídeos quimicamente, geralmente por química de proteção em fase sólida. Isso significa que qualquer aminoácido (protegido) pode ser adicionado à sequência nascente.

Em novembro de 2017, uma equipe do Scripps Research Institute relatou ter construído um genoma de bactéria E. coli semissintético usando seis ácidos nucléicos diferentes (contra quatro encontrados na natureza). As duas 'letras' extras formam um terceiro par de bases não natural. Os organismos resultantes foram capazes de prosperar e sintetizar proteínas usando "aminoácidos não naturais". O par de bases não natural usado é dNaM –dTPT3. Este par de bases não natural foi demonstrado anteriormente, mas este é o primeiro relato de transcrição e tradução de proteínas usando um par de bases não natural.

Veja também

Referências