Elemento Cis-regulador - Cis-regulatory element

Os elementos reguladores Cis ( CREs ) ou módulos reguladores Cis ( CRMs ) são regiões de DNA não codificantes que regulam a transcrição de genes vizinhos. Os CREs são componentes vitais das redes regulatórias genéticas , que por sua vez controlam a morfogênese , o desenvolvimento da anatomia e outros aspectos do desenvolvimento embrionário , estudados na biologia evolutiva do desenvolvimento .

Os CREs são encontrados na vizinhança dos genes que eles regulam. Os CREs normalmente regulam a transcrição do gene ligando-se a fatores de transcrição . Um único fator de transcrição pode se ligar a muitos CREs e, portanto, controlar a expressão de muitos genes ( pleiotropia ). O prefixo latino cis significa "deste lado", ou seja, na mesma molécula de DNA do (s) gene (s) a ser transcrito.

CRMs são trechos de DNA , geralmente de 100-1000 pares de bases de DNA de comprimento, onde vários fatores de transcrição podem se ligar e regular a expressão de genes próximos e regular suas taxas de transcrição. Eles são rotulados como cis porque normalmente estão localizados na mesma fita de DNA que os genes que controlam, em oposição a trans , que se refere a efeitos em genes não localizados na mesma fita ou mais distantes, como fatores de transcrição. Um elemento cis- regulador pode regular vários genes e, inversamente, um gene pode ter vários módulos cis- reguladores. Módulos reguladores Cis realizam sua função integrando os fatores de transcrição ativos e os cofatores associados em um momento e local específicos na célula onde esta informação é lida e uma saída é fornecida.

Os CREs estão frequentemente, mas nem sempre, a montante do site de transcrição. Os CREs contrastam com os elementos trans-regulatórios (TREs) . Código de TREs para fatores de transcrição.

Visão geral

Diagrama mostrando em quais estágios da expressão da via de DNA-mRNA-proteína pode ser controlada

O genoma de um organismo contém de algumas centenas a milhares de genes diferentes, todos codificando um produto único ou mais. Por várias razões, incluindo manutenção organizacional, conservação de energia e geração de variância fenotípica , é importante que os genes sejam expressos apenas quando necessários. A maneira mais eficiente de um organismo regular a expressão gênica é no nível da transcrição. Os CREs funcionam para controlar a transcrição, agindo nas proximidades ou dentro de um gene. Os tipos de CREs mais bem caracterizados são intensificadores e promotores . Ambos os elementos da sequência são regiões estruturais do DNA que servem como reguladores da transcrição .

Módulos reguladores Cis são um dos vários tipos de elementos reguladores funcionais . Elementos reguladores são locais de ligação para fatores de transcrição, que estão envolvidos na regulação gênica. Módulos reguladores Cis executam uma grande quantidade de processamento de informações de desenvolvimento. Módulos reguladores Cis são clusters não aleatórios em seu local de destino especificado que contêm locais de ligação de fator de transcrição.

A definição original apresentava módulos cis-reguladores como potenciadores de DNA de ação cis, o que aumentava a taxa de transcrição de um promotor ligado . No entanto, esta definição mudou para definir os módulos cis- reguladores como uma sequência de DNA com sítios de ligação do fator de transcrição que são agrupados em estruturas modulares, incluindo, mas não se limitando a, regiões de controle de locus, promotores, intensificadores, silenciadores, elementos de controle de fronteira e outros moduladores.

Os módulos regulatórios do Cis podem ser divididos em três classes; potenciadores , que regulam positivamente a expressão gênica; isoladores , que funcionam indiretamente interagindo com outros módulos cis- reguladores próximos ; e silenciadores que desligam a expressão de genes.

O projeto dos módulos cis- reguladores é tal que fatores de transcrição e modificações epigenéticas servem como entradas, e a saída do módulo é o comando dado ao maquinário de transcrição, que por sua vez determina a taxa de transcrição do gene ou se está ativado ou off . Existem dois tipos de entradas de fatores de transcrição: aquelas que determinam quando o gene alvo deve ser expresso e aquelas que servem como condutores funcionais , que entram em ação apenas durante situações específicas durante o desenvolvimento. Essas entradas podem vir de diferentes pontos no tempo, podem representar diferentes ligantes de sinal ou podem vir de diferentes domínios ou linhagens de células. No entanto, muito ainda permanece desconhecido.

Além disso, a regulação da estrutura da cromatina e da organização nuclear também desempenha um papel na determinação e controle da função dos módulos cis-reguladores. Assim, as funções de regulação gênica (GRF) fornecem uma característica única de um módulo cis-regulador (CRM), relacionando as concentrações de fatores de transcrição (entrada) às atividades do promotor (saída). O desafio é prever GRFs. Este desafio ainda permanece sem solução. Em geral, as funções de regulação gênica não usam a lógica booleana , embora em alguns casos a aproximação da lógica booleana ainda seja muito útil.

O pressuposto da lógica booleana

Dentro do pressuposto da lógica booleana, os princípios que orientam o funcionamento desses módulos incluem o desenho do módulo que determina a função regulatória. Em relação ao desenvolvimento, esses módulos podem gerar saídas positivas e negativas. A saída de cada módulo é um produto das várias operações executadas nele. As operações comuns incluem a porta OR - este projeto indica que em uma saída será fornecida quando qualquer uma das entradas for fornecida [3], e a porta AND - neste projeto, dois fatores regulatórios diferentes são necessários para garantir que uma saída positiva resulte. "Chaves de alternância" - esse design ocorre quando o ligante de sinal está ausente enquanto o fator de transcrição está presente; esse fator de transcrição acaba atuando como um repressor dominante. No entanto, uma vez que o ligante de sinal esteja presente, o papel do fator de transcrição como repressor é eliminado e a transcrição pode ocorrer.

Outras operações de lógica booleana também podem ocorrer, como repressores transcricionais específicos de sequência, que quando se ligam ao módulo cis- regulador levam a uma saída de zero. Adicionalmente, além da influência das diferentes operações lógicas, a saída de um módulo regulador "cis" também será influenciada por eventos anteriores. 4) Módulos reguladores Cis devem interagir com outros elementos regulatórios. Para a maior parte, mesmo com a presença de sobreposição funcional entre os módulos cis- reguladores de um gene, as entradas e saídas dos módulos tendem a não ser as mesmas.

Embora a suposição da lógica booleana seja importante para a biologia de sistemas , estudos detalhados mostram que, em geral, a lógica da regulação gênica não é booleana. Isso significa, por exemplo, que no caso de um módulo cis- regulador regulado por dois fatores de transcrição, funções de regulação gênica determinadas experimentalmente não podem ser descritas pelas 16 funções booleanas possíveis de duas variáveis. Extensões não-booleanas da lógica de regulação do gene foram propostas para corrigir esse problema.

Classificação

Módulos reguladores Cis podem ser caracterizados pelo processamento de informações que codificam e pela organização de seus locais de ligação do fator de transcrição. Além disso, os módulos cis- reguladores também são caracterizados pela maneira como afetam a probabilidade, a proporção e a taxa de transcrição. Módulos cis- reguladores altamente cooperativos e coordenados são classificados como enhanosomes . A arquitetura e o arranjo dos locais de ligação do fator de transcrição são críticos porque a interrupção do arranjo pode cancelar a função. Módulos reguladores cis flexíveis funcionais são chamados de outdoors. Sua saída transcricional é o efeito de soma dos fatores de transcrição ligados. Os intensificadores afetam a probabilidade de um gene ser ativado, mas têm pouco ou nenhum efeito na taxa. O modelo de resposta binária atua como um botão liga / desliga para a transcrição. Esse modelo aumentará ou diminuirá a quantidade de células que transcrevem um gene, mas não afeta a taxa de transcrição. O modelo de resposta reostática descreve os módulos cis-reguladores como reguladores da taxa de iniciação da transcrição de seu gene associado.

Promotor

Os promotores são CREs que consistem em sequências relativamente curtas de DNA que incluem o local onde a transcrição é iniciada e a região aproximadamente 35 pb a montante ou a jusante do local de iniciação (pb). Em eucariotos , os promotores geralmente têm os seguintes quatro componentes: a caixa TATA , um local de reconhecimento TFIIB , um iniciador e o elemento promotor do núcleo a jusante . Verificou-se que um único gene pode conter vários locais promotores. A fim de iniciar a transcrição do gene downstream, um hospedeiro de proteínas de ligação ao DNA chamadas fatores de transcrição (TFs) devem se ligar sequencialmente a essa região. Somente depois que essa região foi ligada com o conjunto apropriado de TFs, e na ordem apropriada, a RNA polimerase pode se ligar e começar a transcrever o gene.

Enhancers

Enhancers são CREs que influenciam (aumentam) a transcrição de genes na mesma molécula de DNA e podem ser encontrados a montante, a jusante, dentro dos íntrons , ou mesmo relativamente longe do gene que regulam. Múltiplos intensificadores podem atuar de forma coordenada para regular a transcrição de um gene. Uma série de projetos de sequenciamento do genoma revelaram que os intensificadores são frequentemente transcritos para RNA não codificador longo (lncRNA) ou RNA intensificador (eRNA), cujas alterações nos níveis freqüentemente se correlacionam com as do mRNA do gene alvo.

Silenciadores

Silenciadores são CREs que podem ligar fatores de regulação da transcrição (proteínas) chamados repressores , evitando assim a transcrição de um gene. O termo "silenciador" também pode se referir a uma região na região 3 'não traduzida do RNA mensageiro, que se liga a proteínas que suprimem a tradução dessa molécula de mRNA, mas este uso é distinto de seu uso na descrição de um CRE.

Operadores

Os operadores são CREs em procariotos e alguns eucariotos que existem dentro de operons , onde podem ligar proteínas chamadas repressores para afetar a transcrição.

Papel evolucionário

Os CREs têm um importante papel evolutivo. As regiões codificantes dos genes são freqüentemente bem conservadas entre os organismos; no entanto, diferentes organismos exibem uma diversidade fenotípica marcada. Verificou-se que polimorfismos que ocorrem dentro de sequências não codificantes têm um efeito profundo no fenótipo, alterando a expressão do gene . As mutações que surgem dentro de um CRE podem gerar variação de expressão, alterando a forma como os TFs se ligam. A ligação mais forte ou mais fraca de proteínas regulatórias levará a uma transcrição regulada para cima ou para baixo.

Módulo regulador Cis na rede reguladora de genes

A função de uma rede de regulação gênica depende da arquitetura dos nós , cuja função é dependente dos múltiplos módulos cis- reguladores. O layout dos módulos cis- reguladores pode fornecer informações suficientes para gerar padrões espaciais e temporais de expressão gênica. Durante o desenvolvimento, cada domínio, onde cada domínio representa uma região espacial diferente do embrião, de expressão gênica estará sob o controle de diferentes módulos cis- reguladores. O projeto de módulos regulatórios ajuda a produzir feedback , feedforward e loops de regulação cruzada.

Modo de ação

Módulos reguladores Cis podem regular seus genes-alvo em grandes distâncias. Vários modelos foram propostos para descrever a maneira como esses módulos podem se comunicar com o promotor do gene alvo. Isso inclui o modelo de varredura de DNA, o modelo de looping de sequência de DNA e o modelo de rastreamento facilitado. No modelo de varredura de DNA, o fator de transcrição e o complexo de cofator se formam no módulo cis- regulador e, em seguida, continuam a se mover ao longo da sequência de DNA até encontrar o promotor do gene alvo. No modelo de looping, o fator de transcrição se liga ao módulo cis- regulador, que então causa o looping da sequência de DNA e permite a interação com o promotor do gene alvo. O complexo do módulo regulador cis do fator de transcrição causa o looping da sequência de DNA lentamente em direção ao promotor alvo e forma uma configuração looping estável. O modelo de rastreamento facilitado combina partes dos dois modelos anteriores.

Identificação e previsão computacional

Além de determinar experimentalmente os CRMs, existem vários algoritmos de bioinformática para predizê-los. A maioria dos algoritmos tenta pesquisar combinações significativas de sítios de ligação de fator de transcrição ( sítios de ligação de DNA ) em sequências promotoras de genes co-expressos. Métodos mais avançados combinam a busca por motivos significativos com correlação em conjuntos de dados de expressão gênica entre fatores de transcrição e genes alvo. Ambos os métodos foram implementados, por exemplo, no ModuleMaster . Outros programas criados para a identificação e previsão de módulos cis- reguladores incluem:

INSECT 2.0 é um servidor web que permite pesquisar módulos Cis-reguladores de uma forma genômica. O programa conta com a definição de restrições rígidas entre os Transcription Factor Binding Sites (TFBSs) que compõem o módulo para diminuir a taxa de falsos positivos. O INSECT foi projetado para ser amigável, uma vez que permite a recuperação automática de sequências e várias visualizações e links para ferramentas de terceiros, a fim de ajudar os usuários a encontrar as instâncias que são mais prováveis ​​de serem verdadeiros sites regulatórios. O algoritmo INSECT 2.0 foi publicado anteriormente e o algoritmo e a teoria por trás dele explicados em

Stubb usa modelos de Markov ocultos para identificar grupos estatisticamente significativos de combinações de fatores de transcrição. Ele também usa um segundo genoma relacionado para melhorar a precisão da previsão do modelo.

Bayesian Networks usam um algoritmo que combina previsões de sites e dados de expressão específicos de tecidos para fatores de transcrição e genes-alvo de interesse. Este modelo também usa árvores de regressão para descrever a relação entre o módulo cis- regulador identificado e o possível conjunto de ligação de fatores de transcrição.

O CRÈME examina grupos de locais alvo para fatores de transcrição de interesse. Este programa usa um banco de dados de sítios de ligação de fator de transcrição confirmados que foram anotados em todo o genoma humano . Um algoritmo de pesquisa é aplicado ao conjunto de dados para identificar possíveis combinações de fatores de transcrição, que possuem locais de ligação próximos ao promotor do conjunto de genes de interesse. Os possíveis módulos cis-reguladores são então analisados ​​estatisticamente e as combinações significativas são representadas graficamente

Módulos reguladores cis ativos em uma sequência genômica têm sido difíceis de identificar. Os problemas de identificação surgem porque muitas vezes os cientistas se deparam com um pequeno conjunto de fatores de transcrição conhecidos, o que torna mais difícil identificar grupos estatisticamente significativos de sítios de ligação de fatores de transcrição. Além disso, os altos custos limitam o uso de grandes matrizes de mosaico do genoma inteiro .

Exemplos

Um exemplo de sequência reguladora de ação cis é o operador no operon lac . Essa sequência de DNA é ligada pelo repressor lac , que, por sua vez, impede a transcrição dos genes adjacentes na mesma molécula de DNA. O operador lac é, portanto, considerado como "atuante em cis" na regulação dos genes próximos. O próprio operador não codifica para nenhuma proteína ou RNA .

Em contraste, elementos trans-reguladores são fatores difusíveis, geralmente proteínas, que podem modificar a expressão de genes distantes do gene que foi originalmente transcrito para criá-los. Por exemplo, um fator de transcrição que regula um gene no cromossomo 6 pode ter sido transcrito de um gene no cromossomo 11 . O termo trans-regulatório é construído a partir da raiz latina trans , que significa "através de".

Existem elementos cis-reguladores e trans-reguladores. Os elementos cis-reguladores são freqüentemente locais de ligação para um ou mais fatores de ação trans .

Para resumir, os elementos cis-reguladores estão presentes na mesma molécula de DNA do gene que eles regulam, enquanto os elementos trans-reguladores podem regular genes distantes do gene do qual foram transcritos.

Exemplos em RNA

Elementos de RNA
Modelo Abr. Função Distribuição Ref.
Elemento Frameshift Regula o uso de quadros alternativos com RNAs mensageiros Archaea , bactéria , Eucaryota , vírus de RNA
Local de entrada do ribossomo interno IRES Inicia a tradução no meio de um RNA mensageiro Vírus de RNA , Eucariotos
Elemento de resposta de ferro IRA Regula a expressão de genes associados ao ferro Eukaryota
Peptídeo líder Regula a transcrição de genes e / ou operons associados Bactérias
Riboswitch Regulação do gene Bactérias , Eucariotos
Termômetro de RNA Regulação do gene Bactérias
Sequência de inserção de selenocisteína SECIS Direciona a célula para traduzir códons de parada UGA como selenocisteínas Metazoa

Veja também

Referências

Leitura adicional

links externos