fórmula de amostragem de Ewens - Ewens's sampling formula

Em genética de populações , fórmula amostragem de Ewens , descreve as probabilidades associadas com as contagens de quantos diferentes alelos são observados um determinado número de vezes na amostra .

Definição

Fórmula amostragem de Ewens, introduzido por Warren Ewens , afirma que, sob certas condições (indicados abaixo), se uma amostra aleatória de n gâmetas foi retirado de uma população e classificados de acordo com o gene em um determinado local , em seguida, a probabilidade de que há um 1 alelos uma vez representado na amostra, e um 2 alelos representado duas vezes, e assim por diante, é

para algum número positivo θ que representa a taxa de mutação população , sempre que um 1 , ..., um k é uma sequência de números inteiros não negativos de tal forma que

A frase "sob certas condições" usado acima é feita exacta pelas seguintes hipóteses:

  • O tamanho da amostra n é pequeno em comparação com o tamanho de toda a população; e
  • A população está em equilíbrio estatística de acordo com mutação e a deriva genética e o papel de selecção com o locus em questão é desprezável; e
  • Cada alelo mutante é nova. (Ver também modelo infinito alelos ).

Esta é uma distribuição de probabilidade no conjunto de todas as partições do inteiro n . Entre probabilistas e estatísticos é frequentemente chamado a distribuição Ewens multivariada .

propriedades matemáticas

Quando θ  = 0, a probabilidade é de que todas as 1 N genes são o mesmo. Quando θ  = 1, então a distribuição é precisamente o da partição inteiro induzida por um uniformemente distribuído permutação aleatória . Como q  → ∞, a probabilidade de que não há dois dos n genes são as mesmas abordagens 1.

Esta família de distribuições de probabilidade goza a propriedade que, se após a amostra de n é tomado, m dos n gametas são escolhidos sem substituição, em seguida, a distribuição de probabilidade resultante no conjunto de todas as partições do menor número inteiro m é apenas o que a fórmula acima daria se m foram colocados no lugar do  n .

A distribuição Ewens surge naturalmente a partir do processo de restaurante chinês .

Veja também

Notas

  • Warren Ewens, "A teoria da amostragem de alelos seletivamente neutras", Biologia de população teórica , volume 3, páginas 87-112, 1972.
  • H. guindaste. (2016) " A Fórmula ubíquos Ewens amostragem ", Statistical Science , 31: 1 (Fev 2016). Este artigo introduz uma série de sete artigos sobre Ewens amostragem em um número especial da revista.
  • JFC Kingman, "partições aleatórias em genética de populações", Proceedings of the Royal Society de Londres, Série B, Matemática e Ciências Físicas , o volume 361, número 1704, de 1978.
  • S. Tavare e WJ Ewens, "A distribuição multivariada Ewens." (1997, Capítulo 41 da referência abaixo).
  • NL Johnson, S. Kotz, e N. Balakrishnan (1997) Discrete Distributions multivariados , Wiley. ISBN  0-471-12844-9 .