Índice de fixação

O índice de fixação (FST) é uma medida de diferenciação populacional devido à estrutura genética. É frequentemente estimado a partir de dados de polimorfismo genético, como polimorfismos de nucleotídeo único (SNP) ou microssatélites. Desenvolvido como um caso especial da estatística F de Wright, é uma das estatísticas mais comumente usadas em genética populacional.

Definição

Duas das definições mais comumente usadas para FST em um determinado locus são baseadas em 1) a variância das frequências de alelos entre as populações e em 2) a probabilidade de Identidade por descendência.

Se p ¯ {\displaystyle {\bar {p}}} é a frequência média de um alelo na população total, σ S 2 {\displaystyle \sigma _{S}^{2}} é a variação na frequência do alelo entre diferentes subpopulações, ponderada pelos tamanhos das subpopulações, e σ T 2 {\displaystyle \sigma _{T}^{2}} é a variância do estado alélico na população total, FST é definido como[1]

F S T = σ S 2 σ T 2 = σ S 2 p ¯ ( 1 p ¯ ) {\displaystyle F_{ST}={\frac {\sigma _{S}^{2}}{\sigma _{T}^{2}}}={\frac {\sigma _{S}^{2}}{{\bar {p}}(1-{\bar {p}})}}}

A definição de Wright ilustra que FST mede a quantidade de variância genética que pode ser explicada pela estrutura da população. Isso também pode ser considerado como a fração da diversidade total que não é uma consequência da diversidade média dentro das subpopulações, onde a diversidade é medida pela probabilidade de que dois alelos selecionados aleatoriamente sejam diferentes, ou seja, 2 p ( 1 p ) {\displaystyle 2p(1-p)} . Se a frequência do alelo na população i {\displaystyle i} é p i {\displaystyle p_{i}} e o tamanho relativo da população i {\displaystyle i} é c i {\displaystyle c_{i}} , então

F S T = p ¯ ( 1 p ¯ ) c i p i ( 1 p i ) p ¯ ( 1 p ¯ ) = p ¯ ( 1 p ¯ ) p ( 1 p ) ¯ p ¯ ( 1 p ¯ ) {\displaystyle F_{ST}={\frac {{\bar {p}}(1-{\bar {p}})-\sum c_{i}p_{i}(1-p_{i})}{{\bar {p}}(1-{\bar {p}})}}={\frac {{\bar {p}}(1-{\bar {p}})-{\overline {p(1-p)}}}{{\bar {p}}(1-{\bar {p}})}}}

Alternativamente,[2]

F S T = f 0 f ¯ 1 f ¯ {\displaystyle F_{ST}={\frac {f_{0}-{\bar {f}}}{1-{\bar {f}}}}}

Onde f 0 {\displaystyle f_{0}} é a probabilidade de identidade por descendência de dois indivíduos, dado que os dois indivíduos estão na mesma subpopulação, e f ¯ {\displaystyle {\bar {f}}} é a probabilidade de que dois indivíduos da população total sejam idênticos por descendência. Usando essa definição, FST pode ser interpretada como medindo o quão mais próximos dois indivíduos da mesma subpopulação estão, em comparação com a população total. Se a taxa de mutação for pequena, essa interpretação pode ser mais explícita ligando a probabilidade de identidade por descendência aos tempos de coalescência: sejam T0 e T o tempo médio de coalescência para indivíduos da mesma subpopulação e da população total, respectivamente. Então,

F S T 1 T 0 T {\displaystyle F_{ST}\approx 1-{\frac {T_{0}}{T}}}

Interpretação

Esta comparação da variabilidade genética dentro e entre as populações é freqüentemente usada na genética populacional aplicada. Os valores variam de 0 a 1. Um valor 0 implica panmixia completa, isto é, que as duas populações estão se cruzando livremente. Um valor de 1 implica que toda variação genética é explicada pela estrutura da população e que as duas populações não compartilham nenhuma diversidade genética.

FST em humanos

Os valores de FST dependem fortemente da escolha das populações. Grupos étnicos intimamente relacionados, como dinamarqueses e holandeses, ou portugueses e espanhóis, apresentam valores significativamente abaixo de 1%, indistinguíveis de panmixia. Na Europa, os grupos étnicos mais divergentes têm valores da ordem de 7% (Lapões vs. Sardos).

Valores maiores são encontrados se forem comparados grupos homogêneos altamente divergentes: o maior valor encontrado foi próximo a 46%, entre Mbuti e Papuas.[3]

A distância média Fst entre as populações humanas é de aproximadamente 0,15. Lewontin argumentou que isso representa uma pequena variação racial.[4] Harpending, por outro lado, argumentou que essa distância implica parentesco entre indivíduos da mesma raça equivalente ao parentesco entre meio-irmãos em uma população que se acasala aleatoriamente, e que uma pessoa de determinada raça está geneticamente mais próxima de um indivíduo não relacionado da mesma raça do que de um meio-irmão de raça mista.[5]

Ver também

Referências

  1. Holsinger, Kent E.; Bruce S. Weir (2009). «Genetics in geographically structured populations: defining, estimating and interpreting FST». Nat Rev Genet. 10 (9): 639–650. ISSN 1471-0056. PMC 4687486Acessível livremente. PMID 19687804. doi:10.1038/nrg2611 
  2. Richard Durrett (12 de agosto de 2008). Probability Models for DNA Sequence Evolution. [S.l.]: Springer. ISBN 978-0-387-78168-6. Consultado em 25 de outubro de 2012 
  3. Cavalli-Sforza et al. (1994), cited after V. Ginsburgh, S. Weber, The Palgrave Handbook of Economics and Language, Springer (2016), p. 182.
  4. https://link.springer.com/chapter/10.1007/978-1-4684-9063-3_14
  5. https://www.jstor.org/stable/27503827