Modelo Lee-Carter - Lee–Carter model

O modelo de Lee-Carter é um algoritmo numérico usado na previsão de mortalidade e expectativa de vida de previsão . A entrada para o modelo é uma matriz de taxas de mortalidade específicas por idade ordenadas monotonicamente por tempo, geralmente com idades em colunas e anos em linhas. A saída é uma matriz prevista de taxas de mortalidade no mesmo formato da entrada.

O modelo usa decomposição de valor singular (SVD) para encontrar:

  • Um vetor de série temporal univariada que captura 80-90% da tendência de mortalidade (aqui o subscrito se refere ao tempo),
  • Um vetor que descreve a mortalidade relativa em cada idade (aqui o subscrito se refere à idade), e
  • Uma constante de escala (referida aqui como, mas sem nome na literatura).

Surpreendentemente, geralmente é linear, o que implica que os ganhos na expectativa de vida são razoavelmente constantes, ano após ano, na maioria das populações. Antes de computar SVD, as taxas de mortalidade específicas por idade são primeiro transformadas em , tomando seus logaritmos e, em seguida, centralizando- os subtraindo suas médias específicas por idade ao longo do tempo. A média específica da idade ao longo do tempo é denotada por . O subscrito se refere ao fato de que abrange tanto a idade quanto o tempo.

Muitos pesquisadores ajustam o vetor ajustando-o às expectativas de vida empíricas para cada ano, usando o e gerado com SVD. Quando ajustado com essa abordagem, as alterações em geralmente são pequenas.

Para prever a mortalidade, (ajustada ou não) é projetada em anos futuros usando um modelo ARIMA . A previsão correspondente é recuperada multiplicando por e o primeiro elemento diagonal de S (quando ). As taxas de mortalidade reais são recuperadas tomando exponenciais desse vetor.

Devido à linearidade de , geralmente é modelado como um passeio aleatório com tendência. A expectativa de vida e outras medidas da tábua de vida podem ser calculadas a partir desta matriz prevista após adicionar de volta as médias e tomar exponenciais para produzir taxas de mortalidade regulares.

Na maioria das implementações, os intervalos de confiança para as previsões são gerados simulando várias previsões de mortalidade usando os métodos de Monte Carlo . Uma banda de mortalidade entre 5% e 95% dos percentis dos resultados simulados é considerada uma previsão válida. Estas simulações são feitas através da extensão para o futuro usando randomização com base no erro padrão de derivados a partir dos dados de entrada.

Algoritmo

O algoritmo busca encontrar a solução de mínimos quadrados para a equação:

onde é uma matriz da taxa de mortalidade para cada idade em cada ano .

  1. Calcule qual é a média ao longo do tempo de cada idade:
  2. Calcule que será usado em SVD:
  3. Calcule a decomposição de valor singular de :
  4. Derive , (o valor próprio de escala), e de , e :
  5. Previsão usando um modelo ARIMA univariado padrão para anos adicionais:
  6. Use o previsto , com o original , e para calcular a taxa de mortalidade prevista para cada idade:

Discussão

Sem aplicar SVD ou algum outro método de redução de dimensão, a tabela de dados de mortalidade é uma série de dados multivariados altamente correlacionados, e a complexidade dessas séries de tempo multidimensionais torna difícil prever. SVD se tornou amplamente usado como um método de redução de dimensão em muitos campos diferentes, incluindo pelo Google em seu algoritmo de classificação de página .

O modelo Lee-Carter foi introduzido por Ronald D. Lee e Lawrence Carter em 1992 com o artigo "Modelando e Prevendo as Séries Temporais da Mortalidade nos EUA" (Journal of the American Statistical Association 87 (setembro): 659-671). O modelo surgiu de seu trabalho no final dos anos 1980 e início dos anos 1990, tentando usar a projeção inversa para inferir taxas na demografia histórica . O modelo foi usado pela Administração da Previdência Social dos Estados Unidos , pelo US Census Bureau e pelas Nações Unidas. Tornou-se a técnica de previsão de mortalidade mais amplamente usada no mundo hoje.

Houve extensões do modelo de Lee-Carter, mais notavelmente para levar em conta anos perdidos, populações masculinas e femininas correlacionadas e coerência em grande escala em populações que compartilham um regime de mortalidade (Europa Ocidental, por exemplo). Muitos artigos relacionados podem ser encontrados no site do Professor Ronald Lee .

Implementações

Existem surpreendentemente poucos pacotes de software para previsões com o modelo Lee-Carter.

Referências