Jean-François Mertens - Jean-François Mertens

Jean-François Mertens
Jean-Francois Mertens.jpg
Nascer ( 11/03/1946 )11 de março de 1946
Antuérpia, Bélgica
Faleceu 17 de julho de 2012 (17/07/2012)(66 anos)
Nacionalidade Bélgica
Alma mater Université Catholique de Louvain
Docteur ès Sciences 1970
Prêmios Econometric Society Fellow
von Neumann Palestrante da Game Theory Society
Carreira científica
Campos Teoria dos jogos
Economia matemática
Orientador de doutorado José Paris
Jacques Neveu
Influências Robert Aumann
Reinhard Selten
John Harsanyi
John von Neumann
Influenciado Claude d'Aspremont
Bernard De Meyer
Amrita Dhillon
Françoise Forja
Jean Gabszewicz
Srihari Govindan
Abraham Neyman
Anna Rubinchik
Sylvain Sorin

Jean-François Mertens (11 de março de 1946 - 17 de julho de 2012) foi um teórico de jogos e economista matemático belga.

Mertens contribuiu para a teoria econômica no que diz respeito à carteira de pedidos de jogos de mercado, jogos cooperativos, jogos não cooperativos, jogos repetidos, modelos epistêmicos de comportamento estratégico e refinamentos do equilíbrio de Nash (ver conceito de solução ). Na teoria dos jogos cooperativos, ele contribuiu para os conceitos de solução chamados de núcleo e valor de Shapley .

Em relação aos jogos repetidos e jogos estocásticos , os artigos da pesquisa de Mertens de 1982 e 1986, e sua pesquisa de 1994 em coautoria com Sylvain Sorin e Shmuel Zamir, são compêndios de resultados sobre esse tópico, incluindo suas próprias contribuições. Mertens também fez contribuições para a teoria da probabilidade e publicou artigos sobre topologia elementar.

Modelos epistêmicos

Mertens e Zamir implementaram a proposta de John Harsanyi de modelar jogos com informações incompletas, supondo que cada jogador é caracterizado por um tipo particular conhecido que descreve suas estratégias e payoffs viáveis, bem como uma distribuição de probabilidade sobre os tipos de outros jogadores. Eles construíram um espaço universal de tipos em que, sujeito a condições de consistência especificadas, cada tipo corresponde à hierarquia infinita de suas crenças probabilísticas sobre as crenças probabilísticas dos outros. Eles também mostraram que qualquer subespaço pode ser aproximado arbitrariamente por um subespaço finito, que é a tática usual em aplicações.

Jogos repetidos com informações incompletas

Jogos repetidos com informações incompletas foram lançados por Aumann e Maschler. Duas das contribuições de Jean-François Mertens para o campo são as extensões de jogos repetidos de soma zero para duas pessoas com informações incompletas de ambos os lados para (1) o tipo de informação disponível para os jogadores e (2) a estrutura de sinalização.

  • (1) Informação: Mertens estendeu a teoria do caso independente onde a informação privada dos jogadores é gerada por variáveis ​​aleatórias independentes, para o caso dependente onde a correlação é permitida.
  • (2) Estruturas de sinalização: a teoria de sinalização padrão onde após cada estágio ambos os jogadores são informados dos movimentos anteriores executados, foi estendida para lidar com a estrutura de sinalização geral onde após cada estágio cada jogador recebe um sinal privado que pode depender dos movimentos e o Estado.

Nessas configurações, Jean-François Mertens forneceu uma extensão da caracterização do valor minmax e maxmin para o jogo infinito no caso dependente com sinais independentes de estado. Além de Shmuel Zamir, Jean-François Mertens mostrou a existência de um valor limite. Tal valor pode ser pensado tanto como o limite dos valores dos jogos cênicos, pois vai para o infinito, quanto como o limite dos valores dos jogos -descontados, à medida que os agentes se tornam mais pacientes e .

Um elemento fundamental da abordagem de Mertens e Zamir é a construção de um operador, agora simplesmente referido como o operador MZ no campo em sua homenagem. Em tempo contínuo ( jogos diferenciais com informações incompletas), o operador MZ torna-se um operador infinitesimal no centro da teoria de tais jogos. Solução única de um par de equações funcionais, Mertens e Zamir mostraram que o valor limite pode ser uma função transcendental ao contrário do maxmin ou do minmax (valor no caso da informação completa). Mertens também encontrou a taxa exata de convergência no caso do jogo com informação incompleta de um lado e estrutura geral de sinalização. Uma análise detalhada da velocidade de convergência do valor do jogo de n fases (repetido finitamente) até seu limite tem ligações profundas com o teorema do limite central e a lei normal, bem como a variação máxima dos martingales limitados . Atacando o estudo do caso difícil de jogos com sinais dependentes de estado e sem estrutura recursiva, Mertens e Zamir introduziram novas ferramentas na introdução baseada em um jogo auxiliar, reduzindo o conjunto de estratégias a um núcleo que é 'estatisticamente suficiente'.

Coletivamente, as contribuições de Jean-François Mertens com Zamir (e também com Sorin) fornecem a base para uma teoria geral para jogos repetidos de soma zero para duas pessoas que engloba aspectos estocásticos e de informação incompleta e onde conceitos de ampla relevância são implantados como, por exemplo, reputação, limites em níveis racionais para os payoffs, mas também ferramentas como lema de divisão, sinalização e acessibilidade. Embora em muitos aspectos o trabalho de Mertens aqui volte às raízes originais de von Neumann da teoria dos jogos com uma configuração de soma zero de duas pessoas, vitalidade e inovações com aplicação mais ampla têm sido generalizadas.

Jogos estocásticos

Os jogos estocásticos foram introduzidos por Lloyd Shapley em 1953. O primeiro artigo estudou o jogo estocástico de soma zero de duas pessoas com um número finito de estados e ações e demonstra a existência de um valor e estratégias ótimas estacionárias. O estudo do caso não descontado evoluiu nas três décadas seguintes, com soluções de casos especiais por Blackwell e Ferguson em 1968 e Kohlberg em 1974. A existência de um valor não descontado em um sentido muito forte, tanto um valor uniforme quanto um valor médio limitante , foi comprovado em 1981 por Jean-François Mertens e Abraham Neyman. O estudo da soma não-zero com um estado geral e espaços de ação atraiu muita atenção, e Mertens e Parthasarathy provaram um resultado de existência geral sob a condição de que as transições, em função do estado e das ações, são norma contínuas no ações.

Jogos de mercado: limitar o mecanismo de preços

Mertens teve a ideia de usar economias competitivas lineares como uma carteira de pedidos (negociação) para modelar pedidos limitados e generalizar leilões duplos para uma configuração multivariada. Os preços relativos aceitáveis ​​dos jogadores são transmitidos por suas preferências lineares, o dinheiro pode ser uma das mercadorias e está ok para os agentes terem utilidade marginal positiva para o dinheiro neste caso (afinal os agentes são realmente apenas pedidos!). Na verdade, este é o caso da maioria das ordens na prática. Mais de um pedido (e o agente do pedido correspondente) podem vir do mesmo agente real. Em equilíbrio, o bem vendido deve ter sido a um preço relativo em comparação com o bem comprado, não inferior ao implícito pela função de utilidade. Bens trazidos ao mercado (quantidades no pedido) são transportados por dotações iniciais. A ordem limite é representada da seguinte forma: o agente da ordem traz um bem ao mercado e tem utilidades marginais não nulas naquele bem e em outra (dinheiro ou numerário). Uma ordem de venda no mercado terá utilidade zero para o bem vendido no mercado e positiva para o dinheiro ou numerário. Mertens limpa ordens criando um motor compatível usando o equilíbrio competitivo - apesar das condições de interioridade mais usuais serem violadas para a economia linear auxiliar. O mecanismo de Mertens fornece uma generalização das feitorias Shapley-Shubik e tem o potencial de uma implementação na vida real com ordens limitadas em todos os mercados, em vez de apenas um especialista em um mercado.

Valor Shapley

A fórmula diagonal na teoria dos jogos cooperativos não atômicos atribui elegantemente o valor de Shapley de cada jogador infinitesimal como sua contribuição marginal ao valor de uma amostra perfeita da população de jogadores quando calculada a média de todos os tamanhos de amostra possíveis. Essa contribuição marginal foi mais facilmente expressa na forma de uma derivada - levando à fórmula diagonal formulada por Aumann e Shapley. Esta é a razão histórica pela qual algumas condições de diferenciabilidade foram originalmente exigidas para definir o valor de Shapley dos jogos cooperativos não atômicos. Mas primeiro trocando a ordem de tomar a "média de todos os tamanhos de amostra possíveis" e tomando tal derivado, Jean-François Mertens usa o efeito de suavização de tal processo de média para estender a aplicabilidade da fórmula diagonal. Este truque sozinho funciona bem para jogos majoritários (representado por uma função degrau aplicada na porcentagem da população na coalizão). Explorando ainda mais essa ideia de comutação de tirar médias antes de tirar a derivada, Jean-François Mertens gasta olhando para transformações invariantes e tomando médias sobre elas, antes de tirar a derivada. Fazendo isso, Mertens expande a fórmula diagonal para um espaço muito maior de jogos, definindo um valor de Shapley ao mesmo tempo.

Refinamentos e equilíbrios estáveis ​​de Mertens

Conceitos de solução que são refinamentos do equilíbrio de Nash foram motivados principalmente por argumentos para indução reversa e indução direta. A indução reversa postula que a ação ótima de um jogador agora antecipa a otimização das ações futuras dele e de outros. O refinamento chamado equilíbrio perfeito de subjogo implementa uma versão fraca de indução para trás, e versões cada vez mais fortes são equilíbrio sequencial , equilíbrio perfeito , equilíbrio quase perfeito e equilíbrio adequado , onde os três últimos são obtidos como limites de estratégias perturbadas. A indução direta postula que a ação ótima de um jogador agora presume a otimização das ações passadas dos outros sempre que isso for consistente com suas observações. A indução direta é satisfeita por um equilíbrio sequencial para o qual a crença de um jogador em um conjunto de informações atribui probabilidade apenas às estratégias ótimas de outros que permitem que essa informação seja alcançada. Em particular, uma vez que os equilíbrios de Nash completamente misturados são sequenciais - tais equilíbrios, quando existem, satisfazem tanto a indução para frente quanto para trás. Em seu trabalho, Mertens consegue pela primeira vez selecionar equilíbrios de Nash que satisfaçam tanto a indução para frente quanto para trás. O método é permitir que tal característica seja herdada de jogos perturbados que são forçados a ter estratégias completamente misturadas - e o objetivo só é alcançado com equilíbrios estáveis ​​de Mertens , não com os equilíbrios mais simples de Kohlberg Mertens.

Elon Kohlberg e Mertens enfatizaram que um conceito de solução deve ser consistente com uma regra de decisão admissível . Além disso, deve satisfazer o princípio da invariância de que não deve depender de qual, entre as muitas representações equivalentes da situação estratégica como um jogo de forma extensiva, é usada. Em particular, deve depender apenas da forma normal reduzida do jogo obtida após a eliminação de estratégias puras que são redundantes porque seus payoffs para todos os jogadores podem ser replicados por uma mistura de outras estratégias puras. Mertens enfatizou também a importância do princípio dos mundos pequenos de que um conceito de solução deve depender apenas das propriedades ordinais das preferências dos jogadores, e não deve depender se o jogo inclui jogadores estranhos cujas ações não têm efeito sobre as estratégias viáveis ​​dos jogadores originais e recompensas.

Kohlberg e Mertens definiram provisoriamente um conceito de solução de valor definido denominado estabilidade para jogos com números finitos de estratégias puras que satisfazem a admissibilidade, invariância e indução direta, mas um contra-exemplo mostrou que não precisa satisfazer a indução retroativa; viz. o conjunto pode não incluir um equilíbrio sequencial. Posteriormente, Mertens definiu um refinamento, também chamado de estabilidade e agora muitas vezes chamado de um conjunto de equilíbrios estáveis de Mertens , que tem várias propriedades desejáveis:

  • Admissibilidade e perfeição: Todos os equilíbrios em um conjunto estável são perfeitos, portanto, admissíveis.
  • Indução para trás e indução para frente: Um conjunto estável inclui um equilíbrio adequado da forma normal do jogo que induz um equilíbrio quase perfeito e sequencial em todos os jogos de forma extensiva com evocação perfeita que tem a mesma forma normal. Um subconjunto de um conjunto estável sobrevive à eliminação iterativa de estratégias fracamente dominadas e estratégias que são respostas inferiores em todos os equilíbrios do conjunto.
  • Invariância e mundos pequenos: Os conjuntos estáveis ​​de um jogo são as projeções dos conjuntos estáveis ​​de qualquer jogo maior no qual está embutido, preservando as estratégias e recompensas dos jogadores originais.
  • Decomposição e divisão do jogador. Os conjuntos estáveis ​​do produto de dois jogos independentes são os produtos de seus conjuntos estáveis. Conjuntos estáveis ​​não são afetados pela divisão de um jogador em agentes de forma que nenhum caminho na árvore do jogo inclua ações de dois agentes.

Para jogos de dois jogadores com recall perfeito e recompensas genéricas, a estabilidade é equivalente a apenas três dessas propriedades: um conjunto estável usa apenas estratégias não dominadas, inclui um equilíbrio quase perfeito e é imune à incorporação em um jogo maior.

Um conjunto estável é definido matematicamente por (em breve) essencialidade do mapa de projeção de uma vizinhança conectada fechada no gráfico dos equilíbrios de Nash sobre o espaço de jogos perturbados obtidos por perturbar as estratégias dos jogadores em direção a estratégias completamente misturadas. Essa definição envolve mais do que a propriedade de que todo jogo próximo tem um equilíbrio próximo. A essencialidade requer ainda que nenhuma deformação da projeção seja mapeada para a fronteira, o que garante que as perturbações do problema de ponto fixo que define os equilíbrios de Nash tenham soluções próximas. Isso é aparentemente necessário para obter todas as propriedades desejáveis ​​listadas acima.

Teoria da escolha social e utilitarismo relativo

Uma função de bem-estar social (SWF) mapeia perfis de preferências individuais para preferências sociais sobre um conjunto fixo de alternativas. Em um artigo seminal, Arrow (1950) mostrou o famoso "Teorema da Impossibilidade" , ou seja, não existe um SWF que satisfaça um sistema mínimo de axiomas: Domínio Irrestrito , Independência de Alternativas Irrelevantes , o critério de Pareto e Não-ditadura . Uma grande literatura documenta várias maneiras de relaxar os axiomas de Arrow para obter resultados de possibilidades. O Utilitarismo Relativo (RU) (Dhillon e Mertens, 1999) é um SWF que consiste em normalizar utilitários individuais entre 0 e 1 e adicioná-los, e é um resultado de "possibilidade" que é derivado de um sistema de axiomas muito próximos aos de Arrow. originais, mas modificados para o espaço de preferências sobre loterias. Ao contrário do utilitarismo clássico, RU não assume utilidade cardinal ou comparabilidade interpessoal. Partindo de preferências individuais sobre loterias, que se presume que satisfaçam os axiomas de von-Neumann-Morgenstern (ou equivalente), o sistema de axiomas fixa de maneira única as comparações interpessoais. O teorema pode ser interpretado como fornecendo uma base axiomática para as comparações interpessoais "certas", um problema que tem atormentado a teoria da escolha social por muito tempo. Os axiomas são:

  • Individualismo: Se todos os indivíduos são indiferentes entre todas as alternativas, então a sociedade também é,
  • Não trivialidade: O SWF não é constantemente totalmente indiferente entre todas as alternativas,
  • Não, mal : não é verdade que, quando todos os indivíduos, exceto um, são totalmente indiferentes, as preferências da sociedade são opostas às dele,
  • Anonimato: uma permutação de todos os indivíduos deixa as preferências sociais inalteradas.
  • Independência de alternativas redundantes: este axioma restringe a Independência de alternativas irrelevantes (IIA) de Arrow ao caso em que antes e depois da mudança, as alternativas "irrelevantes" são loterias nas outras alternativas.
  • Monotonicidade é muito mais fraco do que o seguinte "boa axioma vontade": Considere duas loterias e e dois perfis de preferência que coincidem para todos os indivíduos, exceto , é indiferente entre e no primeiro perfil, mas estritamente prefere que no segundo perfil, então a sociedade prefere estritamente a no segundo perfil também.
  • Finalmente, o axioma de continuidade é basicamente uma propriedade de gráfico fechado que leva a convergência mais forte possível para perfis de preferência.

O teorema principal mostra que RU satisfaz todos os axiomas e se o número de indivíduos for maior que três, o número de candidatos é maior que 5, então qualquer SWF que satisfaça os axiomas acima é equivalente a RU, sempre que houver pelo menos 2 indivíduos que não têm exatamente as mesmas preferências ou exatamente as opostas.

Equidade intergeracional na avaliação de políticas

O utilitarismo relativo pode servir para racionalizar o uso de 2% como uma taxa de desconto social intergeracionalmente justa para a análise de custo-benefício . Mertens e Rubinchik mostram que uma função de bem-estar invariante à mudança definida em um rico espaço de políticas (temporárias), se diferenciável, tem como derivada uma soma descontada da política (mudança), com uma taxa de desconto fixa, ou seja, o social induzido taxa de desconto. (A invariância de mudança requer uma função avaliada em uma política deslocada para retornar uma transformação afim do valor da política original, enquanto os coeficientes dependem apenas da mudança de tempo.) Em um modelo de gerações sobrepostas com crescimento exógeno (com o tempo sendo o linha real inteira), a função utilitária relativa é invariante ao deslocamento quando avaliada em políticas (pequenas temporárias) em torno de um equilíbrio de crescimento equilibrado (com estoque de capital crescendo exponencialmente). Quando as políticas são representadas como mudanças nas dotações de indivíduos (transferências ou impostos), e os serviços públicos de todas as gerações são ponderados igualmente, a taxa de desconto social induzida pelo utilitarismo relativo é a taxa de crescimento do PIB per capita (2% nos EUA). Isso também é consistente com as práticas atuais descritas na Circular A-4 do Escritório de Gestão e Orçamento dos Estados Unidos , declarando:

Se sua regra terá benefícios ou custos intergeracionais importantes, você pode considerar uma análise de sensibilidade adicional usando uma taxa de desconto mais baixa, mas positiva, além de calcular os benefícios líquidos usando taxas de desconto de 3 e 7 por cento.

Referências