Modelo matemático - Mathematical model

Um modelo matemático é a descrição de um sistema usando conceitos matemáticos e linguagem . O processo de desenvolvimento de um modelo matemático é denominado modelagem matemática . Modelos matemáticos são usados ​​nas ciências naturais (como física , biologia , ciências da terra , química ) e disciplinas de engenharia (como ciência da computação , engenharia elétrica ), bem como em sistemas não físicos, como ciências sociais (como economia , psicologia , sociologia , ciência política ). O uso de modelos matemáticos para resolver problemas em operações comerciais ou militares é uma grande parte do campo da pesquisa operacional . Modelos matemáticos também são usados ​​em música , linguística , filosofia (por exemplo, intensamente em filosofia analítica ) e religião (por exemplo, os usos recorrentes dos números 7, 12 e 40 na Bíblia ).

Um modelo pode ajudar a explicar um sistema e estudar os efeitos de diferentes componentes e fazer previsões sobre o comportamento.

Elementos de um modelo matemático

Os modelos matemáticos podem assumir muitas formas, incluindo sistemas dinâmicos , modelos estatísticos , equações diferenciais ou modelos teóricos de jogos . Esses e outros tipos de modelos podem se sobrepor, com um determinado modelo envolvendo uma variedade de estruturas abstratas. Em geral, os modelos matemáticos podem incluir modelos lógicos . Em muitos casos, a qualidade de um campo científico depende de quão bem os modelos matemáticos desenvolvidos no lado teórico concordam com os resultados de experimentos repetíveis. A falta de acordo entre os modelos matemáticos teóricos e as medidas experimentais geralmente leva a avanços importantes à medida que melhores teorias são desenvolvidas.

Nas ciências físicas , um modelo matemático tradicional contém a maioria dos seguintes elementos:

  1. Equações governamentais
  2. Submodelos suplementares
    1. Definindo equações
    2. Equações constitutivas
  3. Pressupostos e Restrições
    1. Condições iniciais e de limite
    2. Restrições clássicas e equações cinemáticas

Classificações

Os modelos matemáticos geralmente são compostos de relacionamentos e variáveis . Os relacionamentos podem ser descritos por operadores , como operadores algébricos, funções, operadores diferenciais, etc. Variáveis ​​são abstrações de parâmetros do sistema de interesse, que podem ser quantificados . Vários critérios de classificação podem ser usados ​​para modelos matemáticos de acordo com sua estrutura:

  • Linear vs. não linear: Se todos os operadores em um modelo matemático exibem linearidade , o modelo matemático resultante é definido como linear. Caso contrário, um modelo é considerado não linear. A definição de linearidade e não linearidade depende do contexto e os modelos lineares podem conter expressões não lineares. Por exemplo, em um modelo linear estatístico , assume-se que um relacionamento é linear nos parâmetros, mas pode ser não linear nas variáveis ​​preditoras. Da mesma forma, uma equação diferencial é considerada linear se puder ser escrita com operadores diferenciais lineares , mas ainda pode conter expressões não lineares. Em um modelo de programação matemática , se as funções objetivo e restrições são representadas inteiramente por equações lineares , o modelo é considerado um modelo linear. Se uma ou mais funções objetivo ou restrições são representadas com uma equação não linear, o modelo é conhecido como modelo não linear.
    A estrutura linear implica que um problema pode ser decomposto em partes mais simples que podem ser tratadas independentemente e / ou analisadas em uma escala diferente e os resultados obtidos permanecerão válidos para o problema inicial quando recompostos e redimensionados.
    A não linearidade, mesmo em sistemas bastante simples, costuma estar associada a fenômenos como caos e irreversibilidade . Embora haja exceções, os sistemas e modelos não lineares tendem a ser mais difíceis de estudar do que os lineares. Uma abordagem comum para problemas não lineares é a linearização , mas isso pode ser problemático se alguém estiver tentando estudar aspectos como a irreversibilidade, que estão fortemente ligados à não linearidade.
  • Estático vs. dinâmico: um modelo dinâmico é responsável por mudanças dependentes do tempo no estado do sistema, enquanto um modelo estático (ou estado estacionário) calcula o sistema em equilíbrio e, portanto, é invariante no tempo. Modelos dinâmicos normalmente são representados por equações diferenciais ou equações de diferença .
  • Explícito vs. implícito: se todos os parâmetros de entrada do modelo geral forem conhecidos e os parâmetros de saída puderem ser calculados por uma série finita de cálculos, o modelo será considerado explícito . Mas às vezes são os parâmetros de saída que são conhecidos e as entradas correspondentes devem ser resolvidas por um procedimento iterativo, como o método de Newton ou o método de Broyden . Nesse caso, o modelo é considerado implícito . Por exemplo, as propriedades físicas de um motor a jato , como as áreas da turbina e da garganta do bico, podem ser calculadas explicitamente, dado um ciclo termodinâmico de projeto (taxas de fluxo de ar e combustível, pressões e temperaturas) em uma condição de voo e configuração de potência específicas, mas o motor os ciclos operacionais em outras condições de voo e configurações de potência não podem ser calculados explicitamente a partir das propriedades físicas constantes.
  • Discreto vs. contínuo: um modelo discreto trata objetos como discretos, como as partículas em um modelo molecular ou os estados em um modelo estatístico ; enquanto um modelo contínuo representa os objetos de uma maneira contínua, como o campo de velocidade do fluido em fluxos de tubos, temperaturas e tensões em um sólido e campo elétrico que se aplica continuamente a todo o modelo devido a uma carga pontual.
  • Determinístico vs. probabilístico (estocástico): Um modelo determinístico é aquele em que cada conjunto de estados de variáveis ​​é determinado exclusivamente por parâmetros no modelo e por conjuntos de estados anteriores dessas variáveis; portanto, um modelo determinístico sempre funciona da mesma maneira para um determinado conjunto de condições iniciais. Por outro lado, em um modelo estocástico - geralmente chamado de " modelo estatístico " - a aleatoriedade está presente e os estados das variáveis ​​não são descritos por valores únicos, mas sim por distribuições de probabilidade .
  • Dedutivo, indutivo ou flutuante: A modelo dedutivo é uma estrutura lógica baseada em uma teoria. Um modelo indutivo surge de descobertas empíricas e generalização delas. O modelo flutuante não se baseia em teoria nem observação, mas é apenas a invocação da estrutura esperada. A aplicação da matemática nas ciências sociais fora da economia tem sido criticada por modelos infundados. A aplicação da teoria da catástrofe na ciência foi caracterizada como um modelo flutuante.
  • Os modelos estratégicos versus não estratégicos usados ​​na teoria dos jogos são diferentes no sentido de que modelam agentes com incentivos incompatíveis, como espécies concorrentes ou licitantes em um leilão. Os modelos estratégicos assumem que os jogadores são tomadores de decisão autônomos que escolhem racionalmente ações que maximizam sua função objetivo. Um dos principais desafios do uso de modelos estratégicos é definir e computar conceitos de solução , como equilíbrio de Nash . Uma propriedade interessante dos modelos estratégicos é que eles separam o raciocínio sobre as regras do jogo do raciocínio sobre o comportamento dos jogadores.

Construção

Em negócios e engenharia , modelos matemáticos podem ser usados ​​para maximizar uma determinada produção. O sistema em consideração exigirá certos insumos. O sistema que relaciona entradas a saídas também depende de outras variáveis: variáveis ​​de decisão , variáveis ​​de estado , variáveis exógenas e variáveis ​​aleatórias .

Variáveis ​​de decisão às vezes são conhecidas como variáveis ​​independentes. Variáveis ​​exógenas às vezes são conhecidas como parâmetros ou constantes . As variáveis ​​não são independentes umas das outras, pois as variáveis ​​de estado dependem das variáveis ​​de decisão, entrada, aleatórias e exógenas. Além disso, as variáveis ​​de saída dependem do estado do sistema (representado pelas variáveis ​​de estado).

Os objetivos e restrições do sistema e seus usuários podem ser representados como funções das variáveis ​​de saída ou variáveis ​​de estado. As funções objetivo dependerão da perspectiva do usuário do modelo. Dependendo do contexto, uma função objetivo também é conhecida como índice de desempenho , pois é uma medida de interesse do usuário. Embora não haja limite para o número de funções objetivo e restrições que um modelo pode ter, usar ou otimizar o modelo torna-se mais envolvido (computacionalmente) à medida que o número aumenta.

Por exemplo, os economistas costumam aplicar álgebra linear ao usar modelos de insumo-produto . Modelos matemáticos complicados que possuem muitas variáveis ​​podem ser consolidados pelo uso de vetores onde um símbolo representa várias variáveis.

Informação a priori

Para analisar algo com uma típica "abordagem caixa preta", apenas o comportamento do estímulo / resposta será contabilizado, para inferir a caixa (desconhecida) . A representação usual desse sistema de caixa preta é um diagrama de fluxo de dados centralizado na caixa.

Problemas de modelagem matemática são frequentemente classificados em modelos de caixa preta ou caixa branca , de acordo com a quantidade de informações a priori disponíveis no sistema. Um modelo de caixa preta é um sistema para o qual não existe informação a priori disponível. Um modelo de caixa branca (também chamado de caixa de vidro ou caixa transparente) é um sistema onde todas as informações necessárias estão disponíveis. Praticamente todos os sistemas estão em algum lugar entre os modelos caixa preta e caixa branca, portanto, este conceito é útil apenas como um guia intuitivo para decidir qual abordagem seguir.

Normalmente, é preferível usar o máximo possível de informações a priori para tornar o modelo mais preciso. Portanto, os modelos de caixa branca são geralmente considerados mais fáceis, porque se você usou as informações corretamente, o modelo se comportará corretamente. Freqüentemente, a informação a priori vem na forma de conhecer o tipo de funções que relacionam diferentes variáveis. Por exemplo, se fizermos um modelo de como um medicamento funciona em um sistema humano, sabemos que geralmente a quantidade de medicamento no sangue é uma função exponencialmente decadente . Mas ainda ficamos com vários parâmetros desconhecidos; com que rapidez a quantidade do medicamento decai e qual é a quantidade inicial do medicamento no sangue? Este exemplo não é, portanto, um modelo totalmente branco. Esses parâmetros devem ser estimados por alguns meios antes que se possa usar o modelo.

Nos modelos caixa-preta, tenta-se estimar tanto a forma funcional das relações entre as variáveis ​​quanto os parâmetros numéricos nessas funções. Usando informações a priori poderíamos terminar, por exemplo, com um conjunto de funções que provavelmente poderiam descrever o sistema de forma adequada. Se não houver informações a priori, tentaremos usar as funções o mais gerais possível para cobrir todos os modelos diferentes. Uma abordagem frequentemente usada para modelos de caixa preta são as redes neurais, que geralmente não fazem suposições sobre os dados recebidos. Alternativamente, os algoritmos NARMAX (modelo de média móvel não linear auto-regressiva com entradas eXógenas) que foram desenvolvidos como parte da identificação do sistema não linear podem ser usados ​​para selecionar os termos do modelo, determinar a estrutura do modelo e estimar os parâmetros desconhecidos na presença de ruído correlacionado e não linear . A vantagem dos modelos NARMAX em comparação com as redes neurais é que o NARMAX produz modelos que podem ser escritos e relacionados ao processo subjacente, enquanto as redes neurais produzem uma aproximação opaca.

Informação subjetiva

Às vezes, é útil incorporar informações subjetivas em um modelo matemático. Isso pode ser feito com base na intuição , experiência ou opinião de especialistas , ou com base na conveniência da forma matemática. A estatística bayesiana fornece uma estrutura teórica para incorporar essa subjetividade em uma análise rigorosa: especificamos uma distribuição de probabilidade anterior (que pode ser subjetiva) e, em seguida, atualizamos essa distribuição com base em dados empíricos.

Um exemplo de quando tal abordagem seria necessária é uma situação em que um experimentador dobra levemente uma moeda e a joga uma vez, registrando se deu cara, e então recebe a tarefa de prever a probabilidade de que o próximo lance dê cara. Depois de dobrar a moeda, a verdadeira probabilidade de a moeda dar cara é desconhecida; portanto, o experimentador precisaria tomar uma decisão (talvez olhando para a forma da moeda) sobre qual distribuição anterior usar. A incorporação de tais informações subjetivas pode ser importante para obter uma estimativa precisa da probabilidade.

Complexidade

Em geral, a complexidade do modelo envolve uma troca entre simplicidade e precisão do modelo. A navalha de Occam é um princípio particularmente relevante para modelagem, sua ideia essencial sendo que entre os modelos com poder preditivo aproximadamente igual, o mais simples é o mais desejável. Embora a complexidade adicional geralmente melhore o realismo de um modelo, ela pode dificultar a compreensão e a análise do modelo e também pode representar problemas computacionais, incluindo instabilidade numérica . Thomas Kuhn argumenta que, à medida que a ciência progride, as explicações tendem a se tornar mais complexas antes que uma mudança de paradigma ofereça uma simplificação radical.

Por exemplo, ao modelar o vôo de uma aeronave, poderíamos incorporar cada parte mecânica da aeronave em nosso modelo e, assim, adquirir um modelo quase caixa-branca do sistema. No entanto, o custo computacional de adicionar uma quantidade tão grande de detalhes inibiria efetivamente o uso de tal modelo. Além disso, a incerteza aumentaria devido a um sistema excessivamente complexo, porque cada parte separada induz alguma variação no modelo. Portanto, geralmente é apropriado fazer algumas aproximações para reduzir o modelo a um tamanho razoável. Os engenheiros geralmente podem aceitar algumas aproximações para obter um modelo mais robusto e simples. Por exemplo, a mecânica clássica de Newton é um modelo aproximado do mundo real. Ainda assim, o modelo de Newton é suficiente para a maioria das situações da vida comum, isto é, desde que as velocidades das partículas estejam bem abaixo da velocidade da luz e estudemos apenas macropartículas.

Observe que melhor precisão não significa necessariamente um modelo melhor. Os modelos estatísticos são propensos a overfitting, o que significa que um modelo é ajustado demais aos dados e perdeu sua capacidade de generalizar para novos eventos que não foram observados antes.

Treinamento e ajuste

Qualquer modelo que não seja uma caixa branca pura contém alguns parâmetros que podem ser usados ​​para ajustar o modelo ao sistema que ele pretende descrever. Se a modelagem for feita por uma rede neural artificial ou outro aprendizado de máquina , a otimização dos parâmetros é chamada de treinamento , enquanto a otimização dos hiperparâmetros do modelo é chamada de ajuste e frequentemente usa validação cruzada . Na modelagem mais convencional, por meio de funções matemáticas explicitamente fornecidas, os parâmetros são frequentemente determinados por ajuste de curva .

Avaliação de modelo

Uma parte crucial do processo de modelagem é a avaliação de se um determinado modelo matemático descreve ou não um sistema com precisão. Essa pergunta pode ser difícil de responder, pois envolve vários tipos diferentes de avaliação.

Ajustar aos dados empíricos

Normalmente, a parte mais fácil da avaliação do modelo é verificar se um modelo se encaixa nas medidas experimentais ou em outros dados empíricos. Em modelos com parâmetros, uma abordagem comum para testar esse ajuste é dividir os dados em dois subconjuntos separados: dados de treinamento e dados de verificação. Os dados de treinamento são usados ​​para estimar os parâmetros do modelo. Um modelo preciso corresponderá aos dados de verificação, embora esses dados não tenham sido usados ​​para definir os parâmetros do modelo. Essa prática é conhecida como validação cruzada nas estatísticas.

Definir uma métrica para medir distâncias entre os dados observados e previstos é uma ferramenta útil para avaliar o ajuste do modelo. Em estatística, teoria da decisão e alguns modelos econômicos , uma função de perda desempenha um papel semelhante.

Embora seja bastante simples testar a adequação dos parâmetros, pode ser mais difícil testar a validade da forma matemática geral de um modelo. Em geral, mais ferramentas matemáticas foram desenvolvidas para testar o ajuste de modelos estatísticos do que modelos envolvendo equações diferenciais . As ferramentas da estatística não paramétrica podem às vezes ser usadas para avaliar o quão bem os dados se ajustam a uma distribuição conhecida ou para chegar a um modelo geral que faz apenas suposições mínimas sobre a forma matemática do modelo.

Escopo do modelo

Avaliar o escopo de um modelo, ou seja, determinar a quais situações o modelo é aplicável, pode ser menos simples. Se o modelo foi construído com base em um conjunto de dados, deve-se determinar para quais sistemas ou situações os dados conhecidos são um conjunto "típico" de dados.

A questão de se o modelo descreve bem as propriedades do sistema entre os pontos de dados é chamada de interpolação , e a mesma questão para eventos ou pontos de dados fora dos dados observados é chamada de extrapolação .

A título de exemplo das limitações típicas do escopo de um modelo, ao avaliar a mecânica clássica newtoniana , podemos notar que Newton fazia suas medições sem equipamentos avançados, portanto não conseguia medir propriedades de partículas viajando a velocidades próximas à velocidade da luz. Da mesma forma, ele não mediu os movimentos de moléculas e outras pequenas partículas, mas apenas macropartículas. Portanto, não é surpreendente que seu modelo não extrapole bem para esses domínios, embora seu modelo seja suficiente para a física da vida comum.

Considerações filosóficas

Muitos tipos de modelagem envolvem implicitamente afirmações sobre causalidade . Isso geralmente (mas nem sempre) é verdadeiro para modelos que envolvem equações diferenciais. Como o objetivo da modelagem é aumentar nossa compreensão do mundo, a validade de um modelo reside não apenas em seu ajuste às observações empíricas, mas também em sua capacidade de extrapolar para situações ou dados além daqueles originalmente descritos no modelo. Pode-se pensar nisso como a diferenciação entre previsões qualitativas e quantitativas. Também se pode argumentar que um modelo não tem valor a menos que forneça algum insight que vá além do que já é conhecido da investigação direta do fenômeno que está sendo estudado.

Um exemplo de tal crítica é o argumento de que os modelos matemáticos da teoria do forrageamento ideal não oferecem uma visão que vai além das conclusões do senso comum da evolução e outros princípios básicos da ecologia.

Significado nas ciências naturais

Os modelos matemáticos são de grande importância nas ciências naturais, particularmente na física . As teorias físicas são quase invariavelmente expressas por meio de modelos matemáticos.

Ao longo da história, modelos matemáticos cada vez mais precisos foram desenvolvidos. As leis de Newton descrevem com precisão muitos fenômenos cotidianos, mas em certos limites a teoria da relatividade e a mecânica quântica devem ser usadas.

É comum usar modelos idealizados em física para simplificar as coisas. Cordas sem massa, partículas pontuais, gases ideais e a partícula em uma caixa estão entre os muitos modelos simplificados usados ​​na física. As leis da física são representadas por equações simples, como as leis de Newton, as equações de Maxwell e a equação de Schrödinger . Essas leis são a base para fazer modelos matemáticos de situações reais. Muitas situações reais são muito complexas e, portanto, modeladas de forma aproximada em um computador, um modelo que é computacionalmente viável de computar é feito a partir das leis básicas ou de modelos aproximados feitos a partir das leis básicas. Por exemplo, as moléculas podem ser modeladas por modelos orbitais moleculares que são soluções aproximadas para a equação de Schrödinger. Na engenharia , os modelos físicos são geralmente feitos por métodos matemáticos, como a análise de elementos finitos .

Diferentes modelos matemáticos usam diferentes geometrias que não são necessariamente descrições precisas da geometria do universo. A geometria euclidiana é muito usada na física clássica, enquanto a relatividade especial e a relatividade geral são exemplos de teorias que usam geometrias que não são euclidianas.

Alguns aplicativos

Freqüentemente, quando os engenheiros analisam um sistema a ser controlado ou otimizado, eles usam um modelo matemático. Na análise, os engenheiros podem construir um modelo descritivo do sistema como uma hipótese de como o sistema poderia funcionar, ou tentar estimar como um evento imprevisível poderia afetar o sistema. Da mesma forma, no controle de um sistema, os engenheiros podem experimentar diferentes abordagens de controle em simulações .

Um modelo matemático geralmente descreve um sistema por um conjunto de variáveis ​​e um conjunto de equações que estabelecem relações entre as variáveis. As variáveis ​​podem ser de vários tipos; números reais ou inteiros , valores booleanos ou strings , por exemplo. As variáveis ​​representam algumas propriedades do sistema, por exemplo, saídas do sistema medido, muitas vezes na forma de sinais , dados de tempo , contadores e ocorrência de eventos (sim / não). O modelo real é o conjunto de funções que descrevem as relações entre as diferentes variáveis.

Exemplos

  • Um dos exemplos populares em ciência da computação são os modelos matemáticos de várias máquinas, um exemplo é o autômato finito determinístico (DFA) que é definido como um conceito matemático abstrato, mas devido à natureza determinística de um DFA, é implementável em hardware e software para resolver vários problemas específicos. Por exemplo, o seguinte é um DFA M com um alfabeto binário, que requer que a entrada contenha um número par de 0s.

M = ( Q , Σ, δ, q 0 , F ) onde

0
1
S 1 S 2 S 1
S 2 S 1 S 2

O estado S 1 representa que houve um número par de 0s na entrada até agora, enquanto S 2 significa um número ímpar. Um 1 na entrada não altera o estado do autômato. Quando a entrada terminar, o estado mostrará se a entrada continha um número par de 0s ou não. Se a entrada continha um número par de 0s, M terminará no estado S 1 , um estado de aceitação, de modo que a string de entrada será aceita.

A linguagem reconhecida por M é a linguagem regular dada pela expressão regular 1 * (0 (1 *) 0 (1 *)) *, onde "*" é a estrela de Kleene , por exemplo, 1 * denota qualquer número não negativo ( possivelmente zero) dos símbolos "1".

  • Muitas atividades cotidianas realizadas sem pensamento são usos de modelos matemáticos. A projeção de um mapa geográfico de uma região da Terra em uma superfície pequena e plana é um modelo que pode ser usado para muitos propósitos, como o planejamento de viagens.
  • Outra atividade simples é prever a posição de um veículo a partir de sua posição inicial, direção e velocidade de deslocamento, usando a equação de que a distância percorrida é o produto do tempo e da velocidade. Isso é conhecido como cálculo morto, quando usado de maneira mais formal. A modelagem matemática dessa maneira não requer necessariamente matemática formal; animais demonstraram usar o cálculo morto.
  • Crescimento populacional . Um modelo simples (embora aproximado) de crescimento populacional é o modelo de crescimento malthusiano . Um modelo de crescimento populacional um pouco mais realista e amplamente utilizado é a função logística e suas extensões.
  • Modelo de uma partícula em um campo potencial . Neste modelo, consideramos uma partícula como sendo um ponto de massa que descreve uma trajetória no espaço que é modelada por uma função que fornece suas coordenadas no espaço em função do tempo. O campo potencial é dado por uma função e a trajetória, que é uma função , é a solução da equação diferencial:

que também pode ser escrito como:

Observe que este modelo assume que a partícula é uma massa pontual, o que certamente é falso em muitos casos em que usamos este modelo; por exemplo, como um modelo de movimento planetário.
  • Modelo de comportamento racional para um consumidor . Neste modelo, assumimos que um consumidor enfrenta uma escolha de n mercadorias rotuladas 1,2, ..., n , cada uma com um preço de mercado p 1 , p 2 , ..., p n . Presume-se que o consumidor tenha uma função de utilidade ordinal U (ordinal no sentido de que apenas o sinal das diferenças entre duas utilidades, e não o nível de cada utilidade, é significativo), dependendo das quantidades de mercadorias x 1 , x 2 , ..., x n consumido. O modelo assume ainda que o consumidor tem um orçamento M que é usado para comprar um vetor x 1 , x 2 , ..., x n de forma a maximizar U ( x 1 , x 2 , ..., x n ). O problema de comportamento racional neste modelo torna-se então um problema de otimização matemática , isto é:
sujeito a:
Este modelo tem sido usado em uma ampla variedade de contextos econômicos, como na teoria do equilíbrio geral para mostrar a existência e a eficiência de Pareto dos equilíbrios econômicos.

Veja também

Referências

Leitura adicional

Livros

Aplicações específicas

links externos

Referência geral
Filosófico