Modelo matemático
Em negócios e engenharia, os modelos matemáticos podem ser utilizados para maximizar um determinado resultado. O sistema em consideração exigirá certos inputs. O sistema relativo a entradas para saídas depende também de outras variáveis: variáveis de decisão, variáveis de estado, variáveis exógenas, e variáveis aleatórias.
As variáveis de decisão são por vezes conhecidas como variáveis independentes. As variáveis exógenas são por vezes conhecidas como parâmetros ou constantes. As variáveis não são independentes umas das outras, uma vez que as variáveis de estado dependem da decisão, entrada, variáveis aleatórias, e variáveis exógenas. Além disso, as variáveis de saída dependem do estado do sistema (representado pelas variáveis de estado).
Objectivos e restrições do sistema e dos seus utilizadores podem ser representados como funções das variáveis de saída ou variáveis de estado. As funções objectivas dependerão da perspectiva do utilizador do modelo. Dependendo do contexto, uma função objectiva é também conhecida como um índice de desempenho, uma vez que é uma medida de interesse para o utilizador. Embora não haja limite para o número de funções objectivas e restrições que um modelo pode ter, a utilização ou optimização do modelo torna-se mais envolvida (computacionalmente) à medida que o número aumenta.
Por exemplo, os economistas aplicam frequentemente álgebra linear quando utilizam modelos input-output. Modelos matemáticos complicados que têm muitas variáveis podem ser consolidados através da utilização de vectores em que um símbolo representa várias variáveis.
A priori informationEdit
Problemas de modelação matemática são frequentemente classificados em modelos de caixa negra ou de caixa branca, de acordo com a quantidade de informação a priori disponível sobre o sistema. Um modelo de caixa negra é um sistema do qual não existe informação a priori disponível. Um modelo de caixa branca (também chamado caixa de vidro ou caixa transparente) é um sistema onde toda a informação necessária está disponível. Praticamente todos os sistemas estão algures entre os modelos de caixa negra e de caixa branca, pelo que este conceito é útil apenas como guia intuitivo para decidir qual a abordagem a adoptar.
Usualmente, é preferível utilizar o máximo de informação a priori possível para tornar o modelo mais preciso. Portanto, os modelos de caixa branca são geralmente considerados mais fáceis, porque se tiver utilizado a informação correctamente, então o modelo comportar-se-á correctamente. Muitas vezes a informação a priori vem em formas de conhecer o tipo de funções relacionadas com diferentes variáveis. Por exemplo, se fizermos um modelo de como funciona um medicamento num sistema humano, sabemos que normalmente a quantidade de medicamento no sangue é uma função exponencialmente decadente. Mas ainda nos restam vários parâmetros desconhecidos; com que rapidez se decompõe a quantidade de medicamento, e qual é a quantidade inicial de medicamento no sangue? Este exemplo não é, portanto, um modelo de caixa completamente branca. Estes parâmetros têm de ser estimados através de alguns meios antes de se poder utilizar o modelo.
Nos modelos de caixa negra tenta-se estimar tanto a forma funcional das relações entre as variáveis como os parâmetros numéricos nessas funções. Utilizando informação a priori, poderíamos acabar, por exemplo, com um conjunto de funções que provavelmente poderiam descrever o sistema de forma adequada. Se não houvesse informação a priori, tentaríamos utilizar funções tão gerais quanto possível para cobrir todos os diferentes modelos. Uma abordagem frequentemente utilizada para modelos de caixa negra são as redes neurais que normalmente não fazem suposições sobre os dados recebidos. Alternativamente, os algoritmos NARMAX (Nonlinear AutoRegressive Moving Average model with eXogenous inputs) que foram desenvolvidos como parte da identificação de sistemas não lineares podem ser usados para seleccionar os termos do modelo, determinar a estrutura do modelo, e estimar os parâmetros desconhecidos na presença de ruído correlacionado e não-linear. A vantagem dos modelos NARMAX em comparação com as redes neurais é que NARMAX produz modelos que podem ser escritos e relacionados com o processo subjacente, enquanto que as redes neurais produzem uma aproximação que é opaca.
Informação subjectivaEditar
Por vezes é útil incorporar informação subjectiva num modelo matemático. Isto pode ser feito com base na intuição, experiência, ou opinião de peritos, ou com base na conveniência da forma matemática. As estatísticas Bayesianas fornecem um quadro teórico para incorporar tal subjectividade numa análise rigorosa: especificamos uma distribuição prévia de probabilidade (que pode ser subjectiva), e depois actualizamos esta distribuição com base em dados empíricos.
Um exemplo de quando tal abordagem seria necessária é uma situação em que um experimentador dobra ligeiramente uma moeda e atira-a uma vez, registando se ela sobe de cabeça, e é então dada a tarefa de prever a probabilidade de que a próxima virada surja de cabeça. Depois de dobrar a moeda, a verdadeira probabilidade de a moeda virar cabeças é desconhecida; assim, o experimentador teria de tomar uma decisão (talvez olhando para a forma da moeda) sobre qual a distribuição anterior a utilizar. A incorporação de tal informação subjectiva pode ser importante para obter uma estimativa precisa da probabilidade.
ComplexidadeEditar
Em geral, a complexidade do modelo envolve um compromisso entre a simplicidade e a precisão do modelo. A navalha de Occam é um princípio particularmente relevante para a modelação, sendo a sua ideia essencial que entre modelos com um poder de previsão sensivelmente igual, o mais simples é o mais desejável. Embora a complexidade acrescida melhore geralmente o realismo de um modelo, pode tornar o modelo difícil de compreender e analisar, e pode também colocar problemas computacionais, incluindo instabilidade numérica. Thomas Kuhn argumenta que à medida que a ciência avança, as explicações tendem a tornar-se mais complexas antes de uma mudança de paradigma oferecer uma simplificação radical.
Por exemplo, ao modelar o voo de uma aeronave, poderíamos incorporar cada parte mecânica da aeronave no nosso modelo e assim adquiriríamos um modelo quase de caixa branca do sistema. No entanto, o custo computacional de adicionar uma quantidade tão grande de detalhes iria efectivamente inibir a utilização de tal modelo. Além disso, a incerteza aumentaria devido a um sistema demasiado complexo, porque cada parte separada induz alguma variação no modelo. Por conseguinte, é geralmente apropriado fazer algumas aproximações para reduzir o modelo a uma dimensão sensata. Os engenheiros podem muitas vezes aceitar algumas aproximações a fim de obter um modelo mais robusto e simples. Por exemplo, a mecânica clássica de Newton é um modelo aproximado do mundo real. Ainda assim, o modelo de Newton é bastante suficiente para a maioria das situações da vida comum, ou seja, desde que as velocidades das partículas estejam bem abaixo da velocidade da luz, e estudamos apenas macro-partículas.
Nota que uma melhor precisão não significa necessariamente um modelo melhor. Os modelos estatísticos são propensos a sobreajustamento, o que significa que um modelo está demasiado ajustado aos dados e perdeu a sua capacidade de generalizar a novos eventos que não foram observados antes.
Formação e afinaçãoEditar
Um modelo que não é puro white-box contém alguns parâmetros que podem ser usados para ajustar o modelo ao sistema que se pretende descrever. Se a modelagem for feita por uma rede neural artificial ou outra aprendizagem de máquina, a optimização dos parâmetros chama-se treino, enquanto a optimização dos hiperparâmetros do modelo chama-se tuning e usa frequentemente a validação cruzada. Em modelagem mais convencional através de funções matemáticas explicitamente dadas, os parâmetros são muitas vezes determinados por ajuste de curvas.
Avaliação de modelosEditar
Uma parte crucial do processo de modelagem é a avaliação de se um determinado modelo matemático descreve ou não um sistema com precisão. Esta pergunta pode ser difícil de responder, pois envolve vários tipos diferentes de avaliação.
Adequação a dados empíricosEditar
Usualmente, a parte mais fácil da avaliação do modelo é verificar se um modelo se adapta a medições experimentais ou a outros dados empíricos. Em modelos com parâmetros, uma abordagem comum para testar este ajuste é dividir os dados em dois subconjuntos desajustados: dados de formação e dados de verificação. Os dados de formação são utilizados para estimar os parâmetros do modelo. Um modelo preciso corresponderá de perto aos dados de verificação, embora estes dados não tenham sido utilizados para definir os parâmetros do modelo. Esta prática é referida como validação cruzada em estatística.
Definir uma métrica para medir as distâncias entre os dados observados e previstos é uma ferramenta útil para avaliar a adequação do modelo. Em estatística, teoria da decisão, e alguns modelos económicos, uma função de perda desempenha um papel semelhante.
Embora seja bastante simples testar a adequação dos parâmetros, pode ser mais difícil testar a validade da forma matemática geral de um modelo. Em geral, foram desenvolvidas mais ferramentas matemáticas para testar a adequação dos modelos estatísticos do que modelos que envolvem equações diferenciais. Ferramentas de estatísticas não paramétricas podem por vezes ser utilizadas para avaliar o quão bem os dados se ajustam a uma distribuição conhecida, ou para elaborar um modelo geral que faz apenas suposições mínimas sobre a forma matemática do modelo.
Escopo do modeloEditar
Avaliar o alcance de um modelo, ou seja, determinar a que situações o modelo é aplicável, pode ser menos simples. Se o modelo foi construído com base num conjunto de dados, deve-se determinar para que sistemas ou situações os dados conhecidos são um conjunto “típico” de dados.
A questão de saber se o modelo descreve bem as propriedades do sistema entre pontos de dados chama-se interpolação, e a mesma questão para eventos ou pontos de dados fora dos dados observados chama-se extrapolação.
Como exemplo das limitações típicas do âmbito de um modelo, ao avaliar a mecânica clássica Newtoniana, podemos notar que Newton fez as suas medições sem equipamento avançado, pelo que não pôde medir as propriedades das partículas que viajam a velocidades próximas da velocidade da luz. Da mesma forma, ele não mediu os movimentos das moléculas e outras pequenas partículas, mas apenas as macro partículas. Não é então surpreendente que o seu modelo não faça uma boa extrapolação para estes domínios, mesmo que o seu modelo seja bastante suficiente para a física da vida comum.
Considerações filosóficasEditar
Muitos tipos de modelagem envolvem implicitamente alegações sobre a causalidade. Isto é geralmente (mas nem sempre) verdade no caso de modelos que envolvem equações diferenciais. Como a finalidade da modelação é aumentar a nossa compreensão do mundo, a validade de um modelo assenta não só na sua adequação às observações empíricas, mas também na sua capacidade de extrapolar para situações ou dados para além daqueles originalmente descritos no modelo. Pode-se pensar nisto como a diferenciação entre previsões qualitativas e quantitativas. Também se pode argumentar que um modelo não vale nada a menos que forneça uma visão que vá além do que já é conhecido da investigação directa do fenómeno em estudo.
Um exemplo de tal crítica é o argumento de que os modelos matemáticos da teoria da forragem óptima não oferecem uma visão que vá além das conclusões de senso comum da evolução e outros princípios básicos da ecologia.