Articles

Modelo matemático

En los negocios y la ingeniería, los modelos matemáticos pueden utilizarse para maximizar un determinado resultado. El sistema considerado requerirá ciertas entradas. El sistema que relaciona las entradas con las salidas depende también de otras variables: variables de decisión, variables de estado, variables exógenas y variables aleatorias.

Las variables de decisión se conocen a veces como variables independientes. Las variables no son independientes entre sí, ya que las variables de estado dependen de las variables de decisión, de entrada, aleatorias y exógenas. Además, las variables de salida dependen del estado del sistema (representado por las variables de estado).

Los objetivos y las restricciones del sistema y sus usuarios pueden representarse como funciones de las variables de salida o de las variables de estado. Las funciones objetivo dependerán de la perspectiva del usuario del modelo. Dependiendo del contexto, una función objetivo también se conoce como un índice de rendimiento, ya que es una medida de interés para el usuario. Aunque no hay límite en el número de funciones objetivo y restricciones que puede tener un modelo, el uso u optimización del modelo se vuelve más complicado (computacionalmente) a medida que el número aumenta.

Por ejemplo, los economistas suelen aplicar el álgebra lineal cuando utilizan modelos de entrada-salida. Los modelos matemáticos complicados que tienen muchas variables pueden consolidarse mediante el uso de vectores donde un símbolo representa varias variables.

Información a prioriEditar

Para analizar algo con un típico «enfoque de caja negra», sólo se tendrá en cuenta el comportamiento del estímulo/respuesta, para inferir la caja (desconocida). La representación habitual de este sistema de caja negra es un diagrama de flujo de datos centrado en la caja.

Los problemas de modelización matemática suelen clasificarse en modelos de caja negra o de caja blanca, según la cantidad de información a priori que se tenga sobre el sistema. Un modelo de caja negra es un sistema del que no se dispone de información a priori. Un modelo de caja blanca (también llamado caja de cristal o caja clara) es un sistema del que se dispone de toda la información necesaria. Prácticamente todos los sistemas se encuentran en algún punto entre los modelos de caja negra y de caja blanca, por lo que este concepto es útil sólo como guía intuitiva para decidir qué enfoque adoptar.

Por lo general, es preferible utilizar toda la información a priori posible para que el modelo sea más preciso. Por lo tanto, los modelos de caja blanca suelen considerarse más fáciles, porque si se ha utilizado la información correctamente, entonces el modelo se comportará correctamente. A menudo la información a priori viene en forma de conocer el tipo de funciones que relacionan las diferentes variables. Por ejemplo, si hacemos un modelo de cómo funciona un medicamento en un sistema humano, sabemos que normalmente la cantidad de medicamento en la sangre es una función que decae exponencialmente. Pero aún nos quedan varios parámetros desconocidos: ¿con qué rapidez decae la cantidad de medicamento y cuál es la cantidad inicial de medicamento en la sangre? Por lo tanto, este ejemplo no es un modelo completamente de caja blanca. Estos parámetros tienen que ser estimados por algún medio antes de que uno pueda utilizar el modelo.

En los modelos de caja negra uno trata de estimar tanto la forma funcional de las relaciones entre las variables como los parámetros numéricos en esas funciones. Utilizando información a priori podríamos acabar, por ejemplo, con un conjunto de funciones que probablemente podrían describir el sistema adecuadamente. Si no hay información a priori, intentaríamos utilizar funciones lo más generales posible para cubrir todos los modelos diferentes. Un enfoque muy utilizado para los modelos de caja negra son las redes neuronales, que normalmente no hacen suposiciones sobre los datos entrantes. Alternativamente, los algoritmos NARMAX (Nonlinear AutoRegressive Moving Average model with eXogenous inputs) que se desarrollaron como parte de la identificación de sistemas no lineales pueden utilizarse para seleccionar los términos del modelo, determinar la estructura del mismo y estimar los parámetros desconocidos en presencia de ruido correlacionado y no lineal. La ventaja de los modelos NARMAX en comparación con las redes neuronales es que NARMAX produce modelos que se pueden escribir y relacionar con el proceso subyacente, mientras que las redes neuronales producen una aproximación que es opaca.

Información subjetivaEditar

A veces es útil incorporar información subjetiva en un modelo matemático. Esto puede hacerse basándose en la intuición, la experiencia o la opinión de los expertos, o basándose en la conveniencia de la forma matemática. La estadística bayesiana proporciona un marco teórico para incorporar dicha subjetividad en un análisis riguroso: especificamos una distribución de probabilidad a priori (que puede ser subjetiva) y, a continuación, actualizamos esta distribución basándonos en los datos empíricos.

Un ejemplo de cuándo sería necesario este enfoque es una situación en la que un experimentador dobla ligeramente una moneda y la lanza una vez, registrando si sale cara, y a continuación se le encomienda la tarea de predecir la probabilidad de que el siguiente lanzamiento salga cara. Después de doblar la moneda, se desconoce la verdadera probabilidad de que la moneda salga cara, por lo que el experimentador tendría que tomar una decisión (quizás mirando la forma de la moneda) sobre qué distribución previa utilizar. La incorporación de esta información subjetiva podría ser importante para obtener una estimación precisa de la probabilidad.

ComplejidadEditar

En general, la complejidad del modelo implica un compromiso entre la simplicidad y la precisión del modelo. La navaja de Occam es un principio particularmente relevante para la modelización, su idea esencial es que entre los modelos con aproximadamente igual poder de predicción, el más simple es el más deseable. Aunque la complejidad añadida suele mejorar el realismo de un modelo, puede dificultar su comprensión y análisis, y también puede plantear problemas computacionales, como la inestabilidad numérica. Thomas Kuhn sostiene que, a medida que la ciencia progresa, las explicaciones tienden a hacerse más complejas antes de que un cambio de paradigma ofrezca una simplificación radical.

Por ejemplo, al modelar el vuelo de un avión, podríamos incrustar cada parte mecánica de la aeronave en nuestro modelo y adquiriríamos así un modelo casi de caja blanca del sistema. Sin embargo, el coste computacional de añadir una cantidad tan grande de detalles inhibiría efectivamente el uso de dicho modelo. Además, la incertidumbre aumentaría debido a un sistema excesivamente complejo, ya que cada parte separada induce cierta cantidad de varianza en el modelo. Por tanto, suele ser conveniente realizar algunas aproximaciones para reducir el modelo a un tamaño razonable. Los ingenieros suelen aceptar algunas aproximaciones para conseguir un modelo más robusto y sencillo. Por ejemplo, la mecánica clásica de Newton es un modelo aproximado del mundo real. Aun así, el modelo de Newton es bastante suficiente para la mayoría de las situaciones de la vida ordinaria, es decir, siempre y cuando las velocidades de las partículas estén muy por debajo de la velocidad de la luz, y sólo estudiemos las macropartículas.

Nótese que una mayor precisión no significa necesariamente un mejor modelo. Los modelos estadísticos son propensos a la sobreadaptación, lo que significa que un modelo se ajusta demasiado a los datos y ha perdido su capacidad de generalizar a los nuevos eventos que no se observaron antes.

Entrenamiento y sintoníaEditar

Cualquier modelo que no sea de caja blanca pura contiene algunos parámetros que se pueden utilizar para ajustar el modelo al sistema que se pretende describir. Si el modelado se realiza mediante una red neuronal artificial u otro tipo de aprendizaje automático, la optimización de los parámetros se denomina entrenamiento, mientras que la optimización de los hiperparámetros del modelo se denomina sintonía y a menudo utiliza la validación cruzada. En el modelado más convencional a través de funciones matemáticas dadas explícitamente, los parámetros se determinan a menudo por ajuste de curvas.

Evaluación del modeloEditar

Una parte crucial del proceso de modelado es la evaluación de si un modelo matemático dado describe o no un sistema con precisión. Esta cuestión puede ser difícil de responder, ya que implica varios tipos diferentes de evaluación.

Ajuste a los datos empíricosEditar

Por lo general, la parte más fácil de la evaluación del modelo es comprobar si un modelo se ajusta a las mediciones experimentales u otros datos empíricos. En los modelos con parámetros, un enfoque común para probar este ajuste es dividir los datos en dos subconjuntos disjuntos: datos de entrenamiento y datos de verificación. Los datos de entrenamiento se utilizan para estimar los parámetros del modelo. Un modelo preciso se ajustará a los datos de verificación, aunque estos datos no se hayan utilizado para establecer los parámetros del modelo. Esta práctica se conoce como validación cruzada en estadística.

Definir una métrica para medir las distancias entre los datos observados y los predichos es una herramienta útil para evaluar el ajuste del modelo. En la estadística, la teoría de la decisión y algunos modelos económicos, una función de pérdida desempeña un papel similar.

Aunque es bastante sencillo probar la adecuación de los parámetros, puede ser más difícil probar la validez de la forma matemática general de un modelo. En general, se han desarrollado más herramientas matemáticas para probar el ajuste de los modelos estadísticos que los modelos que implican ecuaciones diferenciales. Las herramientas de la estadística no paramétrica pueden utilizarse a veces para evaluar lo bien que los datos se ajustan a una distribución conocida o para llegar a un modelo general que sólo hace suposiciones mínimas sobre la forma matemática del modelo.

Alcance del modeloEditar

Evaluar el alcance de un modelo, es decir, determinar a qué situaciones es aplicable el modelo, puede ser menos sencillo. Si el modelo se construyó a partir de un conjunto de datos, hay que determinar para qué sistemas o situaciones los datos conocidos son un conjunto «típico» de datos.

La cuestión de si el modelo describe bien las propiedades del sistema entre los puntos de datos se llama interpolación, y la misma cuestión para los eventos o puntos de datos fuera de los datos observados se llama extrapolación.

Como ejemplo de las limitaciones típicas del alcance de un modelo, al evaluar la mecánica clásica newtoniana, podemos observar que Newton realizó sus mediciones sin equipos avanzados, por lo que no pudo medir las propiedades de las partículas que viajan a velocidades cercanas a la de la luz. Asimismo, no midió los movimientos de las moléculas y otras partículas pequeñas, sino únicamente los de las macropartículas. No es de extrañar entonces que su modelo no se extrapole bien a estos dominios, aunque su modelo es bastante suficiente para la física de la vida ordinaria.

Consideraciones filosóficasEditar

Muchos tipos de modelización implican implícitamente afirmaciones sobre la causalidad. Esto suele ser cierto (aunque no siempre) en los modelos que implican ecuaciones diferenciales. Dado que el propósito de la modelización es aumentar nuestra comprensión del mundo, la validez de un modelo no sólo se basa en su ajuste a las observaciones empíricas, sino también en su capacidad para extrapolar situaciones o datos más allá de los descritos originalmente en el modelo. Se puede pensar en esto como la diferenciación entre predicciones cualitativas y cuantitativas. También se puede argumentar que un modelo carece de valor a menos que proporcione alguna idea que vaya más allá de lo que ya se conoce a partir de la investigación directa del fenómeno estudiado.

Un ejemplo de esta crítica es el argumento de que los modelos matemáticos de la teoría del forrajeo óptimo no ofrecen una idea que vaya más allá de las conclusiones de sentido común de la evolución y otros principios básicos de la ecología.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *