Wiskundig model
In het bedrijfsleven en de techniek kunnen wiskundige modellen worden gebruikt om een bepaalde output te maximaliseren. Voor het beschouwde systeem zijn bepaalde inputs nodig. Het systeem dat inputs aan outputs relateert, hangt ook van andere variabelen af: beslissingsvariabelen, toestandsvariabelen, exogene variabelen en toevalsvariabelen.
Beslissingsvariabelen worden ook wel onafhankelijke variabelen genoemd. De variabelen zijn niet onafhankelijk van elkaar, omdat de toestandsvariabelen afhankelijk zijn van de beslissings-, invoer-, toevals- en exogene variabelen. Bovendien zijn de outputvariabelen afhankelijk van de toestand van het systeem (weergegeven door de toestandsvariabelen).
De doelstellingen en beperkingen van het systeem en zijn gebruikers kunnen worden weergegeven als functies van de outputvariabelen of toestandsvariabelen. De doelfuncties zullen afhangen van het perspectief van de gebruiker van het model. Afhankelijk van de context wordt een doelfunctie ook wel een prestatie-index genoemd, omdat het een maatstaf is die voor de gebruiker van belang is. Hoewel er geen limiet is aan het aantal objectieve functies en restricties dat een model kan hebben, wordt het gebruik of de optimalisatie van het model (rekenkundig) ingewikkelder naarmate het aantal toeneemt.
Economen passen bijvoorbeeld vaak lineaire algebra toe bij het gebruik van input-outputmodellen. Ingewikkelde wiskundige modellen met veel variabelen kunnen worden geconsolideerd door gebruik te maken van vectoren, waarbij één symbool meerdere variabelen vertegenwoordigt.
A priori informatieEdit
Mathematische modelleerproblemen worden vaak ingedeeld in black box- of white box-modellen, al naar gelang hoeveel a priori informatie over het systeem beschikbaar is. Een black-box model is een systeem waarover geen a priori informatie beschikbaar is. Een white-box model (ook wel glass box of clear box genoemd) is een systeem waarvan alle noodzakelijke informatie beschikbaar is. Vrijwel alle systemen bevinden zich ergens tussen de black-box en white-box modellen in, zodat dit concept alleen nuttig is als intuïtieve leidraad voor de keuze van de te volgen benadering.
In de regel verdient het de voorkeur zoveel mogelijk a priori informatie te gebruiken om het model nauwkeuriger te maken. Daarom worden de white-box-modellen meestal als eenvoudiger beschouwd, want als je de informatie juist hebt gebruikt, zal het model zich ook juist gedragen. Vaak komt de a priori informatie in de vorm van kennis over het type van functies die verschillende variabelen met elkaar in verband brengen. Als wij bijvoorbeeld een model maken van de werking van een geneesmiddel in een menselijk systeem, weten wij dat de hoeveelheid geneesmiddel in het bloed gewoonlijk een exponentieel afnemende functie is. Maar we zitten nog steeds met een aantal onbekende parameters; hoe snel neemt de hoeveelheid medicijn af, en wat is de oorspronkelijke hoeveelheid medicijn in het bloed? Dit voorbeeld is dus geen volledig white-box model. Deze parameters moeten op de een of andere manier worden geschat voordat men het model kan gebruiken.
In black-box modellen probeert men zowel de functionele vorm van de relaties tussen variabelen als de numerieke parameters in die functies te schatten. Met behulp van a priori informatie zou men bijvoorbeeld kunnen uitkomen op een reeks functies die het systeem waarschijnlijk adequaat zouden kunnen beschrijven. Als er geen a priori informatie is, zouden we proberen zo algemeen mogelijke functies te gebruiken om alle verschillende modellen te bestrijken. Een vaak gebruikte benadering voor black-box modellen zijn neurale netwerken die gewoonlijk geen aannames doen over binnenkomende gegevens. Als alternatief kunnen de NARMAX (Nonlinear AutoRegressive Moving Average model with eXogenous inputs) algoritmen, die werden ontwikkeld in het kader van de niet-lineaire systeemidentificatie, worden gebruikt om de modeltermen te selecteren, de modelstructuur te bepalen en de onbekende parameters te schatten in aanwezigheid van gecorreleerde en niet-lineaire ruis. Het voordeel van NARMAX-modellen ten opzichte van neurale netwerken is dat NARMAX modellen oplevert die kunnen worden opgeschreven en gerelateerd aan het onderliggende proces, terwijl neurale netwerken een benadering opleveren die ondoorzichtig is.
Subjectieve informatieEdit
Soms is het nuttig om subjectieve informatie in een wiskundig model op te nemen. Dit kan gebeuren op basis van intuïtie, ervaring, of de mening van een deskundige, of op basis van het gemak van de wiskundige vorm. Bayesiaanse statistiek biedt een theoretisch raamwerk om dergelijke subjectiviteit in een rigoureuze analyse te verwerken: we specificeren een voorafgaande kansverdeling (die subjectief kan zijn), en actualiseren deze verdeling vervolgens op basis van empirische gegevens.
Een voorbeeld van wanneer een dergelijke benadering nodig is, is een situatie waarin een experimentator een munt licht buigt en één keer opgooit, noteert of de munt op kop komt, en vervolgens de taak krijgt om te voorspellen hoe groot de kans is dat de volgende keer de munt op kop valt. Na het buigen van de munt is de ware kans dat de munt op kop valt onbekend; de experimentator zou dus een beslissing moeten nemen (misschien door naar de vorm van de munt te kijken) over de te gebruiken prioriteitsverdeling. Het opnemen van dergelijke subjectieve informatie kan van belang zijn om een nauwkeurige schatting van de kans te krijgen.
ComplexityEdit
In het algemeen houdt complexiteit van een model een afweging in tussen eenvoud en nauwkeurigheid van het model. Het scheermes van Occam is een principe dat bijzonder relevant is voor het modelleren. De essentie ervan is dat van modellen met ongeveer gelijke voorspellende kracht, het eenvoudigste model het meest wenselijk is. Hoewel extra complexiteit meestal het realisme van een model verbetert, kan het model daardoor moeilijk te begrijpen en te analyseren zijn, en kan het ook rekenproblemen opleveren, waaronder numerieke instabiliteit. Thomas Kuhn stelt dat naarmate de wetenschap vordert, verklaringen steeds complexer worden voordat een paradigmawisseling een radicale vereenvoudiging biedt.
Bij het modelleren van de vlucht van een vliegtuig zouden we bijvoorbeeld elk mechanisch onderdeel van het vliegtuig in ons model kunnen inbedden en zo een bijna white-box model van het systeem krijgen. De computerkosten van het toevoegen van zo’n grote hoeveelheid details zou het gebruik van zo’n model echter effectief belemmeren. Bovendien zou de onzekerheid toenemen als gevolg van een al te complex systeem, omdat elk afzonderlijk onderdeel een zekere variantie in het model induceert. Daarom is het meestal aangewezen een aantal benaderingen te maken om het model tot een zinvolle omvang terug te brengen. Ingenieurs kunnen vaak een aantal benaderingen aanvaarden om tot een robuuster en eenvoudiger model te komen. De klassieke mechanica van Newton is bijvoorbeeld een benaderd model van de echte wereld. Toch volstaat Newtons model voor de meeste situaties in het gewone leven, dat wil zeggen, zolang de snelheden van de deeltjes ver onder de lichtsnelheid liggen, en we alleen macrodeeltjes bestuderen.
Merk op dat een grotere nauwkeurigheid niet noodzakelijk een beter model betekent. Statistische modellen zijn gevoelig voor overfitting, wat betekent dat een model te veel is aangepast aan de gegevens en dat het zijn vermogen heeft verloren om te generaliseren naar nieuwe gebeurtenissen die niet eerder zijn waargenomen.
Training en tuningEdit
Elk model dat geen pure white-box is, bevat enkele parameters waarmee het model kan worden aangepast aan het systeem dat het moet beschrijven. Als de modellering gebeurt met een kunstmatig neuraal netwerk of een andere vorm van machinaal leren, wordt de optimalisatie van parameters training genoemd, terwijl de optimalisatie van de hyperparameters van het model tuning wordt genoemd en vaak gebruik maakt van kruisvalidatie. Bij meer conventionele modellering met behulp van expliciet gegeven wiskundige functies worden de parameters vaak bepaald door curve fitting.
ModelevaluatieEdit
Een cruciaal onderdeel van het modelleringsproces is de evaluatie van de vraag of een gegeven wiskundig model een systeem al dan niet accuraat beschrijft. Deze vraag kan moeilijk te beantwoorden zijn, omdat er verschillende soorten evaluatie bij betrokken zijn.
Passing bij empirische gegevensEdit
In de regel is het gemakkelijkste deel van de modelevaluatie te controleren of een model past bij experimentele metingen of andere empirische gegevens. Bij modellen met parameters is een gebruikelijke aanpak om deze fit te testen het splitsen van de gegevens in twee disjuncte deelverzamelingen: trainingsgegevens en verificatiegegevens. De opleidingsgegevens worden gebruikt om de modelparameters te schatten. Een accuraat model zal goed overeenkomen met de verificatiegegevens, ook al werden deze gegevens niet gebruikt om de parameters van het model vast te stellen. Deze praktijk wordt in de statistiek kruisvalidatie genoemd.
Het definiëren van een metriek om de afstanden tussen de waargenomen en de voorspelde gegevens te meten, is een nuttig hulpmiddel om de geschiktheid van het model te beoordelen. In de statistiek, de beslissingstheorie en sommige economische modellen speelt een verliesfunctie een soortgelijke rol.
Hoewel het vrij eenvoudig is om de geschiktheid van parameters te testen, kan het moeilijker zijn om de geldigheid van de algemene wiskundige vorm van een model te testen. In het algemeen zijn er meer wiskundige hulpmiddelen ontwikkeld om de geschiktheid van statistische modellen te testen dan van modellen met differentiaalvergelijkingen. Hulpmiddelen uit de niet-parametrische statistiek kunnen soms worden gebruikt om te evalueren hoe goed de gegevens in een bekende verdeling passen of om een algemeen model te bedenken dat slechts minimale aannamen doet over de wiskundige vorm van het model.
Reikwijdte van het modelEdit
Het beoordelen van de reikwijdte van een model, dat wil zeggen het bepalen op welke situaties het model toepasbaar is, kan minder eenvoudig zijn. Als het model is geconstrueerd op basis van een reeks gegevens, moet worden bepaald voor welke systemen of situaties de bekende gegevens een “typische” reeks gegevens vormen.
De vraag of het model de eigenschappen van het systeem tussen de datapunten goed beschrijft, wordt interpolatie genoemd, en dezelfde vraag voor gebeurtenissen of datapunten buiten de waargenomen gegevens, wordt extrapolatie genoemd.
Als voorbeeld van de typische beperkingen van de reikwijdte van een model, kunnen we bij de evaluatie van de Newtoniaanse klassieke mechanica opmerken dat Newton zijn metingen deed zonder geavanceerde apparatuur, zodat hij geen eigenschappen kon meten van deeltjes die met snelheden in de buurt van de lichtsnelheid reisden. Evenzo mat hij niet de bewegingen van moleculen en andere kleine deeltjes, maar alleen van macrodeeltjes. Het is dan ook niet verwonderlijk dat zijn model niet goed extrapoleert naar deze domeinen, ook al voldoet zijn model prima voor de gewone levensfysica.
Filosofische overwegingenEdit
Veel soorten modellering impliceren beweringen over causaliteit. Dit is gewoonlijk (maar niet altijd) het geval bij modellen met differentiaalvergelijkingen. Aangezien het doel van modellen is ons begrip van de wereld te vergroten, berust de geldigheid van een model niet alleen op de mate waarin het past bij empirische waarnemingen, maar ook op het vermogen om te extrapoleren naar situaties of gegevens die verder gaan dan die welke oorspronkelijk in het model zijn beschreven. Men kan dit zien als het onderscheid tussen kwalitatieve en kwantitatieve voorspellingen. Men kan ook stellen dat een model waardeloos is tenzij het enig inzicht verschaft dat verder gaat dan wat reeds bekend is uit direct onderzoek van het bestudeerde verschijnsel.
Een voorbeeld van dergelijke kritiek is het argument dat de wiskundige modellen van de optimale foerageertheorie geen inzicht verschaffen dat verder gaat dan de gezond-gevoel-conclusies van evolutie en andere basisprincipes van de ecologie.