Articles

Model matematyczny

W biznesie i inżynierii, modele matematyczne mogą być używane do maksymalizacji pewnej produkcji. Rozważany system będzie wymagał pewnych nakładów. System odnoszący dane wejściowe do danych wyjściowych zależy również od innych zmiennych: zmiennych decyzyjnych, zmiennych stanu, zmiennych egzogenicznych i zmiennych losowych.

Zmienne decyzyjne są czasami znane jako zmienne niezależne. Egzogeniczne zmienne są czasami znane jako parametry lub stałe. Zmienne nie są od siebie niezależne, ponieważ zmienne stanu są zależne od zmiennych decyzyjnych, wejściowych, losowych i egzogenicznych. Ponadto, zmienne wyjściowe są zależne od stanu systemu (reprezentowanego przez zmienne stanu).

Cele i ograniczenia systemu i jego użytkowników mogą być reprezentowane jako funkcje zmiennych wyjściowych lub zmiennych stanu. Funkcje celu będą zależały od perspektywy użytkownika modelu. W zależności od kontekstu, funkcja celu jest również znana jako indeks wydajności, ponieważ jest to pewna miara interesująca użytkownika. Chociaż nie ma ograniczeń co do liczby funkcji celu i ograniczeń, jakie może mieć model, to jednak wraz ze wzrostem liczby funkcji celu i ograniczeń optymalizacja modelu staje się bardziej skomplikowana (obliczeniowo).

Na przykład ekonomiści często stosują algebrę liniową przy korzystaniu z modeli wejścia-wyjścia. Skomplikowane modele matematyczne, które mają wiele zmiennych mogą być skonsolidowane przez użycie wektorów, gdzie jeden symbol reprezentuje kilka zmiennych.

Informacja a prioriEdit

Aby przeanalizować coś z typowym „podejściem czarnej skrzynki”, tylko zachowanie bodźca / odpowiedzi zostanie uwzględnione, aby wywnioskować (nieznane) pudełko. Zwykłą reprezentacją tego systemu czarnej skrzynki jest diagram przepływu danych wyśrodkowany w skrzynce.

Problemy modelowania matematycznego są często klasyfikowane do modeli czarnej skrzynki lub białej skrzynki, w zależności od tego, ile informacji a priori na temat systemu jest dostępnych. Model czarnej skrzynki to system, o którym nie ma dostępnych informacji a priori. Model białej skrzynki (zwany również szklaną skrzynką lub czystą skrzynką) jest systemem, w którym wszystkie niezbędne informacje są dostępne. Praktycznie wszystkie systemy znajdują się gdzieś pomiędzy modelami czarnej i białej skrzynki, więc koncepcja ta jest użyteczna tylko jako intuicyjny przewodnik przy podejmowaniu decyzji, które podejście należy przyjąć.

Zwykle preferuje się wykorzystanie jak największej ilości informacji a priori, aby model był bardziej dokładny. Dlatego też modele typu white-box są zwykle uważane za łatwiejsze, ponieważ jeśli poprawnie wykorzystałeś informacje, to model będzie zachowywał się poprawnie. Często informacja a priori jest dostarczana w postaci znajomości typu funkcji odnoszących się do różnych zmiennych. Na przykład, jeśli tworzymy model działania leku w ludzkim organizmie, wiemy, że zazwyczaj ilość leku we krwi jest funkcją wykładniczo malejącą. Ale nadal mamy kilka nieznanych parametrów: jak szybko spada ilość leku i jaka jest początkowa ilość leku we krwi? Przykład ten nie jest więc modelem całkowicie białoskrzynkowym. Te parametry muszą być oszacowane za pomocą pewnych środków, zanim będzie można użyć modelu.

W modelach czarnej skrzynki próbujemy oszacować zarówno postać funkcyjną relacji między zmiennymi, jak i parametry liczbowe w tych funkcjach. Używając informacji a priori możemy na przykład otrzymać zestaw funkcji, które prawdopodobnie będą w stanie adekwatnie opisać system. Jeśli nie ma informacji a priori, staralibyśmy się użyć funkcji tak ogólnych, jak to tylko możliwe, aby objąć wszystkie różne modele. Często stosowanym podejściem do modeli typu black-box są sieci neuronowe, które zazwyczaj nie przyjmują założeń dotyczących napływających danych. Alternatywnie, algorytmy NARMAX (Nonlinear AutoRegressive Moving Average model with eXogenous inputs), które zostały opracowane w ramach identyfikacji systemów nieliniowych, mogą być wykorzystane do wyboru warunków modelu, określenia struktury modelu i oszacowania nieznanych parametrów w obecności skorelowanego i nieliniowego szumu. Zaletą modeli NARMAX w porównaniu do sieci neuronowych jest to, że NARMAX tworzy modele, które można zapisać i odnieść do procesu bazowego, podczas gdy sieci neuronowe tworzą przybliżenie, które jest nieprzejrzyste.

Informacja subiektywnaEdit

Czasami przydatne jest włączenie informacji subiektywnej do modelu matematycznego. Można to zrobić na podstawie intuicji, doświadczenia lub opinii eksperta, lub na podstawie wygody formy matematycznej. Statystyka bayesowska dostarcza teoretycznych ram dla włączenia takiej subiektywności do rygorystycznej analizy: określamy wcześniejszy rozkład prawdopodobieństwa (który może być subiektywny), a następnie aktualizujemy ten rozkład w oparciu o dane empiryczne.

Przykładem tego, kiedy takie podejście byłoby konieczne, jest sytuacja, w której eksperymentator wygina lekko monetę i rzuca nią raz, rejestrując, czy wypadnie reszka, a następnie otrzymuje zadanie przewidzenia prawdopodobieństwa, że następny rzut wypadnie reszka. Po wygięciu monety, prawdziwe prawdopodobieństwo, że moneta wypadnie jako reszka jest nieznane, więc eksperymentator musiałby podjąć decyzję (być może patrząc na kształt monety), jaki rozkład wstępny zastosować. Włączenie takich subiektywnych informacji może być ważne, aby uzyskać dokładne oszacowanie prawdopodobieństwa.

ComplexityEdit

Ogólnie, złożoność modelu wiąże się z kompromisem pomiędzy prostotą a dokładnością modelu. Brzytwa Occama jest zasadą szczególnie istotną dla modelowania, jej istotną ideą jest to, że wśród modeli o mniej więcej równej mocy predykcyjnej, najprostszy jest najbardziej pożądany. Podczas gdy dodatkowa złożoność zwykle poprawia realizm modelu, może ona jednak utrudnić jego zrozumienie i analizę, a także powodować problemy obliczeniowe, w tym niestabilność numeryczną. Thomas Kuhn twierdzi, że wraz z postępem nauki wyjaśnienia stają się coraz bardziej złożone, zanim nastąpi zmiana paradygmatu, oferująca radykalne uproszczenie.

Na przykład, modelując lot samolotu, moglibyśmy osadzić w naszym modelu każdą mechaniczną część samolotu i w ten sposób uzyskać niemal białoskrzynkowy model systemu. Jednakże, koszt obliczeniowy dodania tak dużej ilości szczegółów skutecznie uniemożliwiłby wykorzystanie takiego modelu. Dodatkowo, niepewność wzrosłaby z powodu zbyt złożonego systemu, ponieważ każda oddzielna część wprowadza do modelu pewną wariancję. Dlatego zazwyczaj należy dokonać pewnych przybliżeń, aby zredukować model do rozsądnych rozmiarów. Inżynierowie często są w stanie zaakceptować pewne przybliżenia, aby uzyskać bardziej solidny i prosty model. Na przykład, mechanika klasyczna Newtona jest przybliżonym modelem świata rzeczywistego. Mimo to, model Newtona jest wystarczający dla większości sytuacji w życiu codziennym, to znaczy tak długo, jak prędkości cząstek są znacznie mniejsze od prędkości światła, a my badamy tylko makrocząstki.

Zauważ, że większa dokładność nie musi oznaczać lepszego modelu. Modele statystyczne są podatne na przepasowanie, co oznacza, że model został dopasowany do danych zbyt mocno i stracił zdolność do generalizacji na nowe zdarzenia, które nie były obserwowane wcześniej.

Trening i dostrajanieEdit

Każdy model, który nie jest czystą białą skrzynką zawiera pewne parametry, które mogą być użyte do dopasowania modelu do systemu, który ma opisywać. Jeśli modelowanie odbywa się za pomocą sztucznej sieci neuronowej lub innych metod uczenia maszynowego, optymalizacja parametrów nazywana jest treningiem, podczas gdy optymalizacja hiperparametrów modelu nazywana jest strojeniem i często wykorzystuje walidację krzyżową. W bardziej konwencjonalnym modelowaniu poprzez jawnie podane funkcje matematyczne, parametry są często określane przez dopasowanie krzywej.

Ewaluacja modeluEdit

Kluczową częścią procesu modelowania jest ocena, czy dany model matematyczny dokładnie opisuje system. Odpowiedź na to pytanie może być trudna, ponieważ obejmuje kilka różnych typów oceny.

Dopasowanie do danych empirycznychEdit

Zwykle najprostszą częścią oceny modelu jest sprawdzenie, czy model pasuje do pomiarów eksperymentalnych lub innych danych empirycznych. W modelach z parametrami, powszechnym podejściem do testowania tego dopasowania jest podzielenie danych na dwa rozłączne podzbiory: dane treningowe i dane weryfikacyjne. Dane szkoleniowe są wykorzystywane do oszacowania parametrów modelu. Dokładny model będzie ściśle odpowiadał danym weryfikacyjnym, nawet jeżeli dane te nie były wykorzystywane do wyznaczania parametrów modelu. Ta praktyka jest określana w statystyce jako walidacja krzyżowa.

Zdefiniowanie metryki do pomiaru odległości między danymi obserwowanymi i przewidywanymi jest użytecznym narzędziem do oceny dopasowania modelu. W statystyce, teorii decyzji i niektórych modelach ekonomicznych podobną rolę odgrywa funkcja straty.

O ile testowanie adekwatności parametrów jest dość proste, o tyle testowanie poprawności ogólnej formy matematycznej modelu może być trudniejsze. Ogólnie rzecz biorąc, opracowano więcej narzędzi matematycznych do testowania dopasowania modeli statystycznych niż modeli zawierających równania różniczkowe. Narzędzia ze statystyki nieparametrycznej mogą być czasami użyte do oceny, jak dobrze dane pasują do znanego rozkładu lub do wymyślenia ogólnego modelu, który czyni tylko minimalne założenia dotyczące matematycznej formy modelu.

Zakres modeluEdit

Ocena zakresu modelu, czyli określenie, do jakich sytuacji model ma zastosowanie, może być mniej prosta. Jeśli model został zbudowany na podstawie zestawu danych, należy określić, dla jakich systemów lub sytuacji znane dane są „typowym” zestawem danych.

Pytanie, czy model dobrze opisuje właściwości systemu pomiędzy punktami danych, nazywamy interpolacją, a to samo pytanie dla zdarzeń lub punktów danych poza obserwowanymi danymi nazywamy ekstrapolacją.

Jako przykład typowych ograniczeń zakresu modelu, w ocenie Newtonowskiej mechaniki klasycznej, możemy zauważyć, że Newton dokonywał swoich pomiarów bez zaawansowanej aparatury, więc nie mógł mierzyć własności cząstek poruszających się z prędkościami bliskimi prędkości światła. Podobnie nie mierzył ruchów cząsteczek i innych małych cząstek, a jedynie makrocząstki. Nie jest więc zaskakujące, że jego model nie ekstrapoluje się dobrze na te dziedziny, nawet jeśli jego model jest całkiem wystarczający dla zwykłej fizyki życia.

Rozważania filozoficzneEdit

Wiele typów modelowania implicite zawiera twierdzenia o przyczynowości. Jest to zwykle (ale nie zawsze) prawdziwe w przypadku modeli obejmujących równania różniczkowe. Ponieważ celem modelowania jest zwiększenie naszego zrozumienia świata, ważność modelu opiera się nie tylko na jego dopasowaniu do obserwacji empirycznych, ale także na jego zdolności do ekstrapolacji na sytuacje lub dane wykraczające poza te pierwotnie opisane w modelu. Można o tym myśleć jako o rozróżnieniu między przewidywaniami jakościowymi i ilościowymi. Można też argumentować, że model jest bezwartościowy, jeśli nie dostarcza wglądu, który wykracza poza to, co jest już znane z bezpośredniego badania badanego zjawiska.

Przykładem takiej krytyki jest argument, że modele matematyczne teorii optymalnego żerowania nie oferują wglądu, który wykracza poza zdroworozsądkowe wnioski ewolucji i inne podstawowe zasady ekologii.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *