Eigenschappen van Adaptieve Modellen

Het doel van dit blog is een manier te vinden om te voorspellen of er discontinuïteiten te verwachten zijn bij een onderneming. De vraag is of dat mogelijk is en zo ja, hoe dan. Het doel van elke post in deze blog is een aspect van die vraag te belichten vanuit bestaande kennis over Complexe Adaptieve Systemen (CAS). Mijn werkwijze is per onderwerp te onderzoeken of die kennis zonder meer kan worden gebruikt om aan het beantwoorden van die vraag bij te dragen of dat er dan nieuwe aannames, aannames en ‘leaps-of-faith’ zijn en of er nieuwe vragen opdoemen. Het einddoel is te koment met iets concreets en werkbaars.

Iets concreets is dan zoiets als een apparaat waar een aantal gegevens van / over een onderneming ingaan en waar dan een antwoord uitkomt. Zoals de vraag nu is geformuleerd is dat van de categorie: ‘Ja, pas op, discontinuïteiten te verwachten!’ of ‘Nee, alles in orde, geen discontinuïteiten in zicht!’, een soort diagnose dus. Dat apparaat is een model, een weergave van de werkelijkheid, en mijn intentie is te voorspellen. Ik zoek dus een geschikt voorspellend model om die vraag te kunnen beantwoorden. In deze post 8 van 10 zoek ik uit welke modellen daarvoor in aanmerking komen en welke eisen aan zo’n model te stellen zijn.

Het is niet mogelijk om te experimenteren met ondernemingen door mogelijke parameters aan te passen en het effect te onderzoeken: neem eens een paar mensen aan, zet de e-mail een paar dagen dicht, pas de financiering aan of staak de productie van een product. Alles heeft consequenties in het dagelijks leven van een onderneming. De route die we daarom nemmen is in die volgorde:

Wat zijn belangrijke kenmerken van (het gedrag van) ondernemingen?
Welke kenmerken kunnen we terugvinden in computermodellen van het type CAS die betrekking hebben op natuurlijke processen?
Welke ‘drivers’ hebben in die computermodellen geleid tot die herkenbare uitkomsten?
Zijn die drivers herkenbaar in het geval van bedrijven en wat is de betekenis daarvan?
Hoe is een bedrijf te modelleren in een computermodel en is daarmee iets te zeggen over de toekomst van dat bedrijf?

We komen dus vanuit het domein van bedrijven, zoeken antwoorden in het domein van computers en proberen die terug te vertalen naar het domein van bedrijven. Dat is allemaal nodig omdat we niet kunnen experimenteren en omdat het in dat laatste domein niet mogelijk mathematisch te voorspellen of te beschrijven wat de toekomst van een onderneming is.

Voorspellen en / of beschrijven
Kortom: ik zoek een model, in de vorm van een set regels, dat uit de eraan toegevoegde bedrijfsgegevens een antwoord deduceert, namelijk conform mijn doelstelling: Ja of Nee. Nog mooier was het als duidelijk werd wat de reden was van het verkregen antwoord, op welke termijn er een verandering te verwachten viel en wat er gedaan kan worden om te voorkomen dat het de verkeerde kant opgaat.

Ik hoop dat de regels die tot die voorspeling leiden betekenisvol zijn, evenals de startgegevens en de uitkomsten, maar zoals gezegd is het doel niet zo geformuleerd. Dat is commercieel interessant, maar dat kan het ontdekken van de equivalent van de wetten van Newton voor ondernemingen impliceren. Later in deze post komen argumenten naar voren waarom dat niet voor de hand ligt.

Een alternatief aan de andere kant van het spectrum is een model dat regels induceert op basis van aangeboden bedrijfsgegevens en daar dan een conclusie aan verbindt, door middel van een ‘patroonzoeker’ zoals een neuraal netwerk of een genetisch algoritme. Dat kan wel een voorspelling opleveren, maar dan is er naderhand geen zicht meer op hoe het model tot die conclusie kwam en dus wat de betekenis is van de gegenereerde regels of de output. Dat is inderdaad binnen de marges van het doel van dit onderzoek. Een directie krijgt dan een rapport met het antwoord Ja of Nee en de technische onderbouwing, zonder dat duidelijk is waarom of wat er nu moet gebeuren of, achteraf, of dat advies tot iets heeft geleid, want het wordt niet duidelijk of de genomen verbeteractie niet toch al zou zijn ingezet. En waarom zou zo’n advies dus eigenlijk worden gevraagd? Dit leidt hoogstens om iets meer begrip voor de werking van het systeem, maar het is niet erg commercieel.

Voor de volledigheid: ik vermoed dat een onderneming zelf uit de gegevens van haar omgeving continu een model induceert en in extremo is het bedrijf misschien zelf wel het model, een soort experiment zoals een individu in een populatie organismen. De manier waarop een onderneming zelf gevolgtrekkingen maakt uit de omgevingsinformatie is niet noodzakelijk gelijk aan de manier waarop ik mijn voorspelling wil maken. Ik ga daar nog een aparte post aan wijden in de conversatie Memes en Levendheid van dit blog.

John L. Casti schrijft in ‘Would be Worlds‘, waarop deze post grotendeels is gebaseerd, dat modellen die het meest in aamerking komen voor het begrijpen van CAS en hun gedrag, mathematische en theoretische modellen zijn. Als voorbeeld voor mathematische modellen noemt hij de wetten van Newton. Hiermee kan het gedrag van bijvoorbeeld hemellichamen worden beschreven en voorspeld. Als voorbeeld van een theoretische model geeft hij de voorstelling van Bohr van electronen als een soort planetaire structuur dus een kern met kleinere deeltjes die daar als planeten omheen circelen. Het doel daarvan is om te beschrijven hoe atomen werken, niet om er voorspellingen mee te doen. Het principe van natuurlijke selectie van Darwin rubriceert hij als verklarend model, dat bedoeld is om een raamwerk te geven waarin observaties worden gecategoriseerd, ook hiermee kunnen geen voorspellingen worden gedaan, we hebben namelijk geen idee hoe een volgende evolutionaire generatie van een bepaald organisme eruit gaat zien.

Hi-Fi
Hij komt tot de conclusie dat de ‘fidelity’, de mate waarin het model aan alle aspecten van de werkelijkheid getrouw is, noch een noodzakelijke noch een voldoende voorwaarde is voor een goed model. Het model moet een antwoord geven op de gestelde vraag en daarvoor is het niet van belang dat het alle details van alle aspecten van het bestudeerde object weergeeft of in aanmerking neemt. Dit sluit aan bij mijn gedachtengang tot nu toe: de onderneming blijft transparant, dus de interne details zijn niet relevant. Ik kijk alleen naar de ontwikkeling van de onderneming in zijn context. De de kenmerken van de onderneming als transparante ‘black-box’ (haha) interacterend met zijn omgeving moet hi-fi gemodelleerd worden.

Eisen aan het model
Eenvoud: een uitdrukking moet zo eenvoudig mogelijk zijn, in overeenstemming met en in verhouding tot een gegeven set met relevante feiten. Van die eenvoud zijn allerlei verschijningsvormen, bijvoorbeeld: het kleinste aantal vergelijkingen, het meest ‘compacte’ model, de laagste dimensie. De meest bruikbare eis is: de kortste beschrijving van het model.

Helderheid: een goed model is een helder model, dat door iedere geïnteresseerde onderzoeker kan worden gebruikt, gegeven dat zij beschikt over de uitleg in een universele taal (zoals wiskunde) en de middelen om er een experiment op uit te voeren (zoals een computer).

Objectief: het model produceert onafhankelijk van menselijke interpretatie uitkomsten.

Betaalbaarheid (’tractability’): de inspanning / kosten van de berekeningen die het model vergt moeten in een redelijke verhouding staan tot de waarde van uitkomsten. Vergelijk The Hitchhiker’s Guide to the Galaxy waarin de aarde de computer is die ’the answer to life, the universe and everything’ uitrekent.

Misbehaving models (hopefully)
Een intrigerende eigenschap van een CAS is niet-geprogrammeerd, onverwacht, contra-intuïtief, verrassingen genererend gedrag. Dat ontstaat in een CAS door de interactie van de onderdelen van het systeem. Dat is ook hoe een bedrijf zich gedraagt en daarom wil ik ook zulk ‘emergent’ gedrag zien in zo’n systeem. Voorbeelden van de onderliggende mechanismes van zulk gedrag die mijn model het liefst ook vertoont – maar niet allemaal tegelijk – zijn:

Paradoxaal: dit soort gedrag komt voort uit verkeerde aannames over het gedrag die leiden tot een afwijking ten opzichte van het feitelijke gedrag. Het resulterende gedrag vertoont inconsistenties met de verwachtingen.

Instabiel: menselijke intuïtie wordt gevormd door systemen waarvan het gedrag stabiel is voor kleine afwijkingen. De reden daarvoor is dat onstabiele systemen niet lang genoeg bestaan om er een intuïtie mee / voor te ontwikkelen. Een voorbeeld hiervan is het onstaan van VHS en Betamax als video players. Het format dat de meeste video’s in de verkoop en verhuur winkels wist te krijgen zou ook de meeste machines verkopen. Dat zou er weer toe leiden dat er meer winkels video op dat format zouden inkopen en zo voort: ‘winner takes all’. Wie de winaar zou worden was a priori niet voorspelbaar. Kleine veranderingen brengen grote effecten in het gedrag voort.

‘Uncomputable’: om ‘computable’ te zijn, moeten de oorzaken van het gedrag programmmeerbaar oftwel in regels te vangen zijn. Als er dus ‘in het wild’ gedrag te vinden is dat niet het gevolg is van regels (stel de natuur volgt in bepaalde gevallen geen regels) dan is dat niet programmeerbaar, het gedrag kan dan niet ‘in silico’ worden voortgebracht. Het resulterende gedrag overstijgt de regels van het systeem.

Connectivity: wat een systeem een systeem maakt en niet een verzameling van losse elementen is hun onderlinge verbindingen. Het gedrag kan niet worden opgesplitst in de gedragingen van de samenstellende deelsystemen.

‘Emerging behaviour’: dit verschijnsel bestaat alleen bij de gratie van connectivity. Ik heb de achtergrond ervan in de post Simplexity en Complicity beschreven. Het bewijs staat hieronder onder het kopje Normale Verdeling en Emerging Behaviour.

Catastrofe: als het gedrag van een systeem verspringt doordat het niet langer door de ene regel(set) in dat systeem wordt voortgebracht maar naar een nabij gelegen regel(set) overspringt en daardoor een ander pad gaat aflopen dan verwacht kon worden op basis van de eerste begincondities en de initieel gevolgde regels. Een voorbeeld hiervan is de problemen die ontstonden met economische modellen tijdens het begin van de crisis in 2008: er werd afgeweken van de bestaande modellen en de regels van de nieuwe situatie waren nog niet duidelijk. De uitkomsten van de oude modellen op basis van de nieuwe economische gegevens waren niet eenduidig noch waren het adequate voorspellingen.

Self-referencing outcomes
W. Brian Arthur heeft onderzoek gedaan naar die situaties, waarin de voorspellingen (van mensen) de toekomst bepalen die ze aan het voorspellen zijn. Voorbeelden zijn de financiële markten en het bezoek aan een kroeg (El Farol) of het strand, alleen als het niet te druk is. Dit staat bekend als ‘self-referencing outcomes’, dus als een voorspelling invloed heeft op het gedrag van een systeem, dat dan de voorspelling beïnvloedt. En zo voort. Dus: we gaan niet/wel naar het strand, omdat we voorspellen dat anderen ook wel/niet gaan en parkeren wel/niet een drama wordt. Hij vond dat het gedrag van een systeem naar een eigen attractor gaat, die direct terug te leiden is op de voorspelregels van de individuele ‘agents (strandgangers)’, onafhankelijk van de beginvoorwaarden. Er is dus geen random variabele die dat gedrag bepaalt, hoewel dat gedrag er wel random uitziet. Bovendien zijn de regels om te voorspellen van de individuele ‘agents’ zelf gebaseerd op eerder gedrag van het systeem.

Er bestaat op dit moment geen wiskunde om dit te mechanisme of het daaruit volgende gedrag te bewijzen. Er bestaat geen deductieve redenering (lees wiskundig model) waarmee een individu het best kan beslissen of zij wel of niet een bepaalde actie moet ondernemen die de uitkomst beïnvloedt, dus wel of niet naar het strand gaan, wel of niet een bepaald aandeel kopen. Het kan voorlopig alleen in ‘gewone mensen taal’ worden opgeschreven, wat ik hier doe, en gesimuleerd worden ‘in silico’. Net als in mijn geval is de werkwijze van Arthur om op basis van een analogie over te stappen van de ‘echte wereld’ naar (simulaties in) computermodellen en op basis daarvan weer analoge conclusies te trekken over de ‘echte wereld’.

Analoog hieraan is er dus helaas (en niet helemaal onverwacht) geen wiskundig model voorhanden waarmee het gedrag van een onderneming precies in haar omgeving kan worden voorspeld. Sterker nog: er is geen wiskunde voor. Want – ten overvloede – op het moment dat er een keiharde voorspelling zou bestaan zou die het gedrag zo beïnvloeden dat die voorspelling al niet meer kon uitkomen, omdat een ieder zijn gedrag c.q. voorspelling erop zou aanpassen. Wat is dan wel de juiste aanpak bij de beslissing of we dit weekend wel of niet naar Scheveningen gaan? Brian Arthur noemt dit ‘inductive rationality’. Dat is, wetend dat je niet alle voorspellingen van alle andere strandbezoekers kan weten, het proces van kiezen van het beste voorspellende model (uit de modellen die je zelf voorhanden hebt) voor deze situatie. Terwijl steeds nieuwe informatie binnenkomt over het feitelijke bezoek aan Scheveningen, stel je dan steeds in een inductief proces je ‘ranking’ bij van welk model de beste voorspeller zou zijn geweest voor de steeds veranderende situatie. Analoog ‘speelt’ een bedrijf steeds met voorspellingen over de toekomst en past de resulterende modellen steeds aan of genereert nieuwe en rangordent ze op basis van de meest recente informatie uit de omgeving.

Normale Verdeling en Emergent Behaviour
Pafnuty L. Chebyshev heeft, voortbouwend op het werk van Gauss bewezen dat het mogelijke gedrag (uitkomsten) van een systeem dat aangedreven wordt door random variabelen die die uitkomsten bepalen, zich altijd verdelen in een normale waarschijnlijkheidsverdeling. Dat is de inhoud van het Central Limit Theorema, dat stelt dat als:

er veel individuele random factoren zijn
die onderling grotendeels onafhankelijk zijn en
het effect van ieder van die factoren op de uitkomst is klein dan

zijn de frequenties van de mogelijke uitkomsten van het hele systeem normaal verdeeld. Dus het mogelijke gedrag van een systeem dat bestaat uit een netwerk van agenten is, onder die minimale voorwaarden en ongeacht de regels die de ‘agents’ gebruiken, normaal verdeeld. Dat kan verklaren (het hoeft niet de enige verklaring te zijn) waarom eenvoudige regels ontstaan uit grote aantallen interacterende ‘agents’. Het verklaart niet waarom nieuw ‘emergent’ gedrag kan ontstaan in die systemen. Dat dat kan bestaan (het verklaart niet hoe het werkt, zie daarvoor de post ‘Simplexity en Complicity’ in deze conversatie) is als volgt aangetoond:

Kurt Gödel bewees met het ‘Incompleteness Theorem’ dat voor elk consistent formeel systeem (laten we het een wiskundige wereld noemen) waarvan het doel is alle arithmetische uitdrukkingen te bewijzen dan wel te falsifiëren er een arithmetische uitdrukking is die bewezen noch gefalsifieerd kan worden volgens de regels van dat systeem.

Alan Turing bewees met het ‘Halting Theorem’ dat er voor een Turing-machine programma H waarvan het doel is vast te stellen dat het alle Turing-machine programma’s stopt of niet stopt, is er een Turing-machine programma en P een gegevensset I zodanig dat programma H niet kan vaststellen of programma P zal stoppen als het gegevens I aan het verwerken is.

De bovenstaande theorema bewijzen beide op een andere manier dat er gebeurtenissen in een door ons gedefinieerd wiskundige systeem zijn, die niet het gevolg zijn van het volgen van de in dat systeem gedefinieerde regels. Dat maakt de weg vrij voor een zo’n wiskundig (lees programmeerbaar) systeem om gedrag te vertonen dat niet in de regels ligt besloten, niet eens volgens die regels kan worden bewezen (of gefalsifieerd) en dus nieuw is voor dat systeem.

Een illustratie uit een heel ander aandachtsgebied is Zipf’s Law. George Zipf stelt in 1949 in Human Behavior and the Principle of Least Effort een relatie voor tussen de mate waarin een in een taal woord wordt gebruikt (dat levert een rang van dat woord op) en de frequentie waarin het in een bepaalde tekst voorkomt. Hij vond de volgende uitkomst: als de rang van een woord N is dan is de gebruiksfrequentie in teksten 1/N. Dat is voorbeeld van een zogenaamde ‘power law’. Die laat een patroon zien dat niet in de woorden zelf schuilt maar in de relaties tussen de woorden, de interactie zogezegd, en dus een ‘emergent’ eigenschap uit het gebruik van de woorden.

Richtlijn voor de bouw van een CAS
Regels voor het bouwen van een adaptief systeem volgens Melanie Mitchell [link]:

Vereenvoudig het probleem uit de echte wereld zoveel mogelijk en hou alleen die elementen over die relevant zijn voor het beantwoorden van de vraag
Schrijf een programma dat de individuele agenten en hun actie en interactie simuleert met de random elementen die nodig zijn
Run het programma vaak met steeds andere ‘seeds’ voor de random generator en verzamel data en statistieken van de uitkomsten
Probeer te begrijpen hoe de eenvoudige regels van de ‘agents’ het globale gedrag van het systeem tot gevolg hebben
Verander parameters van het systeem gevoel te krijgen voor de de bronnen van het succes en voor het effect van wijzigingen van de parameters
Vereenvoudig de simulatie verder waar mogelijk en voeg nieuwe elementen toe waar nodig

De voorwaarden van Casti aan de ontwikkeling van een CAS:

Het aantal agenten is niet te klein en niet te groot: dus bijvoorbeeld niet geopolitieke vraagstukken met weinig ‘agents’ of vragen over sterrenstelsels met heel veel ‘agents’
De ‘agents’ zijn intelligent en adaptief: ze beslissen op basis van regels en ze kunnen de regels aanpassen op basis van nieuwe informatie die ze uit de omgeving ontvangen. Ze kunnen regels ontwikkelen die ze niet eerder hebben gebruikt of die niet eerder zijn vertoond. Dat betekent in feite dat er een ecologie van regels ontstaat die evolueren tijdens het proces
De ‘agents’ hebben geen toegang tot informatie over alles wat alle andere ‘agents’ doen. Op zijn meest heeft de ‘agent’ beschikking over de informatie van een kleine subset van alle ‘agents’, die hij dan verwerkt tot een actieplan

Fitness van een ‘agent’
In de kantlijn van deze post staat in dit kopje een aantal illustraties van de manieren waarop ‘fitness’ is gedefinieerd voor verschillende systemen. De systemen zelf zijn mogelijk niet relevant voor het odnerwerp ondernemingen, de illustraties zijn bedoeld om een voorraadje op te bouwen aan voorbeelden, die dan misschien tot een equivalent voor bedrijven leiden. Here goes:

W. Brian Arthur: een voorspelling is, evolutionair gezien (of hoe dat dan ook heet in ondernemings termen), alleen ‘fit’ is als zij goed presteert in verhouding tot alle andere voorspellingen. Dit leidt tot de visie dat een economie een co-evoluerende wereld is, waarin steeds nieuwe voorspellende modellen worden aangemaakt die met elkaar concurreren, zodat hun ‘agents’ een relatief voordeel hebben. Analoog is de vraag wat een bedrijf fit maakt, wat is het betaalmiddel, wat gaat er over de toonbank waar is bij een goedlopend bedrijf veel van of juist weinig? Op de zaken vooruitlopend: een antwoord dat mogelijk is bij al die vragen is ‘geld’ maar gevoelsmatig denk ik dat dat een resultaat is, niet hetgene dat de fitheid van de ‘agents’ bepaalt.

Zipf’s Law stelt dat de talen die overleven in het evolutionaire proces de meeste informatie kunnen overbrengen per eenheid van kosten. Die kosten zijn te meten als de tijd die nodig is om de woorden van die taal te produceren. Die uitkomst is op zich niet relevant maar illustratief bij de vraag in post 6: wat zijn de regels voor ‘fitheid’ in een onderneming, langs welke parameters vindt ‘evolutie’ van een onderneming plaats).

Casti geeft verder Tierra als voorbeeld, ontwikkeld door Tom Ray. Dit programma evolueert ‘in silico’ levensvormen op basis van de digitale equivalent van natuurlijke selectie. Na verloop van een aantal generaties ontstaan verschillende digitale organismen inclusief parasieten, hyper-parasieten en het tot stand komen van soorten, namelijk groepen genetisch vergelijkbare individuen. Deze A-life vormen voeden zich met processing time: ze leren er slimmer mee omgaan, concurreren erom, proberen er trucs omheen te verzinnen en lijden eronder. Deze is opnieuw niet geschikt maar is toch illustratief: voor de verzameling.

De onzichtbare hand bestaat niet
Ook in de kantlijn van deze conversatie en waarvan ik het gevoel heb dat het bruikbaar is, is dit ‘factlet’: Hugo Sonnenschein heeft bewezen dat elke mogelijke regel om marktprijzen te voorspellen voldoet. Met andere woorden: er zijn geen deductieve modellen (ze zijn allemaal even goed of slecht) voor het bepalen waar vraag en aanbod elkaar ontmoeten en waar dus het evenwicht is waar de prijs ‘ontstaat’, zoals de ‘Invisible Hand’ van Adam Smith. Economische modellen die uitgaan van een prijsevenwicht zijn hoogstens geschikt als gedachtenoefening, nauwelijks als beschrijvend en niet als voorspellend model. Voor mijn aanstaande model betekent dit dat er geen deductief model is voor de prijsvorming van de producten of diensten die een bedrijf verkoopt. Dat is relevant omdat dat toch een manier is voor een onderneming om iets uit te wisselen met de omgeving, eenn centraal punt in mijn betoog. Die prijs wordt dus bepaald tijdens die voortdurende interacties met de omgeving maar er is geen vast model voor de prijsvorming.

Deze post blijkt een potpourri te zijn geworden van eigenschappen van CAS, richtlijnen en voorwaarden bij de ontwikkeling, onderliggende mechanismes, fundamenten en aannames voor de systemen en gedrag dat verwacht kan (of moet) worden en een handvol trouvailles. ‘Work in progress’ is de definitie van fitheid van mijn systeem. Wordt dus vervolgd!

Eigenschappen van Adaptieve Modellen

Gepubliceerd door

DP