Hoe groot is de kans dat je tijdens 100 jaar een 100-jarige storm meemaakt?

Een 100-jarige storm is een gebeurtenis die gemiddeld gezien één keer om de 100 jaar voorkomt. Is het antwoord op bovenstaande vraag dan niet simpelweg dat je gedurende 100 jaar met zekerheid een 100-jarige storm zal meemaken? Zoals een lezer die enige ervaring heeft met spanningsbogen en retorische vragen in dit soort van teksten al vermoedt, is het antwoord volmondig: nee. Laten we starten met een wonderbaarlijke tocht naar de exacte kans.

Een 100-jarige storm is een storm met een terugkeerperiode van 100 jaar, dat wil zeggen dat ze gemiddeld om de 100 jaar zal plaatsvinden. Na een kortstondige overpeinzing kom je al snel tot het besef dat er een kans bestaat dat een persoon op zijn 100ste verjaardag de 100-jarige storm niet heeft meegemaakt. Men kan zich gemakkelijk inbeelden dat er een 100-jarige storm over het land raasde net voor z’n geboorte en net na z’n 100ste verjaardag. Hieruit kunnen we alvast besluiten dat de kans op het meemaken van een storm al zeker kleiner zal zijn dan 100%. Hiermee hebben we wellicht een open deur ingetrapt.

Er komt een voortschrijdend inzicht dat er ook een kans is dat er zich meerdere stormen kunnen voordoen in 100 jaar. Eentje aan het begin en eentje aan het einde bijvoorbeeld, dat is niet ondenkbeeldig. Weliswaar met kleiner wordende kans kunnen zich, als het geluk wat tegen zit, ook meer dan 2 stormen nestelen in de eeuw die we onder de loep nemen. We komen tot het besef dat we beter moeten definiëren wat we willen berekenen. In feite willen we weten wat de kans is dat er minstens één storm zal plaatsvinden tijdens 100 jaar.

We halen de complementregel van onder het statistische stof. Die regel klinkt veel ingewikkelder dan wat ze is. De complementregel zegt bijvoorbeeld dat het ofwel regent ofwel niet regent, nu we toch bezig zijn met open deuren in te trappen… En de som van beide kansen is 1. Symbolisch uitgeschreven: P(regen) + P(geen regen)=1. Passen we dit toe op de stormkwestie dan is de kans dat er geen storm is samen met de kans dat er minstens één storm is gelijk aan 1. Aldus verkrijgen we volgende uitdrukking voor de kans op minstens één storm:

De queeste naar het resultaat heeft zich dus herleid tot de zoektocht naar de kans op 0 stormen.

De olifant in de kamer is hier het feit dat we op gelijk welk moment getroffen kunnen worden door de bliksemse toorn van Zeus in ons aardse dal, en dat kunnen we moeilijk linken aan toevalsexperimenten zoals muntjes gooien en dobbelsteen gooien waarmee de gekende paden der probabiliteit geplaveid zijn. We tasten eerst in het duister, en daarna in het duister van onze zak en vinden een muntje en doen toch een verwoede poging om het voorliggende vraagstuk te herleiden tot het opgooien van een muntje.

We zouden bijvoorbeeld een muntje kunnen opwerpen om per eeuwhelft te bepalen of er een 100-jarige storm zal plaatsvinden. Kop is storm. Dus we willen weten hoeveel kans we hebben om enkel munt te gooien en dan nemen we de complement van het zaakje. Aangezien de kans op succes (=kop gooien = storm) per half jaar 1 op 2 is, is de kans op geen succes 1-1/2. Aangezien we de twee halve eeuwen als onafhankelijke gebeurtenissen beschouwen kunnen we de vermenigvuldigingsregel toepassen, met k als het aantal stormen tijdens de beschouwde periode van 100 jaar, en daarna de complementregel om de kans te bepalen op minstens één storm. Resultaat: 75% kans.

De vreugde om deze eerste benaderende poging wordt echter snel getemperd door het besef dat deze verdienstelijke poging om de vraagstelling op een zeer toegankelijke wijze te benaderen in al z’n eenvoud voorbijgaat aan het feit dat er meerdere stormen in een eeuwhelft kunnen plaatsvinden. Het noopt ons tot nederigheid en reflectie en het mondt uit in louterende verfijning.

Vinden we 50 jaar te ruim? Dan nemen we toch gewoon een kleiner tijdsinterval? Pakweg één jaar. En we passen de kans aan naar 1 op 100, want we verwachten nog altijd om de honderd jaar gemiddeld één storm, statistische wordt dit trouwens ook de verwachtingswaarde genoemd. De kans op een storm per jaar is equivalent met één gooien met een 100-zijdige dobbelsteen (ja die bestaan, zoek maar op). De complementregel en de vermenigvuldigingsregel leert ons gelijkaardig aan de bovenstaande formule voor het opgooien van het muntje dat de kans op minstens één storm gelijk is aan 63,4%, een flinke reductie van onze eerste benadering.

We gaan er prat op dat we flirten met de exacte kans. Tevreden en misschien vreugdevolg zouden we kunnen zijn om deze mooie benadering maar ergens begint het te knagen in de delen van ons brein waar de wiskunde huist en hunkerend naar exactheid beseffen we dat de tijdintervallen nog verder moeten verkleind worden, tot ze oneindig klein zijn. En dan komt de aha-erlebnis want we stoten zowaar op de definitie van de exponentiële functie exp(x) met x=-1. Hier komt plots het getal van Euler als het ware uit de hemel vallen, onverwacht en verrassend en het laat ons achter met enige verbazing… maar het laat ons ook achter met het exacte antwoord!

Bijgevolg is de kans om tijdens een periode van 100 jaar een 100-jarige storm mee te maken gelijk aan 63,2%. Het wordt iets complexer wanneer we de kans op een exact aantal stormen willen berekenen, want dan gaan we een ommetje moeten maken via de binomiaalverdeling om met zachtheid te landen in de Poissonverdeling, waarin de exponentiële functie oogstrelend figureert. Het zal je ook zeggen hoe groot de kans is dat er een aantal auto’s passeren op een bepaalde plek per tijdsinterval en hoe groot de kans is dat het water in de koffiemachine morgen op is. Als dat niet uit het leven gegrepen is…

Stormachtige 100-jarige groeten

T.E.

De entropie in mijn dochters kamer

Wanneer ik mijn dochters kamer betreed, word ik geconfronteerd met één van de meest fundamentele natuurwetten. Het is een wetmatigheid die nog fundamenteler is dan dan de wetten van Maxwell of de relativiteitsleer. Het is het onomkeerbare proces van nuttige energie naar nutteloze energie, dat in één adem ook nog eens de richting van tijd vastlegt. Het is inderdaad de wet van de stijgende entropie waar ik aan herinnerd word terwijl ik me een weg baan doorheen speelgoed, kleren en knuffels in mijn dochters kamer.

Een gebroken glas heeft veel meer mogelijke toestanden dan een niet-gebroken glas.

Het niet zo tot de verbeelding sprekende maar toch algemeen bekende entropie-experiment is het plaatsen van een bord warme soep in een kamer en dan kijken wat er gebeurd. De soep zal afkoelen en de kamer zal heel lichtjes opwarmen door de warme soep, maar de feitelijke vraag is waarom dit gebeurt. De analogie met mijn dochters kamer is ook snel gemaakt: we laten haar een paar uur spelen in de kamer en dan checken we de toestand. Ook hier zal de vaststelling zijn dat de kamer geëvolueerd is naar een toestand waarin het speelgoed overal rond ligt, eerder dan dat we zouden verwachten dat die netjes opgeruimd blijft. In beide gevallen evolueert het systeem naar een evenwichtssituatie, waarbij de entropie maximaal wordt. Bij de soep gaat het over de verspreiding van de energie bij een bepaalde temperatuur, daarom is de eenheid van entropie energie (Joule) per temperatuur (Kelvin): J/K.

Om een meer exacte verklaring te geven over het waarom van bovenstaande processen moeten we spreken over de waarschijnlijkheid van toestanden. Het lijkt misschien bizar om bij het soepbord-experiment te gaan spreken over waarschijnlijkheden, want je bent in feite zeker dat het nieuwe evenwicht zal ontstaan. Om duidelijk te maken dat entropie alles te maken heeft met de waarschijnlijkheid van toestanden, kunnen we bij de kamer van mijn dochter eens gaan kijken naar de waarschijnlijkheid. We vereenvoudigen sterk de kamer en veronderstellen dat er slechts 2 posities zijn waarin speelgoed of andere kameringrediënten zich kunnen bevinden en dat we de positie waarin alles in één positie ligt, kunnen beschouwen als een opgeruimde kamer. Laten we eerst even een kamer nemen met 2 posities en 2 spullen, haar pop Meesje en een rondslingerende schoen.

We stellen vast dat er 4 mogelijke toestanden zijn, 2 toestanden zijn opgeruimde toestanden en er zijn 2 rommel-toestanden. Dat betekent dat de waarschijnlijkheid dat in dit sterk vereenvoudigd systeem de kamer er opgeruimd zal uitziet 50% is. Doordat er amper 2 spullen en 2 posities zijn, is er in dit geval nog een goede kans dat we na een tijdje toch terugkeren naar een opgeruimde toestand. Maar als we het aantal spullen verhogen dan bemerken we een verandering van de kans op ‘opgeruimde toestand’. Laten we ter illustratie het aantal spullen even verdubbelen naar 4: we vullen de pop en de schoen aan met een knuffel en een auto, en beschouwen nu de kans op ‘opgeruimde kamer’.

We kunnen vaststellen dat het aantal mogelijke toestanden toegenomen is tot 16. Om de correcte terminologie te gebruiken spreken we per individueel geval van een microtoestand en per globale toestand (bv. 1 spul ligt links 3 spullen rechts) spreken we van een macrotoestand. Bij macrotoestanden verliezen we de info over individuele toestanden, en deze link naar informatie maak ik niet zomaar, want ook in de informatietheorie is entropie een belangrijke grootheid. De eenheid van entropie in deze tak van de wetenschap is bit en de entropie van de informatie is gelijk aan het gemiddeld aantal ja-of-nee-vragen die gesteld moeten worden om de informatie te achterhalen. Als de info die je wenst mee te geven één van je ouders is, dan is dit te achterhalen met één ja-of-nee-vraag, dus is de entropie van die informatie één bit. Als de info een bepaalde letter is van het alfabet, ergens in een tekst, dan zal de kans op voorkomen van elke letter bepalend zijn om de entropie te bepalen van de informatie die besloten ligt in die letter.

Terug naar de kamer met spullen. Het is gemakkelijk in te zien dat bij het verder toenemen van spullen de mogelijkheden exponentieel zullen toenemen. Bij 2 mogelijke posities in de kamer en n spullen zal het aantal mogelijke toestanden 2n zijn. Bij 10 spullen zijn die mogelijke toestanden 1024, dus dat loopt wel snel op. (zie ook: Schaakmat voor koning Shirham). Het gevolg is dat de kans op ‘opgeruimde toestand’ dramatisch daalt bij toenemende spullen in de kamer. Zo is de kans op een opgeruimde kamer bij 4 spullen nog maar 12,5% (14 van de 16 toestanden zijn rommel-toestanden) en bij 10 spullen nog maar amper 0,2%.

Zonder dat we goed beseffen zijn we terecht gekomen in een binomiaal-verdeling, ook wel bekend van de kop-of-munt experimenten (dit eenvoudige toevalsexperiment wordt een Bernoulli-experiment genoemd). Het plaatsen van een bepaalde hoeveelheid spullen in één van de twee posities komt overeen met het uitvoeren van een zelfde aantal kop-of-munt experimenten. En wanneer we het aantal spullen nog laten toenemen gebeurt er iets heel curieus, en ook iets heel logisch. De oppervlakte onder elke grafiek is gelijk genomen aan 1, zodat we direct kansen kunnen aflezen en de discrete grafiek is continue gemaakt.

Het curieuze is dat de grafiek evolueert naar een normaalverdeling (de welbekende klokvorm), dat volgt uit de centrale limietstelling die stelt dat voor (bijna) gelijk welke soort kansverdeling (bv 50% kop of 50% munt) de verdeling van de gemiddeldes uit verschillende experimenten normaal verdeeld zijn. Als je er even over nadenkt is dat wel heel curieus, maar we zien het in de grafiek voor onze ogen gebeuren. En het logische is dat de grafiek smaller en smaller wordt, tot alle waarden zich in een minieme band rond het gemiddelde zullen bevinden. Dat betekent dat er altijd maar minder kans is op variatie van het gemiddelde. Als je heel lang kop-of-munt gooit zal je uiteindelijk met zeer hoge nauwkeurigheid in de buurt van 50% komen. Deze zeer hoge nauwkeurigheid is wat we vaststellen als we de temperatuur van iets gaan meten. Temperatuur is de hevigheid van het trillen van deeltjes. Het is bijlange niet zo dat alle deeltjes met precies dezelfde hevigheid trillen, maar we kunnen wel met zekerheid zeggen dat de gemiddelde trilling, dus de temperatuur niet fluctueert. De wet van de grote getallen zorgt ervoor dat de temperatuur gewoon een vaste waarde is.

Nu is het moment er gekomen om de meest beroemde formule van de (statistische) entropie tentoon te spreiden: S=k ln W, beter bekend als de formule van Boltzmann. Waarbij S staat voor de entropie, en W voor het aantal manier waarop een toestand mogelijk is. Bij systemen met miljoenen, miljarden deeltjes zal er niet meer gesproken worden over een kansverdeling, maar over het aantal mogelijke posities. De factor k is er enkel om de energieboekhouding goed te krijgen tussen eenheden, zodat entropie in J/k kan uitgedrukt worden. De formule van Boltzmann is in feite ook een soort gemiddelde en geldig bij grote aantallen microtoestanden (bv bij een gas). De statistische wet van de grote aantallen zorgt ervoor dat dat de de formule van Boltzmann geldig is bij grote aantallen, zoals toestanden van gassen in de natuurkunde. Als we heel veel spullen laten rondslingeren in de twee mogelijke posities, zal precies de helft in de eerste positie zitten en precies de andere helft in de tweede positie zitten. Dit is hetzelfde evenwicht dat we ervaren bij de druk in een ballon, of de temperatuur van een systeem in evenwicht.

Er kan ook redelijk eenvoudig aangetoond worden waarom de logaritme nodig is in de formule. De entropie van een systeem is immers een extensieve grootheid, dat wil zeggen dat de entropie evenredig moet zijn met het aantal deeltjes. Dus als we tien keer zoveel deeltjes nemen, willen we ook dat de entropie maal tien gaat. Wiskundig gezien is er een manier om de exponentieel stijgende toestanden toch evenredig te krijgen met het aantal deeltjes en dat is door de logaritme te nemen van de de mogelijke toestanden. Zo blijft de entropie netjes evenredig met het aantal deeltjes, terwijl de mogelijke toestanden exponentieel stijgen.

Entropie heeft dus alles te maken met waarschijnlijkheid. Het stijgen van de totale entropie is equivalent met wat het meest waarschijnlijke zal gebeuren. Daarom is entropie ook zo sterk gelinkt met de richting van de tijd. Als je een glas laat vallen is het meest waarschijnlijke dat één van de miljoenen, miljarden toestanden waarop een glas gebroken kan zijn zal ontstaan, en is het onnoemelijk onwaarschijnlijk dat die ene toestand waarbij het glas intact blijft wordt bereikt. Net omdat er zoveel mogelijkheden zijn op een gebroken glas kunnen we met complete zekerheid voorspellen dat het glas zal breken.

Omdat waarschijnlijk het waarschijnlijke zal gebeuren stijgt de entropie, en dat is in feite een veel exactere (en volgens mij meer duidelijke) omschrijving dan ‘chaos die toeneemt’ of ‘wanorde die stijgt’. Daarom sta ik dus met aan zekerheid grenzende waarschijnlijkheid te waden in de rommel van mijn dochters kamer. Eerst wou ik afsluiten met: ‘het is niet het einde van de wereld, die stijgende entropie’, om de boel wat te relativeren. Maar daar moet ik helaas op terugkomen. Het is de mogelijke drijfveer voor het einde van het heelal want nadat alle materie zich verliest in zwarte gaten (grootste entropietoestand voor gravitatie) zullen deze verdampen door hawkingstraling en eindigt het heelal in een warmtedood, het finale thermodynamische evenwicht… en graag eindig ik met deze vrolijke noot.

Veel entropisch gemaximaliseerde groeten,

T.E.

Oneindig is de hemel van de wiskunde

Twee evenwijdige rechten zullen mekaar nooit ontmoeten. Dat is de trieste realiteit. “Het waren twee koningskinderen – Zij hadden elkander zo lief- Zij konden bijeen niet komen”. Behalve als ze in oneindig geloven, want daar zullen ze mekaar ontmoeten. “Adieu mijne zuster en broeder – Ik vare naar t’hemelrijk.” Oneindig is dus een beetje als de hemel voor wiskunde. Als we op een open nacht de sterrenhemel bewonderen, overkomt ons ook een gevoel van oneindigheid. We vragen ons af of het heelal oneindig groot zou zijn, zou de fysieke realiteit rondom ons echt oneindig kunnen zijn? Want oneindig is echt wel een heel vreemd beestje met rare eigenschappen, dat bleek al bij een bezoekje aan Hilbert’s oneindige hotel…

David Hilbert was een Duitse wiskundige die de wereld liet kennis maken met z’n hotel met oneindig veel kamers. Het paradoxale aan dit hotel was dat, alhoewel alle kamers volgeboekt waren, men toch steeds een plaatsje vond voor een extra gast. Dat was wel een beetje gedoe, want die ene gast kreeg kamer 1 en de rest moest verhuizen naar de volgende kamer en dat ging vlotjes want er waren dan ook oneindig kamers. Ook toen er een groep van n gasten aankwam werd er plaats gevonden, want dan verhuisde iedereen naar z’n oorspronkelijke kamernummer + n. Alle hotelgasten waren gelukkig met hun nieuwe kamer.

De volgende avond kwam een bus met oneindig veel gasten toe aan het hotel. Ook dit vormde geen probleem. Alle gasten werden gevraagd om te verhuizen naar een kamer met het dubbele kamernummer; zo bleven alle oneven kamers over om de gasten van uit de bus ter herbergen. So far so good. Alle hotelgasten hadden na wat gerommel op de gang uiteindelijk een nieuwe kamer en sliepen als oneindig veel roosjes.

De avond daarna werd het wat drukker. Er kwam niet één bus met oneindig veel gasten het (waarschijnlijk oneindige) parkeerterrein van het hotel oprijden, maar er boden zich oneindig veel bussen aan met telkens oneindig veel gasten aan boord. Wat nu gedaan? Gelukkig was de man aan de receptie koelbloedig. Hij zuchtte even, sloot z’n ogen, dacht even na, en opende ze opnieuw met een lichte glimlach. Hij sommeerde alle gasten nu om te verhuizen van hun kamer n naar kamer 2n , en dan loodste hij de eerste bus met gasten op zitplaats n naar alle kamers 3n , en de volgende bus naar alle machten van 5. En zo ging hij vervolgens alle priemgetallen af, en dat zijn er gelukkig oneindig veel. Zo vond iedereen een unieke kamer, want alle kamers zijn slechts op één manier te ontbinden in priemgetallen, en kon de nacht starten voor alle reizigers die op de oneindige vele bussen zaten en ze droomden oneindig veel dromen.

Tot nu toe hebben we nog maar een glimp opgevangen van dit paradox. Want het hotel kan nog veel lagen van oneindig aan! En daar kwamen ze al aan de volgende avond: oneindig veel ferry’s (f) vol met oneindig veel bussen (b) met uiteraard oneindig veel gasten (g). En ook deze kregen allen een plaats in het hotel in kamer 2g3b5f , het kamernummer voor zitje nr g in bus nr b op ferry nr f. Opnieuw spielerei met de unieke factorisatie met priemgetallen. Slaapwel iedereen en laat ze maar komen de volgende dimensies van oneindig! Hier schiet fantasie (oneindig veel containerschepen vol met oneindig hoog gestapelde ferry’s) en voorstellingvermogen al gauw te kort om het ware gelaat van oneindig te aanschouwen. Het hotel dat volgeboekt was blijkt oneindig veel kamers over te hebben.

Als het heelal echt oneindig is, komen die twee rechten dan effectief ooit elkaar tegen en gelden dan alle eigenschappen van Hilbert’s hotel ook voor het heelal? En nog een confronterende eigenschap heeft te maken met kansberekening, denk maar aan het verhaal van die aap die ooit Hamlet van Shakespeare zal schrijven wanneer hij oneindig lang aan een typemachine zit. Hoe groot is de kans dat er ergens een planeet bestaat die als twee druppels water op de aarde gelijkt? Heel enorm klein? Geen probleem voor een oneindig heelal: het zal toch bestaan. En op die planeet wonen toevallig dezelfde mensen als hier op aarde? Kleine kans? In een oneindig heelal zal het toch bestaan, je kan jezelf tegenkomen. Dat vind ik een zeer speciaal gevolg van een oneindig heelal, het komt er in feite op neer dat als het kan, het ook zal zijn. Als het kan, dan is het. Descartes revisited: ‘ik kan dus ik ben’.

Dat zou ik echt zo verbazingwekkend vinden dat ik het toch maar hou op een eindig heelal. Wat ook bijzonder is want dan bestaat er ergens een getal waarmee we alle, pakweg, elektronen, kunnen tellen. Misschien een waanzinnig groot getal, een onvoorstelbaar krankzinnig groot getal. Maar ook dat is relatief, wat hoe groot dat getal ook is, je kan het in gedachten altijd groter maken. Je kan het getal bij zichzelf optellen. Herhaald optellen is vermenigvuldigen, herhaald vermenigvuldigen is kwadrateren, herhaald kwadrateren wordt een tetratie genoemd. En dit spelletje kan oneindig verder gaan, want ook een tetratie kan je herhalen en ga zo maar door… tot zover je wil! Zo komen we tot duizelingwekkende grote getallen. Er bestaan getallen die niet te vatten zijn zonder dat je een zwart gat zou creëren van je hoofd van alle informatie die bijeen zit. TREE(x) is zo’n functie die naar adem doet happen. TREE(1)=1 en TREE(2)=3, maar TREE(3) is zo kolossaal groot dat er onvoldoende (zichtbaar) heelal is om het weer te kunnen geven. Het is zo waanzinnig groot dat ook wiskundigen onvoldoende adem hebben om de waanzinnige grootte van het getal te benoemen, maar het is zeker niet oneindig!

En dan, dames en heren, zijn we nog verreweg van oneindig. Hoe groot TREE(3) ook is, in vergelijking met oneindig is het quasi nul. Ik zei het al: een heel vreemd beestje.

Oneindig goed, al goed.

TREE(googolplex) groeten,

T.E.

De puntjes op de i van de wetenschappelijke methode

Willens nillens hebben we onze oren moeten spitsen in de richting van wetenschappers die ons hebben geadviseerd in het nemen van maatregelen tegen de woekerende pandemie. Diezelfde wetenschappers hebben het vertrouwen in hen niet geschaad door op de proppen te komen met een verlossende oplossing in de vorm van een vaccin. Een uitgelezen moment om de loftrompet te steken over deze wetenschappers en meer algemeen over de wetenschappelijke methode die zij hanteren. Tijd om, in deze post-truth-era waarin de eerste beste social-media amateur-commentator overloopt van zelfzekerheid terwijl de experts volop twijfelen, de puntjes van de wetenschappelijke methode nog eens op de i te zetten.

Meer en meer lijkt iedereen over alles z’n mening klaar te hebben. Dat kan een positieve zaak zijn wanneer deze mening enigszins onderbouwd is, maar veelal blijkt de betreffende mening een product van de onderbuik te zijn. Een holle excretie die niet gehinderd werd door enige kennis ter zake. Het wordt nog driester wanneer blijkt dat sommigen zich ook over feiten een mening denken te moeten vormen. Het poneren van een wetenschappelijk feit lijkt tegenwoordig veel van z’n potentieel om een discussie in een definitieve plooi te leggen te zijn verloren, want de miniemste onzekerheid in het bouwwerk der wetenschap wordt naar voor geschoven om dit bouwwerk te laten instorten. Ten onrechte, want die twijfel is juist de cement waarmee de gehele wetenschap is opgebouwd.

Graag wil ik van de gelegenheid gebruik maken om theoretisch natuurkundige Carlo Rovelli te citeren. Hij verwoordt de wetenschappelijke methode uitstekend: “Het wetenschappelijk denken onderzoekt de wereld en overdenkt haar opnieuw, ze verschaft ons steeds betere beelden van de wereld en leert ons om er op doeltreffender wijze over na te denken. De wetenschap is een voortdurende exploratie van vormen van denken. Haar kracht is haar visionaire vermogen om vooropgezette ideeën omver te werpen, om nieuwe gebieden van de werkelijkheid te ontsluiten en om nieuwe en effectievere beelden van de wereld te construeren. De onzekerheid waarin we leven, de onbestendigheid die boven de afgrond zweeft van onze immense onwetendheid, maakt het leven niet zinloos, maar juist zeer waardevol.”

Wat me vooral aanspreekt is het bescheiden karakter van het wetenschappelijk denken over z’n eigen denkbeelden. De wetenschap levert ons geen zekerheden, ook al wordt dit soms graag zo voorgesteld. Ze is niet betrouwbaar omdat ze zekere antwoorden geeft, maar is betrouwbaar omdat ze de beste antwoorden verschaft die we op dit moment hebben. Juist het feit dat ze zelf de kennis voortdurend in twijfel trekt garandeert ons dat de antwoorden die ze geeft de beste zijn die ons ter beschikking zijn. Toen Einstein ontdekte dat de wetten van Newton niet helemaal klopten was dat op geen enkele wijze een blaam voor de wetenschappelijke methode, maar in tegendeel het bewijs dat de wetenschap effectief in staat is om de beste mogelijke antwoorden altijd opnieuw in vraag te stellen, zelfs wanneer deze voortvloeiden uit een monument als Newton, met een theorie die heel lang het beste antwoord was op vragen over zwaartekracht.

Kan de wetenschap alles verklaren? Bijlange niet. Nog niet, maar evengoed misschien zelfs nooit. Maar waarom zouden we niet niet blijven zoeken?

Wetenschap is het beste antwoord. Niet meer. Maar ook niet minder.

De beste groeten, niet meer, maar ook niet minder.

T.E.

Over structuren en de perfecte boogvorm

De aanwezigheid van een bucolisch kabbelend beekje met wat keien en stenen, is voor veel mensen, waaronder mezelf, niet zozeer een aanleiding om mediterend de intrinsieke schoonheid van de natuurpracht tot zich te nemen, maar eerder een uitnodiging om deze natuurlijke elementen te gaan verbouwen tot een dam of, in casu, tot een oeververbindende boogbrug. Het gevecht tegen de zwaartekracht mondde daarna dan toch uit in een quasi oeverloze meditatie over de ideale boogvorm.

Waarom blijft de ene boog staan en stort de andere boog ter aarde? Om het antwoord op deze vraag te vinden beschouwen we de krachtwerking in een boog. Wanneer de boog is opgebouwd uit losse stenen zijn de enige krachten die doorgegeven kunnen worden drukkrachten tussen de stenen. In een geïdealiseerd model kunnen we stellen dat de richting van de kracht in de boog telkens precies evenwijdig moet zijn aan de vorm van de boog (een raaklijn van de boog). Daarenboven dient die kracht op ieder punt de resultante te zijn van de verticale kracht, afkomstig van het eigen gewicht van de ontwikkelde booglengte, en de horizontale drukkracht in de boog. Er is slechts één curve die erin slaagt om dit huzarenstukje tot een goed einde te brengen. Maar we maken eerste een zijstap naar een analoge situatie waar de drukkrachten trekkrachten worden.

De unieke eigenschap van de perfecte boog waarin enkel drukkrachten spelen heeft z’n analogie in de kettinglijn waar enkel trekkrachten mogelijk zijn. Dit zorgt ervoor dat de kettinglijn het perfecte spiegelbeeld is van de gezochte boogvorm. Anders dan bij een boog dient zij niet in de juiste vorm gebouwd te worden, maar valt deze automatisch in de juiste vorm, dankzij de zwaartekracht. Dit is een toestand van minimale potentiële energie, dat is een professionele uitdrukking voor iets dat gewoon hangt te hangen of gevallen is. Gaudi heeft handig gebruik gemaakt van deze analogie door te steunen op een model met hangende touwen voor het ontwerp van z’n Sagrada Familia.

Het antwoord op de perfecte boogvorm vinden we bijgevolg door een blik te werpen op de vorm van een kettinglijn. Deze vorm vinden we terug bij halskettingen of hoogspanningskabels. Aan de lezer de keuze welke van beide hij aandachtig wenst te bestuderen. Al heel wat befaamde wetenschappers hebben hun tanden stuk gebeten op het bepalen van de exacte curve van de kettinglijn. Zo veronderstelde Galileo dat dit een parabool betrof, al wist hij dat het eigenlijk een benadering betrof (het idee van heliocentrisme had hij wel goed). Het was Jakob Bernoulli die op het einde van de 17de eeuw enkele wiskundigen uitdaagde om de juiste vorm exact af te leiden en uiteindelijk werd de oplossing in 1691 gepubliceerd door Christiaan Huygens, Gottfried Leibniz en Johan Bernoulli. Driewerf hoera voor deze heren! Maar welke formule schuilt nu achter de kettinglijn? Onze zoektocht zal nu even in wiskundewonderland passeren, maar eerst willen we ons verwonderen over de kroonzaal van het paleis in het historische Ctesiphon (huidige Irak), waarvan de vorm van de boog een bijna perfecte kettinglijn is, en dat is meteen de verklaring waarom deze constructie nog steeds overeind staat (zie afbeelding hieronder). Een knap staaltje Perzische engineering uit de 3de eeuw, van lang voor de tijd van de heren Huygens, Leibniz en Bernoulli.

In de onderstaande figuur is een stuk kettinglijn beschouwd tussen punt A en B. In punt A is er enkel een horizontale kracht T0 aanwezig want de raaklijn aan de curve in het laagste punt is horizontaal. In het punt B is de trekkracht T rakend aan de curve. De horizontale component van de kracht is T0 en de verticale component is gelijk aan het gewicht van de ketting tussen A en B. Waarbij λ de massa is per kettinglengte, g de valversnelling en s de booglengte tussen A en B. Hieruit volgt dat de verticale component in het punt B gelijk is aan λgs. Hierdoor kan er een uitdrukking gevonden worden voor de tangens van de hoek θ, dat wiskundig gezien ook gelijk is aan de afgeleide van de curve:

Als we de verhouding van de horizontale kracht en het gewicht per lengte voorstellen door een parameter a:

kunnen we het verband tussen de booglengte s en de helling van de curve op de volgende manier noteren:

Het afleiden van bovenstaande uitdrukking naar x geeft het verband tussen de kromming van de curve en de toename van de booglengte in de x-richting.

Fysisch betekent het dat een toename van de booglengte, dus van extra gewicht zal aanleiding geven tot een kromming van de curve, dat is logisch want de verticale component van de trekkracht wordt telkens groter bij toenemende booglengte, waardoor een kromming ontstaat gezien de horizontale kracht constant T0 blijft.

Dit lijkt nog een redelijk eenvoudige uitdrukking, maar de booglengte moet nog uitgedrukt worden in functie van x en y. We maken dankbaar gebruik van de stelling van Pythagoras (toegpast op ds, dx en dy) en vinden een differentiaal vergelijking die opgelost moet worden om de ware aard van de kettinglijn te ontrafelen:

Vooraleer we de oplossing uit onze toverhoed halen, kunnen we nog even de vergelijking nader beschouwen. Wanneer de helling heel groot wordt (bij grote waarden van x) zal de vergelijking zich vervellen tot een eenvoudige eerste orde differentiaalvergelijking waarbij de oplossing een exponentiële functie is, maar voor grote negatieve waarden van x moet dit ook zo zijn, want de kettingfunctie is immers symmetrisch. Zou het dan zo eenvoudig zijn dat het resultaat het gemiddelde is van een positieve en een negatieve exponentiële functie? Inderdaad! En de som van deze exponentiële functies kan ook geschreven worden als een cosinus hyperbolicus.

Dus hoogspanningskabels, halskettingen en touwen hebben allemaal de vorm van een cosinus hyperbolicus. (De naam hyperbolicus is trouwens een gevolg van de mogelijkheid om een hyperbool te beschrijven door parametrisatie met hyperbolische functies, analoog aan de parametrisatie van een cirkel met sinus en cosinus) En bijgevolg is de perfecte boog ook een omgekeerde cosinus hyperbolicus, waarbij de parameter a de verhouding van de horizontale drukkracht en het gewicht van de booglengte is. Hoe groter de horizontale drukkracht hoe platter de boog.

Maar als de kracht in de boog varieert, varieert ook de spanning van in het materiaal. Daarom zien we in de praktijk veel boogbruggen die massiever zijn aan de steunpunten dan in het midden. Maar hierdoor verlaten we de wiskundige voorwaarden om te komen tot een kettinglijn. Een bekend voorbeeld van een ‘gewogen kettinglijn’ is de 192 m hoge Gateway Arc in St. Louis (hieronder afgebeeld). Het is een ‘afgeplatte kettinglijn’ omdat het gewicht per booglengte niet constant is.

Is de vorm van de kabel van een kabelbrug dan misschien een kettinglijn? Dat zou logisch lijken. Maar ook hier is het gewicht niet gelijk verdeeld over de lengte van de boog omdat het wegdek dat relatief gezien veel zwaarder is dan de kabel hangt aan de kabel. Hierdoor zal de kabel de vorm krijgen van een parabool en niet van een kettinglijn. Maar wanneer de kabel bij constructie wordt opgehangen zal deze wel een kettinglijn vormen. Naarmate het brugdek wordt gebouwd evolueert de kabel zich tot een parabool.

Kettinglijnen hebben soms onverwachte toepassingen. In het minder voor de hand liggende geval van voertuigen met vierkante wielen is het aangewezen om deze te laten rijden op een wegdek dat precies de vorm heeft van opeenvolgende kettinglijnen. Dit wordt hieronder geïllustreerd door een prof die met vierkante wielen over een wegdek rijdt dat opgebouwd is uit kettinglijnen. Hij rijdt zonder schokken want de wielassen volgen een horizontale lijn.

Een ruimtelijke figuur die wordt bekomen door een kettinglijn te roteren rond de x-as wordt een catenoïde genoemd. Een speciale eigenschap van een catenoïde is dat het een minimaaloppervlak is, wat betekent dat een catenoïde het minste oppervlak nodig heeft om de gegeven randvoorwaarden te verbinden in de ruimte. Een zeepbel gevormd tussen twee cirkels is een mooi voorbeeld hiervan.

Een ander voorbeeld van een catenoïde is de vorm van het beschermdoek van sommige trampolines met cirkelvormige randen boven en onder. Dit ontdekte ik toen ik een aantal dagen geleden vanuit de tuin van de buren even verder naar mijn eigen tuin keek en me plots de vorm van het beschermingsdoek opviel. Dit gebeurde juist op het moment dat ik aan het vertellen was dat ik iets wou schrijven over bogen en kettinglijnen! Soms is het echt verrijkend om eens iets vanuit een ander perspectief te bekijken. En dat is wellicht niet enkel geldig voor trampolines…

hyperbolische groeten,

T.E.

De vogels in de lucht

Het overkomt iedereen wel eens dat je ouders plots daar staan met souvenirs uit het verleden. Cursussen en toetsen vanuit je schooltijd. Het lijkt te komen uit een ander leven. Maar er was een tijd dat je die toetsen hebt gemaakt, dat je hebt gezwoegd aan al die knutselwerkjes en dat je die cursussen al dan niet met veel ijver hebt doorploegd om de kennis ervan af te kunnen vinken in je tocht naar volwassenheid en wasdom. Tussen al die papieren vond ik ook het onderstaande kaartje, met excuses uit het verleden van mijn 8-jarige zelf over de werkwoordsfout.

Ik vermoed dat ik het gemaakt heb in de tijd van mijn eerste communie gezien de religieuze inslag. Ik let nog dagelijks op de vogels in de lucht. Op de fantastische manier waarop zij ontwikkeld zijn tot vliegende dieren, geoptimaliseerd in alle opzichten om met een minimum aan energie door de lucht te klieven.

Dat ze niet zaaien en niet maaien. Dat staat er ook op het kaartje. Dat zaaien en maaien is natuurlijk iets waar wezens hogerop op de evolutionaire ladder zich mee bezighouden. Zaaien ze niet een klein beetje wanneer ze zaadjes van plantjes eten en die dan ergens via de stoelgang droppen, zodat de planten zicht verspreiden? En maaien ze ook niet een klein beetje wanneer ze takjes zoeken voor hun nestje? Nee? Wellicht is dat te ver gezocht en moet de wereld voor een 8-jarige niet te complex gemaakt worden.

Maar dat hoeft ook helemaal niet, ze moeten helemaal niet zaaien en maaien. Ze worden gevoed door de hemelse Vader. Chill en relax dus voor al het gevogelte. Er wordt voor hen gezorgd. Wel ja, ze krijgen het uiteraard niet op een bordje voorgeschoteld. Ze moeten het nog altijd zelf verzamelen, en ook zelf duizenden kilometers naar het zuiden vliegen wanneer het eten hier op is. Ja, dat is toch wel een kleine moeite, niet? Ze kunnen vliegen, dus het zou maar kleingeestig zijn als ze daarover zouden zeuren. De wormen en de insecten zijn er in overvloed, ze moeten enkel naar binnen gespeeld worden. Easy-peasy, lemonsqueezy!

Maar uiteraard heeft de achterliggende boodschap niets met vogels te maken. Het heeft alles te maken met het feit dat je moet vertrouwen. In een hemelse Vader, volgens het kaartje. Ik ben zo benieuwd van wat ik er echt over dacht toen ik 8 was. Gelukkig ben ik niet gestopt met nadenken en studeren. Het zou een gevolg kunnen zijn van de tekst op het kaartje. Waarom moeite doen? Let eens op de vogels, strevers aller landen! En stop met werken. Vlieg er op uit!

Gevleugelde groeten,

T.E.

Ook voor Coronavirus-data geldt dat een getal meestal begint met het cijfer 1, 2 of 3, de wet van Benford volgend

Als je de lijst van Corona-besmettingen per land overloopt valt het je niet meteen op, maar de meeste getallen beginnen met 1, 2 of 3. En dat is toch bizar, want we hebben toch 9 mogelijkheden voor het eerste cijfer, met bijhorende kans van 1 op 9 (11%) Klopt niet. En er is meer: bijna alles om ons heen volgt deze wetmatigheid: de kans dat een getal begint met ‘1’ is 30%, de kans op een 9 slechts een kleine 5%. Neem maar de proef op de som en turf de getallen in je krant: je zal zien dat meer dan de helft van de getallen start met 1, 2 of 3. Ik vind dit waanzinnig! Het is de fysische wereld die spartelt in het keurslijf van ons positiestelsel.

2020-03-08 09_29_53-Benford.xlsx - Excel

Ik poneerde dit gisteren bij een vriend en we namen samen de proef op de som: we namen de krant en ik turfde het aantal keer dat een getal met een bepaald cijfer begon. En na enkele pagina’s van De Tijd doorploegd te hebben op zoek naar getallen was het overduidelijk: hoe hoger het cijfer hoe minder kans dat het een startcijfer is. Hieronder de uitslag waaruit overduidelijk blijkt dat de kans op het eerste cijfer niet gelijk verdeeld is.

turven De Tijd

We hebben daarna zowel het aantal inwoners als de oppervlakte van elk land op de zelfde manier geanalyseerd en we komen tot de zelfde verrassende vaststelling dat het cijfer 1 het meest voorkomt of het nu gaat over een aantal inwoners of een oppervlakte. Het maakt zelfs niet uit in welke eenheid de oppervlakte wordt beschouwd vierkante km, vierkante mijl, hectares,… de uitkomst zal eenzelfde beeld geven.

opp inwoners per land - benford

Ook ik vond dat op het eerste zicht verrassend en zelfs verbluffend: hoe is het mogelijk? Het fenomeen blijkt beschreven te zijn door de wet van Benford, en dat is wat wikipedia ons vertelt:

De wet van Benford beschrijft de frequentieverdeling van het begincijfer van getallen in grote dataverzamelingen waarin een beperkte mate van stochasticiteit optreedt. De wet van Benford werd in 1881 ontdekt door de Amerikaanse wiskundige en astronoom Simon Newcomb, maar kreeg grote bekendheid door de herontdekking en publicaties in 1938 van Frank Benford, een fysicus die zijn hele leven bij het Amerikaanse bedrijf General Electric heeft gewerkt.”

De wet van Benford drukt op volgende wijze uit wat de kans is op een startcijfer ‘d’:

Toegepast op het cijfer ‘1’ geeft dit:

d 1 2 3 4 5 6 7 8 9
kans (%) 30,1 17,6 12,5 9,7 7,9 6,7 5,8 5,1 4,6

Hoe kunnen we dit verklaren? Er lijkt niet echt een eenvoudige wiskundige verklaring te zijn. Wat we wel kunnen aantonen is dat als we een frequentieverdeling beschouwen van de startcijfers die onafhankelijk moet zijn van de gebruikte eenheid, we op een logaritmische frequentieverdeling komen, zoals hierboven beschreven.  Concreet wil dat zeggen dat we er van uitgaan dat de eenheid voor bepaalde grootheden geen invloed heeft op het resultaat. Want het is de mens die heeft uitgevonden hoelang een meter is. Daar kan de natuur of de werkelijkheid der dingen zich niets van aantrekken.

Eens je beseft dat het switchen van de ene eenheid naar een andere in feite een vermenigvuldiging is, kan je het fenomeen begrijpen door er een cirkelvormige rekenlat bij te halen. Jammer genoeg heb ik er geen in bezit, maar op een Breitling Navitimer zijn de buitenste rijen getallen die je kan verdraaien ten opzichte van elkaar eigenlijk een rekenlat. Wat kan je daarmee doen? Getallen vermenigvuldigen door te draaien, zie ook: De geheimen van grootvaders rekenlat. Graag breng ik je aandacht op het feit dat meer dan de helft van de cirkel getallen zijn die beginnen met een 1, 2 of 3. Dus hoe meer we willekeurige getallen gaan vermenigvuldigen hoe meer we zullen voldoen aan de wet van Benford. En we moeten hierbij ook opmerken dat we meeste natuurwetten gebaseerd zijn op een vermenigvuldiging, denk maar aan F=ma, de gravitatiewet, wetten van Maxwel,…

Breitling-Navitimer-Rattrapante.--600x406

Een test die je eenvoudig zelf kunt doen is willekeurig gekozen getallen A, B en C vermenigvuldigen op een rekenmachine en turven wat de frequentieverdeling is van uitkomst AxBxC, en na een tijdje zal de wet van Benford zich aan je openbaren: cijfer 1 zal beduidend meer voorkomen dan de andere cijfers.

Geldt de wet voor alle reeksen van getallen? Nee, dat ook weer niet. Om dergelijke verdeling te hebben moeten de gegevens over meerdere grootte-ordes gespreid zijn. Dus de lengtes van personen vallen hier bijvoorbeeld niet onder. Ook een lijst van hoogste bergtoppen niet, maar een lijst van alle bergen op aarde dan weer wel.

Het is contra-intuïtief omdat het het begrip ‘ad random’ een beetje op z’n kop zet. Als je getallen door een computer ad random laat bepalen dan zullen ze niet aan de wet van Benford voldoen. Het zijn dan ook geen werkelijke dingen die gemeten of geteld kunnen worden, maar enkel een getal genomen uit een verzameling van getallen, zoals een lotto-trekking. Als je op een bepaald moment een aantal gegevens moet verzinnen, b.v. facturen of in een wetenschappelijk onderzoek, kan je maar beter zorgen dat deze voldoen aan de wet van Benford. Want je zou niet de eerste fraudeur zijn die tegen de lamp loopt doordat z’n data zo verzonnen is dat alle startcijfers gelijk verdeeld voorkomen.

Tot slot terug naar het Corona-virus. Een prachtig voorbeeld van exponentiële groei in de huidige fase. Zie ook: Dromen over het getal e. Wanneer je een bedrag laat opbrengen op de bank zal het totaal bedrag groeien. Maar om van 100 euro naar 200 euro te groeien moet het bedrag verdubbelen (groei: 50%), maar daarentegen om te groeien van 800 euro naar 900 euro hoeft het bedrag maar te groeien met 12,5%. Daarom blijft het totaalbedrag langer ‘hangen’ tussen 100 en 200 euro en groeit het sneller door van 800 naar 900 euro. Wat we terugvinden in de frequentieverdeling van alle bedragen die op de bank staan, daarvan zal 30% ook starten met een ‘1’ ! Ook voor het aantal Corona-besmettingen is het een verdubbeling om van 1000 naar 2000 besmettingen te gaan, maar slecht een kleine groei om van 8000 naar 9000 besmettingen te gaan. En dat raakt volgens mij de ziel van deze mooie wetmatigheid.

Getallen die de Benford-wet volgen zijn echt en staan met beide voeten in de werkelijkheid.

Het is op dit moment (begin maart 2020) nog koffiedik kijken hoeveel het maximale aantal besmettingen per land zal zijn, maar één ding weten wel wel: het zal voldoen aan de wet van Benford.

En in tijden van onzekerheid, is dit misschien een lichtpuntje.

Benford-verdeelde groeten aan iedereen,

T.E.

Tijd voor een spelletje Dobble! Maar wacht eens… hoe zit dat in elkaar?

Dobble. Zeggen dat je zenuwen gesloopt worden is misschien overdreven, maar je zenuwen worden toch serieus onder druk gezet. (Zoveel bouwkundige uitdrukkingen in ons dagelijks leven waar je op kunt bouwen!) Je hebt kaarten met daarop 8 verschillende symbolen en elke twee kaarten hebben slechts één gemeenschappelijk symbool. En dat moet je natuurlijk zo snel mogelijk in de mot hebben om te winnen. En kinderen kunnen er verduiveld goed in zijn. Maar wacht eens even… stel dat je meer of minder symbolen per kaart hebt… papa moet even iets gaan opzoeken, meisjes!

dobble

En ja… net wat ik dacht. Er bestaat een formule dat aangeeft wat het maximale aantal kaartjes is dat je kan maken met een bepaald aantal symbolen op je kaart. Voor een zeer eenvoudig geval van 2 symbolen per kaart kan je gemakkelijk uitzoeken dat het maximaal aantal kaarten 3 is. Stel dat de symbolen A, B en C zijn, dan zul je 3 kaartjes hebben: AB, AC en CB. Ieder kaartje heeft inderdaad slechts één gemeenschappelijk symbool. We kunnen dus al stellen dat 2 symbolen –> 3 kaartjes. Hieronder een grafiek waarop de kaartjes zijn weergegeven en de lijnen tonen aan welke symbool de kaarten gemeenschappelijk hebben.

IMG_20200207_0004

De grafiek heeft de volgende eigenschappen (lijnen staan voor symbolen, kaarten zijn de snijpunten):

  • Gelijk welke twee kaarten zijn telkens verbonden met één lijn (dat zorgt er voor dat er tussen elke twee kaarten een gemeenschappelijk symbool is)
  • Gelijk welke twee lijnen snijden slechts in één kaart (zorgt ervoor dat er slechts één gemeenschappelijk symbool is)

So far so good, maar wat met 3 symbolen per kaart? Hoeveel verschillende symbolen en dus hoeveel kaarten kan je nu maken? Laten we maar direct proberen een grafiek te maken waar elke kaart het kruispunt is van 3 lijnen (3 symbolen per kaart)… In de grafiek staan 4 kaarten en we maken gebruik van 6 symbolen A tot F.

IMG_20200207_0005

Maar we kunnen met 3 symbolen verder gaan dan 4 kaarten, hieronder een grafiek van het maximaal mogelijke aantal kaarten met 3 symbolen. Ook hier geldt dat alle twee kaarten verbonden zijn met een lijn, en dat 2 lijnen slechts op één punt snijden. En inderdaad, niemand zei dat het rechte lijnen moesten zijn hé. Vervang de letters door leuke tekeningen en je kan al een zeer eenvoudige Dobble-spel samenstellen van 7 kaarten met telkens 3 symbolen op de kaart.

IMG_20200208_0001

Dus met 2 symbolen per kaart vinden we een maximum van 3 kaarten en 3 verschillende symbolen. En met 3 symbolen vinden we maximum 7 kaarten en 7 verschillende symbolen: ABC, CFG, CDE, BEG, AEF, BDF en ADG. Het spreekt misschien iets meer aan met echte symbolen en mooie kleurtjes:

fano-plane.png

Het kan wiskundig aangetoond worden dat als we r symbolen per kaart kiezen het totaal aantal kaarten N (en ook het totaal aantal verschillende symbolen) gelijk is aan:

Dit lijkt inderdaad te kloppen voor r=2, dan wordt N=3. Bij r=3 vinden we dat N gelijk is aan 7. Deze ‘Dobble’-formule blijft geldig voor hogere waarden van r. Maar het maken van de grafiek wordt dan steeds wat complexer. stel nu dat we r=4 nemen, dan krijgen we een totaal van N=13, een bijhorende grafiek vind je hieronder. De zwarte punten staan voor de 13 kaarten en de 4 lijnen die er snijden stellen de symbolen voor, hier voorgesteld als 13 verschillende kleuren.

SymmetricalProjectivePlaneOrder3

En zo kunnen we verder gaan en voor r=5 vinden we N=21.

21lines

En voor 8 symbolen per kaart, zoals bij het Dobble-spel vinden we N=57. Ook hiervan heb ik een grafische weergave gevonden, je kan zien dat voor kaart 1 helemaal in het midden er 8 lijnen samenkomen.

pporder7

Maar wat merken we op als we de kaarten van Dobble tellen? Weliswaar 57 verschillende symbolen, maar slechts 55 kaarten! Dit wil zeggen dat er nog 2 unieke kaarten kunnen aangevuld worden aan het spelletje Dobble. Welke precies? Daar ben je ook al snel een avondje mee zoet denk ik.

Waarom 55 kaarten en niet 57? Dat is geen complot of vergetelheid denk ik, maar gewoon optimalisatie bij het drukken. Bij een gewoon spel speelkaarten stel je ook vast dat er naast de 52 kaarten (13×4) ook nog 2 jokers bijzitten en nog een instructie-kaart, wat het totaal brengt op 55 kaarten, die netjes in 11 rijen van 5 kaarten voorbij zoeven in de drukkerij… Ja, we eindigen gewoon met boerenverstand en de tafel van 5.

Tot zover een spelletje Dobble spelen met papa…

Aan iedereen unieke groeten,

T.E.

 

Priemgetallen staan in voor uw veiligheid… voorlopig althans

In 1977 werd door de heren Ron Rivest, Adi Shamir en Len Adleman een asymmetrisch encryptiealgoritme (de RSA encryptie) ontworpen , dat gebaseerd is op het ontbinden in factoren van grote getallen. Het is namelijk zeer gemakkelijk om getallen te vermenigvuldigen, maar het duurt eeuwig om deze getallen opnieuw te ontbinden in z’n factoren. Als deze twee getallen priemgetallen zijn dan is er maar één ontbinding mogelijk. Het is een mooi voorbeeld van hoe op het eerste zicht nutteloze wiskunde (de zoektocht naar zeer grote priemgetallen) toch de mensheid ten dienste kan zijn. De afkorting RSA is afkomstig van Rives-Shamir-Adleman: hieronder vrolijk samen op een graspleintje.

RSA

Wie al eens het moedige idee gehad heeft om een puzzel van meer dan duizend stukjes in elkaar te puzzelen zal beamen dat het proces van duizend stukjes naar puzzel veel langer duurt dan wanneer je op het einde de puzzel omzet naar duizend stukjes en de hele poespas weer in de doos kiepert in afwachting tot iemand anders op het idee komt om de stukken terug samen te puzzelen tot één of andere Oostenrijkse bungalow met een overdaad aan bloemen. Althans zo herinner ik me dergelijke puzzels. Hetzelfde geldt voor het ontbinden van het product van twee grote priemgetallen. Je kan in een fractie van een seconde het product maken, maar de ontbinding duurt jaren, en dat principe is zeer handig om een asymmetrische versleuteling te ontwerpen.

Wanneer ik mijn huis verlaat gebruik ik een sleutel om naar buiten te gaan. Wanneer ik na een tijdje weer naar binnen wil gebruik ik diezelfde sleutel. Het feit dat we voor beide richtingen (naar buiten en naar binnen) dezelfde sleutel gebruiken zorgt ervoor dat we in een symmetrische situatie zitten. Wanneer je echter een andere sleutel zou nodig hebben om weer naar binnen te komen dan is er sprake van asymmetrie. Zo’n systeem heeft meestal een publieke sleutel en een privé sleutel. Een publieke sleutel betekent dat iedereen de manier weet om een boodschap te versleutelen, maar dat alleen de ontvanger de manier weet om die versleutelde boodschap terug te brengen naar de oorspronkelijke boodschap.

Een uitleg over encryptie kan in feite niet zonder Alice en Bob op te trommelen die een boodschap willen uitwisselen, die niet onderschept mag worden door Eve! Bij een asymmetrische encryptie zal Bob een publieke sleutel aan Alice geven waarmee zij een boodschap kan versleutelen. Doordat deze sleutel publiek is kan Eve deze sleutel onderscheppen, maar ze kan deze sleutel niet gebruiken om de boodschap te ontcijferen. Dat kan alleen Bob, want hij beschikt over een private sleutel die hij met niemand heeft gedeeld, waarmee hij de boodschap kan decoderen. Superhandig want Alice en Bob kunnen zonder geheime sleutels aan elkaar te geven toch boodschappen uitwisselen, die Eve niet kan ontcijferen. In feite moet ik zeggen: nog niet kan ontcijferen…

Alhoewel de RSA-versleuteling met de huidige snelheid van traditionele computers bijna onmogelijk gebroken kan worden omwille van de enorme rekentijd die nodig is om een zeer groot getal te ontbinden in factoren, is het niet ondenkbeeldig dat er in de toekomst wel degelijk manieren zullen gevonden worden om de RSA-versleuteling toch te kunnen breken. Kwantumcomputers zouden over een paar jaren de klus kunnen klaren in enkele uren waar de klassieke computers eeuwen voor nodig hebben.

Dan kunnen we al vermoeden wat de de geheime informatiediensten van veel landen aan het doen zijn: massaal veel data in z’n versleutelde toestand opslaan totdat het moment komt dat de kwantumcomputers ver genoeg ontwikkeld zijn en er een algoritme zal gevonden worden worden om op relatief korte tijd zeer grote getallen te kunnen ontbinden… Hoog tijd dat er een andere ogenschijnlijk onnuttige tak van de wiskunde van het rek wordt gehaald om een nieuwe manier te vinden om boodschappen te versleutelen.

Gedecodeerde groeten,

T.E.

 

 

Het theorema van Bayes en de NIPT-test

In de EOS van september 2019 las ik de column ‘Nipte cijferverwarring’ van Hetty Helsmoortel over de NIPT-test, een test om een Down-zwangerschap op te sporen. Zonder hier evenwel in te gaan op het maatschappelijk debat over deze NIPT-test, is het een mooi voorbeeld over het verrassende karakter van de uitkomst van het theorema van Bayes. Anders dan bij Hetty zullen we hier even dieper ingaan op de toepassing van Bayes, en wellicht zal er ook een formule tevoorschijn komen. Hopelijk zien we elkaar op het einde van dit stukje terug, en ben je niet blijven haperen aan de formule.

Nipte cijferverwarring

Update. Zo zou je het theorema van Bayes met één woord kunnen samenvatten. Er is een gebeurtenis waardoor je kennis over iets een update krijgt. In het geval van de NIPT-test heb je als zwangere vrouw een bepaalde kans op een Down-zwangerschap, dat wordt de a-priori-kans genoemd. De NIPT-test heeft uiteraard als doel om uitsluitsel te krijgen over een Down-zwangerschap, maar helaas brengt deze geen 100% zekerheid, maar het zal de kennis over de waarschijnlijkheid wel sterk verhogen, en resulteren in een a-posteriori-kans.

Een feilloze test zou je in één klap zekerheid bieden. Een positieve test zou betekenen dat de kans op een Down-zwangerschap 100% is, en wanneer je negatief test zou het uiteraard ook helemaal zeker zijn dat er geen Down-zwangerschap is. Maar helaas bestaat zo’n test niet. Wat betref de NIPT-test heb je 99,2% kans dat je postief test bij een Down-zwangerschap, dat wordt de sensitiviteit genoemd. Het is de kans op een postieve test (POS) op voorwaarde dat er een Down-zwangerschap is (D), de voorwaardelijke kans wordt als volgt uitgedrukt, waarbij P staat voor probability:

P(POS|D)=0,992

Bij een voorwaardelijke kans kan je niet zomaar de argumenten omdraaien. De kans op een positieve test gegeven een Down-zwangerschap is niet hetzelfde als de kans op een Down-zwangerschap gegeven een postieve test. Zo is bijvoorbeeld ook de kans op regenweer gegeven dat je een paraplu bij je hebt helemaal niet dezelfde als de kans dat je een paraplu bij je hebt bij regenweer.

De specificiteit van een test is de kans dat je negatief test gegeven dat er geen sprake is van een Down-zwangerschap. Bij de NIPT-test is de specificiteit 99,9%. Dat kan al volgt symbolisch uitgedrukt worden, waarbij G staat voor ‘geen Down-zwangerschap’:

P(NEG|G)=0,999.

Hieruit volgt logischerwijs dat er 1 kans op 1000 is dat je positief test terwijl je geen Down-zwangerschap hebt (ook wel soms omschreven als de vals-positieven), dit kunnen we noteren als:

P(POS|G)=0,001.

In de column ‘Nipte cijferverwarring’ wordt beschreven dat iemand bericht krijgt dat ze positief getest heeft. Wetende dat de specificiteit en de sensitiviteit van de test respectievelijk 99,9% en 99,2% is, percentages die toch flirten met de 100% lijkt het op het eerste zicht een certitude te zijn dat de betreffende persoon effectief een Down-zwangerschap heeft, maar verrassend genoeg stond in de brief dat de voorspellende waarde van de test 50% bedroeg gezien haar leeftijd. Hoe valt dat te verklaren?

Nu komt de Bayesiaanse aap uit de mouw! Zoals gezegd heb je als je geen Down-zwangerschap hebt toch één kans op duizend dat je positief test (de vals-positieven, afgeleid uit de specifiteit van de test). Hoog tijd om een cruciaal ontbrekend element boven water te halen. Welke absolute kans is er op een Down-zwangerschap? We weten dat deze kans toeneemt met de leeftijd, voor personen tussen 25 en 30 jaar is deze kans 1 op 1000, bij hogere leeftijden loopt dit op tot een kans van 12 op 1000. Zonder formules kunnen we dus wel al zien dat de kans op een Down-zwangerschap bij pakweg 27 jarigen van dezelfde grootte-orde is als de kans op een vals-positieve test. En dat betekent inderdaad dat de kans op een Down-zwangerschap gegeven een positieve test ca 50% bedraagt.

Nu komt het moment om er toch even de formule van Bayes bij te halen, zodat het plaatje compleet wordt, de formule zal de kans geven op een Down-zwangerschap bij een positieve test P(D|POS) en we weten ondertussen dat dit geheel iets anders is dan de kans op een positieve test bij een Down-zwangerschap P(POS|D). Want ontvang je een positieve test dan ligt je interesse uiteraard bij P(D|POS), deze voorwaardelijke kans wordt als volgt berekend:

We merken op dat de formule van Bayes onderzoekt welk aandeel de correcte positieve testen heeft ten opzicht van alle positieve testen P(POS). De noemer geeft de kans weer op alle positieve testen, los van al dan niet aanwezigheid van een Down-zwangerschap, dit is een optelling van de kans op een correct positieve test P(POS|D)P(D) en de kans op een vals positieve test P(POS|G)P(G), wat leidt tot de volgende uitdrukking:

Gezien alle argumenten van het rechterlid gekend zijn, kunnen we de bovenstaande uitdrukking evalueren om de kans te ontdekken op een Down-zwangerschap gegeven een positieve NIPT-test:

Om het helemaal helder te maken kunnen we een tabel opstellen voor 1 miljoen personen, die zwanger zijn en behoren tot de leeftijdsklasse 25-30 jaar:

tabel bayes

Uit deze tabel zie je dat van alle 1991 postieve testen, er 999 vals-positief zijn. En dat de kans op een Down-zwangerschap bij een postieve test dus 992/1991=0,498… is.

En hier zien we dus inderdaad dat deze kans ca. 50% bedraagt. Misschien op het eerste gezicht verrassend, maar na het lezen van dit stukje hopelijk een stuk helderder.

Specifieke, maar ook zeer sensitieve groeten,

T.E.