Komt een man bij de dokter… zo beginnen wel meer verhaaltjes. En zo begint ook het verhaal waarmee we de deur van de Bayesiaanse wereld op een kiertje willen zetten om het licht van het theorema te laten schijnen op ons denken. Een verhaal over hoe we onze beslissingen moeten bijsturen, en onze kansen kunnen updaten wanneer er nieuwe feiten bekend zijn.

bayes t-shirt

Komt een man bij de dokter en krijgt te horen dat hij lijdt aan een gevaarlijke ziekte waarbij hij binnen de dag zal sterven. De man is uiteraard nogal verbouwereerd en vraagt aan de dokter of hij het echt zeker is. De dokter leest nog eens de bijsluiter van de test: “… bij personen die de ziekte hebben, reageert de test in gemiddeld 99% van de gevallen op de ziekte door een positieve uitslag; bij personen die de ziekte niet hebben, is de kans 2% dat de test (ten onrechte) een positieve uitslag heeft…” ’s Mans moed is helemaal in ’s mans schoenen gezakt bij het horen van deze onheilspellende percentages. Hij is ervan overtuigd dat z’n laatste uren geslagen zijn.

Gelukkig bestaat er een medicijn dat de ziekte kan genezen. Het medicijn heeft echter het nadeel dat het perfect doeltreffend is wanneer de ziekte aanwezig is, maar bij afwezigheid van de ziekte is het medicijn instant dodelijk. Dat zijn zo van die medicijnen die je dus beter uit het bereik van kinderen houdt. Doet de arme man er goed aan van zo snel mogelijk het medicijn te nemen, zodat de ziekte niet kan leiden tot z’n veel te vroege dood? Hij doet er alleszins goed aan van zich in z’n vermeende laatste levensuren te verdiepen in wat basistheorie over kansrekening, voorwaardelijke kans en het theorema van Bayes.

De kans op iets is altijd kleiner dan 1. Het is de verhouding tussen het aantal keren dat iets gebeurt en het totaal aantal gebeurtenissen. Als er wordt gezegd dat er 50% kans is op kop bij het opwerpen van een munt, dan is de kans op kop 0,5. Het is maar een aanname, maar in de statistiek wordt dat als volgt genoteerd:

De kansen die de dokter opgeeft, zijn allebei voorwaardelijke kansen. Dat is een kans dat iets gebeurt gegeven een andere gebeurtenis. De kans op een positief testresultaat, gegeven dat je ziek bent is 0,99. Dit wil zeggen dat bij 100 mensen die ziek zijn er 99 positief zullen tekenen.

De man in kwestie is in feite vooral geïnteresseerd in de kans dat hij ziek is, gegeven dat er een positieve test is. En hier komt de formule van Bayes op de proppen, die het verband geeft tussen de voorwaardelijke kansen P(ZIEK|POS) en P(POS|ZIEK):

De dominee Thomas Bayes vond dit zelfs iets te triviaal om er over te publiceren, en pas na z’n dood is z’n naam verbonden geraakt aan deze stelling.

Hoera, riep de man, dat is wat ik wil weten. De noemer van de breuk geeft de algemene kans op een positieve test, dus ongeacht of die persoon ziek is of gezond. In statistiek betekent dit het optellen van kansen.

Alles op een rijtje en dan vlug uitrekenen, denk de man, want hij voelt zich al wat zwakjes worden… maar hij ontdekt dat er nog één cruciaal gegeven ontbreekt en dat is de kans P(ZIEK), de kans dat je hebt om de ziekte op te lopen. Hij belt naar de dokter en vraagt hoe zeldzaam de ziekte is en de dokter antwoordt hem dat die kans 1 op 1000 is.

Laten we even alle gegevens op een rijtje zetten:

Hierdoor kunnen we afleiden dat:

De info op de bijsluiter kunnen we als volgt noteren:

Nu vullen we in onderstaande uitdrukking de waarden in:

Alles ingevuld komt de man tot de volgende constatatie:

Dat wil zeggen dat hij slechts een kleine 5% kans heeft dat hij effectief de ziekte heeft. Hij slaakt een zucht van opluchting en bedankt vriendelijk voor het medicijn, want de kans is nog altijd veel groter dat hij die ziekte niet heeft dan dat hij de ziekte wel heeft. In onderstaande tabel is bovenstaand voorbeeld uitgewerkt voor een bevolking van 1 miljoen mensen. Daarvan zullen 1000 mensen ziek zijn. Bij 990 zal dit een gedetecteerd worden door een positieve test. De 2% mensen die onterecht positief testen zijn echter een veelvoud van de 990 waarbij de ziekte gedetecteerd wordt. Hierdoor is het gemakkelijker te begrijpen dat de kans op ziekte gegeven een positieve test ongeveer gelijk is aan 5%.

screenshot 2019-01-18 at 20.21.37

Dit voelt uiteraard wat contra-intuïtief aan en dat is juist waarom het theorema van Bayes zo belangrijk is. Het toepassen wrikt je los van je intuïtie, die je in sommige gevallen helemaal de mist instuurt. Het theorema zorgt voor een update van je kansen. De oorspronkelijke kans, ook wel de a-priori-kans genoemd is hier de kans op het optreden van de ziekte wat hier 1 op 1000 is. De kennis die toegevoegd is aan het systeem is hier het positieve testresultaat, en die zorgt voor een a-posteriori-kans van 1 op 20. We kunnen dus stellen dat de kans 50 keer groter geworden is door het positieve testresultaat.

Maar het impact van het theorema gaat veel ruimer, want je kunt je wel voorstellen dat de man met welbepaalde klachten naar de dokter is gegaan, en dat de dokter bovendien na z’n onderzoek ook weer wat feiten heeft verzameld. Als de man duidelijke uitwendige tekenen vertoont van de aanwezigheid van de ziekte zal dit feit uiteraard samen met de test moeten geëvalueerd worden. En daar is waar het schoentje knelt tussen de voor- en tegenstanders van deze Bayesiaanse statistiek, want er moeten inschattingen gemaakt worden en gebruik gemaakt worden van de kennis die je al hebt, en dat subjectieve gegeven is iets waar sommigen een koudwatervrees voor hebben.

Een logische volgende stap zou zijn om een tweede test te doen. En dan zal de man opnieuw z’n kansen kunnen updaten. Dan is de a-priori-kans de kans op de ziekte gegeven 1 positieve test (1/20) en is de a-posteriori-test de kans op de ziekte gegeven 2 positieve testen. Opnieuw Bayes toepassen en je mening durven te veranderen als de feiten veranderen.

Nu ben je gewapend voor het driedeurenprobleem. Je bent gast in een grote televisieshow en er zijn 3 glimmende deuren. Achter één zit een auto en achter twee andere deuren zit een geit. De presentator vraagt je om een deur te kiezen. Nadat je een deur hebt gekozen opent de presentator een deur waarachter een geit zit. Bayes zal je vertellen dat je altijd meer kans hebt om te veranderen van deur nadat de presentator de geit heeft getoond, de complete uitleg vind je op op wikipedia.

Dat was een korte maar boeiende omweg langs de wondere wereld van de statistiek en de kansrekening…

Bayesiaanse groeten,

T.E.

Plaats een reactie