In de EOS van september 2019 las ik de column ‘Nipte cijferverwarring’ van Hetty Helsmoortel over de NIPT-test, een test om een Down-zwangerschap op te sporen. Zonder hier evenwel in te gaan op het maatschappelijk debat over deze NIPT-test, is het een mooi voorbeeld over het verrassende karakter van de uitkomst van het theorema van Bayes. Anders dan bij Hetty zullen we hier even dieper ingaan op de toepassing van Bayes, en wellicht zal er ook een formule tevoorschijn komen. Hopelijk zien we elkaar op het einde van dit stukje terug, en ben je niet blijven haperen aan de formule.

Update. Zo zou je het theorema van Bayes met één woord kunnen samenvatten. Er is een gebeurtenis waardoor je kennis over iets een update krijgt. In het geval van de NIPT-test heb je als zwangere vrouw een bepaalde kans op een Down-zwangerschap, dat wordt de a-priori-kans genoemd. De NIPT-test heeft uiteraard als doel om uitsluitsel te krijgen over een Down-zwangerschap, maar helaas brengt deze geen 100% zekerheid, maar het zal de kennis over de waarschijnlijkheid wel sterk verhogen, en resulteren in een a-posteriori-kans.
Een feilloze test zou je in één klap zekerheid bieden. Een positieve test zou betekenen dat de kans op een Down-zwangerschap 100% is, en wanneer je negatief test zou het uiteraard ook helemaal zeker zijn dat er geen Down-zwangerschap is. Maar helaas bestaat zo’n test niet. Wat betref de NIPT-test heb je 99,2% kans dat je postief test bij een Down-zwangerschap, dat wordt de sensitiviteit genoemd. Het is de kans op een postieve test (POS) op voorwaarde dat er een Down-zwangerschap is (D), de voorwaardelijke kans wordt als volgt uitgedrukt, waarbij P staat voor probability:
P(POS|D)=0,992
Bij een voorwaardelijke kans kan je niet zomaar de argumenten omdraaien. De kans op een positieve test gegeven een Down-zwangerschap is niet hetzelfde als de kans op een Down-zwangerschap gegeven een postieve test. Zo is bijvoorbeeld ook de kans op regenweer gegeven dat je een paraplu bij je hebt helemaal niet dezelfde als de kans dat je een paraplu bij je hebt bij regenweer.
De specificiteit van een test is de kans dat je negatief test gegeven dat er geen sprake is van een Down-zwangerschap. Bij de NIPT-test is de specificiteit 99,9%. Dat kan al volgt symbolisch uitgedrukt worden, waarbij G staat voor ‘geen Down-zwangerschap’:
P(NEG|G)=0,999.
Hieruit volgt logischerwijs dat er 1 kans op 1000 is dat je positief test terwijl je geen Down-zwangerschap hebt (ook wel soms omschreven als de vals-positieven), dit kunnen we noteren als:
P(POS|G)=0,001.
In de column ‘Nipte cijferverwarring’ wordt beschreven dat iemand bericht krijgt dat ze positief getest heeft. Wetende dat de specificiteit en de sensitiviteit van de test respectievelijk 99,9% en 99,2% is, percentages die toch flirten met de 100% lijkt het op het eerste zicht een certitude te zijn dat de betreffende persoon effectief een Down-zwangerschap heeft, maar verrassend genoeg stond in de brief dat de voorspellende waarde van de test 50% bedroeg gezien haar leeftijd. Hoe valt dat te verklaren?
Nu komt de Bayesiaanse aap uit de mouw! Zoals gezegd heb je als je geen Down-zwangerschap hebt toch één kans op duizend dat je positief test (de vals-positieven, afgeleid uit de specifiteit van de test). Hoog tijd om een cruciaal ontbrekend element boven water te halen. Welke absolute kans is er op een Down-zwangerschap? We weten dat deze kans toeneemt met de leeftijd, voor personen tussen 25 en 30 jaar is deze kans 1 op 1000, bij hogere leeftijden loopt dit op tot een kans van 12 op 1000. Zonder formules kunnen we dus wel al zien dat de kans op een Down-zwangerschap bij pakweg 27 jarigen van dezelfde grootte-orde is als de kans op een vals-positieve test. En dat betekent inderdaad dat de kans op een Down-zwangerschap gegeven een positieve test ca 50% bedraagt.
Nu komt het moment om er toch even de formule van Bayes bij te halen, zodat het plaatje compleet wordt, de formule zal de kans geven op een Down-zwangerschap bij een positieve test P(D|POS) en we weten ondertussen dat dit geheel iets anders is dan de kans op een positieve test bij een Down-zwangerschap P(POS|D). Want ontvang je een positieve test dan ligt je interesse uiteraard bij P(D|POS), deze voorwaardelijke kans wordt als volgt berekend:
We merken op dat de formule van Bayes onderzoekt welk aandeel de correcte positieve testen heeft ten opzicht van alle positieve testen P(POS). De noemer geeft de kans weer op alle positieve testen, los van al dan niet aanwezigheid van een Down-zwangerschap, dit is een optelling van de kans op een correct positieve test P(POS|D)P(D) en de kans op een vals positieve test P(POS|G)P(G), wat leidt tot de volgende uitdrukking:
Gezien alle argumenten van het rechterlid gekend zijn, kunnen we de bovenstaande uitdrukking evalueren om de kans te ontdekken op een Down-zwangerschap gegeven een positieve NIPT-test:
Om het helemaal helder te maken kunnen we een tabel opstellen voor 1 miljoen personen, die zwanger zijn en behoren tot de leeftijdsklasse 25-30 jaar:

Uit deze tabel zie je dat van alle 1991 postieve testen, er 999 vals-positief zijn. En dat de kans op een Down-zwangerschap bij een postieve test dus 992/1991=0,498… is.
En hier zien we dus inderdaad dat deze kans ca. 50% bedraagt. Misschien op het eerste gezicht verrassend, maar na het lezen van dit stukje hopelijk een stuk helderder.
Specifieke, maar ook zeer sensitieve groeten,
T.E.
Een gedachte over “Het theorema van Bayes en de NIPT-test”