Naast dergelijke praktische problemen, is er nog een punt dat het placebo-gecontroleerd onderzoek problematisch maakt dat op een fundamenteler niveau ligt. Daarvoor moeten we eerst een stapje terug naar de basale theorie.
Causaliteit
Wat is eigenlijk de reden dat er gevraagd wordt om placebo-gecontroleerd onderzoek (een RCT)? Dat doen onderzoekers, en wij met hen, omdat we willen weten of iets de oorzaak is van een effect. Leidt een voedingspatroon dat op punten zus en zo is aangepast inderdaad tot een afname van de ziektelast? We willen voorkomen dat we iets gaan toepassen dat louter een associatie is, want dan zal het immers niet tot het gehoopte effect leiden.
Maar hoe stellen we causaliteit eigenlijk vast? Filosofen hebben hier verschillende antwoorden op geformuleerd. Sommigen, zoals David Hume, stellen zelfs dat we strikt genomen helemaal niet kunnen vaststellen of iets een oorzakelijke verband heeft. Toch heeft ieder mens een vaak uitstekend gevoel voor het verschil tussen oorzaak en associatie om de simpele reden dat we anders niet zouden overleven. Een pragmatische definitie van causaliteit die goed past bij onze alledaagse beleving, is dat een effect wél optreedt als je een actie neemt en niet optreedt als je die actie niet neemt1,2. Er is alleen één probleem: het is onmogelijk om beide opties tegelijkertijd uit te voeren. Als je stopt met brood eten en na een maand van je constipatie af bent, kun je niet weten of dat ook was gebeurt als je niet gestopt was met brood eten.
Als je stopt met brood eten en na een maand van je constipatie af bent, kun je niet weten of dat ook was gebeurt als je niet gestopt was met brood etenPraktische manier van toetsen vereist uitwisselbaarheid
Placebo-gecontroleerde onderzoeken zijn op bovenstaande pragmatische definitie van causaliteit gebaseerd: onderzoek wat er gebeurt als je een actie wél en niet neemt. Om dat te kunnen doen, worden (in de eenvoudigste vorm) deelnemers in twee groepen verdeeld en krijgt de ene groep een inactieve interventie (placebo) en de andere een verondersteld actieve interventie. In plaats van individuele causaliteit wordt hiermee gemiddelde causaliteit onderzocht3. Om te kunnen voldoen aan het pragmatische uitgangspunt, is het essentieel dat beide groepen in alle relevante opzichten identiek zijn. Dat wordt uitwisselbaarheid genoemd; het zou niet moeten uitmaken of groep 1 de placebo krijgt en groep 2 de actieve interventie, of andersom, als de groepen uitwisselbaar zijn komt er in beide gevallen hetzelfde uit. Er worden allerlei technieken gebruikt om dit voor elkaar te krijgen, zoals stratificatie en randomisatie, maar het voert te ver om dat hier te bespreken.
Het probleem van toewijsbaarheid
Het fundamentele probleem met deze opzet, is dat het veronderstelt dat het mogelijk is om een uitspraak te doen over het effect van dat ene ding dat je onderzoekt. Neem het voorbeeld van stoppen met brood eten bij constipatie. Als dat met een RCT4 zou worden onderzocht, dan is het uitgangspunt dat het (risico op5) optreden van constipatie (in een bepaalde groep mensen6) deels kan worden toegeschreven aan brood. Het verschil in afname van constipatie tussen de actieve interventie groep en placebogroep wordt gezien als de effectgrootte die de interventie heeft; het wordt als het ware een eigenschap van de interventie ‘stoppen met brood eten’. Maar wat nu als andere factoren meespelen? Stel dat stoppen met brood eten alleen werkt tegen constipatie als iemand tegelijkertijd ook stopt met melk drinken, terwijl alleen stoppen met brood eten, of alleen stoppen met melk drinken geen effect hebben? Dergelijke complexere situaties worden beschreven met twee gerelateerde, maar verschillende termen: interacties of effect modificaties7. Laatstgenoemde treedt op als een actie zelf geen effect heeft, maar wel het effect van een andere actie beïnvloedt (bijvoorbeeld grapefruitsap die de werking van sommige medicijnen beïnvloedt), terwijl bij interacties twee of meer acties zowel zelf een effect hebben, als elkaar beïnvloeden (bijvoorbeeld magnesium dat pijnstillend werkt én pijnstillende medicijnen versterkt). Voor dit soort verstrengeling valt te corrigeren, onder voorwaarde dat bekend is welke factoren meespelen. Desondanks wordt hierbij nog altijd de veronderstelling gedaan dat het effect slechts afhangt van enkele factoren.
Wat nu als de oorzaak en effect niet uiteen te rafelen valt tot enkele hoofdfactoren? Wat als het al dan niet optreden van een effect echt individueel bepaald is, als het in zeer grote mate afhangt van onbekende factoren die per persoon verschillen? In dat geval is de kans groot dat de veronderstellingen achter placebo-gecontroleerd onderzoek niet meer op gaan. Bij de één heeft een interventie dan een gunstig effect, bij een ander geen effect, en bij een derde misschien een negatief effect. Het resultaat kan dan zijn dat een RCT, hoe nauwkeurig opgezet en uitgevoerd dan ook, een heel klein (positief of negatief) effect, of geen effect laat zien. Als dat met een RCT van hoge kwaliteit wordt gevonden, dan is de veel getrokken conclusie dat de betreffende interventie niet effectief is.
Omgekeerd hoeft in het geval van een onontrafelbare samenhang met individuele factoren, een gemiddeld positief effect niet te betekenen dat dit inderdaad aan de interventie toe te schrijven is. In de praktijk is namelijk het aantal deelnemers beperkt en als er vele onbekende individuele factoren zijn die mede bepalen of de interventie werkt, is het maar de vraag of de groepen op die punten wel uitwisselbaar zijn. Een ongelijke verdeling van individuele factoren zou er zomaar voor kunnen zorgen dat de gemiddelde effecten in de groepen er anders uit zouden zien als de placebo en interventie groep omgewisseld zouden zijn. Als in zo’n geval de RCT herhaald wordt met andere deelnemers, is, zelfs als de opzet verder identiek is, de kans groot dat er toch een ander resultaat gevonden wordt. Als dit gebeurt wordt vaak geconcludeerd dat de studies slecht uitgevoerd zijn of de groepen te klein waren om het echte effect te kunnen bepalen.
Kortom, als een effect niet zo eenvoudig toe te schrijven is aan een interventie omdat het afhangt van het samenspel van diverse onbekende factoren, dan kan de poging om een gemiddelde causaal effect te vinden middels placebo-gecontroleerd onderzoek ons op meerdere manieren op het verkeerde been zettenKortom, als een effect niet zo eenvoudig toe te schrijven is aan een interventie omdat het afhangt van het samenspel van diverse onbekende factoren, dan kan de poging om een gemiddelde causaal effect te vinden middels placebo-gecontroleerd onderzoek ons op meerdere manieren op het verkeerde been zetten. Toch is het heel goed mogelijk dat er bij sommige personen wel degelijk echt sprake is van individuele causaliteit. Voor hen geldt dat zij, hoewel praktisch niet of nauwelijks toetsbaar, geheel voldoen aan de definitie van causaliteit: met interventie is er wel een effect, zonder niet. De vraag is hoe een dergelijke situatie te onderzoeken is.
Het continuüm tussen volledige onafhankelijkheid en complexiteit
Er zijn talloze voorbeelden van fenomenen waar grote variatie tussen personen bestaat die samenhangt met allerlei onbekende factoren die niet afzonderlijk te identificeren zijn. Gedrag is daar een voorbeeld van, waarbij er (naast enkele belangrijke factoren waarmee een eerste grove verdeling tussen personen te maken valt) een groot aantal details meespelen die bepalend zijn voor de manier waarop een individu reageert. Ook het microbioom is een voorbeeld van een zeer individueel en enorm complex systeem. Hetzelfde geldt voor voeding, epigenetica, leefstijl, etc. Bij dit soort aspecten zijn factoren met een dominante rol over het algemeen wel op te sporen, maar zijn er ook effecten die afhangen van een groot aantal factoren die elk slechts een kleine rol spelen, maar die gezamenlijk bepalend kunnen zijn voor het effect van een interventie. Er is in feite sprake van een continuüm: aan de ene kant zijn er interventies die invloed hebben op of beïnvloed worden door geen of slechts enkele dominante factoren die identificeerbaar zijn, aan de andere kant van het spectrum staan interventies die zodanig samenhangen met een groot aantal recessieve factoren dat het onmogelijk is om de betreffende factoren in kaart te brengen.
Hoe onderzoek je een situatie die meer aan de laatstgenoemde kant van het spectrum zitten? In feite hebben artsen dagelijks met deze complexiteit te maken: wat werkt voor die ene persoon die tegenover hem of haar zit? Dat het antwoord op deze vraag lastig is komt ook door allerlei andere fenomenen8, maar hangt ook samen met de invloed van een groot aantal onbekende recessieve factoren. In systeemtheorie wordt zo’n situatie complex genoemd, dat voor technische toepassingen (zoals elektronica) gedefinieerd is als een situatie waarvan het niet mogelijk is om alle toestanden te testen. U kunt zich voorstellen dat als zo’n complexe situatie voor zoiets deterministisch als elektronica bestaat, dat het in een biologisch systeem zoals ons de mens al helemaal ondoenlijk is om alle meespelende factoren te kennen. Artsen hebben daarmee dus de uiterst lastige taak om voor die ene patiënt de juiste aanpak te kiezen en hebben daarvoor een grote dosis pragmatiek (en ervaring) nodig.
Maar hoe kunnen we nu weten of die specifieke aanpak voor die ene patiënt causaal leidt tot het effect?
Op die vraag gaat deel II van dit tweeluik in. Het verschijnt zondag a.s. (update: en is via deze link te vinden).
Noten
1. Hernán MA, Robins JM. Causal Inference [Internet]. Boca Raton: Chapman & Hall/CRC; forthcoming [cited 2018 Apr 25]. Available from: https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/
2. De twee elkaar uitsluitende situaties (wel of niet een actie nemen) worden met een mooie Engelse term ‘counterfactual’ genoemd, wat zich in het Nederlands laat vertalen als ‘tegenfeitelijk’. Als iemand stopt met brood eten dan is het tegen-het-feit-in dat hij niet stopt met brood eten.
3. Causaliteit volgens de pragmatische definitie kan ook als groepsgemiddelde beschreven worden: de proportie mensen in een groep waarbij het effect wel optreedt na een actie is ongelijk aan de proportie mensen waarin het effect niet optreedt na afwezigheid van een actie.
4. RCT: randomized controlled trial, ofwel een gerandomiseerd, placebo-gecontroleerd onderzoek.
5. Een effect hoeft niet dichotoom te zijn, maar kan ook een continue verdeling hebben.
6. Het is van belang om het effect waar we naar kijken nauwkeurig te omschrijven. Dit kan gaan om een bepaalde groep mensen, die bijvoorbeeld een bepaalde ziekte hebben, of om een periode na de actie waarin het effect al dan niet optreedt. Als de beschrijving te breed is, verliest het zijn betekenis. Het kan bijvoorbeeld zijn dat witbrood een andere effect op constipatie heeft dan volkorenbrood en dan is een uitspraak als ‘het causale effect van brood op constipatie’ te breed, terwijl er bijvoorbeeld wel gesproken kan worden van ‘het causale effect van witbrood op constipatie’.
7. P. Corraini, M. Olsen, L. Pedersen, O. M. Dekkers, and J. P. Vandenbroucke, “Effect modification, interaction and mediation: an overview of theoretical insights for clinical investigators,” Clin Epidemiol, vol. 9, pp. 331–338, Jun. 2017.
8. Niet alleen speelt voor artsen mee dat sommige behandelingen beïnvloed worden door een groot aantal onbekende factoren, artsen hebben ook te maken met het verschil tussen wat in het Engels efficacy en effectiveness wordt genoemd, maar waar de Nederlandse taal geen onderscheid in maakt. Eerstgenoemde is het effect dat sec aan het medicijn toegeschreven kan worden, terwijl het tweede de optelsom is van alle factoren (inclusief de efficacy) die bepalen of een medicijn helpt. Placebo-gecontroleerde onderzoeken pogen het eerste vast te stellen, maar de groepsgemiddelde effecten in zo’n onderzoek zijn vaak niet te vertalen naar het te verwachten effect voor een individu. Een voorschrift van een arts is mede om die reden altijd persoonsgebonden, zelfs als het een medicijn betreft waarvan het effect slechts beïnvloed wordt door enkele dominante factoren. Nog lastiger is de werking van een medicijn afhangt van vele onbekende factoren. Veel kankermedicijnen zijn daar een voorbeeld van, en een number needed to treat van 100 is daarbij niet ongewoon9, omdat er grote variatie is tussen tumorcellen zelfs in tumoren in hetzelfde orgaan.
9. M. Kruse, A. Parthan, J. Coombs, M. Sasane, and D. Taylor, “Comparison of Different Adjuvant Therapies for 9 Resectable Cancer Types,” Postgraduate Medicine, vol. 125, no. 2, pp. 83–91, maart 2013.
Op 2 oktober krijg je nieuwe kado-artikelen.
Als betalend lid lees je zoveel artikelen als je wilt, én je steunt Foodlog
Martijn #9, misschien maakt deel 2 mijn punt wat duidelijker.
Arnold van Woerkom,
Doe maar het uitgebreide verhaal en dan op een voor iedereen leesbare manier.
Jan Peter en Marco heb het in een lezing op de HAS in Leeuwarden aan de studenten zo uitgelegd.
KUNST mest evenals drijfmest zijn drugs voor de plant, en moordenaars voor het zo nodige bodemleven.
Jullie weten toch wat drugs aan schadelijke bijwerkingen teweeg brengen, zo erg is het.
kan er een heel uitgebreid verhaal over houden dit is het kernachtig.
Jan Peter van Doorn,
Ik denk dat Arnold van Woerkom (net als veel andere boeren) over kennis beschikt dat kunstmest een onnatuurlijke niet evenwichtige (qua mineralen) plantengroei tot gevolg heeft. Stikstof via kunstmest word niet opgenomen als het gewas daar behoefte aan heeft
(natuurlijk proces) maar door verschil in potentiaal ongeacht de omstandigheden in de plantenwortels geperst.
Verleden week was ik bij een lezing van de meest bekende boer i.v.m. precisielandbouw, en die zegt met andere woorden feitelijk hetzelfde over bemesting/stikstof als Arnold van Woerkom.
Ik lees in je #11 nog geen duidelijk antwoord op de vraag wat de relatie is tussen kunstmest en gezondheid. Weet je die?