Commentaar op de CDC-bewijsreview over ME/CVS

In een eerdere blogpost hebben we een samenvatting gegeven van het ontwerprapport van een systematische review over de behandeling van myalgische encefalomyelitis/chronisch vermoeidheidssyndroom (ME/cvs). De review werd uitgevoerd in opdracht van de Centers for Disease Control and Prevention (CDC) in de Verenigde Staten.

Helaas vertoont het ontwerprapport meerdere gebreken, zoals het niet opnemen van objectieve metingen en rapporten over schade uit observationele studies. Het rapport onderschat ook het risico op vertekening in niet-geblindeerde studies met subjectieve vragenlijsten, waarbij de interventie de manier beïnvloedt waarop patiënten hun symptomen zien en waarbij de controlegroep helemaal geen interventie krijgt. Dergelijke studies lopen een hoog risico op vertekening, maar dit komt niet tot uiting in het ontwerprapport.

In deze blogpost presenteren wij onze opmerkingen en feedback op het rapport. We hebben belangrijke tekortkomingen vastgesteld en aanbevelingen opgenomen over hoe de evaluatie kan worden verbeterd. Onze opmerkingen zijn hieronder ook in PDF-formaat beschikbaar.

Lees onze opmerkingen in PDF-formaat [in het Engels]

Het abstract moet vermelden dat de bewijskracht onvoldoende of laag was

Tabel 22. Samenvatting van Bewijs (vanaf pagina 153) geeft aan dat de bewijskracht als ‘onvoldoende’ of ‘laag’ werd beoordeeld voor alle uitkomsten en interventies. Volgens een rapport uit 2014 van het Agency for Healthcare Research and Quality (AHRQ) (Agentschap voor Gezondheidsonderzoek en Kwaliteit) betekent een lage bewijskracht dat we een beperkt vertrouwen hebben in de schattingen van het effect en dat het bewijsmateriaal grote of talrijke tekortkomingen vertoont (of beide). [1]

Aanbeveling: De mate van bewijskracht moet duidelijk worden gemaakt in de samenvatting. De huidige formulering is te dubbelzinnig.

Referenties

[1] Agency for Healthcare Research and Quality (AHRQ). Methods Guide for Effectiveness and Comparative Effectiveness Reviews. 2014. https://effectivehealthcare.ahrq.gov/sites/default/files/pdf/cer-methods-guide_overview.pdf

“Inactieve controletherapieën” vereist een andere formulering

De bewering dat “CGT en oefentherapie geassocieerd waren met verbeterde vermoeidheid, functioneren en andere uitkomsten in vergelijking met inactieve controletherapieën” is problematisch. In deze studies kregen patiënten in de controlegroep gebruikelijke zorg, gespecialiseerde medische zorg of werden ze op een wachtlijst geplaatst. De term “controletherapieën” is misplaatst omdat de patiënten in de controlegroep in veel van deze studies geen interventie kregen. Het is bijvoorbeeld misleidend om van “controletherapie” te spreken als patiënten een aantal weken op een wachtlijst moeten staan om de behandeling te krijgen die de andere groep kreeg. Het zou nauwkeuriger zijn om deze vergelijkingen CGT of oefentherapie versus “geen interventie” te noemen.

Omdat de patiënten in de controlegroep in deze studies geen interventie kregen, zou elke verbetering in symptoomscores te wijten kunnen zijn aan verwachtingseffecten of ongelijke aandacht van de therapeuten in plaats van aan de aard van de interventie zelf. Ondanks deze beperking heeft de review de bewijskracht van deze studies niet naar beneden bijgesteld omdat er geen actieve controle-interventie werd gebruikt. Daarom moeten de controle-aandoening en de beperkingen daarvan expliciet in de tekst worden beschreven. Het is bijvoorbeeld belangrijk om formuleringen te vermijden die impliceren dat CGT en oefentherapie leiden tot verbetering in vermoeidheid, aangezien het onzeker blijft of de verbeteringen te danken zijn aan de interventie zelf of aan andere factoren zoals verwachtingspatronen of ongelijke aandacht van zorgverleners.

Aanbeveling: Een voorzichtiger formulering wordt geadviseerd bij het bespreken van vergelijkingen met controlegroepen waar geen interventie werd gegeven, bijvoorbeeld: “Patiënten die CGT en oefentherapie kregen, rapporteerden minder vermoeidheid en een hoger lichamelijk functioneren dan patiënten in de controlegroep die geen interventie kregen. Het blijft onzeker of deze verschillen te wijten zijn aan de interventie zelf of aan andere factoren zoals verwachtingseffecten en ongelijke aandacht van zorgverleners.”

De evaluatie onderschat de bias door het gebrek aan blindering voor subjectieve uitkomsten

In alle studies naar CGT en oefentherapie konden noch patiënten, noch therapeuten geblindeerd worden wat betreft de toewijzing van de behandeling. Bijgevolg lopen deze studies een groot risico op vertekening wanneer subjectieve uitkomsten worden gebruikt, zoals de door de patiënt gerapporteerde vragenlijsten over de symptomen die het leeuwendeel van het bewijs in deze review vormen. Savovic en collega’s vonden dat gebrek aan blindering geassocieerd was met een gemiddeld 13% overdrijving van behandelingseffecten (ratio van odds ratio’s: 0,87, 95% betrouwbaarheidsinterval 0,79 tot 0,96). [1] Een review uit 2014 van Hróbjartsson et al. over gerandomiseerde studies die geblindeerde en niet-geblindeerde groepen vergeleken, vond dat het gemiddelde verschil in effectgrootte voor door de patiënt gerapporteerde uitkomstmaten 0,56 was (95% betrouwbaarheidsinterval 0,41 tot 0,71). In groepen waarin patiënten niet geblindeerd waren, werden de gerapporteerde effectgroottes met ongeveer een halve standaarddeviatie vergroot. [2]

Bij proeven met CGT en graduele oefentherapie is het risico op vertekening bijzonder groot omdat de interventie sterke aanmoedigingen en stimulering van positieve verwachtingen omvat. In een handleiding voor therapeuten over oefentherapie die in de PACE-studie werd gebruikt, werd bijvoorbeeld geadviseerd regelmatig de overtuiging te promoten dat patiënten beter kunnen worden. Therapeuten kregen volgende instructie:

“… het is belangrijk dat u optimisme aanmoedigt over de vooruitgang die zij met deze aanpak kunnen boeken. U kunt de eerdere positieve onderzoeksresultaten van GET uitleggen en in de manier waarop u doelen bespreekt en taal gebruikt, laten zien dat u gelooft dat ze beter kunnen worden.” [3]

Het patiëntenboekje dat gebruikt werd in de FINE-studie, informeerde studiedeelnemers over welk gevoel oefentherapie hen zou geven:

“U zult een sneeuwbaleffect ervaren als toenemende fitheid leidt tot toenemend vertrouwen in uw kunnen. U zult CVS overwonnen hebben door uw eigen inspanning en u zult uw lichaam weer onder controle hebben.” [4]

Op dezelfde manier stimuleert CGT zelfeffectiviteit, positieve verwachtingen en vermindering van symptoomgerichtheid en catastroferen, wat waarschijnlijk van invloed is op hoe patiënten hun symptomen rapporteren, zelfs als de interventie geen gunstig effect heeft. [5] Oefentherapie en CGT werden ook al aanbevolen voor ME/cvs door gezondheidszorginstellingen toen de grootste studies (PACE, FINE, FITNET, GETSET) werden uitgevoerd. Daarom is het bij studies naar CGT en oefentherapie waarschijnlijk dat de rapportage van de uitkomsten door de deelnemers werd beïnvloed door de kennis van de ontvangen interventie. In dergelijke gevallen geeft het Cochrane-handboek (tweede editie, 2019) aan dat het risico op bias hoog is. [6]

Daarentegen beoordeelde deze review de meeste studies van CGT en oefentherapie als medium risico op bias, zelfs als subjectieve uitkomstmaten werden gebruikt. De review verklaart deze belangrijke beperking ook niet in het abstract. Het abstract vermeldt alleen heterogeniteit, imprecisie, inconsistentie, onzekere generaliseerbaarheid als methodologische beperkingen.

Wij wensen te verduidelijken dat de beoordeling van het risico op bias niet mag worden beïnvloed door praktische beperkingen van de studieopzet. Het AHRQ-rapport ‘Methodegids voor Evaluatie van Effectiviteit en Comparatieve Effectiviteit’ stelt dat “de onmogelijkheid om de beoordelaars van de uitkomsten te blinderen, het risico op bias niet wegneemt door […] gebrek aan blindering.” [7] Evenzo stelt het Cochrane-handboek: “De kans op vertekening kan niet worden genegeerd, zelfs niet als de beoordelaar van de uitkomsten niet geblindeerd kan worden.” [6]

Aanbeveling: De beoordeling van het risico op bias bij niet-geblindeerde studies voor subjectieve uitkomstmaten moet worden gewijzigd van gemiddeld naar hoog. Omdat het grootste deel van het bewijs in deze review wordt beïnvloed door dit risico op bias, wordt aanbevolen om deze belangrijke beperking in het abstract te vermelden en toe te lichten.

Referenties

[1] Savović J, Jones HE, Altman DG, Harris RJ, Jüni P, Pildal J, Als-Nielsen B, Balk EM, Gluud C, Gluud LL, Ioannidis JP. Influence of reported study design characteristics on intervention effect estimates from randomised controlled trials: combined analysis of meta-epidemiological studies. Health Technology Assessment. 2012;16(35):1-82.

[2] Hróbjartsson A, Emanuelsson F, Skou Thomsen AS, Hilden J, Brorson S. Bias due to lack of patient blinding in clinical trials. A systematic review of trials randomizing patients to blind and nonblind sub-studies. International journal of epidemiology. 2014 Aug 1;43(4):1272-83.

[3] Bavinton J, Darbishire L, White PD. PACE manual for therapists. Graded Exercise Therapy (GET) for CFS/ME. Final trial version: version 7 (MREC Version 2). PACE Trial Management Group; 2004. Available from: https://me-pedia.org/images/8/89/PACE-get-therapist-manual.pdf

[4] Powell P. FINE trial patient booklet version 9. Royal Liverpool University Hospital; 2005. Available from: https://web.archive.org/web/20140811161130/http://www.fine-trial.net/downloads/Patient%20PR%20Manual%20ver9%20Apr05.pdf

[5] Surawy C, Hackmann A, Hawton K, Sharpe M. Chronic fatigue syndrome: a cognitive approach. Behaviour research and therapy. 1995 Jun 1;33(5):535-44.

[6] Higgins JPT, Thomas J, Chandler J, Cumpston M, Li T, Page MJ, Welch VA (editors). Cochrane Handbook for Systematic Reviews of Interventions. 2nd Edition. Chichester (UK): John Wiley & Sons, 2019.

[7] Agency for Healthcare Research and Quality (AHRQ). Methods Guide for Effectiveness and Comparative Effectiveness Reviews. 2014. https://effectivehealthcare.ahrq.gov/sites/default/files/pdf/cer-methods-guide_overview.pdf

Objectieve uitkomsten niet gerapporteerd

Objectieve uitkomsten zijn minder vatbaar voor bias dan door de patiënt gerapporteerde uitkomsten. Een van de grootste studies tot op heden over bias bij gerandomiseerde studies, het BRANDO-project, gaf de volgende aanbeveling: “Onze resultaten suggereren dat, voor zover mogelijk, klinische en beleidsbeslissingen niet gebaseerd zouden mogen zijn op studies waarin blindering niet haalbaar is en uitkomstmaten subjectief worden beoordeeld. Daarom moeten studies waarin blindering niet haalbaar is, zich zoveel mogelijk richten op objectief gemeten uitkomsten.”[1]

Objectieve uitkomsten zoals actigrafie, werkgelegenheidscijfers en verschillende fitheidstests werden gebruikt in talrijke studies van oefentherapie en CGT. Helaas bevatte deze review alleen gegevens over schoolbezoek en de looptest van 6 minuten. Het is onduidelijk waarom gegevens over werkgelegenheid niet gerapporteerd zijn, terwijl dit toch expliciet als een van de belangrijkste uitkomstmaten in het onderzoeksprotocol werd genoemd. [2] Evenzo is het onduidelijk waarom de SF-36-vragenlijst werd gebruikt als indicator van lichamelijk functioneren terwijl actigrafie, cardiopulmonaire inspanningstesten en verschillende andere fitheidstesten niet werden gebruikt.

De volgende objectieve uitkomstmaten werden gebruikt in de opgenomen studies over oefentherapie en CGT, maar niet gerapporteerd in deze review:

Studie	Objectieve uitkomstmaten	Publicatie
Fulcher 1997	Verschillende fysiologische beoordelingen werden uitgevoerd tijdens een loopband looptest, waaronder: – Piekzuurstofverbruik tijdens inspanning (ml/kg/min) – Maximale ventilatie (l/min) – Maximale hartslag (slagen/min) – Percentage van voorspelde maximale hartslag – Herstelhartslag drie minuten na de test (slagen/min) – Duur van de test (min)Submaximaal bloedlactaat (mmol/l) – Bloedlactaat na de test (mmol/l) – Maximale vrijwillige contractie van de quadriceps (via twitchinterpolatie)	Fulcher KY, White PD. Randomised controlled trial of graded exercise in patients with the chronic fatigue syndrome. Bmj. 1997 Jun 7;314(7095):1647.
Wearden 1998	De fysiologische beoordeling omvatte het meten van lengte, gewicht, lichaamsvet, grijpkracht en functionele werkcapaciteit. Dit laatste werd bepaald met behulp van een Bosch ERG 551 elektronisch geremde fietsergometer.	Wearden AJ, Morriss RK, Mullis R, Strickland PL, Pearson DJ, Appleby L, Campbell IT, Morris JA. Randomised, double-blind, placebo-controlled treatment trial of fluoxetine and graded exercise for chronic fatigue syndrome. The British Journal of Psychiatry. 1998 Jun 1;172(6):485-90.
Wallman 2004	De deelnemers werden beoordeeld op de Aerobic Power Index-test waarbij verschillende metingen werden geregistreerd, waaronder: – hartslag in rust (bpm) – systolische bloeddruk in rust (mmHg) – Diastolische bloeddruk in rust (mmHg) – Zuurstofopname (mL-kg-1-min-1) – Ademhalingsuitwisselingsratio – Netto lactaatproductie in bloed (mmol/L) – Percentage patiënten bij wie de doelhartfrequentie werd bereikt – Vermogen (W/kg) – Mate van waargenomen inspanning / vermogen – Activiteitenniveau (kJ/week) Cognitieve functie werd getest met behulp van een gecomputeriseerde versie van de gemodificeerde Stroop Colour Word-test	Wallman KE, Morton AR, Goodman C, Grove R, Guilfoyle AM. Randomised controlled trial of graded exercise in chronic fatigue syndrome. Medical Journal of Australia. 2004 May;180(9):444-8.
Moss-Morris 2005	De deelnemers ondergingen een incrementele inspanningstest om de maximale aerobe capaciteit (VO₂-piek) op een gemotoriseerde loopband te bepalen. Fysiologische beoordelingen omvatten: – Bereikte maximale hartslag – Percentage van voorspelde maximale hartslag – VO₂-piek (ml/kg/min)	Moss-Morris R, Sharon C, Tobin R, Baldi JC. A randomized controlled graded exercise trial for chronic fatigue syndrome: outcomes and mechanisms of change. Journal of health psychology. 2005 Mar;10(2):245-59.
Jason 2007	Tewerkstellingsstatus	Jason LA, Torres-Harding S, Friedberg F, Corradi K, Njoku MG, Donalek J, Reynolds N, Brown M, Weitner BB, Rademaker A, Papernik M. Non-pharmacologic interventions for CFS: A randomized trial. Journal of Clinical Psychology in Medical Settings. 2007 Dec 1;14(4):275-96.
Wearden 2010 (FINE)	Het inspanningsvermogen werd beoordeeld met behulp van een getimede stappentest. De mediatieanalyse die drie jaar na de hoofdpublicatie van de studie werd gepubliceerd, rapporteert: “Er waren geen verschillen tussen de groepen in de metingen van de stappentest na 20 of 70 weken.” De volledige gegevens van de stappentest zijn openbaar gemaakt als gevolg van een Verzoek op basis van Vrijheid van Informatie door Kathryn Dickenson.	Wearden AJ, Emsley R. Mediators of the effects on fatigue of pragmatic rehabilitation for chronic fatigue syndrome. Journal of consulting and clinical psychology. 2013 Oct;81(5):83
White 2011 (PACE)	Gegevens over het gebruik van de diensten werden gerapporteerd voor de volgende medische diensten: – Eerstelijnszorg – Andere arts – Gezondheidswerker – Intramurale zorg – Ongevallen en spoedgevallen – Geneeskunde – Aanvullende gezondheidszorg – Andere gezondheids-/sociale diensten – Informele zorg – Totale gezondheidskosten De volgende gegevens zijn ook opgenomen in de economische analyse: – Verlies van werk – Inkomensuitkeringen – Uitkeringen wegens ziekte/arbeidsongeschiktheid – Uitkeringen uit inkomensbeschermingsregelingen of particuliere pensioenen	McCrone P, Sharpe M, Chalder T, Knapp M, Johnson AL, Goldsmith KA, White PD. Adaptive pacing, cognitive behaviour therapy, graded exercise, and specialist medical care for chronic fatigue syndrome: a cost-effectiveness analysis. PLoS One. 2012 Aug 1;7(8):e40808.
White 2011 (PACE)	De fitheid en de waargenomen inspanning werden gemeten met een stappentest. De gegevens werden niet volledig gerapporteerd. De auteurs rapporteerden een grafiek in de mediatieanalyse waaruit bleek dat er geen significant verschil was tussen oefentherapie, gespecialiseerde medische zorg, adaptieve pacingtherapie, of CGT.	Chalder T, Goldsmith KA, White PD, Sharpe M, Pickles AR. Rehabilitative therapies for chronic fatigue syndrome: a secondary mediation analysis of the PACE trial. The Lancet Psychiatry. 2015 Feb 1;2(2):141-52.
Sharpe 1996	De auteurs rapporteerden het percentage dat verbeterde in werkstatus in beide groepen.	Sharpe M, Hawton K, Simkin S, Surawy C, Hackmann A, Klimes I, Peto T, Warrell D, Seagroatt V. Cognitive behaviour therapy for the chronic fatigue syndrome: a randomised controlled trial. Bmj. 1996 Jan 6;312(7022):22-6.
Janse 2018	Lichamelijke activiteit beoordeeld met actigrafie. De gegevens zijn gepubliceerd in het aanvullend materiaal.	Janse A, Worm-Smeitink M, Bleijenberg G, Donders R, Knoop H. Efficacy of web-based cognitive–behavioural therapy for chronic fatigue syndrome: randomised controlled trial. The British Journal of Psychiatry. 2018 Feb;212(2):112-8.
Knoop 2008	Lichamelijke activiteit werd beoordeeld met actigrafie. De gegevens werden gerapporteerd in Wiborg et al. 2010.	Wiborg JF, Knoop H, Stulemeijer M, Prins JB, Bleijenberg G. How does cognitive behaviour therapy reduce fatigue in patients with chronic fatigue syndrome? The role of physical activity.
O’ Dowd 2006	Deelnemers voerden een incrementele Shuttle Walk Test uit. Het aantal gelopen shuttles en de loopsnelheid werden gerapporteerd als uitkomstmaten. Cognitieve functie werd beoordeeld via de neurocognitieve korte vragenlijsten. De uitkomsten omvatten stemming (alertheid, hedonische toon, angst) herinnering (totaal aantal herinnerde woorden, correcte woorden), eenvoudige reactietijd (reactietijd, voltooide proeven), en herhaalde cijferherkenning (reactietijd, aantal treffers). Een gezondheidseconomische vragenlijst beoordeelde persoonlijke uitgaven, medicatiegebruik, privébehandelingen, informele hulp, en werkgegevens.	O’ Dowd H, Gladwell P, Rogers CA, Hollinghurst S, Gregory A. Cognitive behavioural therapy in chronic fatigue syndrome: a randomised controlled trial of an outpatient group programme. Health Technology Assessment-Southampton. 2006 Oct 1;10(37).
Stubhaug 2008	De cardiorespiratoire conditie werd beoordeeld met de A˚strand-Ryhming-test (indirecte test van de maximale zuurstofopname (VO₂-max)), uitgevoerd op een ergometerfiets.	Stubhaug B, Lie SA, Ursin H, Eriksen HR. Cognitive-behavioural therapy v. mirtazapine for chronic fatigue and neurasthenia: randomised placebo-controlled trial. The British Journal of Psychiatry. 2008 Mar;192(3):217-23.
Stulemeijer 2005	Lichamelijke activiteit beoordeeld met actigrafie. De gegevens zijn gerapporteerd door Wiborg et al. 2010.	Wiborg JF, Knoop H, Stulemeijer M, Prins JB, Bleijenberg G. How does cognitive behaviour therapy reduce fatigue in patients with chronic fatigue syndrome? The role of physical activity.

Aanbeveling: Objectieve uitkomsten zijn minder gevoelig voor bias wanneer patiënten en therapeuten niet geblindeerd zijn voor de toewijzing van de behandeling. Ze kunnen daarom betrouwbaardere informatie opleveren dan door de patiënt gerapporteerde uitkomsten in studies waarin noch patiënten noch therapeuten geblindeerd kunnen worden. Het verdient aanbeveling om alle objectieve uitkomstmaten die in studies over oefentherapie en CGT die gebruikt zijn in deze review, op te nemen en de resultaten ervan in het abstract te vermelden.

Referenties

[2] Roger Chou, Marian McDonagh, Jessica Griffin, Sara Grusing. Diagnosis and treatment of myalgic encephalomyelitis/chronic fatigue syndrome: a systematic evidence review. PROSPERO 2019 CRD42019142805 Available from: https://www.crd.york.ac.uk/prospero/display_record.php?ID=CRD42019142805

Rapporten over schade niet opgenomen

Het AHRQ-rapport [1] stelt dat: “het problematisch is om uitsluitend te vertrouwen op gepubliceerde RCT’s [Randomized Controlled Trials, gerandomiseerde gecontroleerde studies] om schade in CER’s [Comparative Effectiveness Reviews, vergelijkende doeltreffendheidsreviews] te evalueren. Ten eerste ontbreken in de meeste RCT’s vooraf gespecificeerde hypothesen voor schade. In plaats daarvan zijn de hypothesen meestal ontworpen om gunstige effecten te evalueren, waarbij de beoordeling van schade een secundaire overweging is. Als zodanig is de kwaliteit en kwantiteit van de rapportage over schade in klinische proeven vaak ontoereikend“. In het rapport wordt geadviseerd om “bewijsmateriaal over schade te verzamelen uit een breed scala aan bronnen, waaronder observationele studies, met name wanneer klinische studies ontbreken”. Waarnemingsstudies verwijzen naar een brede waaier van studieopzetten, met inbegrip van casusverslagen en ongecontroleerde reeksen van patiënten die een interventie ondergaan. Volgens het AHRQ-rapport “kunnen ze allemaal nuttige informatie opleveren, zolang hun specifieke beperkingen worden begrepen”. Evenzo benadrukt AMSTAR-II dat “het niet opnemen van niet-gerandomiseerde studies in een onderzoek naar ongunstige uitkomsten van behandeling een kritieke tekortkoming kan zijn“. [2]

Jammer genoeg bevat deze review alleen gegevens over schade uit gerandomiseerde gecontroleerde onderzoeken. In de samenvatting staat dat er beperkt bewijs is dat oefentherapie “niet geassocieerd is met een verhoogd risico op ernstige ongewenste voorvallen of verergering van de symptomen”. De gegevens over nadelige effecten van oefentherapie waren echter afkomstig van slechts twee studies: PACE en GETSET. De GETSET-studie beoordeelde niet de veiligheid van graduele oefentherapie (GET) maar een zelfhulpgids voor lichaamsbeweging. Daarom zijn de bevindingen ervan mogelijk niet generaliseerbaar naar volledige reeksen van GET in de klinische praktijk. Zoals opgemerkt door Kindlon in 2017, werden gegevens over schade in de PACE-studie niet gerapporteerd in overeenstemming met het vooraf gespecificeerde protocol. [3] GETSET en PACE leverden ook geen objectief bewijs van therapietrouw aan GET.

Deze review gaat voorbij aan de vele patiëntenenquêtes waarin deelnemers aangeven dat hun gezondheid verslechterde nadat ze GET hadden geprobeerd. Deze bevinding wordt al meer dan 20 jaar consequent gerapporteerd door ME/cvs-patiënten. Onderzoeken werden uitgevoerd door patiëntenorganisaties in verschillende landen, waaronder de Verenigde Staten, Noorwegen, Nederland, Australië, en het Verenigd Koninkrijk. Deze werden samengevat en beoordeeld door Geraghty en collega’s in 2019. [4]

Aanbeveling: Het kan misleidend zijn om uitsluitend te vertrouwen op gerandomiseerde gecontroleerde studies om schade te evalueren, vooral als er een grote hoeveelheid observationeel bewijs is dat tot een andere conclusie leidt. Daarom wordt aanbevolen ook andere rapporten mee te nemen over de veiligheid en de schade van de in deze evaluatie beoordeelde interventies, in het bijzonder de graduele oefentherapie.

Referenties

[2] Shea BJ, Reeves BC, Wells G, Thuku M, Hamel C, Moran J, Moher D, Tugwell P, Welch V, Kristjansson E, Henry DA. AMSTAR 2: a critical appraisal tool for systematic reviews that include randomised or non-randomised studies of healthcare interventions, or both. bmj. 2017 Sep 21;358.

[3] Kindlon T. Do graded activity therapies cause harm in chronic fatigue syndrome?. Journal of health psychology. 2017 Aug;22(9):1146-54.

[4] Geraghty K, Hann M, Kurtev S. Myalgic encephalomyelitis/chronic fatigue syndrome patients’ reports of symptom changes following cognitive behavioural therapy, graded exercise therapy and pacing treatments: Analysis of a primary survey compared with secondary surveys. Journal of health psychology. 2019 Sep;24(10):1318-33.

Heterogeniteit

Het abstract stelt dat graduele oefentherapie “effectiever is dan inactieve controletherapieën (gebruikelijke zorg, gebruikelijke specialistische zorg, of een attentiecontrole) in het verbeteren van vermoeidheid, functie, en andere uitkomsten”. Deze meta-analyses hebben echter allemaal te kampen met een hoge heterogeniteit (I2= 85%-95%). De belangrijkste oorzaak van deze heterogeniteit lijkt de uitschieterstudie van Powell en collega’s te zijn. [1] Deze studie rapporteerde reducties in vermoeidheid en fysiek functioneren die meer dan 4 keer zo groot waren als gerapporteerd door meer recente, grote studies zoals FINE, PACE, en GETSET.

Voor veel uitkomsten wordt de heterogeniteit sterk verminderd wanneer de uitschieter van Powell et al. wordt geëlimineerd, maar dit verlaagt ook de effectgroottes aanzienlijk (zie onderstaand overzicht). Zonder de uitschieter van Powell et al. zijn de gevonden verschillen consistent lager dan het minimaal klinisch belangrijke verschil (MCID). Met andere woorden, als de heterogeniteit wordt verminderd door de uitschieter te verwijderen, dan zijn de puntschattingen van het effect niet langer klinisch significant.

Aanbeveling: De meta-analyses voor oefentherapie versus geen interventie (gebruikelijke zorg, gebruikelijke specialistische zorg, of een attentiecontrole) lijdt aan onaanvaardbaar hoge heterogeniteit. Dit is vooral te wijten aan de uitschieter Powell et al. die veel grotere behandelingseffecten rapporteerden dan de andere studies. Als deze uitschieter wordt uitgesloten, dan zijn de puntschattingen van de gemiddelde verschillen niet langer klinisch significant. Daarom moeten uitspraken dat oefentherapie effectief is in het verbeteren van vermoeidheid, functie, en andere uitkomsten, worden vermeden. Wij bevelen aan om in de hoofdtekst een verklaring op te nemen dat oefentherapie niet tot een klinisch significant effect heeft geleid als de uitschieter Powell et al. uit de analyses wordt verwijderd.

Referenties

[1] Powell P, Bentall RP, Nye FJ, Edwards RH. Randomised controlled trial of patient education to encourage graded exercise in chronic fatigue syndrome. Bmj. 2001 Feb 17;322(7283):387.

Rapporteringsbias

Het is onduidelijk waarom in “Appendix F. Risico op Bias voor Gerandomiseerde Gecontroleerde Studies”, alle studies het label “Ja” kregen voor “Uitkomsten Vooraf Gespecificeerd”. Aanbevolen wordt om dit oordeel te bewaren voor studies waarbij voor aanvang van de studie een studieprotocol of registratie openbaar beschikbaar was en waarbij de uitkomsten volgens dit vooraf gespecificeerde plan zijn gepubliceerd.

De FITNET-studie (Nijhof et al. 2012) loopt een hoog risico op vertekening in de rapportage omdat fysieke prestaties, zoals gemeten met een actometer, in het protocol werden genoemd als uitkomstmaat, maar de resultaten ervan nooit werden gerapporteerd. Evenzo werden in de PACE-studie (White et al. 2011) de uitkomstmaten niet gerapporteerd in overeenstemming met het onderzoeksprotocol, en deze veranderingen werden nooit toegelicht of verklaard. In de SMILE-studie (Crawley et al. 2018) verwisselden de auteurs hun primaire uitkomstmaat toen ze hun studie omzetten van een haalbaarheidsstudie naar een volledige studie.

Aanbeveling: Verschillende studies zoals FITNET, PACE en SMILE moeten worden beoordeeld als hoog risico op rapporteringsbias omdat de auteurs de resultaten niet hebben gerapporteerd in overeenstemming met een vooraf gespecificeerd onderzoeksprotocol.

Herstelcriteria in de PACE-studie

Het protocol van de PACE-studie specificeerde een definitie van herstel, maar de auteurs veranderden deze definitie na het bekijken van de resultaten. Zij verduidelijkten dat de verandering was aangebracht zodat de percentages “meer consistent waren met zowel de literatuur als met onze klinische ervaring.”[1] De veranderde definitie verlaagde echter de hersteldrempels, zodat deze voor sommige metingen lager werden dan de drempel die werd gebruikt om patiënten in de studie op te nemen. Zoals opgemerkt door Wilshire et al. werd de herziene hersteldrempelscore voor lichamelijk functioneren bijvoorbeeld “zo laag dat het in de buurt kwam van de gemiddelde score van patiënten met osteoartritis van de heup, reumatoïde artritis, en congestief hartfalen klasse II.” [2]

Aanbeveling: Wij bevelen aan de vooraf gespecificeerde definitie van herstel in de PACE-studie te gebruiken. De herziene definitie is post hoc geformuleerd en vertoont meerdere inconsistenties.

Referenties

[1] Sharpe M, Goldsmith K, Chalder T. The PACE trial of treatments for chronic fatigue syndrome: a response to WILSHIRE et al. BMC psychology. 2019 Dec;7(1):1-5.

[2] Wilshire C, Kindlon T, Matthees A, McGrath S. Can patients with chronic fatigue syndrome really recover after graded exercise or cognitive behavioural therapy? A critical commentary and preliminary re-analysis of the PACE trial. Fatigue: Biomedicine, Health & Behavior. 2017 Jan 2;5(1):43-56.

Problemen met de Vermoeidheidsschaal van Chalder

Cochranes instrument voor risico op bias (tweede versie) vraagt auteurs om rekening te houden met bias in de meting van de uitkomst, namelijk “Of de methode om de uitkomst te meten, geschikt is.” [1] Evenzo moedigt de methodologische gids voor effectiviteits- en vergelijkende effectiviteitsonderzoeken van de AHRQ beoordelaars aan om te evalueren of de uitkomsten werden beoordeeld met behulp van geldige en betrouwbare maatregelen. [2] Helaas wordt in deze review weinig aandacht besteed aan de validiteit en betrouwbaarheid van de uitkomstmaten.

Een van de meest gebruikte uitkomstmaten in gerandomiseerde onderzoeken naar ME/cvs is de Vermoeidheidsvragenlijst van Chalder (CFQ), die te lijden heeft onder plafondeffecten en interpretatieproblemen bij het volgen van de symptomen in de tijd.

Plafondeffecten

Plafondeffecten zijn vooral waargenomen bij het bimodale scoringssysteem (0-11) van de CFQ. [3,4] In de studie van Powell et al. hadden de patiënten bijvoorbeeld een vermoeidheidsscore van 10,28 op 11 punten bij de uitgangswaarde. In de FINE-studie hadden de patiënten bij aanvang een score van 10,45 op 11 punten. Een toename van de vermoeidheid zou in deze proeven niet kunnen worden geregistreerd, aangezien de meeste deelnemers reeds een score hadden die dicht bij het maximum van de schaal lag.

Als een verslechtering van de vermoeidheid even waarschijnlijk is in de inspannings- en de passieve controlegroep, dan bevoordelen plafondeffecten de ene mogelijk niet boven de andere. Maar deze veronderstelling is eerder onwaarschijnlijk aangezien een verslechtering van de symptomen na (fysieke) inspanning een van de kenmerken is van ME/cvs en ME/cvs-patiënten melden in meerdere onderzoeken dat ze verslechterd zijn na GET. Meer in het algemeen is aangetoond dat deelname aan een inspanningsinterventie het relatieve risico op niet-ernstige bijwerkingen verhoogt. [5] Daarom lijkt het redelijk om aan te nemen dat meer ME/cvs-patiënten in de inspanningsgroep dan in de controlegroep een toename van vermoeidheid ervaren zouden kunnen hebben na het scoren van (dicht bij) het maximum op de CFQ. Dit zou de resultaten hebben vertekend en een valse indruk van verbetering hebben veroorzaakt.

Ik zou dit argument nader willen toelichten omdat het gemakkelijk over het hoofd kan worden gezien of verkeerd kan worden geïnterpreteerd. Ter verduidelijking kunnen we een denkbeeldige inspanningsproef gebruiken waarbij alle deelnemers aan het begin van de proef een vermoeidheidsscore van 9 op 11 hebben. In de passieve controlegroep neemt de vermoeidheidsscore van de helft van de deelnemers met 2 punten toe, terwijl die van de andere helft met 2 punten afneemt. Het gemiddelde van de controlegroep aan het eind van de proef zou nog steeds 9 op 11 zijn. In de inspanningsgroep neemt de vermoeidheidsscore van de helft van de deelnemers met 6 punten toe, terwijl die van de andere helft met 6 punten afneemt. Hun gemiddelde is niet 9 maar 7 op 11 omdat een toename van 6 punten niet volledig op de schaal kon worden geregistreerd. Iets soortgelijks zou gebeurd kunnen zijn bij inspanningsproeven voor ME/cvs waar patiënten dicht bij het maximum van de CFQ scoorden aan het begin van de proef.

Interpretatieproblemen

De CFQ heeft ook interpretatieproblemen, omdat de deelnemers aan de proef wordt gevraagd of zij minder dan gewoonlijk vermoeidheidssymptomen ervaren in vergelijking met toen zij zich voor het laatst goed voelden. [6,7] Wanneer vragenlijsten worden ingevuld nadat de behandeling is afgelopen, kunnen patiënten in de war raken en zichzelf vergelijken met hoe ze waren voordat het onderzoek begon, in plaats van met toen ze voor het laatst gezond waren. Deze verkeerde interpretatie kwam voor in een Japans onderzoek naar de effecten van yoga bij ME/CFS. [8] Een van de deelnemers noteerde zeer lage scores op de CFQ na de behandeling omdat ze in de war was door de vergelijking met de uitgangswaarde. De auteurs merken op: “terwijl het de bedoeling was om haar huidige toestand te vergelijken met de laatste keer dat ze zich goed voelde, was ze al enkele jaren ziek en bijna bedlegerig, dus ze begreep ‘dan gewoonlijk’ verkeerd als ‘dan de dagen ziek in bed’ omdat het voor haar een vast onderdeel van haar leven was geworden”. In een onderzoek naar CGT bij multiple sclerose meldden patiënten in zowel de interventie- als de controlegroep dat ze aan het eind van het onderzoek minder vermoeid waren op de CFQ dan gezonde controles. [9] Een plausibele verklaring is dat patiënten wilden aangeven dat ze minder vermoeid waren sinds het begin van de proef en niet in vergelijking met toen ze voor het laatst goed waren. Deze interpretatieproblemen doen twijfels rijzen over de geldigheid van de CFQ bij het meten van verbeteringen in de loop van de tijd.

Aanbeveling: De plafondeffecten en interpretatieproblemen van de CFQ moeten als een beperking in dit onderzoek worden vermeld.

Referenties

[2] Higgins JPT, Thomas J, Chandler J, Cumpston M, Li T, Page MJ, Welch VA (editors). Cochrane Handbook for Systematic Reviews of Interventions. 2nd Edition. Chichester (UK): John Wiley & Sons, 2019.

[3] Stouten B. Identification of ambiguities in the 1994 chronic fatigue syndrome research case definition and recommendations for resolution. BMC Health Serv Res. 2005 May 13;5:37.

[4] Morriss RK, Wearden AJ, Mullis R. Exploring the validity of the Chalder Fatigue scale in chronic fatigue syndrome. J Psychosom Res. 1998 Nov;45(5):411–7.

[5] Niemeijer A, Lund H, Stafne SN, Ipsen T, Goldschmidt CL, Jørgensen CT, et al. Adverse events of exercise therapy in randomised controlled trials: a systematic review and meta-analysis. Br J Sports Med. 2019 Sep 28;pii: bjsports-2018-100461.

[6] S4ME: Submission to the public review on common data elements for ME/CFS: Problems with the Chalder Fatigue Questionnaire [Internet]. Science for ME. [cited 2019 Nov 27]. Available from: https://www.s4me.info/threads/s4me-submission-to-the-public-review-on-common-data-elements-for-me-cfs-problems-with-the-chalder-fatigue-questionnaire.2065/

[7] Vink M, Vink-Niese A. Graded exercise therapy for myalgic encephalomyelitis/chronic fatigue syndrome is not effective and unsafe. Re-analysis of a Cochrane review. Health Psychol Open. 2018 Dec;5(2):2055102918805187.

[8] Takakura S, Oka T, Sudo N. Changes in circulating microRNA after recumbent isometric yoga practice by patients with myalgic encephalomyelitis/chronic fatigue syndrome: an explorative pilot study. Biopsychosoc Med. 2019 Dec 2;13(1):29.

[9] van Kessel K, Moss-Morris R, Willoughby E, Chalder T, Johnson MH, Robinson E. A randomized controlled trial of cognitive behavior therapy for multiple sclerosis fatigue. Psychosom Med. 2008 Feb;70(2):205–13.

Publicatiebias

AMSTAR-II vermeldt “Beoordeling van de aanwezigheid en de waarschijnlijke impact van publicatiebias” als een kritisch domein dat de geldigheid van een review en de conclusie ervan kan beïnvloeden. Het wordt als een belangrijk punt beschouwd dat auteurs “een bewustzijn hebben getoond van de waarschijnlijke impact van PB [publicatiebias] in hun interpretatie en bespreking van de resultaten en een sensitiviteitsanalyse [sic] hebben uitgevoerd om te bepalen hoeveel ontbrekende ‘studies met nulresultaat nodig zouden zijn om de verkregen resultaten te ontkrachten.” [1] In het Cochrane-handboek wordt gesteld dat: “het niet in overweging nemen van de mogelijke impact van bias door niet-rapportage op de resultaten van de review kan leiden tot de toepassing van ineffectieve en schadelijke interventies in de klinische praktijk.” [2]

Jammer genoeg werd publicatiebias in deze review niet geëvalueerd omdat geen enkele meta-analyse 10 studies of meer omvatte. Wel kon worden vermeld dat in de review van Marques en collega’s, waarin alle “gedragsinterventies met een component van graduele oefentherapie” voor ME/cvs werden gecombineerd, aanwijzingen voor publicatiebias werden gevonden. [3]

Aanbeveling: In de review van Marques en collega’s werden aanwijzingen gevonden voor publicatiebias wanneer alle gedragsinterventies voor ME/cvs met een component van graduele oefentherapie werden gecombineerd. Deze bevinding zou vermeld kunnen worden in de paragraaf ‘beperkingen’.

Referenties

[1] Shea BJ, Reeves BC, Wells G, Thuku M, Hamel C, Moran J, Moher D, Tugwell P, Welch V, Kristjansson E, Henry DA. AMSTAR 2: a critical appraisal tool for systematic reviews that include randomised or non-randomised studies of healthcare interventions, or both. bmj. 2017 Sep 21;358.

[2] Higgins JPT, Thomas J, Chandler J, Cumpston M, Li T, Page MJ, Welch VA (editors). Cochrane Handbook for Systematic Reviews of Interventions. 2nd Edition. Chichester (UK): John Wiley & Sons, 2019.

[3] Marques MM, De Gucht V, Gouveia MJ, Leal I, Maes S. Differential effects of behavioral interventions with a graded physical activity component in patients suffering from chronic fatigue (syndrome): an updated systematic review and meta-analysis. Clinical psychology review. 2015 Aug 1;40:123-37.

In- en uitsluiting van studies

Ten aanzien van hoofdvraag 1: “Wat is de frequentie van aandoeningen die geen ME/cvs zijn, bij patiënten die worden geëvalueerd voor mogelijke ME/cvs? Eén relevante studie wordt niet genoemd in de lijst van ingesloten of uitgesloten studies, namelijk:

Johnston SC, Staines DR, Marshall-Gradisnik SM. Epidemiological characteristics of chronic fatigue syndrome/myalgic encephalomyelitis in Australian patients. Clin Epidemiol. 2016 May 17;8:97-107.

De auteurs voerden een klinisch onderzoek uit bij patiënten die ingeschreven waren in een Australische ME/cvs-onderzoeksdatabank. Rekrutering was gebaseerd op zelfidentificatie in antwoord op een advertentie in buurtondersteuningsnetwerken voor ME/cvs in heel Australië, evenals een algemene advertentie op de lokale radio en sociale media. Patiënten moesten een diagnose van ME/cvs door hun huisarts opgeven. Volgens de auteurs “waren er 14,58% die chronische vermoeidheid rapporteerden maar niet voldeden aan de criteria voor CVS/ME en 23,18% werden niet als gevallen beschouwd als gevolg van uitsluitingsvoorwaarden.”

De studie van Stubhaug et al. selecteerde patiënten op basis van de ICD-10-criteria voor neurasthenie. Deze verschillen van de ME/cvs-criteria. Zelfs indien de meeste patiënten in de studie van Stubhaug et al. aan deze laatste voldeden, zou het kunnen dat de deelnemers verschilden van een representatieve steekproef van ME/cvs-patiënten, aangezien zij eerst werden geselecteerd met de ICD-10-criteria voor neurasthenie. Het vorige AHRQ-rapport over de behandeling van ME/cvs sloot deze studie uit.

Stubhaug B, Lie SA, Ursin H, et al. Cognitive-behavioural therapy v. mirtazapine for chronic fatigue and neurasthenia: randomised placebo-controlled trial. Br J Psychiatry. 2008;192(3):217- 23. PMID: 18310583. Exclusion code: 5

De studie van Chan et al. 2013 werd opgenomen, maar selecteerde patiënten zonder klinische bevestiging van hun diagnose zoals ME/cvs-criteria vereisen. De toestand van de deelnemers werden niet gediagnosticeerd als CVS maar “als een CVS-achtige ziekte”.

Chan JSM, Ho RTH, Wang CW, et al. Effects of qigong exercise on fatigue, anxiety, and depressive symptoms of patients with chronic fatigue syndrome-like illness: a randomized controlled trial. Evid Based Complement Alternat Med. 2013

Aanbeveling: Wij adviseren om de studie van Johnston et al. op te nemen, en om de studie van Stubhaug et al. en de studie van Chan et al. uit te sluiten.

Commentaar op de CDC-bewijsreview over ME/CVS

Het abstract moet vermelden dat de bewijskracht onvoldoende of laag was

Referenties

“Inactieve controletherapieën” vereist een andere formulering

De evaluatie onderschat de bias door het gebrek aan blindering voor subjectieve uitkomsten

Referenties

Objectieve uitkomsten niet gerapporteerd

Referenties

Rapporten over schade niet opgenomen

Referenties

Heterogeniteit

Referenties

Rapporteringsbias

Herstelcriteria in de PACE-studie

Referenties

Problemen met de Vermoeidheidsschaal van Chalder

Plafondeffecten

Interpretatieproblemen

Referenties

Publicatiebias

Referenties

In- en uitsluiting van studies

Geef een reactie Reactie annuleren

Zijbalk

Volg ons

Recente Links