Annales de dermatologie et de vénéréologie (2014) 141, 636—639

Disponible en ligne sur

ScienceDirect www.sciencedirect.com

MÉDECINE BASÉE SUR LES PREUVES

Améliorer les performances des essais thérapeutiques en harmonisant les critères de jugement : exemple de la dermatite atopique Improving performance in clinical trials through harmonisation of evaluation criteria: The case of atopic dermatitis S. Barbarot Clinique dermatologique, Hôtel Dieu, CHU de Nantes, place Alexis-Ricordeau, 44000 Nantes, France Rec ¸u le 27 mars 2014 ; accepté le 11 juillet 2014 Disponible sur Internet le 5 aoˆ ut 2014

Introduction Un critère de jugement (CJ) (outcome ou endpoint) est une variable mesurable susceptible de se modifier sous l’influence d’une intervention thérapeutique. Mesurer un CJ sert essentiellement à évaluer l’efficacité d’un traitement

Adresses e-mail : [email protected], [email protected] http://dx.doi.org/10.1016/j.annder.2014.07.005 0151-9638/© 2014 Publié par Elsevier Masson SAS.

dans le cadre d’un essai thérapeutique. Ceci est réalisé en comparant la valeur d’un seul CJ (appelé CJ principal [CJP]) entre deux ou plusieurs groupes de malades traités ou non. Tous les autres CJ choisis pour un essai sont appelés CJ secondaires. Ils sont utiles mais ne permettent pas de déterminer l’efficacité d’un traitement (seul le CJ principal le peut). Les CJ peuvent être de natures très variées : qualitatif binaire (fréquence de survenue d’un évènement comme un décès, une complication ou encore la guérison. . .) ou quantitatif (score de gravité, score de qualité de vie, durée avant

Améliorer les performances des essais thérapeutiques la survenue d’un évènement. . .). L’effet du traitement est parfois mesuré par la proportion de malades ayant un score de gravité supérieur ou inférieur à une valeur seuil (par exemple, dans les essais portant sur le psoriasis, la proportion de malades ayant une amélioration du score Psoriasis Area Severity Index [PASI] > 75 % par rapport à la valeur initiale). Un CJ principal doit être parfaitement défini a priori (c’est-à-dire avant le début de l’essai thérapeutique). Il doit être mesuré au cours de l’essai à un ou des moments précis. De plus, il doit être cliniquement pertinent c’est-àdire que sa modification sous l’influence du traitement doit conduire à un réel bénéfice clinique pour le médecin et pour le malade. Par exemple, le choix d’un paramètre biologique (taux d’IgE sérique dans la dermatite atopique [DA]) dont la valeur n’est pas corrélée à une modification clinique n’est pas pertinent. Des problèmes méthodologiques consécutifs au choix d’un mauvais CJP ou à des modalités d’évaluation inadaptées sont causes de biais majeurs dans l’analyse des résultats des essais et peuvent être une source d’erreurs répétées [1—4].

Pourquoi harmoniser les critères de jugement ? L’harmonisation des critères de jugement est essentielle pour améliorer la qualité des essais thérapeutiques et la prise en charge des malades. Ce processus a débuté en dermatologie par une initiative internationale portant sur la DA [5]. L’harmonisation des CJ permet de regrouper efficacement les résultats de différents essais cliniques dans le cadre de méta-analyses. En effet, la précision et la fiabilité des résultats des méta-analyses dépendent en grande partie de l’harmonisation des CJ utilisés dans les essais cliniques. En pratique, l’harmonisation des CJ permet donc la réalisation de méta-analyses de qualité permettant de conclure avec un meilleur niveau de preuve à l’efficacité d’un traitement versus placebo ou versus comparateur. Ces méta-analyses de qualité conduiront ainsi plus rapidement à une modification des recommandations de prise en charge d’une maladie, sans attendre les résultats d’essais cliniques supplémentaires. En définitive, l’harmonisation des CJ permet d’augmenter la qualité des essais et d’en accélérer les retombées pratiques pour les malades.

Critères de jugement utilisant des scores de gravité Des scores de gravité sont souvent utilisés pour constituer des CJ (PASI pour le psoriasis, SCORAD et EASI pour la DA. . .) [6—8]. Ces scores permettent d’évaluer plusieurs dimensions de l’état de santé du patient. Ils sont constitués le plus souvent de plusieurs items « objectifs » (mesurés par un observateur sans intervention du malade comme par exemple l’intensité de l’érythème, de la xérose ou la surface corporelle atteinte par une dermatose) ou subjectifs (mesurés par le malade comme par exemple l’intensité du prurit ou des troubles du sommeil, la qualité de vie). Ces items sont pondérés de fac ¸ons variées pour constituer in

637 fine une valeur quantitative. La valeur du SCORAD mesurée chez un malade est ainsi comprise entre 0 et 103 (intensité maximale de la maladie).

Qu’est-ce qu’un bon score ? Un bon score doit avoir les quatre qualités suivantes : validité (ou pertinence), fiabilité, acceptabilité et interprétabilité [9]. Ces qualités sont évaluées par une méthodologie précise lors d’études de validation [8,10] : • la validité évalue le bien-fondé des conclusions basées sur une mesure (ce score mesure-t-il bien ce qu’il est censé mesurer ?). La validité d’un score comprend en particulier la validité de contenu (est-ce que le score mesure vraiment les domaines étudiés ?) et la validité de critère (peut-on comparer ce score à un score de référence appelé gold standard ?) ; • la fiabilité d’un score est sa capacité à mesurer un phénomène de fac ¸on constante et reproductible malgré les erreurs de mesures aléatoires. La fiabilité peut être évaluée par : ◦ le coefficient de corrélation (r) obtenu par la comparaison de deux séries de mesures réalisées par un même investigateur chez les mêmes individus à deux moments différents (technique du test-retest), ◦ le degré de consistance interne (mesuré par le coefficient alpha de Cronbach) qui décrit l’homogénéité interne du score, ◦ la reproductibilité des mesures réalisées par plusieurs investigateurs chez un même groupe d’individu, ◦ la sensibilité au changement qui mesure la réactivité du score (est-ce que des modifications cliniques pertinentes sont détectées par le score ?) ; • l’acceptabilité est évaluée le plus souvent par le temps nécessaire à la réalisation du score et la bonne compréhension de celui-ci ; • l’interprétabilité désigne la pertinence clinique d’un score. Par exemple, pour un score de gravité de la DA, l’interprétabilité décrit dans quelle mesure une valeur quantitative du score correspond à une catégorie qualitative particulière (guéri/presque guéri, léger, modéré, sévère. . .).

Comment utiliser ces scores de gravité pour les maladies cutanées ? Disposer d’outils pour mesurer la gravité d’une maladie cutanée est indispensable dans le domaine des essais thérapeutiques mais aussi potentiellement utile en pratique quotidienne. En recherche clinique, ces outils (scores de gravité, échelles de qualité de vie. . .) permettent de mesurer le plus objectivement possible l’effet d’une intervention thérapeutique, de classer les malades en différents sous-groupes de gravité et surtout de comparer les résultats des essais thérapeutiques et donc l’efficacité de différents traitements. Une synthèse systématique de qualité des résultats de différents essais thérapeutiques (méta-analyse) ne peut s’envisager que si les mêmes outils d’évaluation ont été utilisés entre les

638 différents essais, dans les mêmes conditions et aux même dates. Dans la pratique quotidienne, ces outils ne paraissent pas a priori indispensables. En effet, la plupart des dermatologues évaluent la gravité de la maladie de manière intuitive (un peu mieux, beaucoup mieux, presque guéri. . .) sans utiliser d’outils de mesure. Leur utilisation est souvent considérée comme une perte de temps. Néanmoins, ces outils peuvent se révéler utiles en pratique quotidienne car ils permettent de programmer a priori un plan de traitement caractérisé par une succession d’étapes thérapeutiques dont la progression dépend de l’évaluation de la gravité à une date fixée. Par exemple, au cours du psoriasis, on peut choisir de modifier le traitement si l’objectif thérapeutique (mesuré par le score PASI) n’a pas été atteint 3 mois après le début du traitement. De ce fait, l’évaluation « objective » et répétée de la gravité au cours de la maladie permet d’établir des stratégies thérapeutiques par étapes dont le malade prend connaissance au début de la prise en charge. Le malade peut ainsi suivre la stratégie thérapeutique au fil des mois et se repérer par rapport au plan de traitement choisi au début de la prise en charge. Ainsi, l’utilisation d’outils d’évaluation de la gravité des maladies cutanées peut permettre d’impliquer le malade dans sa prise en charge par une participation active au choix du plan de traitement. Bien sûr, ce plan de traitement est susceptible d’être modifié et renégocié avec le malade au cours du suivi pour différentes raisons (tolérance, adhésion au traitement).

Qui doit évaluer la gravité ? Le médecin ou le malade ? L’évaluateur reste le plus souvent le médecin. Cependant, depuis quelques années, les CJ évalués par le malade (patient-reported outcomes) ont pris une importance croissante en médecine. Ainsi, des CJ évalués par le malade sont choisis comme CJP dans de nombreux essais cliniques et des recommandations du groupe Consolidated Standards of Reporting Trials (CONSORT) ont été publiées récemment à ce sujet [11]. En dermatologie, le malade dispose de plusieurs outils : Patient Oriented Eczema Mesure [12] (POEM), Patient Oriented SCORAD [13,14] (PO-SCORAD), Self Administred Eczema Area and Severity Index (SA EASI) [15], Self Assessment PASI (SA PASI). Ces outils permettent au malade d’évaluer lui-même la gravité de sa maladie. Ils sont susceptibles d’impliquer d’avantage le malade dans sa prise en charge ; ainsi, leur développement est encouragé par les autorités de santé internationales. En effet, la gravité des maladies inflammatoires chroniques cutanées fluctue au cours du temps, alternant des périodes de rémissions avec des périodes d’aggravation rapides (poussées). Ainsi, au cours de la DA, l’enjeu thérapeutique principal est d’adapter le plus étroitement possible le traitement local aux variations de la gravité de la maladie. Cette adaptation doit être réalisée par le malade dans sa vie quotidienne. Dans cette perspective, l’utilisation d’outils d’auto-évaluation permet une évaluation plus fréquente (plus souvent qu’une fois tous les 2 ou 3 mois au cours des consultations médicales) et donc plus proche des fluctuations de la gravité de la maladie. Ainsi, ces

S. Barbarot outils permettent au malade de repérer et de quantifier une aggravation de sa maladie et surtout d’adapter la stratégie thérapeutique (par exemple en débutant ou en modifiant son traitement anti-inflammatoire local).

L’exemple de la dermatite atopique : les scores utilisés sont nombreux et de qualité variable Une étude réalisée par Charman et al. a analysé tous les essais thérapeutiques randomisés dans la DA de janvier 1994 à décembre 2001. Sur les 93 études randomisées sélectionnées, 85 utilisaient une évaluation objective des signes cliniques de DA mais seulement 23 utilisaient un score publié et 56 échelles différentes ont été recensées [16]. L’augmentation du nombre de scores utilisés dans les essais thérapeutiques a induit une confusion dans l’évaluation de la sévérité de la DA et rend aujourd’hui très difficile la comparaison les résultats des études. Actuellement, seuls trois scores répondent à ces exigences de qualité dans la DA : le SCORAD, l’EASI et le POEM [10].

Comment harmoniser les critères de jugement dans l’eczéma ? L’exemple du projet HOME (Harmonising Outcome Measures for Eczema) Il y a une vingtaine d’années, les rhumatologues ont été les premiers à mettre en place une méthodologie spécifique visant à harmoniser les CJ dans le cadre du projet OMERACT (Outcome Measures in Rheumatology) [17]. Depuis, plusieurs spécialités se sont engagées dans cette voie, regroupées depuis 2010 sous le label COMET (Core Outcome Measures in Effectiveness Trials) [18]. En dermatologie, un groupe international coordonné par H. Williams et J. Schmitt travaille depuis 2010 à l’harmonisation des CJ dans la DA [5,19,20] (Harmonising Outcome Measures for Eczema [HOME] — http://www.homeforeczema.org). La méthodologie d’harmonisation des CJ comprend plusieurs étapes. La première étape du projet HOME a consisté à réunir un groupe de travail pluri-professionnel comprenant des médecins, des soignants, des méthodologistes, des représentants des associations de malades, des représentants des firmes pharmaceutiques impliquées dans les essais et des représentants des agences de santé. La participation des malades est très importante à ce stade. Ce groupe a choisi par consensus un certain nombre de domaines-clés (core domains) couvrant le champ de l’évaluation de la DA. Le consensus sur le choix des domaines-clés a été obtenu grâce a un processus de votes successifs appelé méthode DELPHI [21]. Les quatre domaines-clés suivants ont été retenus au cours d’une réunion du groupe HOME en 2011 (HOME II) [19] : • les signes cliniques ; • les symptômes ; • le contrôle des poussées à long terme ; • la qualité de vie.

Améliorer les performances des essais thérapeutiques Ainsi, à l’avenir, les essais cliniques portant sur la DA devront au minimum évaluer ces quatre domainesclés à l’aide d’outils adaptés. Certains domaines comme l’adhérence au traitement et le dosage de biomarqueurs n’ont pas été retenus. La deuxième étape consiste à définir un ou plusieurs CJclés pour chaque domaine (core outcome domains) et à identifier (s’ils existent déjà) ou à développer les meilleurs outils (par exemple des scores) pour évaluer ces CJ-clés. Par exemple, pour le domaine « symptômes », il s’agira de choisir quels CJ-clés mesurer parmi la qualité du sommeil, le prurit, la douleur. . . et quel outil utiliser pour mesurer ces CJ-clés (échelle visuelle analogique, scores. . .). La démarche proposée par le projet HOME ne consiste pas à imposer définitivement un nombre restreint de CJ-clés (des CJ supplémentaires pourront être utilisés dans les essais) ni d’imposer le caractère « principal » ou « secondaire » des CJ (ce choix varie en fonction des traitements et des essais et doit être de la responsabilité des investigateurs) mais plutôt de s’assurer qu’un certain nombre de CJ-clés seront a priori toujours évalués au cours des essais à venir portant sur la DA afin de permettre la comparaison des résultats a posteriori. Actuellement, le choix des CJ-clés pour chaque domaine est en cours d’élaboration. Ce travail a été débuté au cours d’une réunion du groupe HOME en avril 2013 (HOME III). Les résultats de ce travail conduisent à choisir, pour le domaine « signes de la maladie » les items clés à évaluer parmi les suivants : érythème, œdème, excoriation, lichenification, ainsi que le score retenu pour mesurer ces variables (EASI, SCORAD.). Ce même travail est en cours pour les domaines « symptômes », « qualité de vie » et « contrôle des poussées à long terme ». Il est à noter qu’il n’existe pas de définition consensuelle d’une poussée de DA. Par conséquent, il est actuellement difficile d’évaluer le domaine « contrôle des poussées à long terme ». Des outils spécifiques devront probablement être développés dans cet objectif.

Déclaration d’intérêts

639

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

L’auteur déclare ne pas avoir de conflits d’intérêts en relation avec cet article. [17]

Références [1] Nassar D, Sbidian E, Bastuji-Garin S, Martin L, Dupuy A. Typology of the primary outcome construction in dermatology: a systematic review of published randomized controlled trials. J Invest Dermatol 2013;133:371—6. [2] Chan AW, Altman DG. Epidemiology and reporting of randomised trials published in PubMed journals. Lancet 2005;365:1159—62. [3] Ioannidis JP. Why most published research findings are false. PLoS Med 2005;2:e124. [4] Kirkham JJ, Dwan KM, Altman DG, Gamble C, Dodd S, Smyth R, et al. The impact of outcome reporting bias in randomised controlled trials on a cohort of systematic reviews. BMJ 2010;340:c365. [5] Schmitt J, Williams H, Home Development Group. Harmonising Outcome Measures for Eczema (HOME). Report from the

[18]

[19]

[20]

[21]

First International Consensus Meeting (HOME 1), 24 July 2010, Munich, Germany. Br J Dermatol 2010;163:1166—8. Severity scoring of atopic dermatitis: the SCORAD index. Consensus Report of the European Task Force on Atopic Dermatitis. Dermatology 1993;186:23—31. Hanifin JM, Thurston M, Omoto M, Cherill R, Tofte SJ, Graeber M. The eczema area and severity index (EASI): assessment of reliability in atopic dermatitis. EASI Evaluator Group. Exp Dermatol 2001;10:11—8. Puzenat E, Bronsard V, Prey S, Gourraud PA, Aractingi S, Bagot M, et al. What are the best outcome measures for assessing plaque psoriasis severity? A systematic review of the literature. J Eur Acad Dermatol Venereol 2010;24:10—6. Mokkink LB, Terwee CB, Patrick DL, Alonso J, Stratford PW, Knol DL, et al. The COSMIN checklist for assessing the methodological quality of studies on measurement properties of health status measurement instruments: an international Delphi study. Qual Life Res 2010;19:539—49. Schmitt J, Langan S, Deckert S, Svensson A, von Kobyletzki L, Thomas K, et al. Harmonising Outcome Measures for Atopic Dermatitis I: assessment of clinical signs of atopic dermatitis: a systematic review and recommendation. J Allergy Clin Immunol 2013;132:1337—47. Calvert M, Blazeby J, Altman DG, Revicki DA, Moher D, Brundage MD, et al. Reporting of patient-reported outcomes in randomized trials: the CONSORT PRO extension. JAMA 2013;309:814—22. Charman CR, Venn AJ, Williams HC. The patient-oriented eczema measure: development and initial validation of a new tool for measuring atopic eczema severity from the patients’ perspective. Arch Dermatol 2004;140:1513—9. Stalder JF, Barbarot S, Wollenberg A, Holm EA, De Raeve L, Seidenari S, et al. Patient-Oriented SCORAD (PO-SCORAD): a new self-assessment scale in atopic dermatitis validated in Europe. Allergy 2011;66:1114—21. Vourc’h-Jourdain M, Barbarot S, Taieb A, Diepgen T, Ambonati M, Durosier V, et al. Patient-oriented SCORAD: a selfassessment score in atopic dermatitis. A preliminary feasibility study. Dermatology 2009;218:246—51. van Velsen SG, Knol MJ, Haeck IM, Bruijnzeel-Koomen CA, Pasmans SG. The Self-administered Eczema Area and Severity Index in children with moderate to severe atopic dermatitis: better estimation of AD body surface area than severity. Pediatr Dermatol 2010;27:470—5. Charman C, Chambers C, Williams H. Measuring atopic dermatitis severity in randomized controlled clinical trials: what exactly are we measuring? J Invest Dermatol 2003;120: 932—41. Boers M, Brooks P, Strand CV, Tugwell P. The OMERACT filter for outcome measures in rheumatology. J Rheumatol 1998;25:198—9. Williamson P, Clarke M. The COMET (Core Outcome Measures in Effectiveness Trials) initiative: its role in improving Cochrane reviews. Cochrane Database Syst Rev 2012;5:ED000041. Schmitt J, Langan S, Stamm T, Williams HC. Harmonizing Outcome Measurements in Eczema Delphi p: core outcome domains for controlled trials and clinical recordkeeping in eczema: international multiperspective Delphi consensus process. J Invest Dermatol 2011;131:623—30. Schmitt J, Spuls P, Boers M, Thomas K, Chalmers J, Roekevisch E, et al. Towards global consensus on outcome measures for atopic eczema research: results of the HOME II meeting. Allergy 2012;67:1111—7. Fink A, Kosecoff J, Chassin M, Brook RH. Consensus methods: characteristics and guidelines for use. Am J Public Health 1984;74:979—83.

[Improving performance in clinical trials through harmonisation of evaluation criteria: the case of atopic dermatitis].

[Improving performance in clinical trials through harmonisation of evaluation criteria: the case of atopic dermatitis]. - PDF Download Free
612KB Sizes 2 Downloads 8 Views