Leitthema Z Rheumatol 2014 · 73:698–705 DOI 10.1007/s00393-014-1412-1 Online publiziert: 26. September 2014 © Springer-Verlag Berlin Heidelberg 2014

Redaktion

R. Alten, Berlin M. Schneider, Düsseldorf

Patientenberichtete Endpunkte bzw. „patient-reported outcomes“ (PRO) haben in den letzten drei Jahrzehnten eine zunehmende Bedeutung in der Beurteilung von Krankheitsverläufen und Therapieansprechen erfahren. Sie stellen den übergeordneten Begriff für Instrumente dar, die über eine direkte Befragung der Patienten Informationen über verschiedene Krankheitsdimensionen erheben und dabei subjektive Einschätzungen und Empfindungen erfassen. „Patient-reported outcomes“ bieten Chancen und Risiken nicht nur in Studien, sondern v. a. auch für die Krankenversorgung in der klinischen Routine. Die Beurteilung erfragter PRO-Parameter erfolgt allein durch den Patienten, ohne dass diese durch Personen der Heilberufe mitbewertet werden. Dieses Vorgehen unterscheidet PRO zunächst von konventionell definierten Endpunkten, zu denen neben definierten Krankheitszuständen, wie Morbidität und Mortalität, laborchemische Werte, objektive klinische Zustände als auch subjektive ärztliche Einschätzungen gehören. In heterogenen Erkrankungen, wie dem systemischen Lupus erythematodes (SLE) werden solche Parameter dann als Teile kombinierter Endpunkte verwendet, um z. B. Krankheitsaktivität oder akkumulierten Krankheitsschaden adäquat widerzuspiegeln. Überwiegend stehen PRO für Instrumente, die für die Erhebung der (gesundheitsbezogenen) Lebensqualität („healthrelated quality of life“ [HRQoL], „quali-

698 | 

Zeitschrift für Rheumatologie 8 · 2014

G. Chehab · J. Richter · M. Schneider Poliklinik für Rheumatologie, Universitätsklinikum Düsseldorf

Möglichkeiten und Grenzen patientenberichteter Endpunkte am Beispiel des systemischen Lupus erythematodes und der LuLa-Studie ty of life“ [QoL]) stehen. Andere patientenberichtete Erhebungen werden auch unter den Begriffen „patient-reported measure“ (PRM) oder „patient reported outcome measure“ (PROM) geführt, was z. B. für die unten erwähnten Instrumente zur Erfassung des Krankheitsschadens, der Krankheitsaktivität und der Fatigue gilt. Der Einfachheit halber wird im folgenden Text einheitlich die Bezeichnung PRO verwendet. PRO können F unidimensional einen Krankheits­ aspekt widerspiegeln (z. B. zur Erfassung von Schmerzen, körperlicher Funktionsfähigkeit oder Fatigue) oder aber F verschiedene Krankheitsaspekte (mehrdimensional) zur Bewertung eines übergeordneten Endpunkts heranziehen (z. B. HRQoL, QoL). Gerade die Möglichkeit, Aspekte der QoL bei heterogenen Erkrankungen wie dem SLE zu erheben, die unzureichend durch klinische Parameter beschrieben werden können, fordert den Einsatz von PRO. Darüber hinaus bieten PRO weitere Möglichkeiten und Herausforderungen, die im Folgenden beschrieben werden sollen.

Institutionelle Empfehlungen In den letzten Jahren ist PRO in die Empfehlungen diverser übergeordneter Institutionen und Entscheidungsträger eingeschlossen worden. In Deutschland ist die Bedeutung der „patient-reported outcomes“ bereits aus den Vorgaben des Sozialgesetzbuchs (SGB V § 35b Abs. 1) ersichtlich. Hier heißt es, dass bei der Be-

urteilung des Patientennutzens eine Verbesserung der Lebensqualität zu berücksichtigen ist. Das Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWIG) hat erstmals in der Version 2.0 ihres Methodenpapiers (2006) auf die Zweckdienlichkeit von PRO in der Nutzenbewertung verwiesen. Das aktuelle Methodenpapier 4.1 (2013) erwähnt, dass neben der gesundheitsbezogenen Lebensqualität auch andere Nutzendimensionen mittels PRO erfasst werden können [1]. Im Februar 2006 hat die „U.S. Food and Drug Administration“ (FDA) Empfehlungen zur Implementierung und Beurteilung von „patient-reported outcomes“ bei Arzneimittel- und Medizinproduktzulassungen gegeben und damit die Diskussion rund um „patient-reported outcomes“ und deren (Fort-)Entwicklung weiter gefördert [2]. Dies wird auch in der Zunahme der auf Pubmed gelisteten Publikationen deutlich (. Abb. 1).

Nutzung von „patient-reported outcomes“ Der Einsatz von PRO bietet sich für zahlreiche Anwendungsgebiete beim SLE an, wozu neben den Zulassungsstudien, epidemiologische Studien und v. a. auch die Patientenversorgung im klinischen, ambulanten Alltag gehören. Neben der Erhebung von F Schmerz, F Fatigue, F Depression, F Qol/HRQoL

Leitthema samen Wissensstand der Patienten ausgegangen werden kann. Zusätzlich erfordert die Anwendung in anderen Sprachregionen und anderen Kulturen eine professionelle Übersetzung und kulturelle Adaptation [5].

450 400 350 300 250

Anwendungsbeispiele in der LuLa-Studie

200 150 100 50

13

14 20

12

20

11

20

10

20

09

20

08

20

07

20

06

20

05

20

04

20

02

03

20

20

00

01

20

20

99

20

98

19

19

19

96

0

Abb. 1 8 Anzahl jährlich gelisteter Publikation auf Pubmed zu PRO, PRM oder PROM (Stand: 26.05.2014)

können z. B. auch Krankheitsaktivität und -schaden abgebildet werden. Die Empfehlungen der „European League Against Rheumatism“ (EULAR) zum Monitoring bei SLE-Patienten schlagen ein regelmäßiges Messen von Aktivität und Lebensqualität bei jeder Visite sowie die jährliche Dokumentation von Krankheitsschaden vor. Es werden arztberichtete validierte Instrumente bzw. für die QoL die einfache Erhebung über eine visuelle Analogskala (VAS) genannt, was mit der mangelnden Praktikabilität eines längeren Patientenfragebogens [3] begründet wird.

»

Verbesserte krankheitsspezifische PRO können das Monitoring verändern Verbesserte krankheitsspezifische PRO können künftig das Monitoring verändern und es zunehmend in die Verantwortung der Patienten (unter professioneller Supervision) legen. In der klinischen Routine stellt die PRO-Nutzung zumeist nur einen geringen administrativen Aufwand dar. Die Erhebung kann eigenständig durch den Patienten, EDV-gestützt oder durch Assistenzpersonal erfolgen.

Entwicklung von PRO Für die Erstellung von PRO gelten die gleichen strengen Entwicklungsvorausset-

700 | 

Zeitschrift für Rheumatologie 8 · 2014

zungen wie für andere Instrumente. Diesbezügliche Empfehlungen setzen zumeist umfangreiche Prüfungen der F Validität (u. a. Inhalts-, Konstruktund Kriteriumsvalidität), F Reliabilität und F internen Konsistenz voraus. Ebenfalls sinnvoll ist eine Bewertung der Änderungssensitivität und des sog. minimal klinisch bedeutsamen Unterschieds [2, 4]. Diese Maße der PRO sind Mitvoraussetzung für die Interpretation, die Bewertung longitudinaler Verläufe oder auch für die Unterscheidung von Gruppen in Studien. Sind diese Qualitätsindikatoren unzureichend, so ist die Wahrscheinlichkeit der Erfassung falsch-negativer Befunde erhöht und es kommt so zu einer zunehmenden Unsicherheit bezüglich der resultierenden Krankheitseinschätzungen und Therapieentscheidungen. Aus diesen Gründen sind immer sorgsame Studien zur Bestimmung der Gütekriterien bei PRO erforderlich. Die Gütekriterien beziehen sich auf die jeweilige Validierungskohorte mit ihren kulturellen und linguistischen Eigenheiten. Anwendungen in anderen Zielgruppen, die sich deutlich von der Validierungskohorte unterscheiden, erfordern ggf. eine erneute Testung der Gütekriterien. Dies ist bei PRO besonders wichtig, da im Gegensatz zu Messinstrumenten für Ärzte nicht von einem gemein-

Seit dem Jahr 2001 führen die Autoren dieses Beitrags die Lupus-erythematodesLangzeit-Studie (LuLa-Studie) in Zusammenarbeit mit der Lupus Erythematodes Selbsthilfegemeinschaft e. V. (SHG) durch. Hierbei handelt es sich um eine jährlich durchgeführte patientenzentrierte Befragung einer seit dem Jahr 2005 geschlossenen Kohorte, die Fragen zu multiplen Krankheitsaspekten erhebt. Neben sich jährlich wiederholenden Fragen, u. a. zur Therapie, Krankheitsaktivität („Systemic Lupus Activity Questionnaire“; SLAQ) und HRQoL, gibt es jährliche Schwerpunktthemen. Sofern verfügbar, wird auf deutschsprachige und validierte Instrumente zurückgegriffen. In Fällen, in denen diese nicht verfügbar waren, wurden eigene Validierungsprozesse durchgeführt (z. B. „Brief Index of Lupus Damage“; BILD [6] und SLAQ [7]). Die Autoren konnten in Querschnittsuntersuchungen zeigen, dass die PROAngaben der Patienten vergleichbar waren mit den Angaben anderer Kohorten, u. a. auch mit denen der Kerndokumentation des Deutschen Rheuma-Forschungszentrums [8]. D Patienten können ihre

gesundheitliche Situation, Krankenvorgeschichte und Begleiterkrankungen korrekt darstellen. Dies wurde auch in anderen Arbeiten publiziert [9, 10] und unterstreicht die Qualität und Verwertbarkeit der Patientenangaben bezüglich klinischer Angaben. Ursachen einer fehlenden Übereinstimmung sind möglicherweise ein vermindertes Berichten durch die Patienten („under-reporting“), z. B. verursacht durch einen „recall bias“ oder Verständnisprobleme in der Fragestellung, z. B. bei Nutzung von Fremdwörtern.

Zusammenfassung · Abstract Z Rheumatol 2014 · 73:698–705  DOI 10.1007/s00393-014-1412-1 © Springer-Verlag Berlin Heidelberg 2014 G. Chehab · J. Richter · M. Schneider

Möglichkeiten und Grenzen patientenberichteter Endpunkte am Beispiel des systemischen Lupus erythematodes und der LuLa-Studie Zusammenfassung Hintergrund.  Patientenberichtete Endpunkte bzw. „patient-reported outcomes“ (PRO) haben in den letzten drei Jahrzehnten eine zunehmende Bedeutung in der Beurteilung von Krankheitsverläufen und Therapieansprechen erfahren. Sie stellen den übergeordneten Begriff für Instrumente dar, die über eine direkte Befragung der Patienten Informationen über verschiedene Krankheitsdimensionen erheben und dabei subjektive Einschätzungen und Empfindungen erfassen. Ziel der Arbeit.  In diesem Beitrag wird der aktuelle Stand der Nutzung von PRO aufgezeigt. Die Vor- und Nachteile einzelner Instrumente werden am Beispiel des systemischen Lupus erythematodes (SLE) und der LuLaStudie diskutiert. Schlussfolgerungen.  Über eine direkte Befragung der Patienten erfassen PRO subjekti-

ve Einschätzungen von Krankheitsaspekten. Sie werden überwiegend zur Bestimmung von (gesundheitsbezogener) Lebensqualität genutzt, können aber auch andere krankheitsassoziierte Aspekte adäquat widerspiegeln. Verschiedene Institutionen propagieren die Nutzung von PRO in klinischen Studien zur Bewertung von Arzneimittel- und Medizinproduktzulassungen, weil letztendlich der Nutzen für den Patienten zählt. Für PRO gelten die gleichen psychometrischen Gütekriterien wie für ärztliche Instrumente, die klinische Endpunkte messen. Besonderes Augenmerk ist hierbei, wegen der sehr heterogenen soziodemographischen Zusammensetzung der Patientenkollektive, auf kulturelle und linguistische Adaptationen zu richten.

Neben gängigen Herausforderungen wie fehlenden Werten, „over-reporting“ und „under-reporting“, können subjektive Angaben durch andere Kontexteinflüsse mit beeinflusst werden (z. B. krankheitsunabhängige Lebenssituationen). Änderungen des Bewertungsverhaltens können im Langzeitverlauf zu Interpretationsschwierigkeiten führen. Ursachen und Einflussfaktoren diskordanter Einschätzungen zwischen Arzt und Patient sind bei der Nutzung von PRO zu berücksichtigen, wobei keiner der Aspekte generell besser ist als der andere. Schlüsselwörter Patientenbezogene Ergebnisbeurteilung · Patientenberichtete Zielgröße · Prognose · Lebensqualität · Fragebogen

Possibilities and limits of patient-reported outcome exemplified by systemic lupus erythematosus and the LuLa study Abstract Background.  Over the last three decades patient reported outcomes (PRO) have become increasingly more important for the assessment of the course of diseases and therapy response. It represents the generic term for instruments which elicit information on various disease dimensions by direct questioning of patients and thereby collate subjective estimations and perceptions. Aim of the study.  This article presents the current situation with respect to the utilization of PRO. The advantages and disadvantages of individual instruments are discussed exemplified by systemic lupus erythematosus (SLE) and the LuLa study. Conclusion.  The PRO instrument collates subjective estimations of various aspects of

Nutzen und Probleme am Beispiel des SLAQ Der SLAQ wurde im Jahr 2003 durch Karlson et al. [11] veröffentlicht. Seine Entwicklung erfolgte in Anlehnung an die klinischen Items des „Systemic Lupus Activity Measure“ (SLAM) und erfragt die Schwere (keine, leicht, mittel und schwer) von 24 Symptomausprägungen in 9 Organsystemen bezogen auf die letz-

diseases directly from the patients. The PRO is mainly used to survey (health-related) quality of life but can also be used to reflect other disease-associated aspects. Various institutions promote the use of PRO in clinical trials for assessment of approval for pharmaceutical and medical products because ultimately only benefits for the patients are of relevance. The development of PRO instruments requires the same extensive psychometric testing as physicains instruments to measure clinical endpoints. Because of the heterogeneous sociodemographic composition of patient collectives, particular attention has to be given to cultural and linguistic adaptation. In addition to common challenges, such as missing values, under-reporting, over-re-

ten 3 Monate. In der englischen Originalversion zeigte der SLAQ eine gute Korrelation mit dem SLAM und positive Vorhersagewerte von 56–89%, um eine klinisch relevante Aktivität nachzuweisen [11]. Mithilfe des SLAQ ist es somit möglich, ohne Erfordernis einer ärztlichen Mitbeurteilung in epidemiologischen Studien die Krankheitsaktivität, umfassender als z. B. durch eine VAS, zu erfassen. Dabei ist zu berücksichtigen, dass

porting and response shift, subjective opinions can be influenced by other contextual factors, such as life situations unrelated to the disease. Alteration of internal standards or conceptualization can lead to interpretation difficulties in the long-term. Determinants of discordant estimations between physicians and patients need to be considered when using PRO but none of the aspects is generally better than the other. Keywords Patient outcome assessment · Patientreported measure · Prognosis · Quality of life · Questionnaire

der SLAQ vom SLAM abgeleitet wurde, der selbst eine relativ hohe Anzahl subjektiver, vom Arzt anamnestisch erhobener, Items enthält. Der Aufwand für das Ausfüllen des Bogens durch den Patienten sowie die nachfolgende Berechnung des Scores sind mit jeweils maximal 10 min zu veranschlagen. Die Nutzung in der klinischen Routine kann die Patienten herausfiltern, die eine relevante oder eine Zunahme der KrankheitsaktiviZeitschrift für Rheumatologie 8 · 2014 

| 701

Leitthema tät aufweisen und einer kurzfristigen Evaluation durch einen Arzt bedürfen.

Nutzen und Probleme am Beispiel des BILD

D Der SLAQ stellt im klinischen Alltag

Zur patientenseitigen Erfassung des Krankheitsschadens beim SLE gibt es den „Lupus Damage Index Questionnaire“ (LDIQ; [12]) und den daraus abgeleiteten, gekürzten „Brief Index of Lupus Damage“ (BILD; [13]), der ins Deutsche übersetzt und validiert wurde [6]. Der BILD enthält 28 Items des LDIQ, der auf dem „Systemic Lupus International Collaborating Clinics/American College of Rheumatology Damage Index“ (SDI) basiert. Die Items wurden patientenverständlich umformuliert. Die deutschsprachige Version des BILD zeigte in den Untersuchung der Autoren eine starke Korrelation mit dem SDI [6]. Der Zeitaufwand für den Patienten liegt zwischen 5 und 10 min und die manuelle Berechnung des Summenscores dürfte nur wenige Minuten veranschlagen. Das Fehlen bestimmter Items des SDI, die für Erhebung durch Patienten ungeeignet sind (z. B. Alopezie, glomeruläre Filtrationsrate), stellen einen Nachteil des BILD dar. Von Vorteil ist, dass bestimmte Schadensausprägungen in der normalen Anamnese zu wenig Beachtung finden, wenn der SDI nicht strukturiert erfasst wird. Hier können die Angaben des BILD als wichtige Informationsquelle ergänzend herangezogen werden. In der longitudinalen Bewertung zeigt der BILD eine vergleichbare Änderungssensitivität wie der SDI [14].

keinen Ersatz für eine ärztliche Aktivitätsbeurteilung dar. Unter den LuLa-Teilnehmern zeigt sich im longitudinalen Verlauf eine erwartungsgemäße Entwicklung des SLAQ mit einem mittleren Abfall von knapp 11% zwischen dem Jahr 2005 und dem Jahr 2011. Vergleichbar rückläufig präsentierten sich andere patientenberichtete Endpunkte (Prednisolon-Tagesdosis, Schubhäufigkeit). Ergänzend weist die in der LuLa-Studie seit dem Jahr 2011 integrierte Inzeptionskohorte einen im Mittel deutlich höheren SLAQ auf, als die seit dem Jahr 2005 geschlossene Kohorte. Diese Ergebnisse sprechen für den SLAQ als Instrument zur Erfassung der Krankheitsaktivität und für die Möglichkeit auch klinische Konstrukte patientenberichtet zu erheben. Die Analyse der Angaben der Einzelteilnehmer dokumentierte auch Fälle (~5,1%), die eine ungewöhnlich geringe Standardabweichung ihres siebenjährigen SLAQ-Mittelwerts aufwiesen und damit eine über Jahre stabile Krankheitsaktivitätseinschätzung. Im Vergleich zu den anderen Teilnehmern waren diese älter, hatten eine längere Krankheitsdauer, mehr Krankheitsschaden und eine schlechtere körperliche Komponente im HRQoL. Offensichtlich beeinflussen hier andere Endpunkte wie Schaden und die schlechte körperliche Verfassung die Einschätzung des Endpunkts. Dies kann zum einen durch eine fehlerhafte Interpretation bzw. Zuordnung von Folgen und Einschränkungen durch Krankheitsschaden oder Symptomen von Begleiterkrankungen zum SLE bedingt sein. Alternativ können sie durch andere Kontexteinflüsse mitverursacht sein, die zwar für den Patienten eine Last darstellen und gegebenenfalls die Lebensqualität beeinflussen, jedoch im klinischen Sinne keiner Krankheitsaktivität entsprechen. Auch können andere (un-)bewusste Aspekte wie Depression oder Copingverhalten eine Rolle spielen oder besondere Situationen (z. B. Rentenbegehren) zu einer Änderung des Antwortverhaltens führen.

702 | 

Zeitschrift für Rheumatologie 8 · 2014

»

Ein bedeutendes Problem bei PRO sind fehlende Angaben der Patienten Ein bedeutendes Problem bei PRO sind fehlende Angaben der Patienten, die auch bei der Anwendung des BILD beobachtet wurden. Trotz der Möglichkeit das Vorhandensein eines Schadenitems als unbekannt einzustufen, fielen bei 18% der Teilnehmer im Mittel 1,4 fehlende Angaben auf (versus 16% mit im Mittel 1,7 unbekannt markierten Items). Eine hohe Anzahl fehlender Werte lag zumeist darin begründet, dass Teilnehmer nur zutreffende Items markierten und alle anderen Items unbearbeitet ließen. Die

Auswertung der Bögen ist dadurch eingeschränkt. In Fragebögen, die mehrere Items für eine Domäne erfassen, wie z. B. beim SF36, ermöglichen Imputationstechniken das Ersetzen fehlender Werte. Bei der Validierung des LDIQ wurden höhere Scorewerte im Patientenfragebogen beobachtet als bei den Arztbögen [12], was auf ein „over-reporting“ zurückgeführt wurde. Dies kann ursächlich durch eine Fehlklassifikation von Ausprägungen oder Verständnisprobleme verursacht werden und zeigt die Wichtigkeit der sprachlichen und kulturellen Anpassung an die Zielpopulation auf.

Arzt-Patienten-Diskordanz Die beschriebenen Probleme beim SLAQ und BILD sind u. a. mit ursächlich für eine Diskordanz zwischen Patient- und ArztEinschätzung. Unterschiedliche Wahrnehmung oder Gewichtung der Schwere von SLE-Symptomen und die Überlagerung durch Begleitumstände oder Begleiterkrankungen tragen hierzu den Hauptanteil bei. Dies wurde z. B. für die Bewertung der globalen Krankheitsaktivität auf einer VAS gezeigt, auf der knapp 21% der Patienten die Krankheitsaktivität höher einstuften als die behandelnden Ärzte, wohingegen dies nur bei knapp 7% der Ärzte der Fall war. Hierfür wurden das psychische und physische Wohlbefinden, die die Patienten in höherem Maße berücksichtigen, als mitursächlich eingestuft. Schmerzen, psychische HRQoL (SF-36) und eine Nierenbeteiligung (SLAM-R) waren Hauptfaktoren, die eine höhere Diskordanz bedingten [7, 15]. Eine weitere Befragung des LuLa-Kollektivs im Jahr 2010 ergab, dass zumeist Gelenk-, Hautbeteiligungen oder psychische Probleme als Hauptlast empfunden wurden. Ferner berichteten über 48% ­aller Teilnehmer, dass sie sich über eine Allgemeinsymptomatik (z. B. ­Fatigue, Angst, Schlafstörungen) mehr belastet und beeinträchtigt sehen als durch Organbeteiligungen. Knapp 32% beschrieben dazu ein ausgeglichenes Verhältnis. Es zeigt sich somit, dass Patienten sich nicht nur durch konventionelle klinische Endpunkte, sondern v. a. durch ergänzen-

Tab. 1  Ausgewählte Patientenberichtete Instrumente, die beim SLE Anwendung finden Instrument



Krankheitsspezifisch   X

Zeitaufwand (min) Patient Admin. k.A. k.A. 10 10

Dimensionen (Items)   Unidimensional (9 Items) Unidimensional (24 Items zu 9 Organsystemen)

„Fatigue Severity Scale“ (1989; [21]) „Systemic Lupus Activity Questionnaire“ (SLAQ, 2003; [11]) „Lupus Damage Index Question­ naire“ (LDIQ; 2007; [12]) „Brief Index of Lupus Damage“ (BILD, 2011; [13]) „Medical Outcome Studies (MOS) 36-Item Short Form“ (SF-36; [22])

Fatigue Krankheitsaktivität Schaden

X

~10

k.A.

Unidimensional (56 Items zu 12 Organsystemen)

Schaden

X

~10

k.A.

Unidimensional (28 Items zu 9 Organsystemen)

HRQoL



10

15–20

SF-12 [18]

HRQoL



2

15–20

„SLE Symptom Checklist“ (SSC, 2003; [23]) „Systemic Lupus ErythematosusSpecific Quality Of Life Question­ naire“ (SLEQoL, 2005; [24]) „Lupus Quality Of Life“ (LupusQoL, 2007; [25])

QoL

X

[Possibilities and limits of patient-reported outcome exemplified by systemic lupus erythematosus and the LuLa study].

Over the last three decades patient reported outcomes (PRO) have become increasingly more important for the assessment of the course of diseases and t...
457KB Sizes 0 Downloads 5 Views