Zum Thema 415

Welcher Nutzen und welcher Schaden kann von Screening- und Routineuntersuchungen erwartet werden und von deren Unterlassung?* E. Kuss 1, M. Tryba2, R. Kürzl', K. Ulsenheimer3

Zusammenfassung Die Frage nach dem Nutzen und Schaden von Screening- und Routineuntersuchungen und von deren Unterlassung wird in vier Abschnitten beantwortet. Im ersten Abschnitt werden die Methoden beschrieben, mit denen der Erkenntniswert medizinischer Untersuchungen geschätzt werden kann. Es werden die Begriffe diagnostische Sensitivität, diagnostische Spezifität einer Untersuchung sowie Prätest- und Posttest-Wahrscheinlichkeit einer Diagnose definiert. Anschließend wird dargestellt, wie die Begriffsinhalte voneinander abhängen und wie deren numerische Werte errechnet werden können (»Bayes-Theorem«). Im zweiten und dritten Abschnitt wird unter Berücksichtigung der oben genannten Zusammenhänge der Wert präoperativer Routineuntersuchung aus anästhesiologischer Sicht erörtert, aus gynäkologischer Sicht außerdem auch der Wert anderer Screeningund auch Nachsorge-Untersuchungen. Präoperative Laboratoriumsuntersuchungen sind dann, aber auch nur dann notwendig, wenn sorgfältige Erhebung der Anamnese und sorgfältige körperliche Untersuchung Hinweise auf Organschäden und Risikofaktoren ergeben. Der Nutzen klinisch-chemischer Screening- und NachsorgeRoutineuntersuchungen, deren Durchführung Frauen-

Let us have not more science, bat better science und truer science in the medical curriculum (53). Weltweit erarbeiten Wissenschaftler, Habilitanden, Doktoranden in Universitäten und Industrien neue Möglichkeiten, Bekanntes besser oder jedenfalls anders zu analysieren und bisher Unbekanntes oder Unmeßbares nachweisbar oder meßbar zu machen. Täglich erscheinen Journale und publizieren die Ergebnisse in der ersten oder einer weiteren Ausführung. Diese Aktivitäten könnten uns der Wahrheit stetig näher bringen, dem

* Ergebnis der Arbeitsgemeinschaft Klinische Chemie und Biochemie in Frauenkliniken, Deutsche Gesellschaft für Gynäkologie und Geburtshilfe, 48. Kongreß, Hamburg 11.09.1990 Geburtsh. u. Frauenheilk. 51 (1991) 415-430 © Georg Thieme Verlag Stuttgart • New York

ärzten empfohlen wird, ist gering. Dies ist, wie belegt wird, zum einen die Folge des hohen Anteils „gesunder" Frauen unter den Patientinnen der Frauenärzte, zum anderen die Folge der Tatsache, daß im Rahmen der gynäkologischen Onkologie die Behandlung eines frühzeitig erkannten Rezidivs nicht nachweislich erfolgreicher ist als die eines später entdeckten. Im vierten Abschnitt wird schließlich ausgeführt, daß keine nachteiligen forensischen Folgen zu erwarten sind, wenn diagnostische Untersuchungen wegen nachweislich geringem Erkenntniswert unterlassen werden. Wird ein einschlägiges Rechtsverfahren eröffnet, dann muß der medizinische Sachverständige den Erkenntniswert der eingeklagten Untersuchung objektiv aus der Sicht ex-ante bestimmen; hierzu dienen die im ersten Abschnitt besprochenen Rechenverfahren. Unter Berufung auf die Judikatur von vornherein „aus Sicherheitsgründen" Diagnostik zu betreiben, aus der sich mit hoher Wahrscheinlichkeit keine therapeutischen Konsequenzen ergeben, ist nicht gerechtfertigt; die fehlende medizinische Indikation darf nicht durch eine „forensische Indikation" ersetzt werden. Diagnostische Untersuchungen wegen mangelnder Erfolgswahrscheinlichkeit zu unterlassen, bleibt nicht nur ohne nachteilige forensische Folge, sondern ist aus ärztlichen, wirtschaftlichen und ethischen Gründen geboten.

praktizierenden Arzt die diagnostische Aufgabe fortwährend erleichtern, das Vertrauen des Patienten zunehmend steigern und der Gesellschaft den Unterhalt ihres Gesundheitswesens stetig erleichtern, würden wir in einer idealen Welt leben. Arzt, Patient und Gesellschaft der realen Welt wissen oder fürchten, daß dem nicht so ist. Komplexität von Gesundheit und Krankheit und die variablen Vorstellungen davon, Ignoranz und Oberflächlichkeit, Spezialistentum, Phobien, Geltungsbedürfnis, „publish or perish", Marketing-Erfordernisse, Verkaufsargumente, Journalismus, Gewinnstreben, Dogmatismus, Anspruchshaltung, Jurisdiktion und was darüber kolportiert wird, Vollständigkeitswahn, „universitärer Standard", Kostenindifferenz, Sicherheitssuggestion und andere Faktoren, mehr oder weniger gleichmäßig auf alle Beteiligten verteilt, induzieren diagnostischen Aktionismus und progrediente Unsicherheit trotz und wegen der Fülle der Ergebnisse. In Deutschland trägt der nicht sehr hoch eingeschätzte Stand der klinischen Forschung (88) das Seine dazu bei. Der folgende Beitrag soll dem praktizieren-

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

I. Frauenklinik der Universität München, 2 Universitätsklinik für Anästhesiologie, Intensiv- und Schmerztherapie, Bochum, 3Rechtsanwaltskanzlei, München

Geburtsh . u. Frauenheilk . 51 (1991)

Benefit and Harm to be Expected from Screening and Routine Tests or Their Omission Benefit and barm of screening and routine tests or their omission are dealt with in four parts. In the first part methods are described to evaluate the diagnostic value of medical testing. The concepts of diagnostic sensitivity, diagnostic specificity, and pre- and posttest probability of a diagnosis are defined. It is then shown how these concepts intercorrelate and how their numerical values can be calculated ("Bayes' theorem"). In consideration of the above mentioned intercorrelations, the second and third parts deal with the diagnostic value of preoperative routine tests from an anaesthesiological viewpoint, and the diagnostic value of other screening and follow-up tests is discussed from a gynaecological point of view. Pre-operative laboratory tests are necessary, and necessary only then, if careful evaluation of patient history and physical examination reveal pathological findings er

den Frauenarzt helfen, die Fülle diagnostischer Möglichkeiten zu sortieren und Forderungen an die Diagnostik auf ein den Ärzten, den Patienten und der Gesellschaft angemessenes Maß einzustellen, das auch von sachverständigen Gutachtern zu respektieren ist. 1. Wie kann die Erfolgswahrscheinlichkeit medizinischer Untersuchungen geschätzt werden? Diagnostische Untersuchungen in der Medizin sollen Symptome nachweisen und nach Möglichkeit quantifizieren. Zu den Symptomen gehören die subjektiven Beschwerden des Patienten wie auch die Ergebnisse der unmittelbaren körperlichen Untersuchung, die der bildgebenden und biophysikalischen Verfahren sowie die Ergebnisse der Untersuchung von biologischen Flüssigkeiten, Zellen und Geweben in den Laboratorien. Die Ergebnisse T dieser Untersuchungen oder Tests, die möglichst nach Regeln der diagnostischen Logik in zeitlicher Reihenfolge als T1, T2, T3...Tn anfallen, sollen Aussagen über das Vorhandensein eines Zustandes oder einer Krankheit D liefern. In der Frauenheilkunde sind dies Tests wie z, B. Anamnese, Palpation, Sonographie, Mammographie, Kardiotokographie, Bestimmung von hCG oder von Tumormarkern und Zustände wie z. B. Schwangerschaft, Blutgruppeninkompatibilität, Infektion oder Karzinom. Es gehört zum Wesen der Diagnostik (17, 29), daß, vom Ergebnis T jeder Untersuchung ausgehend, nicht Aussagen über das Vorhandensein, sondern nur Aussagen über die Wahrscheinlichkeit des Vorhandenseins von D möglich sind. Um diese Wahrscheinlichkeit schätzen zu können, muß es außer dem Ergebnis T der jeweiligen Untersuchung zusätzlich ein Außenkriterium, eine möglichst richtige und von T unabhängige Information über das Vorhandensein von D geben. Nur so ist es möglich, den diagnostischen Wert von T abzuschätzen, T zu validieren. Diese Validierung muß erfolgt und ihr Ergebnis muß bekannt sein, bevor das betreffende Untersuchungsverfahren in der diagnostischen Praxis eingesetzt wird.

E. Kuss, M. Tryba, R. Kürzl, K. Ulsenheimer

risk factors. The benefits from regular lab-screening tests and follow-up tests, as recommended to the gynaecologists, are low. This is due to the large share of "healthy" women among the gynaecological patients, as well as the fact that treatment of early detected recurrences shows no demonstrable advantage over treatment of later detected recurrences. In the fourth part, we show that no adverse forensic consequences are to be expected if diagnostic tests are omitted because of demonstrably low diagnostic value. In case of legal procedures against the physician, a medical expert will have to evaluate the diagnostic value of the omitted test objectively from an "ex-ante" point of view, using the methods defined in the ferst part. To safeguard oneself against possible legal procedures does not justify diagnostic measures that hardly have therapeutic consequences; missing medical indication must not be replaced by "forensic indication". Omission of diagnostic tests that have no diagnostic value, therefore, not only remains without forensic consequences, but is even mandatory for medical, economical and ethical reasons.

Die Erfolgswahrscheinlichkeit medizinischer Untersuchungen kann mit Hilfe von Güteindizes geschätzt werden (77). Die Indizes werden in zwei Gruppen, A und B, eingeteilt. A: Zu dieser Gruppe gehören die diagnostische Sensitivität und die diagnostische Spezifität (Tab. 1) der Ergebnisse eines Untersuchungsverfahrens zum Nachweis des Zustandes/der Krankheit D. Diese Indizes entsprechen dem Anteil richtig positiver und dem Anteil richtig negativer Testergebnisse. Nur gemeinsam charakterisiert das Indexpaar den diagnostischen Wert eines Verfahrens. Beide Indizes sind Ergebnisse der vorangegangenen Validierung des Testverfahrens an zwei Subpopulationen, einer Indexpopulation (Prätest-Wahrscheinlichkeit von D = 1) und einer Referenzpopulation (Prätest-Wahrscheinlichkeit von D = 0). B: Zu dieser Gruppe gehören die A-priori- oder PrätestWahrscheinlichkeit, die auch als Prävalenz eines Zustands/ einer Krankheit bezeichnet wird (Tab. 1) und die A-posteriori- oder Posttest-Wahrscheinlichkeiten dieses Zustandes/dieser Krankheit. Die Posttest-Wahrscheinlichkeiten werden auch als „Prädiktiver Wert des positiven Untersuchungsergebnisses" und „Prädiktiver Wert des negativen Untersuchungsergebnisses" bezeichnet (Tab. 1). Die unter A genannten Indizes Sensitivität und Spezifität zu ermitteln und anzugeben, obliegt denen, die ein Untersuchungsverfahren entwickeln, und denen, die dieses Verfahren begründet empfehlen wollen. Die Indizes charakterisieren den generellen diagnostischen Wert des Testverfahrens zum Nachweis von D. Die unter B genannten Indizes PrätestWahrscheinlichkeit und Posttest-Wahrscheinlichkeiten abzuleiten und abzuwägen, obliegt dem behandelnden Arzt und denen, die eine definierte Gruppe von Personen einem bestimmten Untersuchungsverfahren unterwerfen oder dies empfehlen. Die Indizes charakterisieren die Wahrscheinlichkeiten einer Diagnose vor und nach Kenntnisnahme des Ergebnisses einer Untersuchung speziell

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

416

Nutzen und Schaden bei Screening- und Routineuntersuchungen

Häufigkeit

Geburtsh. u. Frauenheilk. 51 (1991) 417 Tab. 1 Vierfeldertafel zur Charakterisierung der diagnostischen Validität der Ergebnisse von Untersuchungen zum Nachweis oder Ausschluß eines Zustands, z. B. einer Krankheit D.

A

tatsächliches Vorhandensein des Zustands /der Krankheit positiv negativ

Ergebnis der positiv Untersuchung negativ

a c

b d

a, b, c, d: Anzahl von Ergebnissen oder von Individuen (Probanden, Patientinnen) in der jeweiligen Gruppe

B

a/(a + c): Anteil der Wahrscheinlichkeit richtig positiver Untersuchungsergebnisse, P(T+ID+), Diagnostische Sensitivität

a/(a + c) + c /(a + c) 1,00 und d /(b + d) + b/(b + d) = 1,00 oder Anteil falsch positiver Befunde = 1,00-Spezifität = Typ 1 oder a Fehler Anteil falsch negativer Befunde = 1,00 - Sensitivität = Typ II oder ß Fehler

D b c Meßwerte ® Häufigkeitverteilung von D ® Häufigkeitverteilung von D+ Abb. 1

Häufigkeitsdichte von Meßwerten.

(a + c)/(a + b + c + d): Prätest- oder A-priori-Anteil oder -Wahrscheinlichkeit des Vorhandenseins des Zustands D, Prävalenz des Zustands D a/(a + b): Posttest- oder A-posteriori-Anteil oder -Wahrscheinlichkeit des Vorhandenseins des Zustands D bei positivem Ergebnis des Tests oder Prädiktiver Wert des positiven Ergebnisses

A, B, C, D: Vergleich der Subpopulation D- (Referenzpopulation) mit der Subpopulation D+ (Indexpopulation) hinsichtlich der Ergebnisse der Testverfahren TA, Te, Tc, TD. oder Vergleich der Subpopulation D- (Referenzpopulation ) mit den Populationen D+ (D+A, D +B, D+c, D+o) hinsichtlich der Ergebnisse eines Testverfahrens T(TA=TB=Tc=T1). a, b, c, d , e: willkürlich als Diskriminationswerte ausgewählte Meßwerte; s. Tab. 2.

Quotient der Wahrscheinlichkeit („likelihood ratio"): (Sensitivität)/(1 - Spezifität)

bezogen auf den jeweiligen Patienten oder die definierte Gruppe. Die Differenz „Posttest-Wahrscheinlichkeit - Prätest-Wahrscheinlichkeit" quantifiziert den Informationsgewinn durch diesen Test im Verlauf des diagnostischen Prozesses. Mit anderen Worten, es handelt sich darum, A: die bedingte Wahrscheinlichkeit P für das Auftreten eines „positiven" (T+) oder eines „negativen" (T-) Ergebnisses der Untersuchung zu ermitteln unter der Voraussetzung, daß der Zustand/die Krankheit D vorhanden (D+) oder nicht vorhanden ist (D-). B: die bedingte Wahrscheinlichkeit P für das Vorhandensein (D+) oder Nichtvorhandensein (D-) des Zustands/der Krankheit D zu ermitteln unter der Voraussetzung, daß das Testergebnis positiv (T+) oder negativ (T-) ist.

scheinlichkeiten P übergehen (0 < P < 1). Wir empfehlen allen ärztlich tätigen Kollegen, die hier behandelten Begriffe aufzunehmen, wenn auch zunächst nur widerwillig. Was als theoretische Spielerei anmuten mag, ist tatsächlich von eminent praktischer Bedeutung. Die umständliche Bezeichnung der Begriffe mag ihre Aufnahme und den Umgang mit ihnen erschweren. Der Inhalt ist hingegen simpel und leicht verständlich. Wenn er einmal perzipiert wurde, erscheint er fast trivial. Wie dem auch sei, die Kenntnis der vier Begriffe kann das Verständnis für Diagnostik enorm erweitern; die Unkenntnis ist sicherlich Ursache zahlreicher diagnostischer Mißverständnisse und überzogener diagnostischer Anforderungen und Erwartungen. Die Vernachlässigung der Indizes ermöglicht viele fragwürdige Publikationen aus der klinischen Forschung und Erprobung.

Die Indizes sind also Anteile, echte Brüche, die beim Vorliegen hinreichend großer Zahlen in Wahr-

Die Schätzung der Zahlenwerte der diagnostischen Indizes ist selbstverständlich auch fehlerhaft. Die

d/(c + d): Posttest- oder A-posteriori-Anteil oder -Wahrscheinlichkeit des Nichtvorhandenseins des Zustands D bei negativem Ergebnis des Tests oder Prädiktiver Wert des negativen Ergebnisses Quotient der Wahrscheinlichkeiten („likelihood ratio"): (Spezifität)/(1 - Sensitivität)

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

d /(b + d): Anteil oder Wahrscheinlichkeit richtig negativer Untersuchungsergebnisse, P(T-ID-), Diagnostische Spezifität

C

Geburtsh. u. Frauenheilk. 51 (1991)

E. Kuss, M. Tryba, R. Kiirzl, K. Ulsenheimer

SPEZIFITAT (ANTEIL RICHTIG NEGATIVER ERGEBNISSE)

1.00 100 D

080 I

I

UJ Cf) Cf)

z ffi

080~

/

060

-=---

C

0.40 I

./'

020

> /

0

71

0

» 2 1-0.20

~

I-

~

~I

UJ

~ffi

!:::::>

>;:::: i=ü5 -0

060-1

I

/

/

1-040

Z(:J OA°-li w-

2

m

mZ

I

«

/

1-060 m-

JJ-I

(/)~

I

m):l;

g

JJ-I GJ

rr üj

~(/)

GJ(/) »"""-I

(/)0..

-J

m """

1'"

0.20-H

1-0.80 m OJ

/

2

~

fJj

2

«

m

Q20

040

0.60

0.80

1-SPEZIFITAT (ANTEIL FALSCH POSITIVER ERGEBNISSE)

Abb.2 Sensitivität-Spezifität-Diagramm (ROC-Kurve). Graphische Darstellung der resultierenden Werte für Spezifität undSensitivität, wenn kontinuierlich jederder Meßwerte (Abb. 1)zum Diskriminationswert gemacht wird. DieSchenkel desrechten Winkels links oben (0), dieKurven (C undB)unddieDiagonale (A) entsprechen je einer dervierinAbb. 1,A,B,C, D, dargestellten Häufigkeitsverteilungen mit ihren unterschiedlichen Überlappungen.

statistischen Fehler lassen sich mit der entsprechenden Fehlerstatistik (Standardfehler, Konfidenzintervall) quantifizieren (2, 32 b, 45). Problematischer sind systematische, klassifikatorische, "medizinische" Fehler (19, 90). Beschreiber diagnostischer Methoden neigen z. B.dazu, für die Indexpopulation Individuen mit schwerer Ausprägung des zu diagnostizierenden Merkmals heranzuziehen (z. B. Ovarialkarzinom Stadium IV) und für die Referenzpopulation Individuen zu bevorzugen, denen nicht nur das zu diagnostizierende Merkmal, wie z. B. Ovarialkarzinom, sondern auch das möglicherweise diagnostisch interferierende Merkmal, wie z. B. Adnexitis, Endometriose, fehlt. Dies führt zu Initialen und partiell persistierenden Überschätzungen von Spezifität und Sensitivität eines Untersuchungsverfahrens, wie es beispielhaft die historische Entwicklung der Validitäten zeigt, die dem CEA- Test und dem CTG zugesprochen worden waren. Auch die vom behandelnden Arzt der Diagnose zugeordnete Prätest-Wahrscheinlichkeit ist fehlerbehaftet. Aber zumindest dieser Fehler würde auch dann in die Diagnostik eingehen, wenn der behandelnde Arzt, statt die Güteindizes numerisch und explizit zu schätzen, die Untersuchung ohne Berücksichtigung dieser Zusammenhänge fortsetzt (35). Zu A: Zwei hinreichend große Subpopulationen, die sich durch das Vorhandensein (lndexpopulation) oder Nichtvorhandensein (Referenzpopulation) des zu diagnostizierenden Merkmals D unterscheiden, werden dem zu validierenden Test unterworfen. Die Testergebnisse T verteilen sich um einen Zentralwert (Abb. 1; A) oder um zwei (Abb. 1; B, C, D) oder um mehrere Zentralwerte. Je kleiner die analytische und biologische Varianz der Testergebnisse ist, um so enger wird die Verteilung (22). Wenn sich die von beiden Subpopulationen gewonnenen Test-

ergebnisse nicht gleichartig verteilen (wie in Abb. 1 A), sondern verschiedenartig (wie z. B. in Abb. 1 B, C, D), dann können durch diesen Test über einen festzulegenden Meßwert, den Diskriminationswert, die beiden Subpopulationen mehr oder weniger exakt voneinander getrennt werden. Durch die Festlegung dieses .Diskriminationswertes" wird eine kontinuierliche Variable wie z. B. Meßwerte, oder auch eine kategoriale Variable wie z. B. Stadium I, II, III, in eine "binäre" oder "dichotome" Variable, wie z. B. "ja/ nein" umgeformt. Das Kontinuum der "Meßwerte" wird durch den Diskriminationswert in zwei Bereiche eingeteilt: Der erste Bereich umfaßt alle Meßwerte oberhalb des Diskriminationswertes. Diese Meßwerte gehören zum Bereich "positiver" Befunde. Der zweite Bereich umfaßt alle Meßwerte unterhalb des Diskriminationswertes. Diese Meßwerte gehören zum Bereich "negativer" Befund. Diese Zuordnung gilt, wenn das Maximum der Meßwerte der Indexpopulation rechts vom Maximum der Meßwerte der Referenzpopulation liegt, sonst ist die Zuordnung umgekehrt. Wenn der Befund "T+", d. h. der Meßwert ist größer als der Diskriminationswert, mit der Tatsache übereinstimmt, daß das Individuum zur Population D+, zur Indexpopulation, gehört, gilt dieser Befund als "richtigpositiv". Wenn der Befund "r", d. h. der Meßwert ist kleiner als der Diskriminationswert, mit der Tatsache übereinstimmt, daß das Individuum zur Population D-, zur Referenzpopulation, gehört, gilt der Befund als "richtig-negativ" (Tab. 1). Der Anteil richtig-positiver Befunde a/ (a + c) nähert sich mit steigender Anzahl von Befunden der als diagnostische Sensitivität bezeichneten Wahrscheinlichkeit; der Anteil richtig-negativer Befunde d/ (b + d) nähert sich mit steigender Anzahl von Befunden der als diagnostische Spezifität bezeichneten Wahrscheinlichkeit. Sensitivität und Spezifität ändern sich mit dem Diskriminationswert. Es ist grundsätzlich möglich, eine höhere Sensitivität auf Kosten einer verringerten Spezifität zu erreichen und umgekehrt. Deswegen muß das Indexpaar Sensitivität und Spezifität stets gemeinsam angegeben und beurteilt werden. Aus den vier Diagrammen (Abb. 1), die als Darstellung der Ergebnisse von vier verschiedenen Untersuchungsarten/Testverfahren auf jeweils die gleiche Index- und Referenzpopulation oder von einer Untersuchungsart/einem Testverfahren auf vier verschiedene Index- und Referenzpopulationen anzusehen sind, ergeben sich in Abhängigkeit vom Diskriminationswert die in Tab. 2 aufgeführten Zuordnungen. In Abbildung 2 sind diese Relationen in einem Sensitivität-Spezifität-Diagrarnrn (ROC-Kurven) dargestellt. Wertepaare des zum Nachweis von D absolut untauglichen Verfahrens (Abb. 1 A) erscheinen als Diagonale A im Koordinatensystem; zujedem Meßwert, der zum Diskriminationswert erklärt wird, gibt es gleichgroße Anteile richtig-positiver wie falsch-positiver und gleichgroße Anteile richtig-negativer wie falsch-negativer Ergebnisse (Tab.2). Wertepaare des zum Nachweis von D ideal tauglichen Verfahrens (Abb. 1 D) sind durch den rechten Winkel über dem Ausgangspunkt der Koordinaten dargestellt (Abb.2); zu jedem Meßwert, der zum Diskriminationswert erklärt wird (z. B. Meßwerte a, b, c, d), gibt es entweder zumindest ausschließlich richtig-positive (z. B. Meß-

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

418

Nutzen und Schaden bei Screening- und Routineuntersuchungen Geburtsh. u. Frauenheilk. 51 (1991)

positiv (Sens.) A, Diskriminationswert

a b

c D, Diskriminationswert

a b

c d e

0,90 0,50 0,10 1,00 1,00 1,00 0,50 0,10

Anteil der B efunde i chtig negativ negativ (Spez.) (1-Sens.) 0,10 0,50 0,90 0,10 0,50 1,00

0,10 0,50 0,90 0,00 0,00

1,00

0,50 0,90

1,00

419

Tab. 2 Abhängigkeit der Sensitivität und Spezifität der Befunde vom Testverfahren und vom Diskri-

fals ch

minationswert.

ositiv

(1-Spez.) 0,90 0,50 0,10 0,90 0,50 0,00 0,00 0,00

0,00

A, D: s. Häufigkeitsverteilung Abb. 1

werte a, b, c) oder zumindest ausschließlich richtig-negative (z. B. Meßwerte c, d, e) Ergebnisse, für einen bestimmten Bereich (um Meßwert c) jedoch sowohl ausschließlich richtig-positive wie auch ausschließlich richtig-negative Ergebnisse (Tab. 2). Die Testverfahren mit Ergebnissen auf den beiden anderen Kurven (Abb. 2, B und C) repräsentieren Testverfahren, die zum Nachweis von D mäßig bis ziemlich gut geeignet sind.

Tab. 3 Abhängigkeit der Posttest-Wahrscheinlichkeit der „Richtigkeit" eines „positiven" ( 1) und eines „negativen " (II) Testergebnisses von der Prätest-Wahrscheinlichkeit des zu diagnostizierenden Zustands.

Die Darstellung im Spezifität-SensitivitätDiagramm (Abb. 2) ermöglicht es, Testverfahren unabhängig vom jeweiligen Diskriminationswert zu vergleichen. Je besser ein Test für eine jeweilige Fragestellung geeignet ist, um so mehr nähert sich seine Sensitivität-Spezifität-Kurve dem Winkel über dem Ausgangspunkt der Koordinaten. Es macht keinen Sinn, zur Diagnose von D+ zusätzlich Testverfahren einzusetzen, deren Kurven von diesem Winkel weiter entfernt sind. Es sei auf die Möglichkeit hingewiesen, über „Quotienten der Wahrscheinlichkeiten" („likelihood ratios") die Wahrscheinlichkeiten Sensitivität und Spezifität zu kombinieren. Durch diese Quotienten (Sensitivität)/ (1-Spezifität) und (Spezifität)/(1-Sensitivität) kann die initiale Reduktion des Meßwerte-Kontinuums auf ein binäres Ergebnis wieder rückgängig gemacht und der Vorteil der ursprünglich kontinuierlichen Variablen wieder nutzbar gemacht werden (3). Zusätzlich sei auf statistische Probleme in der Behandlung der Ergebnisse von ZeitreihenAnalysen, z. B. CEA beim Mammakarzinom, Östriol in der Schwangerschaft, hingewiesen (1, 87).

1. Positives Testergebnis

Zu B: Der Frauenarzt wird aus dem Erscheinungsbild seiner Patientin und aus ihren Angaben und in Abhängigkeit von der Struktur seiner Praxis die möglichen Diagnosen einschränken und z. B. sekundäre Amenorrhö/Schwangerschaft; knotige Brust/Mammakarzinom; Adnexitis/Adhäsionen vermuten. Damit weist er, bewußt oder unbewußt, der Patientin einen gewissen Wahrscheinlichkeitswert für den Zustand D zu. Dieser Wahrscheinlichkeitswert, der auch als A-priori-Wahrscheinlichkeit oder Prätest-Wahrscheinlichkeit bezeichnet wird, sollte mit der Häufigkeit, der Prävalenz des Zustands/ der Krankheit in einer Population mit eben diesen Symptomen und sonstigen Randbedingungen möglichst übereinstimmen. Aus dieser Prätest-Wahrscheinlichkeit und aus den unter A diskutierten Wahrscheinlichkeiten „Sensitivität" und „Spezifität" werden nach Regeln der Statistik (Bayes' Theorem) die beiden A-posteriori- oder PosttestWahrscheinlichkeiten errechnet, bei positivem Ergebnis die Wahrscheinlichkeit für das Vorhandensein des Merk-

Bayes' Theorem: Posttest-Chance = Prätest-Chance x Quotient der Wahrscheinlichkeiten

Beispiel: Sensitivität: 0,90; Spezifität: 0,80

Quotient der Wahrscheinlichkeiten: 0,90/(1-0,80) = 4,5 Prätest -Wahrsch. I -Chance

Quotient d. Wahrsch.

Posttest -Chance 1 -Wahrsch.

0,001 0,010 0,100 0,500

4,5 4,5 4,5 4,5

1:222 1:22 1:2 1:0,2

1:999 1:99 1:9 1:1

0,0045 0,045 0,333 0,818

II. Negatives Testergebnis Quotient der Wahrscheinlichkeiten: 0,80/(1-0,90) = 8,0

-Wahrsch . 0,999 0,990

0,900 0,500

Prätest 1 -Chance 999:1 990:1 900:1 1:1

Quotient d. Wahrsch.

Posttest -Chance 1 -Wahrsch.

8,0

7992:1 7920:1 7200:1 8:1

8,0 8,0 8,0

> 0,999 > 0,999 > 0,999 0,889

mals D und bei negativem Ergebnis die Wahrscheinlichkeit für das Nichtvorhandensein des Merkmals D. Die einfachen Zusammenhänge werden in einem Diagramm (Abb. 3) und in einem Rechenbeispiel (Tab. 3) aufgezeigt. Im Rechenbeispiel wird statt mit Wahrscheinlichkeiten P mit Chancen [„odds"] [= P/(1-P)] operiert, weil sich das Bayes' Theorem in dieser Form leichter dem Gedächtnis einprägt. Das Diagramm (Abb. 3) zeigt folgende Zusammenhänge: Bei positivem Testergebnis steigt die Posttest-Wahrscheinlichkeit mit der Prätest-Wahrscheinlichkeit an. Bei negativem Testergebnis fällt die Posttest-Wahrscheinlichkeit mit der Prätest-Wahrscheinlichkeit ab. Nur bei ideal richtigen Tests mit Spezifität = 1,00 und Sensitivität = 1,00 ist immer, unabhängig von der Prätest-Wahrscheinlichkeit, die Posttest-Wahrscheinlichkeit = 1,00 oder 0,00.

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

Chance (,odds") = Wahrscheinlichkeit/(1 -Wahrscheinlichkeit) Wahrscheinlichkeit = Chance/(1 + Chance)

Geburtsh. u. Frauenheilk. 51 (1991)

E. Kuss, M. Trqlia, R. Kürzt, K. Ulsenheimer

besonders groß, wenn die Prätest-Wahrscheinlichkeit um 0,5 liegt. Er wird kleiner, wenn die Prätest-Wahrscheinlichkeit gegen 0 oder 1 geht, weil dann die zu erwartenden Posttest-Wahrscheinlichkeiten selten Werte erreichen, die eine Änderung der Behandlung rechtfertigen.

PRATEST WAHRSCHEINLICHKEIT 0-

0.8

1.0

0.0 0.0

0.8

0.2

0.6

0.4

0.4

0.6

1.0

0.6

0.4

0.2

A +

0

--1 --1

LU ~

I

0.8

0.2

::i



m

Cf)

--1

U

z

1]

0

Cf)

I-

0.0

1.0

I

~

I :D

U

Cf)

a:

0

Cf)

I

I

~

0.0

1.0

Il-

0

08

0.2

11.

0.6

0.4

0.4

0.6

0.2

0.8

I

;A

m

=i

Cf)

0

Z

r

I-

Cf)

LU

m

Für den Arzt stellt sich die Frage, ob er durch einen gängigen und angemessenen Test die ihm bereits bekannte Prätest-Wahrscheinlichkeit soweit erhöhen oder soweit vermindern kann, daß daraus wesentliche Folgerungen für die weitere Behandlung zu ziehen sind. Nur solche Tests sind medizinisch notwendig. Wenn der Informationszugewinn durch ein negatives oder positives Ergebnis der intendierten Untersuchung die weitere Behandlung nicht beeinflußt, ist die Untersuchung überflüssig, unabhängig davon, ob dies eine digitale, ultrasonographisehe oder klinisch-chemische Untersuchung ist. Dies sollte vor einer Untersuchung und vor einer Ordination einer Untersuchung abgeschätzt worden sein.

0

I

B

0.0 0.0

10 0.2

0.4

0.6

08

1.0

PRATEST WAHRSCHEINLICHKEIT 0+

Abb.3 Abhängigkeit der Posttest-Wahrscheinlichkeiten von Prätest-Wahrscheinlichkeit undvonder Sensitivität undSpezifität desTestverfahrens (s. I. c. 5). A: Sensitivität 0,90; Spezifität wiean derjeweiligen Kurve angezeigt B: Spezifität 0,90; Sensitivität wiean derjeweiligen Kurve angezeigt In beiden Diagrammen entspricht die Kurvenschar oberhalb derDiagonalen "positiven' Ergebnissen, die Kurvenschar unterhalb der Diagonalen "negativen" Ergebnissen.

Bei absolut ungeeigneten Tests ist die Posttest-Wahrscheinlichkeit stets identisch mit der PrätestWahrscheinlichkeit; die Ergebnisse liegen auf der Diagonalen (Abb. 3). Bei mehr oder weniger geeigneten Tests wird der Informationsgewinn. die Differenz zwischen Prä testund Posttest-Wahrscheinlichkeit, durch den senkrechten Abstand der Diagonalen von der Kurve angezeigt. Die Sensitivität beeinflußt bei positiven Testergebnissen die Posttest-Wahrscheinlichkeit wenig, bei negativen Testergebnissen stark. Ein Test mit hoher Sensitivität wird benötigt, um das Nichtvorhandensein einer Krankheit zu sichern. Die Spezifität beeinflußt bei positiven Testergebnissen die Posttest-Wahrscheinlichkeit stark, bei negativen Testergebnissen wenig. Ein Test mit hoher Spezifität wird benötigt, um das Vorhandensein einer wenig evidenten Krankheit zu sichern. Der Nutzen einer Untersuchung für Entscheidungen über die Behandlung eines Patienten ist dann

Trotz hoher Spezifität und Sensitivität eines Untersuchungsverfahrens kommt dem Untersuchungsergebnis häufig deswegen eine nur geringe diagnostische Bedeutung (niedrige Posttest- Wahrscheinlichkeit für ein richtig-positives oder ein richtig-negatives Ergebnis) zu, weil die Prätest-Wahrscheinlichkeit, die Prävalenz des zu diagnostizierenden Zustands/der zu diagnostizierenden Krankheit zu gering ist (Abb.3, Tab. 3). In diesen Fällen wird häufig empfohlen, verschiedenartige Untersuchungsverfahren zu kombinieren. Diese Empfehlung wird jedoch nur selten mit Zuordnungsregeln verbunden, d. h. es wird nur selten angegeben, wie diskordante Ergebnisse, also z. B. Test 1: "positiv" und Test 2: "negativ", gedeutet werden sollen. Nur selten wird realisiert, wie sich als Folge der Kombination und abhängig von der Zuordnungsregel beide Größen, Sensitivität und Spezifität, notwendigerweise gegenläufig ändern. Wird nämlich Tl +T2 - und Tl -T 2 + als "positiv" gedeutet, so wird damit im Vergleich zu denjeweiligen Einzelverfahren die Sensitivität angehoben und die Spezifität abgesenkt. Werden andererseits diese Kombinationen als "negativ" gedeutet. so wird damit die Sensitivität abgesenkt und die Spezifität angehoben (Einzelheiten, auch hinsichtlich der Unterscheidung paralleler und serieller Anordnungen von Tests, s.l. c. 25, 31). Auch folgende Überlegung zeigt die Problematik paralleler Kombinationen von Tests. Referenzintervalle werden im allgemeinen so gesetzt. daß ein Anteil von 0.95 der von Referenzindividuen (D-) gewonnenen Ergebnisse innerhalb und ein Anteil von 0,05 außerhalb dieses Bereiches liegt. Es wird also ein Anteil von (1,00-0.95) der von Referenzindividuen gewonnenen Meßergebnisse als T" gedeutet und somit zur Gruppe der falsch-positiven Befunde gezählt. Besteht die Kombination der Tests aus n voneinander unabhängigen Verfahren, so liegt die Wahrscheinlichkeit dafür, daß mindestens ein falsch-positiver Befund erzielt wird, bei (1,00-0,95)n, für n = 12 also bei 0,46, also bei etwa der Hälfte der Befunde, allein wegen der so gearteten Definition der Referenzbereiche. Unabhängig davon ist es wahrscheinlich sinnvoller, von dieser univariaten Interpretation der Testergebnisse aufmultivariate Interpretationen überzugehen (10,63, 75).

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

420

Geburtsh, u. Frauenheilk. 51(1991)

2. Welche Ergebnisse präoperativer Laboratoriumsuntersuchungen braucht der Anästhesist routinemäßig?

kenhaus wahrzunehmen (Gemeinsame Empfehlung der Deutschen Gesellschaft für Anästhesiologie und Intensivmedizin und der Deutschen Gesellschaft für Transfusionsmedizin und Immunhämatologie). Für die Transfusionsmedizin ist die frühzeitige Kenntnis der Blutgruppenmerkmale und der irregulären Antikörper sowie, nach Anforderung, der Verträglichkeit von Blutkonserven zwingend erforderlich. Die Anzahl der für den Patienten bereitgestellten verträglichen Blutkonserven muß dem zu erwartenden Blutverlust angemessen sein.

Die Anästhesie ist nicht Selbstzweck; sie dient im allgemeinen dazu, therapeutische Maßnahmen, gynäkologische oder geburtshilfliche Eingriffe, schmerzfrei durchführen zu können. Dafür und für die perioperative Aufrechterhaltung der vitalen Funktionen des Patienten trägt der Anästhesist die Verantwortung (14, 62). Das Risiko der Anästhesie, das vor allem durch Grund- und Begleiterkrankung des Patienten bestimmt wird, muß durch vorherige Untersuchungen charakterisiert werden. Die Frage, welche Untersuchungen angestellt werden müssen, ist unter Berücksichtigung medizinischer, ökonomischer und forensischer Aspekte zu beantworten. Unabdingbar sind die sorgfältige Erhebung der Anamnese und die sorgfältige körperliche Untersuchung. Weitergehende Untersuchungen sind dann, aber nur dann, zwingend indiziert, wenn hierdurch Hinweise auf Organschäden und Risikofaktoren gewonnen wurden (12, 15, 65). Auf einige der Faktoren wird am Ende dieses Teils der Übersicht kurz eingegangen. Im Rahmen der Geburtshilfe ist häufig die Ausschaltung des „physiologischen" Schmerzes primäres anästhesiologisches Ziel. Diese Anästhesie ist für die Geburt nicht essentiell, sie dient dem Patientenkomfort. Dies ist, unabhängig von der jeweiligen Präferenz, sowohl vor einer Allgemeinnarkose als auch vor einer rückenmarksnahen Regionalanästhesie zu beachten. Das bedeutsamste Risiko insbesondere der Katheter-Epiduralanästhesie ist die epidurale Blutung mit nachfolgender Querschnittslähmung. Da diese Blutung bei sonst unauffälligen Schwangeren nicht oder nur extrem selten auf eine vorher analytisch nachweisbare Störung der Hämostase zurückzuführen ist, kann nach sorgfältiger Anamnese und körperlicher Untersuchung auf die Erhebung eines sogenannten „Gerinnungsstatus" verzichtet werden (39, 61, 78). Wenn es jedoch nicht gelingt, eine gründliche Anamnese und Untersuchung durchzuführen, was auch durch Verständigungsschwierigkeiten bedingt sein kann, sollte zumindest die Bestimmung der aktivierten partiellen Thromboplastinzeit (aPTT) mit empfindlichen Reagenzien und die der Thrombozytenzahl (ThrZ) (41) durchgeführt werden, auch wenn, wegen der niedrigen Prävalenz klinisch bedeutsamer Gerinnungsstörungen bei unauffälligen Schwangeren, mit hohem Anteil falsch positiver Befunde gerechnet werden muß. Wenn in den letzten 2 Wochen vor dem geplanten Eingriff die Gerinnungsuntersuchung ergeben hat, daß die aPTT die obere Grenze des Referenzintervalls (30 bis 45 s) nicht um mehr als 5 Sekunden überschritten hat, und daß die ThrZ über 50 x 109/1 lag, ist die Epiduralanästhesie nicht kontraindiziert. Wenn jedoch relevante pathologische Befunde weder durch Anamnese und körperliche Untersuchung noch durch die Gerinnungsuntersuchung sicher ausgeschlossen wurden, sollte auf die Epiduralanästhesie verzichtet werden. Der Arzt für Anästhesiologie bringt bereits Voraussetzungen mit, um die nach den „Richtlinien zur Blutgruppenbestimmung und Bluttransfusion" der Bundesärztekammer vorgeschriebene Funktion eines „für die Transfusionsmedizin verantwortlichen Arztes" am Kran-

Die Deutsche Gesellschaft für Anästhesiologie und Intensivmedizin vertritt den Standpunkt, daß es dem Anästhesisten zu überlassen ist, den Umfang präoperativer Untersuchungen in Abhängigkeit von den Umständen des Einzelfalls in eigener ärztlicher Verantwortung zu bestimmen (85). Die medizinische Notwendigkeit und die ökonomische Vertretbarkeit der jeweils vorgeschlagenen Untersuchungen sollte auf der Basis der im ersten Teil dieser Übersicht besprochenen prädiktiven Werte der jeweiligen Ergebnisse begründet werden. Wie sich schließlich die quantifizierbare medizinische Notwendigkeit und ökonomische Vertretbarkeit auf die Rechtsauffassung auswirkt, wird im letzten Teil aufgezeigt. Neben der medizinischen Notwendigkeit ist auch die organisatorische Zweckmäßigkeit der diagnostischen Verfahrensweise zu berücksichtigen (30). Argumente für ein „Basis -Programm aus organisatorischen Gründen " sollen aber nicht als Hilfskonstruktionen herhalten, um mangelndes Verständnis für und mangelndes Vertrauen in die Logik der Diagnostik beim behandelnden Arzt zu bemänteln. Die Notwendigkeit, wirtschaftliche Überlegungen in ärztliches Denken einfließen zu lassen, möge folgende überschlägige Rechnung belegen. Die Kosten der vielerorts üblichen präoperativen Routineuntersuchungen (Hämoglobin, Na', K+, Kreatinin, Harnstoff, Gesamteiweiß, Blutzucker, GOT, GPT, yGT, Blutgruppe, EKG, ThoraxRöntgenuntersuchung) betragen 183,60 DM (DKG-NT). In einem Krankenhaus mit jährlich etwa 5000 Operationen könnte z. B. durch Einrichtung einer Anästhesieambulanz der Anteil der präoperativen Untersuchungen auf 50 % reduziert werden, was die Kosten um etwa 500000,- DM senken würde (21). Organschäden interferieren in noch wenig erforschter Weise mit der Anästhesie und mit dem operativen Eingriff (66, 82). Wie weit der Anästhesist über das Ausmaß der Schäden auch in Form von Ergebnissen klinisch-chemischer Untersuchungen informiert sein muß, kann hier nur grob skizziert werden. Lunge: Pulmonale Vorerkrankungen sind selten Ursache gefährlicher intraoperativer Komplikationen, sie können aber in der postoperativen Phase den weiteren Krankheitsverlauf bestimmen. Die sogenannte Blutgasanalytik ermöglicht die Überwachung der respiratorischen Funktion (20, 82). Herz und Kreislauf, Blut: Kardiale Alterationen bis hin zum Herzstillstand werden von „Elektrolytentgleisungen" befürchtet. Die zelluläre K+-Aufnahme wird

421

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

Nutzen und Schaden bei Screening- und Routineuntersuchungen

durch ß-adrenerge Aktivität gesteigert, durch a-adrenerge Aktivität gehemmt; die resultierende K+-Konzentration des Serums beeinflußt die neuromuskuläre Erregbarkeit auch des Herzens. Nach Gabe depolarisierender Relaxanzien, z. B. Succinylcholin, erhöht sich die K+-Konzentration im allgemeinen um 0,25-0,8 mmol/l, bei Schwerkranken gelegentlich zeitverzögert exzessiv und lebensbedrohlich (50, 69). Nach Einnahme von Diuretika oder Laxanzien kann die K+-Konzentration abfallen. Aber selbst bei K+Konzentrationen von < 3 mmol/1 kommt es in Narkose nicht, wie befürchtet worden war, zwangsläufig zur hypokaliämischen Arrhythmie. Eine K+-Substitution ist eher kontraindiziert (33, 76). Somit ist die routinemäßige präoperative Bestimmung der K+-Konzentration des Serums unauffälliger Patienten medizinisch nicht notwendig. Die normovolämische Anämie hat weder für die Narkose noch für die Operation oder die Wundheilung nachweisbare Bedeutung (54, 73, 89); von Bluttransfusionen wird abgeraten (55). Eher wäre einer Polyzythämie sowie einer Hämokonzentration bei schwangerschaftsinduzierter Hypertonie Bedeutung beizumessen. Somit ist die routinemäßige präoperative Bestimmung des Hämoglobins für die Anästhesie nicht medizinisch notwendig, zumindest nicht für unauffällige Patientinnen unter 60 Jahren (66, 73). Leber: Leberschaden führt zu verminderter metabolischer Clearance auch der zur Anästhesie verwendeten Pharmaka. Erniedrigte Cholinesterase-Aktivität ist jedoch selten Ursache einer succinylcholininduzierten Lähmung der Atmung (46). Die Empfehlung, bei Leberschaden auf z. B. Halothan zu verzichten, ist umstritten (6). Die Möglichkeiten, aber auch die Grenzen der Möglichkeiten, den Leberschaden durch z. B. Bestimmung der Thromboplastinzeit, der Bilirubin- und Albumin-Konzentration sowie der Aktivitäten von Alanin-Aminotransferase (ALT/ GPT) und 'y-Glutamyl-Transpeptidase (yGT) nachzuweisen, sind bekannt (66, 72). Niere: Bei Niereninsuffizienz kann es zur Akkumulation von Anästhetika kommen (47). Die glomeruläre Filtrationsrate wird über die Bestimmung der Kreatinin-Konzentration oder -Clearance charakterisiert. Für über 40 Jahre alte Patienten wird eine präoperative Kreatinin-(Harnstoff-)Bestimmung empfohlen (65). Endokrinium: Diabetes mellitus beeinflußt den operativen und postoperativen Verlauf. Wegen der altersabhängigen Prävalenz der Erkrankung (65) sollte sie bei über 60 Jahre alten Patienten präoperativ ausgeschlossen werden. Bei Patienten mit manifestem Diabetes mellitus ist eine engmaschige Überwachung des Blutzuckers in der perioperativen Phase erforderlich. Glukose-Bestimmungen, während der Insulin-/Glukose-Infusion alle 4 Stunden, intraoperativ alle 2 Stunden, sollen dazu beitragen, daß Hypoglykämie, Ketoazidose und Hyperosmolalität vermieden werden (66). Kortikoid-Medikation macht, neben K+-, ebenfalls Glukose-Bestimmungen erforderlich (66).

E. Kuss, M. Tryba, R. Kürzl, K. Ulsenheimer

3. Präoperative Routine, Nachsorgeroutine , Screening: Wie hoch ist der Nutzen von Untersuchungen einzuschätzen, deren Durchführung Frauenärzten empfohlen wird? Der Nutzen diagnostischer Untersuchungen kann aus den Angaben der deutschsprachigen Fachliteratur kaum abgeschätzt werden: die hier publizierenden Autoren setzen den Nutzen einfach voraus. Nur selten versuchen sie, die diagnostischen Qualitäten der empfohlenen Tests zu quantifizieren. Belege für diese Behauptung können im Aufsatz „Die Beschreibung und Prüfung diagnostischer Maßnahmen in deutschsprachigen klinischen Zeitschriften" gefunden werden (86). Die Untersuchung zeigt, daß fast nie auf prädiktive Werte und Prävalenzen und auf den Zusammenhang der beiden Größen eingegangen wird, obwohl dies den diagnostischen Wert des Tests charakterisieren würde, was im 1. Teil dieser Übersicht ausführlich dargestellt wurde. Auch in den Standardwerken der Gynäkologie (z. B. 28, 51, 70) werden etwa 6-20 Untersuchungen als präoperative Routine-Diagnostik ohne nähere Begründung aufgeführt. Es herrscht offenbar die irrige Vorstellung, daß viele Tests viele Krankheiten erkennen lassen, und daß noch mehr Tests die Diagnosen noch sicherer machen. Deswegen, aber auch unter der Drohung gefürchteter forensischer Folgen, werden von Gynäkologen und von den mit ihnen kooperierenden Anästhesisten und Pädiatern zahlreiche Untersuchungen „routinemäßig" angeordnet. Allein die Anzahl führt bereits zu Schwierigkeiten. Von den empfohlenen 20 Tests wird nach der vorn diskutierten Formel (1,00-0,95)20 mit 64 % Wahrscheinlichkeit zumindest ein Testergebnis „pathologisch" sein, ohne daß eine Krankheit vorliegt (11). Die Abhängigkeit der Indikation präoperativer Untersuchungen vom Zustand der Patientin wird in der oben genannten Literatur kaum berücksichtigt. Es sind jedoch definierte Zustände der Patienten, die den Verlauf der Narkose sowie den intra- und postoperativen Verlauf ungünstig beeinflussen können: Koronare Herzerkrankung, Herzrhythmusstörungen, chronisch obstruktive Lungenerkrankungen, Diabetes mellitus, Nephritis, Gerinnungsstörungen, Thrombozytopenie, nephrotisches Syndrom, chronisch interstitielle Lungenerkrankungen, Hepatitis, Schwangerschaft, Schilddrüsenerkrankung, Phäochromozytom, Morbus Addison, Morbus Cushing, Herzinsuffizienz (64). Aber wie häufig weisen unsere Patienten diese Risikofaktoren auf? Die Patienten der Frauenheilkunde sind im allgemeinen „gesünder" als die anderer operativer Fächer. Etwa 70 % von ihnen können zur Gruppe „normaler gesunder" Frauen gezählt werden, weitere 25 % zur Gruppe von Frauen mit leichten Allgemeinerkrankungen (4). Auch wenn diese Schätzung nicht für alle Praxen und Kliniken von Frauenärzten zutreffen sollte, so verweist sie doch auf die gerade für unser Fachgebiet große Bedeutung der Frage nach dem Nutzen präoperativer Diagnostik bei Patientinnen mit ansonsten leerer Anamnese und Symptomfreiheit. Ausschließlich nach dem Nutzen präoperativer Diagnostik bei diesen Patientinnen soll im folgenden gefragt werden. Es wird also nicht der Nutzen klinisch oder anamnestisch indizierter Untersuchungen diskutiert.

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

422 Geburtsh . u. Frauenheilk . 51 (1991)

Die oben genannten Risikofaktoren dürften durchwegs anamnestisch und/oder klinisch zu erkennen sein, wobei insbesondere die Altersabhängigkeit der Faktoren den diagnostischen Weg weist. Es bleibt also die Frage nach der Häufigkeit der Risikofaktoren bei anamnestisch und klinisch unauffälligen Frauen und nach dem Einfluß dieser Prävalenz auf die Interpretation von Testergebnissen. Risikofaktoren werden bei etwa 0,001 % bis 1 % asymptomatischer Personen gefunden. Unter der Annahme, daß bei asymptomatischen Personen, die in ein Krankenhaus aufgenommen werden, die Prävalenz 5fach höher liegt, ergeben sich Häufigkeiten von 0,005 % bis 5 %. Es wurde bereits im ersten Teil dieser Übersicht darauf hingewiesen, daß, ungeachtet der Qualität der Tests, die prädiktiven Werte ihrer Ergebnisse gegen 0 gehen, wenn die Prävalenz des zu diagnostizierenden Zustandes gegen 0 geht (Abb. 3). Bei einer Prävalenz von 1 % wird selbst für einen sehr guten Test (Sensitivität 95 %, Spezifität 95) der prädiktive Wert eines positiven Ergebnisses nur 16 % betragen. Das heißt, von 100 Personen mit „positiven" Testergebnissen sind 84 ohne den Risikofaktor, nach dem gefahndet wird. Obwohl dieser Zusammenhang von eminenter praktischer Bedeutung ist, wird er oft als theoretisch und realitätsfern abgetan. Es gibt aber auch empirische Ergebnisse klinischer Studien zur präoperativen Routinediagnostik. In einer retrospektiven Erhebung an 2700 Patienten (34) waren 60 % der Routineuntersuchungen nicht indiziert. Der Anteil nicht indizierter, aber auffälliger Werte, die möglicherweise perioperativ hätten bedeutsam sein können, lag bei 0,15 %. Darüber hinaus erbrachte die Studie das äußerst bemerkenswerte Ergebnis, daß auf diese wenigen Auffälligkeiten nicht reagiert wurde, und daß dennoch keine nachteiligen Narkose- und Operationsfolgen auftraten. In einer prospektiven Studie (16) wurden 1500 Patienten randomisiert: 1000 Patienten wurden den „Routineuntersuchungen" unterworfen, 500 nicht. Die routinemäßig untersuchten Patienten kamen zu 25 % mehr Konsiliaruntersuchungen und zu 32 % mehr Wiederholungsuntersuchungen, aber zu keinem nachweislichen Nutzen hinsichtlich des Krankheitsverlaufes. Theorie und Praxis stimmen also in der Aussage überein: Es ist kein Schaden für den Patienten zu erwarten, wenn solche Untersuchungen unterbleiben, die nicht durch Anamnese oder klinischen Befund indiziert sind. Wie steht es mit dem Nutzen der sogenannten Nachsorge-Routine? Als Basisprogramm werden BKS, Blutbild, Leberfunktionstests, Elektrolyte, harnpflichtige Substanzen und Urinanalyse empfohlen (37). Diese Untersuchungen werden zwar als „unspezifische Laborparameter zur Überwachung der Nebenwirkungen therapeutischer Maßnahmen bei gynäkologischen Malignomen" bezeichnet, und es wird ausdrücklich darauf hingewiesen, daß sie nicht zur Früherkennung von Rezidiven und Metastasen gedacht seien. Aber dennoch sollen sie im Rahmen eines standardisierten Basisprogramms über Jahre hinaus

Geburtsh. u. Frauenheilk. 51 (1991)

423

regelmäßig vorgenommen werden. Die Autoren bleiben, wie andere in ähnlichen Empfehlungen, die Erklärung schuldig, welche Nebenwirkung welcher therapeutischen Maßnahme durch welche Untersuchung bei allen gynäkologischen Karzinomen über Jahre hinweg überwacht werden könnte. Der geringe Nutzen laborchemischer Routine-Nachsorge wurde verschiedentlich belegt (z. B. 13, 81). In einer retrospektiven Untersuchung von 392 Patientinnen mit Mammakarzinom wurden 92 Metastasierungen diagnostiziert. 5100 Laboruntersuchungen waren angefallen und nur bei einer Patientin mit bekanntem Lokalrezidiv kam es zum laborchemischen Hinweis auf eine Lebermetastase, die dann schließlich auch apparativ nachgewiesen werden konnte (81). Eine eigene Untersuchung (13) von 430 Patientinnen mit Mammakarzinom erbrachte in zweijähriger Nachsorge 17 % erneute Tumormanifestation. In dieser Zeit wurden 22126 Ergebnisse von 15 üblichen klinisch-chemischen Tests erhalten. Spezifitäten und Sensitivitäten der Tests erwiesen sich zum Nachweis erneuter Tumormanifestation als so niedrig, daß für diesen Zweck der weitere Einsatz dieser Untersuchungen als nicht gerechtfertigt beurteilt wird. In einer weiteren eigenen Untersuchung (38) wurden im Rahmen der Nachsorge von Patientinnen mit Mammakarzinom in 8 Monaten 41 Metastasierungen diagnostiziert. In fast allen Fällen waren von der Patientin selbst einschlägige Symptome entdeckt worden, nur in 4 Fällen war die routinemäßige Anwendung apparativer Maßnahmen wie Mammographie, Lebersonographie, Röntgen-Thorax und Knochenszintigramm primär erfolgreich. In keinem Fall jedoch waren es die klinisch-chemischen Untersuchungen. Den Tumormarkern wird in der Nachsorge besondere Bedeutung zuerkannt. Es wurde festgestellt (37): „Klinisch relevant sind heute für die gynäkologische Onkologie nur die biochemischen Marker, die ... für die einzelnen Organmalignome als bewährt` eingestuft werden konnten. Die anderen ... Tumormarker ... haben ... nur dann eine 'Hilfsfunktion`, wenn die als bewährt` klassifizierten Tumormarkersubstanzen ,versagen`." Wie kann aber der Kliniker dem Ergebnis eines „bewährten" Tumormarkers ansehen, ob hier der Test versagt hat? Oder soll er bei allen Patienten im Sinne einer Kombinationsdiagnostik neben den „bewährten" Tumormarkern jeweils auch die zahlreichen „Hilfsmarker" bestimmen lassen? In der Diskussion der Nachsorgeuntersuchungen wird kaum danach gefragt, ob die Kenntnis vom Anstieg der Tumormarker-Konzentrationen den Patienten auch dann nützt, wenn noch keine klinischen Symptome der Rezidive oder Metastasen aufgetreten sind. Es wurde aber immerhin nachgewiesen (81), daß die Überlebenszeit nicht davon beeinflußt wird, ob die Patienten bereits vor oder erst nach Auftreten auch subjektiver Symptome behandelt werden. Andere Untersuchungen mit gegenteiligen Ergebnissen sind uns nicht bekannt. Solange es aber eher unwahrscheinlich ist, daß aus der Kenntnis der Meßgrößen von Tumormarkern ein Nutzen für die Patienten abgeleitet werden kann, und solange die Kenntnis positiver Ergebnisse ausschließlich belastet, sowohl den Patienten

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

Nutzen und Schaden bei Screening- und Routineuntersuchungen

424 Geburtsh . u. Frauenheilk. 51 (1991) Tab.4 Ergebnisse der CEA- und SCC-Bestimmungen an 33 Patientinnen mit nachgewiesen rezidiviertem Zervixkarzinom nach Angaben der Tabelle 9 in I. c. 55. SCC

CEA

CEA + SCC + CEA/SCC disjunktiv CEA/SCC konjunktiv

4-

5 5

11 12

1 16 17

Y-

10

23

33

17/33(52%) 23/33(70%) 28/33(85%) 12/33(36%)

wie auch dessen Arzt, erscheint es fragwürdig, die Bestimmung von Tumormarkern allgemein zu empfehlen. Dies gilt auch für den häufig als besonders gut geeignet charakterisierten Tumormarker CA 125 und dessen Bestimmung nach der Primärbehandlung des Ovarialkarzinoms. Es dürfte erwiesen sein, daß diese Bestimmung die explorative Relaparotomie nicht ersetzen kann, unabhängig vom separaten Problem, ob diese überhaupt indiziert ist (23, 48). Tumormarker sind auch beispielhaft für die Problematik der Kombination diagnostischer Maßnahmen. Bezeichnend für die übliche Art der Argumentation ist Tabelle 4: 52 % der Patientinnen mit nachgewiesenem Rezidiv eines Zervixkarzinoms sind CEA-positiv, 70 % sind SCC-positiv und gar 85 % sind CEA- und/oder SCC-positiv. Die Autoren (37) behaupten, daß mit dieser Testkombination die Behandlung von mehr als 80 % aller Patienten richtig überwacht und Rezidive sowie Metastasen frühzeitig erkannt werden. Richtig dagegen ist folgendes: Werden die Ergebnisse mit disjunktivem Positivkriterium kombiniert, d. h. als positiv gelten auch diskordante (positiv/negativ) Ergebnisse, steigt die Sensitivität, hier z. B. auf 85 %. Werden aber die Ergebnisse mit konjunktivem Positivkriterium kombiniert, d. h. als positiv gelten nur konkordante (positiv/positiv) Ergebnisse, so sinkt die Sensitivität, hier z. B. auf 36 %. Die Autoren haben schließlich ihre Diskussion auf die Population mit nachgewiesenen Rezidiven beschränkt. Mit anderen Worten, sie haben sich auf die Sensitivität beschränkt und die ihr komplementäre Spezifität außer acht gelassen, d. h. sie vernachlässigten die Daten der Tumormarker von Patienten ohne nachweisbare Rezidive. Bei paralleler Kombinationsdiagnostik mit disjunktivem Positivkriterium steigt, wie bereits ausgeführt, die Sensitivität an, die Spezifität hingegen fällt ab. Dies führt notwendigerweise zu einer Abnahme des prädiktiven Wertes positiver Ergebnisse (24). Es ist somit falsch, eine Steigerung der Sensitivität als Folge disjunktiver Kombinationsdiagnostik mit einer Erhöhung des prädiktiven Wertes positiver Ergebnisse gleichzusetzen. Screening-Untersuchungen sind per definitionem Untersuchungen größerer Populationen auf Krankheiten, für deren Vorliegen kein Anzeichen erkennbar ist. In der Frauenheilkunde zeigt sich die damit verbundene Problematik am Beispiel der empfohlenen HIV-Testung von Schwangeren. Bereits 1987 stellten Meyer und Pauker (49) die Frage, ob wir uns im HIV-Screening die zwangsläufig auftretenden falsch-positiven Ergebnisse leisten können. Der Anteil falsch-positiver Ergebnisse der kombinierten

Nachweisverfahren des entsprechenden IgG durch ELISA und Western-Blot liegt im Bereich von 0 bis 0,5 %. Hieraus errechneten die Autoren den prädiktiven Wert positiver Ergebnisse bei verschiedenen Prävalenzen. Die Ergebnisse der Untersuchung von Personen mit Prävalenzen der Infektion von 50 % (Risikogruppe) bis 5 % (Gruppe von Personen, denen mehrfach Blut transfundiert worden ist) lassen sich gut interpretieren. Sinkt die Prävalenz jedoch auf 0,16 % (z. B. Gruppe amerikanischer Rekruten), so wirkt sich die Varianz des Anteils falsch-positiver Ergebnisse sehr stark aus. Deswegen wurden, um die Zuverlässigkeit der HIV-Testung amerikanischer Rekruten möglichst hoch zu halten, für diese Aufgabe nur wenige und besonders qualifizierte Laboratorien zugelassen. Sinkt die Prävalenz weiter ab auf 0,01 % (z. B. Gruppe von Blutspenderinnen), so müßte der Anteil falsch-positiver Ergebnisse unter 0,1 % liegen, um noch vertretbare prädiktive Werte positiver Ergebnisse zu erhalten. Für die Praxis des Frauenarztes bedeutet dies, daß positive Ergebnisse von HIV-Tests anamnestisch unbelasteter Schwangerer mit sehr hoher Wahrscheinlichkeit falsch-positiv sind (40). Die gleiche Problematik zeigen letztlich alle Versuche, Krankheiten mit niedriger Prätest-Wahrscheinlichkeit durch Reihenuntersuchungen frühzeitig zu entdecken, wie z. B. auch das Screening des Ovarialkarzinoms mit Hilfe der CA-125-Bestimmung (67). Neben den Kosten der unnötigen Primäruntersuchung ist der weit kostspieligere sogenannte „Kaskadeneffekt" (41) eine der nachteiligen Folgen derartiger Untersuchungen. Die Bilanz für die präoperative Routine, für die Nachsorge-Routine und für viele Screening-Untersuchungen sieht nicht gut aus. Sie könnte sich bessern, wenn das Verständnis für Sensitivitäten, Spezifitäten und prädiktive Werte diagnostischer Untersuchungen wachsen würde, wenn die resultierende Einsicht auch in die Praxis umgesetzt würde und wenn mehr Ergebnisse solcher Untersuchungen vorlägen, die den Nutzen des frühzeitigeren Aufspürens eines vom Patienten noch nicht empfundenen Malignom-Symptoms beweisen. Nachteilige forensische Folgen werden sich nicht ergeben, wenn, wie im folgenden gezeigt wird, wenigstens die Gutachter diese Zusammenhänge berücksichtigen und die Tatsache hinreichend würdigen, daß der gerichtlich belangte Arzt sorgfältige Anamnese und klinische Untersuchung nachweisen kann. Es fehlt häufig an Mut, auf die fehlende Relevanz vermeintlich unabdingbarer diagnostischer Maßnahmen hinzuweisen. Die wissenschaftliche Grundlage für diesen Mut kann man z. B. in „Clinical epidemiology. A basic science for clinical medicine" finden (68). Die Autoren haben ihr Buch recht hintersinnig dem Märchen „Des Kaisers neue Kleider" gewidmet. Und wie heißt es in diesem Märchen? Nur die Dummen und die, die nicht für ihr Amt taugen, erkennen - ohne diagnostischen Aufwand -, daß der Kaiser tatsächlich nackt ist. 4. Welche forensischen Folgen sind zu erwarten , wenn diagnostische Untersuchungen wegen nachweislich geringer Erfolgswahrscheinlichkeit unterlassen werden? Wo „Vertrauen durch Vertrag" und die Einschaltung des Staatsanwalts ersetzt wird, darf es nicht

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

E. Kuss, M. 7ryba, R. Kürzl, K. Ulsenheimer

Geburtsh. u. Frauenheilk. 51 (1991)

wundern, daß sich auch der Arzt „im ureigensten Interesse" auf rechtliche Positionen zurückzieht. Somit wird es für den Arzt aus Gründen des Selbstschutzes ein zwingendes Gebot, sich abzusichern, d. h. um der forensischen Sicherheit willen den Weg des geringsten Risikos zu gehen und sein Verhalten von Anfang an so einzurichten, daß daraus keine Haftungsfolgen erwachsen können (52).

Daraus folgt: Der Standard ist keine rein statische Größe, sondern enthält auch eine dynamische Komponente, die von der Entwicklung und dem jeweiligen Fortschritt des Fachgebietes abhängt, also neue Erkenntnisse und Erfahrungen, z. B. auf dem Gebiete der Ultraschall- oder Labordiagnostik, in sich aufnimmt und dadurch den „Standard" ändert.

So sehr also bei der Krankenbehandlung das forensische Risiko stets zu beachten und vor jeder Entscheidung über die zu treffenden Maßnahmen abzuwägen ist, so sehr muß der Jurist aber gleichzeitig auch davor warnen, den Selbstschutzaspekt zu verabsolutieren und - etwa auf dem Gebiet der Diagnostik - zu einem „diagnostischen Rundumschlag" auszuholen, der weder den Ärzten noch den Patienten noch den Kostenträgern zumutbar ist und der von der Judikatur weder verlangt noch gebilligt wird. Wer „zur Sicherheit", d. h. aus Angst vor forensischen Risiken, diagnostische Untersuchungen vornimmt, die mit hoher Wahrscheinlichkeit keinen Erkenntnisgewinn zum Nutzen des Patienten bringen, kann dies mit der erhöhten „Sensibilität" der Rechtsprechung nicht rechtfertigen.

c) Zur Vermeidung von Mißverständnissen gerade auf dem Gebiete der Diagnostik ist hervorzuheben, daß „Fehldiagnose" und „Diagnosefehler" nicht gleichbedeutend sind, d. h. eine (objektiv) falsche Diagnose beruht nicht stets auf einer fehlerhaften (= fahrlässigen) Diagnosestellung. Auch die Rechtsprechung erkennt diese Tatsache an: „Irrtümer bei der Diagnosestellung kommen in der Praxis häufig vor; sie sind oft nicht einmal die Folge eines vorwerfbaren Versehens des Arztes", da „die Symptome der Erkrankungen nicht immer eindeutig sind, sondern auf die verschiedensten Ursachen hinweisen können" und die vorläufige Diagnose daher „mit hohen Unsicherheitsfaktoren belastet" ist (6).

Damit stellt sich für den Arzt die Aufgabe, im Rahmen seiner Berufsausübung die rechtlichen Aspekte richtig zu gewichten, d. h. einerseits die Notwendigkeit der Sorgfaltsanforderungen, andererseits aber auch ihre Grenzen zu erkennen und dadurch das Prinzip des Eigenschutzes vor Haftungsfolgen auf das richtige Maß zu beschränken. Dies setzt voraus, daß der Arzt zum einen weiß, welcher Art die drohenden forensischen Risiken sind, und zum anderen, unter welchen Voraussetzungen er zivil- oder/ und strafrechtlich für einen Fehler einzustehen hat. 1. Grundvoraussetzung der zivil- und strafrechtlichen Haftung des Arztes ist die Verletzung der objektiven Sorgfaltspflicht. a) Objektive Sorgfalt bedeutet: nicht jede erdenkliche Sorgfalt wird verlangt, vielmehr nur die Einschaltung desjenigen Behandlungsstandards, den - aus Exante-Sicht - ein besonnener und gewissenhafter, dem Fachgebiet des Betroffenen zugehöriger „Facharzt" in der konkreten Situation dem Patienten geboten hätte. Ein Zwischenfall oder eine Komplikation stellen als solche also noch kein Indiz für ein Fehlverhalten oder Verschulden des Arztes dar. Die Haftungsschwelle ist vielmehr erst dann überschritten, „wenn sich der behandelnde Arzt nicht mehr im Rahmen dessen bewegt, was - zum Zeitpunkt der Behandlung - nach dem Urteil seiner Fachkollegen als vertretbar angesehen wird" (84). Andererseits ist die zivil- und strafrechtliche Haftung nicht etwa auf Fälle grober Behandlungsfehler beschränkt. Der Arzt ist vielmehr, wenn auch die übrigen Haftungsvoraussetzungen erfüllt sind, für jegliches Fehlverhalten, jedes noch so geringfügige Versagen verantwortlich, wie es jedem verantwortungsbewußten Arzt jederzeit einmal unterlaufen kann. b) Der ärztliche „Standard" ist abstrakt-generell als der jeweilige Stand der medizinischen Wissenschaft, konkret als das zum Behandlungszeitpunkt in der ärztlichen Praxis bewährte, nach naturwissenschaftlicher Erkenntnis gesicherte, allgemein anerkannte und für notwendig erachtete Verhalten umschrieben.

Hat der Arzt deshalb die medizinisch gebotenen Befunde erhoben und „die notwendigen abklärenden Maßnahmen" ergriffen oder „durch einen kompetenteren Spezialisten vornehmen lassen, soweit die Umstände und Verdachtsmomente dies verlangen" (42), scheidet ein Diagnosefehler aus, wenn die Beurteilung des Krankheitsbildes danach vertretbar (d. h. schlüssig, medizinisch folgerichtig) war. Eine „Überdiagnostik" in Gestalt einer „für den Einzelfall sinnlosen, nur der Absicherung des Arztes dienenden schematischen Durchführung aller nur denkbaren Untersuchungsmethoden" ist keinesfalls erforderlich (83). Entgegen der Ansicht von Giesen (26) ist der Arzt nicht verpflichtet, grundsätzlich, d. h. ausnahmslos, von allen vorhandenen Erkenntnismöglichkeiten Gebrauch zu machen. Dies würde eine Datenflut auslösen, die die Beurteilung des Krankheitsbildes eher erschwert (27). Eine ungezielte Diagnostik unter Erhebung einer Fülle von Parametern ist oftmals von geringerem Erkenntniswert als eine gezielte Erhebung ausgewählter Daten unter Berücksichtigung der Vorgeschichte einer Erkrankung und der Ergebnisse einer körperlichen Untersuchung (5). „Die Möglichkeiten der modernen Diagnostik auszuschöpfen" ist nicht gleichbedeutend mit der tatsächlichen Sammlung aller erreichbaren Daten (5, Fn 8). Vielmehr ist aus rechtlicher Sicht lediglich zu prüfen, „ob die Verletzung der objektiven Sorgfaltspflicht vorgelegen hat, und das heißt, ob alle für den vorliegenden Fall notwendigen diagnostischen Maßnahmen durchgeführt und richtig gedeutet wurden". Insofern kann selbstverständlich das Unterlassen einer Befunderhebung einen ärztlichen „Kunstfehler", d. h. objektiven Sorgfaltspflichtverstoß bedeuten (7), der die zivil- und strafrechtliche Haftung zu begründen vermag. Aber die Betonung liegt auf der medizinisch gebotenen Befunderhebungs- und Befundsicherungspflicht. Als Diagnosefehler wurden z. B. die Nichtvornahme einer Gewebeuntersuchung vor der Entfernung einer Brustdrüse (44) oder das Unterlassen eines Krebsabstrichs trotz typischer, auf Krebserkrankung hinweisender

425

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

Nutzen und Schaden bei Screening- und Routineuntersuchungen

Geburtsh . u. Frauenheilk. 51 (1991) Beschwerden qualifiziert (58). Ebenso wurde es als grobe Unterlassung angesehen, wenn der Arzt bei einer Probeexstirpation aus der Brustdrüse das entnommene Material intraoperativ nicht noch einmal röntgenologisch kontrollierte, um nachzuweisen, daß der präoperative Befund in der Probe enthalten war (57). d) Schließlich noch ein letzter Hinweis zur „objektiven" Sorgfaltspflicht gerade im Hinblick auf die in allen medizinischen Fachgebieten anzutreffenden Bestrebungen, bestimmte „Routineuntersuchungen" oder „Standard-Befunderhebungsprogramme" festzulegen, z. B. die routinemäßige präoperative Gerinnungsdiagnostik , eine standardisierte Tumortherapie oder ein Screening auf HIVAntikörper in der Schwangerschaft. Der BGH hat nämlich inzwischen - deutlicher als die frühere Judikatur - ausdrücklich anerkannt, daß auch finanzielle Aspekte, also Wirtschaftlichkeitserwägungen, den Umfang der vorzunehmenden Untersuchungen begrenzen können. Im sogenannten „Halsrippen"-Urteil aus dem Jahre 1974 (74) ging es darum, ob vor jeder Narkose eine Röntgenuntersuchung zur Feststellung von Halsrippen durchzuführen ist, um die Gefahr von Narkoselähmungen zu erkennen. Maßgeblich für die Beantwortung dieser Frage ist - meint der BGH eine Abwägung aller relevanten Faktoren, zu denen vor allem die statistische Häufigkeit der gefahrdrohenden Anomalie, das Gewicht der verwirklichten Gefahr und schließlich der wirtschaftliche und allgemeine Aufwand für die erforderlichen Feststellungen gehörten.

Stets muß „der personelle und sachliche Aufwand für die Untersuchung noch in angemessenem Verhältnis zu den Risiken" stehen, „deren Vermeidung sie dienen" (85). Auf die entstehenden Kosten kommt es nur dann nicht an, wenn diese in einer vertretbaren Relation „zur drohenden Gefahr stehen und diese Gefahr keine nur ganz entfernte ist" (56). Gerade vor dem Hintergrund beschränkter Kapazitäten und limitierter finanzieller Ressourcen wird die Frage, welche diagnostischen Untersuchungen angestellt werden müssen, in Zukunft mehr und mehr nicht nur unter medizinischen und forensischen Aspekten, sondern auch unter Kostengesichtspunkten beantwortet werden und zur Begrenzung der ärztlichen Sorgfaltspflicht führen. Im Kassenarztrecht ist das Wirtschaftlichkeitsgebot, also die Beachtung der Relation von Kosten und Erfolg sogar gesetzlich verankert (§ 12 SGB V), d. h. der Kassenpatient hat nur Anspruch auf eine „ausreichende, zweckmäßige, das Maß des Notwendigen nicht überschreitende" Behandlung (9). Der Aspekt der Wirtschaftlichkeit hat zwar keinen Vorrang vor dem Wohl des Patienten, aber er ist auch nicht irrelevant, sondern geht in die Bestimmung der Anforderungen des jeweiligen Standes der medizinischen Wissenschaft und Technik ein, anders ausgedrückt, die objektiv gebotene Sorgfalt wird durch den Kostengesichtspunkt mitbestimmt (18). 2. Die Frage, ob ein Arzt im konkreten Fall seine ihm dem Patienten gegenüber obliegende Sorgfaltspflicht erfüllt hat und bei pflichtgemäßem Verhalten der Schaden nicht eingetreten wäre, ist zwar im Streitfall eine vom Gericht bzw. der Staatsanwaltschaft zu beurteilende Rechtsfrage. De facto wird sie aber, da dem Richter und Staatsanwalt die nötigen Fachkenntnisse fehlen, vom medizinischen Gutachter - und damit praktisch von der

E. Kuss, M. Tryba, R. Kürzl, K Ulsenheimer

Ärzteschaft selbst - entschieden. Denn nur der Sachverständige ist aufgrund seiner wissenschaftlichen Qualifikation und fachlichen Erfahrung in der Lage, den Inhalt des Standards zu bestimmen, d. h. darzulegen, wann ein Heilverfahren, eine bestimmte Behandlungs- oder Untersuchungsmethode oder ein Medikament als wissenschaftlich anerkannt, überholt, wirksam aussagekräftig oder gefährlich zu gelten hat (80). Der Richter bleibt zwar verpflichtet, das Gutachten selbständig und kritisch auf seine Überzeugungskraft zu prüfen, doch läuft dies im Gerichtsalltag auf eine bloße Plausibilitätskontrolle hinaus. Dies hat zur Folge, daß der Richter die Verantwortung für Entscheidungen trägt, die in Wirklichkeit ein anderer, nämlich der Sachverständige getroffen hat. Gerade weil der Sachverständige aber sich im Arzthaftungsrecht „weitgehend als eine den Tathergang ermittelnde und die Entscheidung vorprogrammierende Institution etabliert" hat (36), obliegt ihm eine besonders hohe Verantwortung für die sachliche Richtigkeit seiner Ausführungen. Dagegen wird leider zu Lasten der betroffenen Ärzte, aber auch der Justiz, nicht selten verstoßen, und zwar in dreifacher Richtung: a) Bei der Frage , ob dem behandelnden Arzt ein Verstoß gegen allgemein anerkannte Regeln der ärztlichen Kunst vorzuwerfen ist, wird von den Sachverständigen oft nicht genügend „ unter dem Gesichtspunkt der sogenannten Gruppenfahrlässigkeit " differenziert und dadurch übersehen : Der Facharzt „ schuldet ein anderes Maß an Sorgfalt als der Arzt für Allgemeinmedizin und entsprechende Unterschiede sind auch zwischen dem klinisch Tätigen und dem niedergelassenen Arzt und wohl auch zwischen einem kleineren kommunalen Krankenhaus einerseits und einer Universitäts - oder Spezialklinik andererseits zu machen" (79). In diesem Zusammenhang sei beispielhaft etwa auf den Ultraschall-Spezialisten verwiesen. Hiersche hat völlig recht, wenn er feststellt, „daß die spezifische, häufig einseitige Kenntnis von Ultraschalldiagnostikern einerseits, ihre ihnen für die Untersuchung zur Verfügung stehende Zeitspanne andererseits und schließlich ihr moderner Gerätepark in den Gutachten nicht als medizinischer Standard gewertet werden dürfen" (32). Insofern ist ihm beizupflichten, wenn man sich manchmal „aus medizinrechtlicher Sicht nicht des Eindrucks erwehren kann, daß bei den fast sintflutartig auf uns zukommenden Zivilprozessen, aber auch Strafverfahren, der Gutachter schlichtweg Unheil verkörpert". Denn derartige - verfehlte - Äußerungen oder Anforderungen von Sachverständigen finden über die Bestimmung des Standards Eingang in Gerichtsurteile und erlangen dadurch normative Kraft. b) Ein zweiter Gesichtspunkt, der von Sachverständigen vielfach nicht beachtet wird, ist der Grundsatz der Methodenfreiheit. Gibt es mehrere medizinisch anerkannte Heilmethoden oder haben sich noch keine StandardBehandlungsregeln bzw. Untersuchungsprogramme durchgesetzt, muß das ganze Meinungsspektrum deutlich gemacht und darf der „Schulenstreit" bzw. die Meinungsdivergenz nicht durch Parteinahme zugunsten einer Rich-

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

426

tung zu Lasten des betroffenen Arztes entschieden werden. Gerade für den überzeugten Wissenschaftler ist daher in seiner Funktion als Sachverständiger angesichts der Relativität medizinischer Wahrheit größte Zurückhaltung geboten, damit er nicht der Gefahr erliegt, übersteigerte oder einseitige, noch nicht allgemein anerkannte Sorgfaltsanforderungen an seine Berufskollegen zu stellen und seine „Schule" bzw. seine eigenen Erfahrungen oder Ansichten zum alles entscheidenden Maßstab bei der Begutachtung fremden Handelns zu machen. Speziell für die Nichtvornahme diagnostischer Möglichkeiten gilt: der Sachverständige, der die Validität einer bestimmten Untersuchung für die weitere ärztliche Behandlung bejaht, ohne darzutun, daß ein Großteil oder jedenfalls eine beachtliche Zahl von Stimmen in der medizinischen Wissenschaft anderer Meinung sind, verstößt nicht nur gegen seine Pflicht zur Objektivität, sondern setzt die entscheidende Ursache für ein Fehlurteil und erhöht damit zugleich für die Zukunft die forensischen Risiken seiner Kollegen. Der Arzt verstößt nämlich nur dann gegen seine Sorgfaltspflichten, wenn er sich ohne triftigen Grund für die gefahrenträchtigere Behandlungsweise entscheidet, indem er z. B. effektive, d. h. für das weitere Vorgehen wichtige, aussagekräftige Untersuchungen unterläßt und damit das Risiko für den Patienten unnötig erhöht. c) Als drittes wird schließlich von Sachverständigen vielfach auch übersehen, daß die objektive Sorgfaltspflicht aus der Sicht ex-ante zu bestimmen ist, d. h. konkret, es ist zu prüfen, wie sich ein umsichtiger und erfahrener Arzt derselben Fachrichtung in gleicher Situation, also zur Zeit der Behandlung verhalten hätte: Später bekannt gewordene Umstände, nachträgliche wissenschaftliche Erkenntnisse und Forschungsergebnisse haben deshalb außer Betracht zu bleiben. Im nachhinein, rückblickend, ist es aber meist sehr viel leichter zu entscheiden, was man in dieser oder jener Lage hätte tun sollen, ob also z. B. ausnahmsweise eine diagnostische Untersuchung im konkreten Fall - trotz allgemeiner geringer Erfolgswahrscheinlichkeit - Erkenntnisse gebracht hätte. 3. Welche Folgerungen ergeben sich daraus? a) Ob und unter welchen Umständen bestimmte diagnostische Untersuchungen bei stationären und ambulanten Patienten indiziert sind, ist also im Streitfall primär eine Entscheidung des medizinischen Sachverständigen. Denn aus juristischer Sicht sind die Folgerungen klar: nur das „Unterlassen medizinisch erforderlicher diagnostischer Untersuchungsmaßnahmen, die die Art der Erkrankung erhellen und Grundlage für die einzuschlagende Therapie geben", stellt einen ärztlichen Behandlungsfehler dar, der eine „vertragliche und deliktische Haftung auslöst" und zur Strafbarkeit führen kann (8). Wenn jedoch die Untersuchungsmethode eine „nachweislich geringe Erfolgswahrscheinlichkeit" hat, dürfte sie kaum dem „diagnostischen Standard" entsprechen, also nicht indiziert sein. „Wo nicht mit ausreichender Sicherheit feststeht, welche konkreten Schlußfolgerungen" z. B. aus bestimmten Voruntersuchungen „für die Narkosefä-

Geburtsh. u. Frauenheilk. 51 (1991) 427

higkeit" des Patienten, für einen bestimmten operativen Eingriff oder die vorgesehene Therapie zu ziehen sind, „erscheint ihre Aufnahme in ein Routine-Untersuchungsprogramm nicht angezeigt". Weissauer spricht hier zutreffend vom notwendigen „Mut zur Lücke" (85). „Der diagnostische Endpunkt" muß „von der möglichen Therapie her bestimmt werden" und das heißt: die Grenze medizinisch gebotener und dadurch aus rechtlicher Verpflichtung vorzunehmender diagnostischer Untersuchungen ist erreicht, „wenn aus weiteren diagnostischen Maßnahmen keine therapeutischen Konsequenzen zu erwarten sind". „Eine Laboruntersuchung, von der man vorher weiß, daß ihr Ergebnis mit hoher Wahrscheinlichkeit für die Therapie überflüssig sein wird", wäre sogar, wenn sie den Patienten belastet, „unärztlich und juristisch eine rechtswidrige Körperverletzung" (27), außerdem noch unwirtschaftlich im kassenärztlichen Sinne. Ein typisches Beispiel aus der Unfallchirurgie: die teure szintigraphische Untersuchung bei ausbleibender Frakturheilung, da ihr kein wesentlicher Aussagewert zukommt. b) Ebenso wie das Unterlassen notwendiger diagnostischer Untersuchungen einen groben Behandlungsfehler darstellt und damit sogar zur Umkehr der Beweislast zu Ungunsten des Arztes führen kann, ebenso gehört eine von einem oder vielleicht auch einigen Ärzten für zweckmäßig, sinnvoll oder gar notwendig erachtete diagnostische Maßnahme dadurch noch nicht zum „Standard". Dieser ist „nicht nur eine Beschreibung tatsächlich geübten ärztlichen Verhaltens, sondern auch eine normative Kategorie in Gestalt von anerkanntem, in der Praxis für richtig und erforderlich angesehenem Verhalten" (71). Solange also ein Großteil der medizinischen Wissenschaft und Praxis den Erkenntniswert bestimmter diagnostischer Abklärungen für gering erachtet, stellt ihre Unterlassung keinen Verstoß gegen die objektiv gebotene Sorgfalt dar. Ist zum Beispiel die histologische Untersuchung auch bei als gutartig eingeschätzten Geschwulsten in Zweifelsfällen dringend angeraten, ist der Arzt verpflichtet, die Gewebeuntersuchung durchzuführen. Besteht aber nach den Gesamtumständen kein Anlaß für solche Zweifel, „wird der geschuldete Standard in einer fachärztlichen Hautpraxis nicht verletzt, wenn die Gewebeuntersuchung unterbleibt" (59). Denn „eine generelle Verpflichtung, jedes entnommene Gewebe einer histologischen Untersuchung zuzuführen", entspricht nicht den anerkannten Regeln der Diagnostik, mag auch der Sachverständige „für seinen Universitätsbereich routinemäßige Gewebeuntersuchungen vornehmen". c) Schon deshalb können sich also aus der Nichtvornahme von Untersuchungen mit nachweislich geringer Aussagekraft bei zutreffender Sachverständigenbegutachtung keine im Ergebnis negativen forensischen Haftungsfolgen ergeben. Hinzu kommt: der bloße Verstoß gegen die Regeln der ärztlichen Kunst führt, was vielfach übersehen wird, für sich alleine weder zur zivil- noch zur strafrechtlichen Haftung. Diese setzt vielmehr voraus, daß die Pflichtverletzung des Arztes für den Tod oder die Körperverletzung des Patienten ursächlich gewesen ist. aa) Dabei wird im Zivilrecht ein Schaden schon dann als ursächlich angesehen, wenn der Behandlungsfehler nach dem gewöhnlichen Verlauf der Dinge

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

Nutzen und Schaden bei Screening - und Routineuntersuchungen

Geburtsh . u. Frauenheilk . 51 (1991)

geeignet war, die Schädigung herbeizuführen. Dies bedeutet: Hätte die Anwendung einer bestimmten Diagnosemethode die nachfolgenden Komplikationen nach medizinischer Erfahrung mit einer gewissen Wahrscheinlichkeit ausgeschlossen, anders formuliert, hat die unterlassene Diagnosemaßnahme die Gefahr der Schädigung oder sogar des Todes des Patienten nicht unerheblich erhöht, ist die Kausalität im Sinne der sog. Adäquanztheorie zu bejahen und damit die Schadenersatz- und Schmerzensgeldklage begründet. bb) Im Strafrecht erfolgt dagegen die Kausalitätsprüfung nach einem strengeren Maßstab. Wegen des strafprozessualen Grundsatzes „im Zweifelsfalle für den Angeklagten" ist die Ursächlichkeit einer Unterlassung nur dann zu bejahen, wenn bei sorgfaltsgemäßem Verhalten der Tod oder die Körperverletzung mit an Sicherheit grenzender Wahrscheinlichkeit vermieden worden wäre. Dabei ist dieser der medizinischen Fachsprache fremde Begriff nicht mit mathematisch-statistischen Prozentzahlen, z. B. 99 % oder 99,9 % zu erfassen. „An Sicherheit grenzende Wahrscheinlichkeit" bedeutet vielmehr: ursächlich ist das Verhalten immer schon, aber auch nur dann, wenn keine - aus konkreten Anhaltspunkten begründeten - „vernünftigen Zweifel" daran bestehen, daß der Patient ohne den Behandlungsfehler des Arztes am Leben geblieben bzw. nicht geschädigt worden wäre. Eine „überwiegende", „hohe" oder „sehr große" Wahrscheinlichkeit für die Lebensrettung oder Heilung genügt für den Nachweis der Kausalität einer Pflichtverletzung im Strafprozeß nicht. cc) Daraus folgt für eine unterlassene diagnostische Untersuchung mit nachweislich geringer Erfolgswahrscheinlichkeit: Da unter dieser Prämisse weder „nach allgemeiner Lebenserfahrung" noch „mit an Sicherheit grenzender Wahrscheinlichkeit" festgestellt werden kann, daß die Durchführung dieser konkreten Diagnosemaßnahmen den Eintritt des Schadens bzw. Todes verhindert hätten, würde selbst bei Bejahung einer Sorgfaltspflichtverletzung jedenfalls deren Kausalität und damit die zweite wesentliche Haftungsvoraussetzung fehlen. Entscheidend ist dafür natürlich zum einen, daß die Erfolgswahrscheinlichkeit der unterlassenen Maßnahme wirklich gering ist, und zum anderen, wie man „gering" definiert. Darüber hat der Gutachter zu befinden, so daß es an ihm ist, die dies belegenden Erfahrungswerte, Statistiken, Forschungsergebnisse korrekt vorzutragen. 4. „Je weiter die Diagnostik ausgreift, je mehr Krankheiten - auch des erwachsenen Lebens - sie festzustellen oder vorauszusagen vermag, desto stärker geraten Ärzte unter den forensisch erhöhten Druck, von den neuen Erkenntnismöglichkeiten Gebrauch zu machen" (43), z. B. besonders sichtbar im Bereich der pränatalen Diagnostik. Nicht alles, was medizinisch machbar und vertretbar ist, muß jedoch im konkreten Fall auch vorgenommen werden. Vielmehr gilt insoweit der jeweilige „Stand der Wissenschaft" zur Bestimmung und gleichzeitig zur Begrenzung des objektiven Sorgfaltsmaßstabs. Zwischen medizinischer Zweckmäßigkeit und medizinischer Notwendigkeit, zwischen potentieller Nützlichkeit und rechtlicher Gebotenheit ist streng zu unterscheiden.

E. Kuss, M. Tryba, R. Kürzl, K. Ulsenheimer

a) Wer diagnostische Untersuchungen mit geringer Erfolgswahrscheinlichkeit für medizinisch unbedingt erforderlich hält, um das - im übrigen stets verbleibende - Restrisiko für den Patienten weiter zu reduzieren, fordert, solange zumindest beachtliche Teile der Wissenschaft anderer Ansicht sind, einen überhöhten Leistungsstandard. Dessen Nichteinhaltung mag zwar vielleicht zunächst zum Vorwurf eines ärztlichen Sorgfaltsmangels und zu forensischen Implikationen führen. Da es jedoch nur auf die objektiv gebotene Sorgfalt ankommt, die vom „Standard" der medizinischen Wissenschaft bestimmt wird, ist bei sachgerechter, d. h. unvoreingenommener, objektiver Begutachtung seine zivil- und strafrechtliche Haftung ausgeschlossen, zumal ja, wie dargelegt, die Kausalität der unterbliebenen Diagnosemaßnahmen für den Eintritt des Schadens praktisch unter der Prämisse „geringer Erkenntniswert" nicht beweisbar ist. b) Aus praktischen und wirtschaftlichen Gründen kann und muß nicht von allen Erkenntnisquellen Gebrauch gemacht werden (60); auch Kosten-NutzenÜberlegungen sind -jedenfalls bei Diagnosemaßnahmen im Arzthaftungsrecht zu berücksichtigen. c) Unter Berufung auf die Judikatur, aus Sicherheitsgründen eine Diagnostik zu betreiben, aus der sich mit hoher Wahrscheinlichkeit keine therapeutischen Konsequenzen ergeben, ist weder ärztlich indiziert noch rechtlich geboten. Die Erbringung eigentlich unnötiger, weil höchstwahrscheinlich ohne Erkenntniswert bleibender Diagnosemaßnahmen gehört nicht zu den Regeln der ärztlichen Kunst und verstößt gegen das kassenärztliche Wirtschaftlichkeitsgebot. Die Begründungslast, warum etwas untersucht werden soll, liegt daher beim Arzt. Trotz allem Verständnis für das Sicherheitsdenken und -handeln der Ärzte im Sinne einer „defensiven" Medizin kann und darf jedoch die medizinische Indikation nicht durch eine sozusagen „forensische" Indikation ersetzt werden. Abkürzungen: AHRS: Arzthaftpflicht-Rechtsprechung BGH: Bundesgerichtshof BGHZ: Entscheidungen des Bundesgerichtshofes in Zivilsachen BSG: Bundessozialgericht BSGE: Entscheidungen des Bundessozialgerichts JR: Juristische Rundschau LG: Landgericht LSG: Landessozialgericht NJW: Neue ,Juristische Wochenschrift OLG: Oberlandgericht VersR: Versicherungsrecht ZStW: Zeitschrift für die gesamte Strafrechtswissenschaft

Literatur Abel, U., L. Edler, E. Weber: Neuere statistische Methoden für die Analyse von Tumormarkerdaten. TumorDiagn. Ther. 4 (1983), 39-44. Abel, U.: Die Beurteilung von Indexschätzungen zur Validierung diagnostischer Tests. TumorDiagn. Ther. 5 (1984), 242-248. Albert, A.: On the use and computation of likelihood ratios in clinical chemistry. Clin. Chem. 28 (1982), 1113-1119. Altemeyer, K.-H., M. Schutz, H.-M. Merckens, E. Heinz, W. Dick: Präoperative Befunderhebung durch eine Anästhesie-Ambu-

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

428

Nutzen und Schaden bei Screening- und Routineuntersuchungen

429

31

Hershey, J. C., R. D. Cebul, S. V. Williams: Clinical guidelines for using two dichotomous tests . Med. Decis . Making 6 (1986), 68-78. 32 Hiersche , H.-D.: Ultraschalldiagnostik in der Pränatal -Medizin aus medizinischer Sicht . Medizinrecht 7 (1989), 304-306. 326 Hilgers, R. A.: Distribution - free confidence bounds for ROC curves. Meth. Inform. Med. 30 (1991), 96-101. 33 Hirsch, I. A., D. L. Tomlinson, S. Slogoff, A. S. Keats: The overstated risk of preoperative hypokalemia. Anesth. Analg. 67 (1988), 131-136. 34 Kaplan, E. B., L. B. Sheiner, A. J. Boeckmann, M. E Reizen, S. L. Beal, S. N. Cohen, C. D. Nicoll: The usefulness of preoperative laboratory screening. JAMA 253 (1985), 3576-3581. 35 Kong, A., G. 0. Barnett, E Mosteller, C. Youtz: How medical Professionals evaluate expressions of probability. N. Engl. J. Med. 315 (1986), 740-741. 36 Krauß, D.: Richter und Sachverständiger im Strafverfahren. ZStW 85 (1973), 320-359. 37 Kreienberg, R., H. Merkl: Spezielle medizinische Nachsorge bei gynäkologischen Malignomen. In: Gynäkologie und Geburtshilfe, Bd. 111/2. Käser, 0., V. Friedberg, K. G. Ober, K. Thomsen, J. Zander (Hrsg.). Thieme, Stuttgart 1985. 38 Kürzl, R., M. Stumpfe, D. Hölzel, in Vorbereitung. 39 Kuss, E., A. L. Suchman: Use of the activated partial thromboplastin time. Ann. Intern. Med. 109 (1988), 347. 40 Kuss, F..: Zur Aufnahme von Tests auf Anti-HIV-IgG in die allgemeine Vorsorgeuntersuchung für Schwangere. Geburtsh. u. Frauenheilk. 49 (1989), 922-923. 41 Kuss, E.: Routinemäßige präoperative Gerinnungsdiagnostik. Geburtsh. u. Frauenheilk. 50 (1990), 499-501. 42 Laufs, A.: Die Entwicklung des Arztrechts 1985/86. NJW 39 (1986), 1515-1521. ' Laufs, A.: Pränatale Diagnostik und Lebensschutz aus arztrechtlicher Sicht. Medizinrecht 8 (1990), 231-237. 44 LG Frankfurt, Urteil vom 16.01.1975-2/7 0 412/7311: Mastopathia fibrosa. Diagnosefehler eines Frauenarztes (bei Frauenkrankheiten) 1942/ 1. In: AHRS. Ankermann, E., Erich Schmidt (Hrsg.) Berlin (1987), 1-4 (4. Lfg. IX/87). 45 Linnet, K.: A review an the methodology for assessing diagnostic tests. Clin. Chem. 34 (1988),1379-1.386. 41, Maze M.: Hepatic physiology. In: Anesthesia, 2. Aufl. Miller, R. D. (Hrsg.). Churchill Livingstone, New York 1986. 47 Mazze, R. 1.: Renal physiology and the effects of anesthesia. In: Anesthesia, 2. Aufl. Miller, R. D. (Hrsg.). Churchill Livingstone, New York 1986. 48 Meier, W., P Stieber, W. Eiermann, A. Schneider, A. FatehMoghadam, H. Hepp: Serum levels of CA 125 and histological findings at second-look laparotomy in ovarian carcinoma. Gynec. Oncol. 35 (1989), 44-46. 49 Meyer, K. B., S. G. Pauker: Screening for HIV: Can we afford the false positive rate? N. Engl. J. Med. 317 (1987), 238-241. 70 Miller, R. D., J. J. Savarese: Pharmacology of muscle relaxants and their antagonists. In: Anesthesia, 2. Aufl. Miller, R. D. (Hrsg.). Churchill Livingstone, New York 1986. Muck, B. R., F. Bode, S. Trotnow: Operationsvorbereitung und postoperative Überwachung. In: Gynäkologie und Geburtshilfe, Bd. 111/1. Käser, 0., V Friedberg, K. G. Ober, K. Thomsen, J. Zander (Hrsg.). Thieme, Stuttgart 1985. Müller-Dietz, H.: Rechtliche Regelung und therapeutische Bedürfnisse. In: Arzt und Patient zwischen Therapie und Recht (Medizin und Recht, Bd. 11). Jung, H. (Hrsg.). Enke, Stuttgart (1981), 7-26. Nossal, G. J. V.: Science in the medical curriculum. Lancet II (1976), 840-842. 54 Office of Medical Applications of Research, National Institutes of Health, Bethesda: Perioperative red blond cell transfusion. JAMA 260 (1988), 2700-2703. Office of Medical Applications of Research, National Institutes of Health, Bethesda: So wenige Transfusionen wie möglich. Dt. Ärztebl. 86 (1989), B-836.

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

lanz: Auswertung der Ergebnisse bei 2 500 Patienten. Anäst. Intensivmed. 25 (1984), 1-7. Anschütz, E: Probleme der Diagnostik aus klinischer Sicht. In: Effizienz und Effektivität medizinischer Diagnostik. Vogel, H.R. (Hrsg.). Fischer, Stuttgart (1985), 3-13. 6 BGH, Urteil vom 14.07.1981 - VI ZR 35/79 (KG): BGH § 823: Zur Frage von Beweiserleichterungen bei einem schweren Behandlungsfehler. Medizinrecht 1 (1983), 107-109. 7 BGH, Urteil vom 3.2. 1987 -VI ZR 56/86: Beweiserleichterung bei fehlender Befundsicherung. BGHZ 99 (1987), 391-400. 8 BGH, Urteil vom 19.5.1987 - VI ZR 167/86. VersR 38 (1987), 1092-1094. 9 BSG, Urteil vom 29.5.1962 - 6 RKa 24/ 9: Honorarkürzung. BSGE 17 (1962) 79-89. Boyd, J. C.: Perspectives an the use of chemometrics in laboratory medicine. Clin. Chem. 32 (1986), 1726-1733. 11 Cebul, R. D., J. R. Beck.: Biochemical profiles. Applications in ambulatory screening and preadmission testing of adults. Ann. Int. Med. 106 (1987), 403-413. 12 Christian, K.-W., H. Gervais, W. Dick: Aussagewert von präoperativen Screeninguntersuchungen. Anaesthesist 37 (1988), 694-703. 13 de Waal, J. C., E. Dirr, E. Kuss: Klinisch-chemische Befunde von Patientinnen mit Mammakarzinom - eine retrospektive Studie. Arch. Gynec. 250 (1991), im Druck. 14 Deutsche Gesellschaft für Anästhesiologie und Intensivmedizin: Entschließung zur anästhesiologischen Voruntersuchung. Anästhesiol. Intensivmed. 11 (1982), 446. 15 Dick, W.: Die Beurteilung der Narkosefähigkeit. Anästhesiol. Intensivmed. 31 (1990), 66-67. 16 Durbridge, T. C., E Edwards, R. G. Edwards, M. Atkinson: Evaluation of benefits of screening tests done immediately an admission to hospital. Clin. Chem. 22 (1976), 968-971. 17 Editorial: Diagnosis: Logis and psycho-logic. Lancet 1 (1987), 840-841. 18 Engisch, K.: Die rechtliche Bedeutung der ärztlichen Operation. (Aus: Fehler und Gefahren bei chirurgischen Operationen, Bd. 2). G. Fischer, Jena (1958), 21-34. 19 Feinstein, A. R., R. I. Horwitz: Double standards, scientific methods, and epidemiologic research. N. Engl. J. Med. 307 (1982), 1611-1617. 2° Fencl, V., T. H. Rossing: Acid-base disorders in critical care medicine. Ann. Rev. Med. 40 (1989), 17-29. 21 Fischer, K.: Die Beurteilung der Narkosefähigkeit-Aspekte der Wirtschaftlichkeit. Anästhesiol. Intensivmed. 31 (1990), 144-146. 22 Fraser, C. G., Y. Fogarty: Interpreting laboratoy results. Brit. Med. J. 298 (1989), 1659-1660, 21 Friedmann, J. B., N. S. Weiss: Second thoughts about secondlook laparotomy in advanced ovarian cancer. N. Engl. J. Med. 322 (1990), 1079-1081. 24 Galen, R. S., S. R. Gambino: Norm und Normabweichung klinischer Daten. Gustav Fischer Verlag, Stuttgart - New York 1979. 25 Galen, R. S.: The predictive value model and patient care decisions. In: Clinical decisions and laboratory use. Connelly, D. P, E. S. Benson, M. D. Burke, D. Fenderson (Hrsg.). University of Minnesota Press, Minneapolis (1982), 279-286. 26 Giesen, D.: Wandlungen des Arzthaftungsrechts. 2. unveränd. Aufl. Mohr, Tübingen (1984), 14-40. 27 Goetze, E.: Ärztliche Sorgfaltspflichten im Straf- und Zivilrecht (Kap. 3): In: Arzthaftungsrecht und kassenärztliches Wirtschaftlichkeitsgebot (MedR, Schriftenreihe Medizinrecht). Springer, Berlin (1989), 78-9 1. 28 Grospietsch, G., W. Kuhn: Präoperative Untersuchungen und Vorbereitung. In: Gynäkologische Operationen. Zander, J., H. Graeff (Hrsg.). 3.Aufl., Springer, Berlin 1991. 29 Gross, R.: Über diagnostische und therapeutische Entscheidungen. Klin. Wschr. 53 (1975), 293-305. 30 Heinrichs, W.: Klinisch-chemische Untersuchungen zur Anästhesievorbereitung. Dtsch. Med. Wschr. 112 (1987), 1595.

Geburtsh. u. Frauenheilk. 51 (1991)

Geburtsh . u. Frauenheilk.51 (1991) bb OLG Düsseldorf, Urteil vom 25.11.1982 - 8 U 87/80: BGB § 276, 823 Abs. 1: Sorgfaltspflichten einer Nervenheilanstalt. Medizinrecht 2 (1984), 69-72. 57 OLG Düsseldorf, Urteil vom 27.06.1985 - 8 U 151/83: Fibrozystische Mastopathie (LG Düsseldorf). Diagnosefehler eines Frauenarztes (bei Frauenkrankheiten) 1942/7. In: AHRS. Ankermann, E., Erich Schmidt (Hrsg.). Berlin (1987), 15-24 (4. Lfg. IX/87). 58 OLG Hamm, Urteil vom 4.7.1983 - 3 U 356/82: Sigma-Scheidenfistel (LG Dortmund). Diagnosefehler eines Frauenarztes (bei Frauenkrankheiten) 1942/3. In: AHRS. Ankermann, E., Erich Schmidt (Hrsg.). Berlin (1987), 7-8 (4. Lfg. IX/87). 59 OLG Oldenburg, Urteil vom 7.11. 1989 - 5 U 13/89: BGB § 823: Zur diagnostischen Sorgfaltspflicht eines Gebietsarztes. Medizinrecht 8 (1990), 92-93. 60 Perret, W: Arzthaftpflicht. Urban & Schwarzenberg, München - Berlin (1956), 48-55. 61 Rasmus, K. T., R. L. Rottan, D. M. Kotelko, W. C. Wright, J. J. Stone, R. M. Rosenblatt: Unrecognized thrombocytopenia and regional anesthesia in parturients: A retrospective review. Obst. Gynecol. 73 (1989), 943-946. 62 Ratzel, R., W. Weißauer: Zur Vereinbarung über die Zusammenarbeit in der operativen Gynäkologie und in der Geburtshilfe. Anästhesiol. Intensivmed. 4 (1989),121-126. 63 Reynolds, T. M., M. D. Penney: The mathematical Basis of multivariate risk screening: With special reference to screening for Down's syndrome associated pregnancy. Ann. Clin. Biochem. 27 (1989), 452-458. 64 Robbins, J. A., A. 1. Mushlin: Preoperative evaluation of the healthypatient. Med. Clin. NorthAm. 63 (1979), 1145-1156. 65 Roizen, M. F.: Routine preoperative evaluation. In: Anesthesia, 2. Aufl. Miller, R. D. (Hrsg.). Churchill Livingstone, New York 1986. 66 Roizen, M. R.: Anesthetic implications of concurrent diseases. In: Anesthesia, 2. Aufl. Miller, R. D. (Hrsg.). Churchill Livingstone, New York 1986. 67 Roulston, J. E., J. Fisken, R. Leonard: Screening for early ovarian cancer. Lancet 11 (1988), 171-172. 68 Sackett, D. L., R. B. Haynes, P Tugwell: Clinical Epidemiology. A Basic Science for Clinical Medicine. First edition, Little, Brown and Company, Boston/Toronto 1985. 69 Sarubin, J., E. Gebert: Serumkaliumanstieg nach depolarisierenden Muskelrelaxantien. Anaesthesist 30 (1981), 246-250. 70 Schnürch, H.-G., H. G. Bender: Perioperative Maßnahmen und Komplikationen in der operativen Gynäkologie. In: Gutartige gynäkologische Erkrankungen II. Beck, L., H. G. Bender (Hrsg.). Bd. 9 der Reihe Klinik der Frauenheilkunde und Geburtshilfe. Wulf, K.-H., H. Schmidt-Matthiesen (Hrsg). 2.Aufl. Urban & Schwarzenberg, München - Wien - Baltimore 1990. 71 Schreiber, H. L.: Rechtliche Maßstäbe des medizinischen Standards. Dtsch. Med. Wschr. 109 (1984), 1458-1460; siehe auch Carstensen, G.: Fortschritt und Standard in der Chirurgie. Langenbecks Arch. Chir. 364 (1984), 299-301. 72 Sear, J. W.: Liver dysfunction and the anaesthetist. Curr. Opin. Anaesthesiology 3 (1990), 457-462. 73 Shapiro, M. E, S. Greenfield: The complete blood count and leukocyte differental count. An approach to their rational application. In: Common Diagnostic Tests. Use and Interpretation. Sox, H. C. (Hrsg.). American College of Physicians, Philadelphia 1987. 74 Siegmund-Schultze, G.: Zum Umfang der Narkoseuntersuchung - ein Urteil des Bundesgerichtshofes. Anästhes. Inform. 16 (1975),174-176. 75 Slotnick, H. B., P. Etzell: Multivarate interpretation of laboratory tests used in monitoring patients. Clin. Chem. 36 (1990), 748-751. 76 Smiler, B. G., M. E. Williams: Hyperkalemia during anesthesia. N. Engl. J. Med. 311 (1984), 1187. 77 Sox, H. C.: Probability theory in the use of diagnostic tests. Ann. Int. Med. 104 (1986), 60-66.

F. Kuss, M. Tryba, R. Kürzl, K. Ulsenheimer 78

Tryba, M. und die Teilnehmer des Workshops über hämostaseologische Probleme bei Regionalanaesthesien: Hämostaseologische Voraussetzungen zur Durchführung von Regionalanaesthesien. Regional-Anaesthesie 12 (1989),127-131. 79 Ulsenheimer, K.: Anmerkung (BGH, Urteil vom 20.12. 1984 4 StR 668/84). JR (1986), 248-251, unter Hinweis auf Franzki, MedR,1984,189. 80 Ulsenheimer, K.: Stellung und Aufgaben des Sachverständigen im Strafverfahren. Gynäkologe 22 (1989), 401-405. 81 Umbach, G. E., C. Holzki, U. Perschmann, H.-G. Schnürch, H. G. Bender: Erfahrungen in der Nachsorge von Patientinnen mit Mammakarzinom. Geburtsh. u. Frauenheilk. 48 (1988), 292-298. 82 Unertl, K., H. Wroblewski, S. Glükher, G. Heinrich, M. Rauch, K. Peter: Das Risiko in der Anästhesie. Münch. Med. Wschr. 127 (1985), 609-612. 83 Wachsmuth, W.: Die chirurgische Indikation - Rechtsnorm und Realität. In: Festschrift für Bockelmann. Kaufmann, A., (Hrsg.). Beck, München (1979), 473-480. 84 Weber-Steinhaus, D.: Ärztliche Berufshaftung als Sonderdeliktsrecht. In: Medizin in Recht und Ethik, Bd. 21. Eser, A., E. Seidler (Hrsg.) Enke, Stuttgart 1990. 85 Weißauer, W : Die Beurteilung der Narkosefähigkeit. Anästhesiol. Intensivmed. 31(1990), 63-65. 86 Windeler, J., K. Richter, J. Köbberling: Die Beschreibung und Prüfung diagnostischer Maßnahmen in deutschsprachigen klinischen Zeitschriften. Schweiz. med. Wschr. 118 (1988), 1437-1441. 87 Winkel, P., M. W. Bentzon, B. E. Statland, H. Mouridsen, 0. Sheike: Predicting recurrence in patients with breast cancer from laboratory results: A new technique for the application of time series analysis. Clin. Chem. 28 (1982), 2057-2967. 8 Wissenschaftsrat: Empfehlungen zur klinischen Forschung in den Hochschulen; Zitat 3 und 4. (Hrsg.): Wissenschaftsrat (1986). 89 Zander, R.: Sauerstoff-Konzentration und Säure-Status des arteriellen Blutes als limitierende Faktoren einer Hämodilution. Klin. Wochenschr. 66 (1988), (Suppl. XV) 3-7. 90 Zweig, M. H., E. A. Robertson: Why we need better test evaluations. Clin. Chem. 28 (1982), 1272-1276.

Prof. Dr. rer nat., Dr. med. Erich Kuss Priu. -Doz. Dr. med. Rainer Kürzl 1. Frauenklinik der Universität München Maistraße 11 W-8000 München 2 Prof. Dr. med. Michael Tryba Universitätsklinik für Anästhesiologie Intensiv- und Schmerztherapie „ Bergmannsheil" Gilsingstraße 14 W-4630 Bochum Prof. Dr jur , Dr rer pol. Klaus Ulsenheimer Maximiliansplatz 12 W-8000 München 2

Heruntergeladen von: NYU. Urheberrechtlich geschützt.

430

[What benefit and harm can be expected from screening and routine examinations and from their omission?].

Benefit and harm of screening and routine tests or their omission are dealt with in four parts. In the first part methods are described to evaluate th...
2MB Sizes 0 Downloads 0 Views