Das GPR Gesundheits- und
Pflegezentrum Rüsselsheim besteht
aus den Teilbereichen GPR Klinikum
(577 Betten), der GPR
Seniorenresidenz „Haus am
Ostpark“ (185 Plätze) sowie dem
GPR Ambulanten Pflegeteam. Das GPR
Klinikum versorgt jährlich rund
27.000 stationäre und 75.000
ambulante Patienten. Damit leisten
wir einen bedeutenden Anteil zur
Sicherung der Lebensqualität in
der Region
Rüsselsheim/Main-Spitze. Wir
gelten als besonders frauen- und
familienfreundlicher Betrieb und
nehmen als Aka...
Pflegezentrum Rüsselsheim besteht
aus den Teilbereichen GPR Klinikum
(577 Betten), der GPR
Seniorenresidenz „Haus am
Ostpark“ (185 Plätze) sowie dem
GPR Ambulanten Pflegeteam. Das GPR
Klinikum versorgt jährlich rund
27.000 stationäre und 75.000
ambulante Patienten. Damit leisten
wir einen bedeutenden Anteil zur
Sicherung der Lebensqualität in
der Region
Rüsselsheim/Main-Spitze. Wir
gelten als besonders frauen- und
familienfreundlicher Betrieb und
nehmen als Aka...
Evidenzhierarchie – Level of Evidence (LoE)
Die verschiedenen Arten/Designs der Studien haben unterschiedlich starke Aussagekraft – das Level of Evidence (LoE). Die häufigste Darstellungsform für diese Hierarchie ist eine Pyramide.
- Systematische Übersichtsarbeiten (SR) und Meta-Analysen
- Kontrollierte Studien
- Randomisiert kontrollierte Studien (RCT)
Unter den primären Studiendesigns rangiert die randomisiert kontrollierte Studie (RCT) an der Spitze (LoE II). Es ist das aktuell zuverlässigste methodische Vorgehen von Untersuchungen. Ihre Aussagekraft ist am größten und die Ergebnisse am sichersten. Es ist allerdings auch das teuerste Verfahren. Im Mittel beliefen sich die Kosten für jede teilnehmende Person auf 17.000 US-Dollar. Das bedeutet, dass eine Studie mit 100 ProbandInnen rund 1,5 Millionen Euro verschlingt. Je nach Beobachtungszeitraum kann sich diese Summe schnell vervielfachen.
- NICHT-randomisiert kontrollierte Studien (CT)
Wie der Name verrät, gibt es auch kontrollierte (gegenüberstellende) Studien (CT), bei denen die ProbandInnenzuteilung nicht per Zufall geschieht. Sie sind methodisch zunächst wie die RCTs aufgebaut. Sie vergleichen die Effekte unterschiedlicher Situationen auf den Untersuchungsgegenstand. Per se sind die Ergebnisse auch vertrauenswürdig. Das Problem ist allerdings, dass eben aufgrund der fehlenden Randomisierung nicht sichergestellt ist, ob nicht eine Vorauswahl der „vielversprechendsten“ TeilnehmerInnen erfolgte.
- Beobachtungsstudien
- Fall-Kontroll-Studien
- Einzelfallberichte
Es werden üblicherweise fünf Stufen für die verschiedenen Studiendesigns verwendet. Hinzu kommen ExpertInnenmeinungen mit dem höchsten Verzerrungspotenzial und der entsprechend geringsten Vertrauenswürdigkeit.
Das höchste Evidenzlevel wird mit römisch Eins beziffert (LoE I). Hier finden sich die systematischen Übersichtsarbeiten (Systematic Review – SR). Diese Veröffentlichungen fassen die bisherige Datenlage zusammen, filtern diese anhand ihrer Qualität und geben ein kompaktes Resümee. Es gibt mittlerweile eine Vielzahl verschiedener Review-Designs. Diese alle aufzugreifen, würde hier den Rahmen sprengen.
Die Königsklasse stellen dazu dann die SRs dar, die zusätzliche eine Meta-Analyse aus den randomisiert kontrollierten Studien durchführen. Hierbei werden nicht nur die Ergebnisse der bisherig verfügbaren Publikationen „textlich“ zusammenfassend wiedergegeben, sondern auch die zugrundeliegenden Daten mathematisch zusammengeführt. Bildhaft gesprochen wird mithilfe statistischer Verfahren aus mehreren Einzelstudien mit jeweils kleinen Stichproben, eine Studie mit einer großen bis riesigen ProbandInnenzahl gemacht. In Wahrheit ist das ganze deutlich komplizierter, aber so ist es wohl am greifbarsten. Dies erhöht die Zuverlässigkeit der Ergebnisse und steigert die Allgemeingültigkeit.
Bei diesem Design wird der Untersuchungsgegenstand mindestens zwei verschiedenen Situationen ausgesetzt. Dieser Punkt beschreibt das „kontrollierte“. Bei den Therapiewissenschaften sind die PatientInnen der Untersuchungsgegenstand und die Situationen die Behandlungsformen. So ergibt sich beispielsweise der Vergleich zwischen chirurgischer und konservativer Behandlung bei PatientInnen mit Meniskusriss. Möglich sind aber auch ganz andere Gegenüberstellungen wie:
Aber auch Gegenüberstellungen von mehr als zwei Situationen/Interventionen sind möglich.• Physio vs. Placebo
• MT vs. KG
• KG vs. nichts (waitlist control)
• Physio vs. Medikamente
• OP vs. Placebo-OP
• Medikament vs. Placebo
• Medikament A vs. Medikament B
• …
Das „Randomisiert“ ist den meisten vom Random (Zufallswiedergabe) bei Musikplayern bekannt. Und nichts anderes beschreibt es im Kontext der Studien. Die Zuordnung der TeilnehmerInnen zu den unterschiedlichen gegenübergestellten Situationen/Interventionen erfolgt per Zufall.
Das große Problem an den Kosten dieser Studien ist, dass besonders Felder bei denen „nichts verkauft werden kann“ Finanzierungsschwierigkeiten in der Forschung haben. Somit sind die Wissenschaften der Therapieberufe auf öffentliche Fördermittel angewiesen, da Geldgeber wie Produkthersteller fehlen.
Daher sind die Resultate immer etwas limitierter einzuschätzen als bei einer RCT. Häufig wird für dieses Design auch der Begriff „quasi-randomisiert“ verwendet. Wird beispielsweise in einer Einrichtung die Interventionsgruppe und in einer anderen Einrichtung die Kontrollgruppe versorgt, wäre dies quasi randomisiert. Die Gruppenzuordnung entsteht, weil die ProbandInnen eine der Einrichtungen wählen. Aufgrund von Erreichbarkeit und anderen Kofaktoren wie soziodemografische Struktur ist dies eben kein echter Zufall und somit nicht randomisiert.
Dieses Studiendesign der Beobachtungsstudien (LoE III) ähnelt in der Herangehensweise zunächst dem, was TherapeutInnen als täglich Brot in der praktischen Arbeit erfahren. Es werden Interventionen an Betroffenen durchgeführt und ein Vorher-Nachher-Vergleich gezogen. Im Forschungsprozess werden diese Eingangs-, Zwischen- und Abschlusswerte systematisch anhand valider Assessments erhoben und statistisch ausgewertet.
Das größte Manko dieser Methodik ist die fehlende Gegenüberstellung zu anderen Interventionen oder gar dem „nichts tun“. Provokant formuliert, weiß man somit nicht – weder in der täglichen Praxis, noch nach der Beobachtungsstudie – ob die PatientInnen wegen oder trotz der Behandlung genesen sind. Genau an dieser Stelle ist das größte Problem der „guten Erfahrungen aus jahrzehntelanger Praxis“ begraben.
Die Beobachtungsstudien dienen somit nur der Schaffung erster wissenschaftlicher Erkenntnisse um darauf aufbauend weitere Forschung (RCTs) zu begründen oder abzulehnen. Ein Beispiel für eine solche Studie ist die zum Cross-Bracing-Protokoll.
Liegen allerdings mehrere Beobachtungsstudien zur selben Fragestellung, aber unterschiedlichen Interventionen vor, kann (mit gebotener Vorsicht) auch eine indirekte Gegenüberstellung durchgeführt werden. Auch hierfür ist das Beispiel des Cross-Bracing-Protokolls geeignet. Stellt man die Ergebnisse aus dieser Studie denen aus anderen Beobachtungsstudien zur Selbstheilungsquote von Kreuzbändern gegenüber, wird erkennbar, dass das Protokoll nicht überlegen ist.
Das Level of Evidenz IV wird durch sogenannte Fall-Kontroll-Studien (Case-Control-Studies) gebildet. Diese zählen grundsätzlich zu den Beobachtungsstudien. Allerdings werden sie rückblickend aufgebaut. Dies eignet sich, wenn sich eine ausreichend große Stichprobe findet, für die Erkennung von Risikofaktoren. Ähnlich wie bei den (R)CTs werden dabei Gruppen gegenübergestellt.
Das typische Beispiel hierfür ist die Risikobewertung des Rauchens. Es werden RaucherInnen und NichtraucherInnen untersucht und die Häufigkeit von Krankheiten in beiden Gruppen gezählt. Dabei stellt man fest, dass 80 Prozent aller Lungenkrebsfälle auf RaucherInnen entfallen.
Das größte Problem bei diesem Studiendesign ist, dass es leicht zu Verwechselungen zwischen Korrelation und Kausalität kommen kann. Das offensichtlichste Beispiel hierfür ist wahrscheinlich das „gesunde (lebensverlängernde Glas Rotwein“. Es sind eben die Lebensumstände (Bildungslevel, Einkommen, medizinische Versorgung) die Menschen innehaben, die ein Glas Rotwein statt dem „Feierabendbier“ trinken und die dann ein gesünderes und längeres Leben verursachen. Und das Glas Rotwein ist es nicht!
Noch problematischer wird es, wenn man solche Designs auf Behandlungen anwendet. Wie bereits bei den Beobachtungsstudien ist es unklar ob „wegen oder trotz“ der Intervention Genesung entstand. Aufgrund des rückblickenden Charakters der Fall-Kontroll-Studien sind außerdem die Nebeninterventionen (Kofaktoren) noch weniger dokumentierbar und somit im wahrsten Sinne unberechenbar.
„Ich habe da mal einen Patienten mit Problem XY mit dieser Technik behandelt – danach ging es ihm viel besser.“ Solche Sprüche hat sicher jeder Therapeut und jede Therapeutin bereits gehört oder gelesen. Diese sogenannten Einzelfallberichte (Case-Reports) mit dem LoE V sind für die Forschungsabteilungen absolut unverzichtbar, um neue Ideen (Hypothesen) aufzugreifen und diese systematisch wissenschaftlich zu untersuchen.
Für die Übertragung in die Praxis sind sie allerdings nicht zu empfehlen. Da PatientInnen keine Versuchskaninchen sind, sollten solche Experimente mit bisher nicht (ausreichend) untersuchten Verfahren nicht angewendet werden. Tatsächlich dürfen sie nicht durchgeführt werden, da es in der ambulanten Versorgung ein sogenanntes Generalverbot mit Erlaubnisvorbehalt gibt. Was bedeutet, dass nur Strategien angewendet werden dürfen, die explizit erlaubt wurden.
Expertenmeinung
Das Problem an den Meinungen von ExpertInnen ist immer, dass nicht sicher gesagt werden kann, ob es sich um Aussagen aus einer wahren Expertise oder eben nur Erfahrungswiederholung handelt. Erfahrung baut sich durch lineare Reproduktion desselben Vorgehens auf. Expertise hingegen entwickelt sich aus reflektierter und adaptierter Erfahrung. Dafür wird das eigene Vorgehen (Erfahrung) immer wieder mit externen Daten abgeglichen und an diese angepasst.
Fährt man beispielsweise immer wieder von Berlin über Paris nach Rom, dann macht man immer „gute“ Erfahrungen, denn man ist schließlich „erfolgreich“ in Rom angekommen. Nutzt man keine externen Daten (Navi) erkennt man aber nicht, dass es effektivere/schnellere/effizientere Wege gegeben hätte. In die therapeutische Praxis entspräche das „über Paris nach Rom Fahren“ dem typischen „Wir machen schon immer Behandlung XY und haben damit gute Erfahrungen gemacht“ – ohne auf das wissenschaftliche „Navi“ zu schauen.
Weitere Begriffe
Pro- und retrospektiv – Die Blickrichtung
Den Begriff prospektiv (vorausschauend) nutzt man für Studien, bei denen zum Beginn der Beobachtung (T0) eine Ausgangssituation (Status) erhoben wird und die ProbandInnen erst ab dann dem „Reiz“ ausgesetzt werden. Zu einem späteren Zeitpunkt (T1) wird erneut gemessen und aus dem Unterschied zwischen T0 und T1 der Effekt des Reizes ermittelt.
Als retrospektiv (zurückschauend) werden Designs bezeichnet, wenn Daten aus der Vergangenheit genutzt werden, um daraus Erkenntnisse zu gewinnen. Anders als bei der prospektiven Arbeit, wird hier der Status quo nicht vor, sondern nach dem Reiz erhoben. Auch wenn die Zuverlässigkeit dieses Ansatzes geringer ist als bei einem prospektiven Design, hat er seine Berechtigung. Denn vor allem bei ethisch kritischen Themen, wie das Setzen lebensverkürzender Reize, ist eine prospektive Gestaltung nicht vertretbar. Ein typisches Beispiel wäre die Ermittlung des Raucherrisikos.
Würde man ProbandInnen rekrutieren und diese dann in zwei Gruppen teilen, wovon eine Gruppe rauchen MUSS und die andere NIEMALS rauchen DARF, dann wäre dies ein prospektives Design. Dies ist allerdings ethisch nicht vertretbar.
Zieht man hingegen eine Stichprobe aus der Bevölkerung und befragt diese, ob sie Raucher sind oder waren und stellt die Erkrankungszahl derjenigen mit „nein“ denen mit „ja“ gegenüber, dann ist dies retrospektiv. Die Probleme hierbei sind, dass einerseits Daten aus Erinnerungen generiert werden, die potenziell verzerrt sein können und andererseits viele Kofaktoren, die neben dem eigentlichen Reiz auch unterschiedlich sein können nur schwer zu berücksichtigen sind.
Quer- und Längsschnitt
Dieser Unterschied ist zunächst einfach erklärt. Ein Querschnittsdesign (cross-sectional) stellt üblicherweise eine Erhebung zu einem Zeitpunkt dar. Dies kann parallel auch in mehreren Gruppen stattfinden. Bei Längsschnittstudien (longitudinal) werden Wiederholungsmessungen – mehrere Erhebungen zu unterschiedlichen Zeitpunkten – durchgeführt. Methodisch präzise müsste man hier noch feinere Unterteilungen und Beschreibungen liefern.
Verblindung
Das Blinding (Verblindung) ist nahezu wörtlich zu nehmen. Ein Beispiel wäre, nicht zu wissen (blind zu sein), welcher Gruppe einer Studie man selbst und die ProbandInnen zugehörig sind. Dies kann auf mehreren Ebenen (Beteiligte) stattfinden. Zum einen die ProbandInnen, als auch die UntersucherInnen, die Messungen erheben; aber auch die Intervenierenden und Auswertenden können verblindet sein. Je mehr Beteiligte verblindet sind, desto geringer ist das potenzielle Verzerrungsrisiko. Bei therapeutischen Techniken ist dies häufig schwer umzusetzen, weil sowohl PatientInnen als auch TherapeutInnen beispielsweise nicht gegenüber der Intervention verblindet werden können.
BIAS
Das Verzerrungspotenzial, der BIAS, ist ein breit gefächerter Begriff. Denn die mögliche Verzerrung kann an vielen Punkten stattfinden und durch unterschiedliche Auslöser hervorgerufen werden. Es ist hiermit aber keine bewusste Verfälschung oder Täuschung gemeint. So kann beispielsweise eine fehlende Verblindung zu verzerrten Ergebnissen führen. Kennt die Person, die die Messungen durchführt, die Gruppenzugehörigkeit der ProbandInnen, kann es (unterbewusst) zu besseren Messergebnissen bei TeilnehmerInnen der Interventionsgruppe kommen.
Der BIAS existiert auch abseits der Wissenschaft. Die Verzerrung liegt in der Natur der Menschen. Gewisse Grundannahmen, Erwartungen, Erfahrungen und weitere Faktoren prägen uns alle. Und sie führen dazu, dass wir interpretieren oder Dinge „zurechtbiegen“. Und da WissenschaftlerInnen auch nur Menschen sind, unterliegen sie den gleichen Mechanismen. Um dies zu vermeiden, gibt es entsprechende Maßnahmen in der wissenschaftlichen Methodik, wie beispielsweise die Verblindung oder die Randomisierung.
Anmerkung des Autors
Einige Ausführungen sind aus Gründen der Verständlichkeit vereinfacht oder verkürzt und daher in manchen Punkten eventuell etwas unpräzise. Dies schmälert nicht die Korrektheit der Kernaussagen, kann aber bei Menschen mit tiefem methodischem Verständnis zu Irritationen führen.
Martin Römhild B.Sc. / physio.de
BegriffsklärungStudieAkademisierung
Mein Profilbild bearbeiten