Am seidenen Faden: Wie verlässlich sind Daten aus Phase-III-Studien? Logo of esanum https://www.esanum.de

Am seidenen Faden: Wie verlässlich sind Daten aus Phase-III-Studien?

Viele randomisierte, kontrollierte Phase-III-Studien, die die Überlegenheit neuer Krebsmedikamente gegenüber Kontrolltherapien zeigen sollen, stehen statistisch gesehen auf wackeligem Fundament, wie eine aktuelle Studie im 'Lancet' zu bedenken gibt.

Viele randomisierte, kontrollierte Phase-III-Studien, die die Überlegenheit neuer Krebsmedikamente gegenüber Kontrolltherapien zeigen sollen, stehen statistisch gesehen auf wackeligem Fundament, wie eine aktuelle Studie im 'Lancet' zu bedenken gibt.

Entscheidungen von EMA oder FDA stützen sich auf eine Bandbreite wissenschaftlicher Evidenz. Ein wichtiger Teil hiervon sind randomisierte, kontrollierte (RCT) Phase-III-Studien.
Eine in der aktuellen Ausgabe des Lancet veröffentlichte Untersuchung sowie das zugehörige Editorial warnen jedoch, dass die für Zulassungen von Tumortherapien herangezogene Evidenz teils besorgniserregende Schwächen aufweist.1,2
Eine Analyse von Zulassungsstudien für onkologische Medikamente aus den Jahren 2014 bis 2018 ergab, dass etwas mehr als die Hälfte der RCTs einen Fragilitätsindex von 2 und weniger aufwiesen – das bedeutet: wenn 2 oder weniger Patienten in der Interventionsgruppe nicht ereignisfrei geblieben wären, sondern stattdessen ein Ereignis wie Progress oder Tod eingetreten wäre, hätten die Studienresultate kein statistisches Signifikanzniveau mehr erreicht, es wäre also kein (bedeutender) Unterschied zwischen Interventions- und Kontrollkohorte mehr nachweisbar gewesen.

Zweifel an der Robustheit der Resultate

Der Fragilitätsindex – in anderen Worten: die minimale Anzahl der Änderungen von "keinem Ereignis" zu einem "Ereignis", die zu einem Verlust der statistischen Signifikanz (p < 0,05) führt – ist also eine Art Vertrauensparameter dafür, dass ein in einer RCT berichteter, positiver Effekt real vorhanden ist.

Für die Evaluation wurden 36 Phase‑III-RCTs identifiziert, von denen 17 für die Bestimmung eines Fragilitätsindex geeignet waren (zweiarmige Studien mit 1:1‑Randomisierung und einem "Zeit bis zu einem Ereignis"-Outcome). Der Fragilitätsindex lag im Median nur bei 2 und in 9 von 17 Studien (53%) betrug er 2 oder weniger. In diesen Studien entsprach der Fragilitätsindex einem Prozent oder weniger der gesamten Stichprobengröße. In 5 Studien (29luk%) war die Anzahl derer, die nicht nachuntersucht werden konnten ("lost to follow-up") größer als der Fragilitätsindex.

Müssen wir unseren Begriff von einem "positiven Ergebnis" neu definieren?

Sollte demnach mehr als eine signifikante, positive Phase‑III-RCT für Neuzulassungen onkologischer Medikamente gefordert werden? Viele Argumente sprechen dagegen: hohe Kosten, Überlebens-Endpunkte erfordern lange Beobachtungszeiträume, wir wollen sicherstellen, dass Patienten möglichst schnell Zugang zu der wahrscheinlich überlegenen Therapie erhalten und etliche Sponsoren sind unwillig, mehr als eine Studie zu finanzieren.
All dies geht jedoch an einem wesentlichen Punkt vorbei, der in der eben genannten Untersuchung offenkundig wird: dass ein zweites positives Ergebnis keine ausgemachte Sache ist.

Ein weiteres Problem, welches wir u. a. in diesem Beitrag thematisiert hatten, ist die nötige Differenzierung zwischen statistischem und klinischem Benefit.

Das Editorial des Lancet schließt mit einem naheliegenden Vorschlag: wenn sich die Quantität der für Zulassungen erforderlichen Evidenz nicht ändert, müssten wir Real-World-Daten zur Effektivität (und nicht nur zur Toxizität) für alle zugelassenen Medikamente verlangen – entweder über Phase‑IV-/ Post-Marketing-Studien oder Real-World-Evidenz von Patienten – und nach diesen Ergebnissen handeln, wenn sie erheblich von den ursprünglich als Evidenz vorgelegten Daten abweichen.
Eine weitere Idee wäre, den Fragilitätsindex als zusätzlichen Marker in Studien aufzunehmen. Auch wenn er kein Maß für die Wirksamkeit ist, würde er bei der Einschätzung dessen helfen, wie viel Gewicht den Resultaten beigemessen werden kann.

Referenzen:
1. Editor. Are results from clinical trials reliable? The Lancet Oncology 20, 1035 (2019).
2. Paggio, J. C. D. & Tannock, I. F. The fragility of phase 3 trials supporting FDA-approved anticancer medicines: a retrospective analysis. The Lancet Oncology 20, 1065–1069 (2019).