Die Überlebenszeitanalyse ist der Kern der meisten onkologischen Artikel, und sie ist der Bereich, in dem ich als Gutachter am genauesten hinschaue. Nicht weil ich es genießé, sondern weil stark wirkende Ergebnisse dort am häufigsten auseinanderfallen. Eine Kaplan-Meier-Kurve kann überzeugend aussehen und dennoch auf einer Endpunktdefinition beruhen, die nie angegeben wurde, auf einem Zensierungsmuster, das das Ergebnis still verzerrt, oder auf einer Hazard Ratio aus einem Modell, dessen zentrale Annahme nie geprüft wurde. Wenn die Überlebenszeitberichterstattung nachlässig ist, beginnt ein erfahrener Gutachter, dem Rest des Artikels zu misstrauen. Wenn sie sauber ist, signalisiert das, dass die gesamte Studie mit derselben Sorgfalt durchgeführt wurde.

Dieser Leitfaden zeigt, wie man Überlebenszeitanalysen so berichtet, dass ein Gutachter nichts zu beanstanden hat. Er ist aus der Perspektive des Schreibtisches auf der anderen Seite verfasst. Jeder Abschnitt endet mit den konkreten Fehlern, die einen Kommentar, und manchmal eine Ablehnung, nach sich ziehen.

1. Definieren Sie Ihre Endpunkte zuerst

Das häufigste Problem ist kein statistischer Fehler. Es ist ein Endpunkt, der nie präzise definiert wurde. Jeder Überlebenszeitendpunkt benötigt drei Dinge, die in klaren Worten angegeben werden: den Startpunkt (der Indexzeitpunkt), das Ereignis und was mit Patienten passiert, die das Ereignis nie erleiden.

Indexzeitpunkt Progression Tod OS = Ereignis PFS = Ereignis TTP Tod ohne vorherige Progression → zensiert (○) 0 6 12 18 24 Monate seit Indexzeitpunkt
Abbildung 1. Derselbe Patient, drei Endpunkte. OS endet nur beim Tod; PFS endet bei Progression oder Tod, je nachdem, was zuerst kommt; TTP endet bei Progression, aber ein Tod ohne vorherige Progression wird zensiert. PFS und TTP stimmen hier überein, weil die Progression zuerst kam. Sie weichen genau dann voneinander ab, wenn ein Patient stirbt, bevor er progredient wird.
Was ich als Gutachter beanstande

Ein Endpunkt ohne angegebenen Indexzeitpunkt. Progression, die nur als “klinisch oder radiologisch” beschrieben wird, ohne genannte Kriterien. PFS und TTP werden so verwendet, als wären sie dasselbe. Nennen Sie den Start, das Ereignis und die Kriterien, je einen kurzen Satz.

2. Zensierung: Sagen Sie, was Sie getan haben, und prüfen Sie, ob es fair ist

Zensierung bedeutet, dass ein Patient das Ereignis bis zum Ende der Beobachtungszeit noch nicht erlitten hatte, sei es, weil die Studie endete oder weil er aus der Nachbeobachtung ausgeschieden ist. Zwei Dinge müssen im Artikel erscheinen.

Das tiefere Problem ist die informative Zensierung. Kaplan-Meier setzt voraus, dass zensierte Patienten dasselbe künftige Risiko tragen wie diejenigen, die weiter beobachtet werden. Wenn kränkere Patienten ausscheiden, sodass die Zensierung mit der Prognose zusammenhängt, ist die Kurve verzerrt, weil sie besser erscheint als die Realität. Sie können nicht vollständig beweisen, dass die Zensierung nicht informativ war, aber Sie sollten zeigen, dass Sie dies in Betracht gezogen haben.

Was ich als Gutachter beanstande

Keine mediane Nachbeobachtungszeit oder eine, die als einfache Beobachtungszeit berechnet wurde. Ein großer, ungeklärter Verlust aus der Nachbeobachtung. Kein Hinweis darauf, dass die Zensierung möglicherweise informativ war.

3. Die Kaplan-Meier-Kurve: Die Konventionen, die Gutachter erwarten

Eine Überlebensabbildung hat einige unverzichtbare Elemente. Ihre Weglassung ist der schnellste Weg, Unerfahrenheit zu signalisieren.

100 75 50 25 0 Überlebenswahrscheinlichkeit (%) 0 6 12 18 24 30 36 Monate seit Randomisierung Median 16 Mo. Median 30 Mo. Striche = zensiert Behandlung (n = 120) Kontrolle (n = 120) Anzahl gefährdet Behandlung 120 112 96 78 60 44 30 Kontrolle 120 92 64 40 26 16 10
Abbildung 2. Ein gutachterreifes Kaplan-Meier-Diagramm. Vier Elemente sind unverzichtbar: die Tabelle der gefährdeten Patienten unter der Achse, Zensierungsmarkierungen auf jeder Kurve, das mediane Überleben abgelesen an der 50%-Linie und ein Schwanz, der nicht überinterpretiert wird, sobald nur noch wenige Patienten gefährdet sind. Die Daten sind illustrativ.
Was ich als Gutachter beanstande

Keine Anzahl gefährdeter Patienten unter der Kurve. Autoren, die aus dem fernen Schwanz eine sichere Schlussfolgerung ziehen, wo noch drei Patienten verbleiben. Diese beiden zusammen sind die häufigsten Probleme bei Überlebensabbildungen, die ich sehe.

4. Gruppenvergleiche: Log-Rank, Hazard Ratios und die Annahme, die alle vergessen

Um zwei Überlebenskurven zu vergleichen, berichten Sie in der Regel einen Log-Rank-p-Wert und eine Hazard Ratio aus einem Cox-Proportional-Hazards-Modell. Beides ist Standard. Ein Schritt wird viel zu oft übersprungen.

Hazards bleiben proportional survival Zeit → Eine Hazard Ratio passt für die gesamte Nachbeobachtung Überlebenskurven kreuzen sich Zeit → Eine einzelne Hazard Ratio ist irreführend
Abbildung 3. Die Annahme proportionaler Hazards in einem Bild. Wenn die Kurven proportional bleiben (links), fasst eine einzelne Cox-Hazard Ratio den Unterschied ehrlich zusammen. Wenn sie sich kreuzen oder annähern (rechts), ändert sich das relative Risiko über die Zeit, und eine Hazard Ratio verbirgt das, weshalb die Annahme getestet werden muss und nicht vorausgesetzt werden darf.
Was ich als Gutachter beanstande

Eine Hazard Ratio ohne Konfidenzintervall. Keine Erwähnung der Annahme proportionaler Hazards, insbesondere wenn sich die veröffentlichten Kurven sichtbar kreuzen. Ein verdächtig aufgeräumtes multivariables Modell ohne Anzeichen einer Vorspezifikation.

5. Die Verzerrung, die Beobachtungsstudien ruiniert: unsterbliche Zeit

Wenn Ihre Studie keine randomisierte Studie ist, verdient eine Verzerrung einen eigenen Abschnitt, weil sie sowohl häufig als auch gravierend ist. Der Bias durch unsterbliche Zeit entsteht, wenn Patienten nach etwas gruppiert werden, das erst nach dem Indexzeitpunkt eintreten kann, zum Beispiel “Patienten, die Behandlung X erhalten haben” versus “diejenigen, die sie nicht erhalten haben.” Die behandelte Gruppe muss per Definition lange genug überlebt haben, um die Behandlung zu erhalten. Diese garantierte Überlebenszeit ist die unsterbliche Zeit, und sie lässt die Behandlung schützend wirken, obwohl sie möglicherweise gar nichts bewirkt.

Die übliche Lösung ist eine Landmark-Analyse, bei der Patienten nach ihrem Status zu einem festen Zeitpunkt klassifiziert werden, oder eine zeitvariable Kovariable im Cox-Modell. Wenn Ihr Studiendesign eine solche Struktur hat, gehen Sie darauf ein, bevor ein Gutachter es tut. Für einen erfahrenen Leser ist es ein sofortiges Warnsignal, und ein unbehandeltes beendet oft das Review.

Kohorteneintritt / Indexzeitpunkt Behandlung beginnt Ereignis (Tod) Unsterbliche Zeit muss bis hierher überleben, um als “behandelt” klassifiziert zu werden Bias: Der behandelten Gruppe ist garantiert, das unsterbliche Fenster zu überleben, sodass die Behandlung schützend wirkt, auch wenn sie nichts tut. Lösung: eine Landmark-Analyse oder eine zeitvariable Kovariable im Cox-Modell.
Abbildung 4. Bias durch unsterbliche Zeit. Patienten nach etwas zu gruppieren, das erst nach dem Indexzeitpunkt eintreten kann (hier: Behandlung erhalten), baut ein garantiertes Überlebensfenster in die behandelte Gruppe ein und lässt die Behandlung vorteilhaft erscheinen, obwohl sie möglicherweise gar nichts bewirkt.

6. Eine Vorab-Checkliste

Überprüfen Sie vor der Einreichung, ob das Manuskript jeden dieser Punkte enthält.

All das macht ein schwaches Ergebnis nicht stark. Was es tut: Es beseitigt jeden leichten Grund, an Ihnen zu zweifeln, sodass Ihr Befund nach seinen Verdiensten beurteilt wird. Das ist das ganze Spiel.