Statistik bei Raketen
Nein, auch an Weihnachten gibt es nicht die Weihnachtlichen Themen. Also wer ein weihnachtliches Raumfahrtthema sucht sollte vielleicht mal den Artikel vor 3 Jahren lesen. Ich will mich heute mit dem Thema Statistik im allgemeinen und im Besonderen bei Raketen beschäftigen, wobei natürlich hier die Erfolgsstatistik interessiert.
Man kann es sich ganz einfach machen, und so tue ich es oft: Die Zuverlässigkeit kann man leicht definieren als:
Anzahl der erfolgreichen Starts / Anzahl aller Starts
oder wenn man Prozente lieber mag:
100 * Anzahl der erfolgreichen Starts / Anzahl aller Starts
Doch man kann leicht erkennen, dass dies ein Manko hat. Nehmen wir die Falcon 9: Zwei Starts, beide „erfolgreich“ – Zuverlässigkeit 1 oder 100% und die R-7: 1725 Starts, 1638 erfolgreich, Zuverlässigkeit: 94,9%. Daraus können wir doch folgern, dass die Falcon 9 eine zuverlässigere Rakete ist?
Es zeigt schon das Problem der Methode. Wenn der nächste Falcon 9 Start schiefgeht, sinkt ihre Zuverlässigkeit auf 66,7%, dagegen würde ein weiterer Fehlstart nicht mal ein Zehntelprozent an der Zuverlässigkeit der R-7 ändern.
Bei der Statistik nehmen wir bei zufällig verteilten Ereignissen, wie es Fehlstarts sind, wenn es keinen systematischen Fehler gibt (was auch vorkommt) an, dass sie normalverteilt sind, und dann kann man mit der Standardabweichung berechnen wie sicher der Wert für die Zuverlässigkeit ist. Eigentlich gibt die Standardabweichung die Streuung der Messwerte um den Mittelwert an. Also bei einem anderen Beispiel: Wir messen die Größe von erwachsenen Männern. Wenn wir nun eine Grafik erstellen, in der in der X-Achse die Größe in Zentimetern und in der Y-Achse die Anzahl der Probanden mit dieser Größe feststellen, so sollte sich bei einem zufällig gleich verteilten Ereignis eine Glockenkurve bilden. Also rund um den Mittelwert gibt es die meisten Personen und je weiter man zu kleinen oder großen Werten geht werden es weniger: Es gibt viele die etwa 175-180 cm groß sind und nur wenige die 200-205 oder 150-155 cm.
Der Übergang auf Raketenstarts erscheint nun schwer, weil es eben hier nur zwei Werte gibt, nämlich 0 und 1. Aber nur zum Test: summieren wir die Werte auf und bilden Balken und die entsprechenden statistischen Werte beziehen sich nun auf den ermittelten Zuverlässigkeitswert. Kurzum: wie genau ist dieser bekannt.
Nach der Theorie sollten 68,2% der Werte in einem Bereich um 1 Standardabweichung liegen, und 95,4% im Intervall 2 Standardabweichungen und 99,7% im Bereich 3 Standardabweichungen was man dann meist schreibt als: 94% ± 2%. So wäre es doch toll oder? Nur ist dieses Kriterium nicht bei Raketenstarts anwendbar, denn wir haben hier nur zwei Werte: 0 für fehlgeschlagen und 1 für gelungen. Eine Normalverteilung geht schon deswegen nicht weil damit die zweite Seite fehlt. Wendet man diese Berechnungsmethode z.B. auf das Space Shuttle an, so resultiert eine Standardabweichung von 0,12 bei einem Mittelwert von 0,985 – es könnte also auch sein dass die Zuverlässigkeit 1,10 übersteigt … Kurzum: Die Methode ist nicht anwendbar.
Für Ja/Nein Vorhersagen bildet es sich die Bayes zu beziehen, der für die Schätzung vor Wahrscheinlichkeiten basierend auf den derzeit bekannten Werten eine Theorie entwickelt hat. Man kann sie bei einfachen Vorhersagen, bei der es nur um Ja/Nein geht auf folgende Formel reduzieren:
P = k+1 / n+2
- P ist die Wahrscheinlichkeit für einen Erfolg.
- k sind die bisher erfolgten erfolgreichen Flüge
- n sind alle bisher erfolgten Flüge.
Angewandt auf unser Beispiel ergibt sich für den dritten Falcon 9 Flug zu P = 75% und bei der Sojus zu 94,1%.
Es gibt aber noch andere Aspekte. Da ist zum einen mal: was ist ein Fehlstart. Wie wir wissen, gibt es da verschiedene Meinungen. Okay, wenn man im Himmel eine Explosionswolke sieht, dann ist alles klar. Aber was ist wenn die Nutzlast wie beim zehnten Ariane Start einen zu niedrigen Orbit erreicht? Oder die Stufe unkontrolliert rollt, wie beim ersten Falcon 9 Flug? Oder das absetzen im Parkorbit gelingt und die Raumsonde selbst zündet dann nicht ihre Triebwerke wie bei Phobos Grunt? Oder der Start gelingt, aber beim Wiedereintritt bricht Columbia auseinander?
Nun zumindest bei kommerziellen Raketen gibt es Users Guide und dort stehen die garantierten maximalen Abweichungen von der Sollbahn drinn. Damit hat man ein Kriterium. Wendet man es auf SpaceX an, so sind übrigens zwei Starts welche die Firma selbst als Erfolge präsentiert, als Fehlstarts zu deklarieren, da die Abweichungen der Bahn die Garantien übersteigen.
Das zweite ist die Stichprobe. Nun wird es wirklich schwierig. Die meisten Typen im Westen wurden laufend verändert. Selbst bei russischen und chinesischen Trägern gibt es Modernisierungen. Natürlich verändert dies die Eigenschaften einer Rakete. Dann muss man getrennte Statistiken machen. Doch wann? Sicher ist es einfach, wenn die Rakete völlig neu ist, auch wenn sie bekannt klingt, wie dies bei der Ariane 5 der Fall ist. Doch wie sieht es bei kleineren Änderungen aus? Rechtfertigt eine neue Oberstufe wie der Einsatz der Centaur auf der Atlas eine eigene Stichprobe, oder sollte man sie mit der Atlas Agena zusammenlegen? Machen Booster wie bei der Titan 3 eine neue Rakete? Oder was ist bei einem neuen Haupttriebwerk (Atlas II vs. Atlas III)? Reicht schon eine Tankverlängerung aus für eine neue Gruppierung (Long Tank Delta vs normale Delta?)
Die Entscheidung ist schwierig. Meiner Ansicht nach:
- Neue Oberstufen rechtfertigen eine neue Stichprobe
- Bei Triebwerken ist eine genauere Betrachtung nötig. Ist es nur ein Upgrade so ist keine neue Stichprobe anzusetzen. Bei einem völlig neuen Triebwerk dagegen schon
- Bei Boostern ist es schwierig. Unterstützen diese die Hauptstufe, so sicher nicht (Delta II). Kann die Rakete ohne Booster oder mit reduzierter Boosterzahl nicht mehr eingesetzt werden (Titan III), dann sollte eine neue Stichprobe genommen werden.
Interessant wäre es zu sehen wie Versicherungen arbeiten. Nun zum einen haben sie sicher einen anderen Kenntnisstand als die Öffentlichkeit. Ich denke es gibt Untersuchungen wie zuverlässig eine Rakete ist, Prognosen werden ab und an ja mal bekannt (z.B. sollte Ariane 5 eine von 0,98 erreichen). Ich denke auch dass ihre Prognosen nicht von 1957 gehen sondern die letzten Jahre einschließen, d.h. wi viele Versicherungsfälle fielen da an. Das ist auch sinnvoll, weil Raketen zumeist dazu tendieren immer zuverlässiger zu werden, also Fehlstarts immer seltener werden. Nehmen wir die Ariane 1-4 Familie. Da gab es Fehlstarts bei Flug 2,5,15,18,35,63 und 70. (Die Häufung zeigt bei 15/18 und 63/70 übrigens auch dass es zweimal jeweils Designfehler waren die nicht immer zuschlugen). Das bedeutet aber auch: Nach Flug 70 bis zum letzten Einsatz bei Start 144 gab es keinen Fehlstart über rund 10 Jahre also alles tadellos. Eine Versicherung die dann noch die ersten Flüge mit einrechnet, ignoriert dieses Verhalten.
Man kann alles berechnen, muss sich aber im Klaren sein, was man mit den Zahlen ausdrücken will. Sonst hat man einen Zahlenfriedhof ohne Nutzen. Ich habe als Kaufmann beruflich mit Informatikern (bzw. Fachinformatikern) zu tun. Ich muss da schon zwischen verschiedenen Sprachen und Denkweisen „übersetzen“.
Bei Raketen mit verschiedenen Oberstufen ist es wohl sinnvoll, für jede Stufe einzeln die Zuverlässigkeit zu berechnen. Und aus diesen Werten dann die Gesamtzuverlässigkeit.
Es gibt verschiedene Ansätze, so gibt es natürlich auch Entwurfsziele für die Zuverlässigkeit von Oberstufen. Bei der Ariane 5 ECA z.B. eines von 0,98.
Man kann es beliebig fein herunterbrechen, so z.B. auf die Triebwerke. Dann kommt man z.B. beim Merlin auf 2 Ausfälle bei bisher 45 Einsätzen, was kein besonders guter Wert ist (0,955).