Stratus everRun erklärt: So funktioniert Software-basierte Fehlertoleranz

Stratus everRun ist eine Softwarelösung, die aus zwei Standard-Servern ein fehlertolerantes System macht. Anders als bei Cluster-Lösungen gibt es keinen Failover-Moment: Beide Server arbeiten permanent synchron. Fällt einer aus, läuft die Anwendung auf dem anderen weiter — ohne Unterbrechung, ohne Neustart, ohne Datenverlust.
Dieser Artikel erklärt die technische Funktionsweise von everRun, das SplitSite-Konzept für Geo-Redundanz und den Unterschied zu VMware HA.
Lock-Step-Synchronisation: Das Kernprinzip
everRun installiert auf zwei physischen Servern jeweils eine virtuelle Maschine (VM). Beide VMs führen gleichzeitig dieselbe Anwendung aus. Die Synchronisation erfolgt über Speicher-Checkpoints: In definierten Intervallen werden die Speicherinhalte beider Maschinen abgeglichen. Jede Schreib-Operation, jede Transaktion, jeder Zustandswechsel wird auf beiden Servern identisch abgebildet.
Das Ergebnis: Zu jedem Zeitpunkt befinden sich beide Server in exakt demselben Zustand. Wenn Server A ausfällt, muss Server B nicht „übernehmen“ — er führt die Arbeit einfach weiter. Es gibt keinen Umschaltmoment, keinen Neustart der Anwendung, keinen Verlust laufender Transaktionen.
- 1.Zwei physische Server werden mit der everRun-Software konfiguriert
- 2.Auf beiden Servern läuft je eine VM mit identischer Anwendung
- 3.Speicher-Checkpoints synchronisieren den Zustand in Echtzeit
- 4.Bei Hardwareausfall eines Servers läuft die VM auf dem anderen unterbrechungsfrei weiter
- 5.Nach Reparatur wird der ausgefallene Server automatisch resynchronisiert
Die Unterscheidung zur herkömmlichen Hochverfügbarkeit (HA) ist fundamental: HA-Systeme erkennen einen Ausfall und reagieren darauf. Fehlertolerante Systeme wie everRun machen den Ausfall unsichtbar. Die Anwendung — und ihre Nutzer — bemerken nichts.
Quelle: Stratus/Penguin Solutions Produktdokumentation

SplitSite: Geographische Redundanz
Die Synchronisation der beiden Server muss nicht im selben Serverraum stattfinden. Mit der SplitSite-Funktion können die Server an geographisch getrennten Standorten betrieben werden — beispielsweise in zwei verschiedenen Gebäuden, Stadtteilen oder sogar Städten.
SplitSite schützt damit nicht nur vor Hardwareausfällen, sondern auch vor Standortrisiken: Brand, Hochwasser, Stromausfall, physische Beschädigung. Fällt ein gesamter Standort aus, läuft das System am zweiten Standort unterbrechungsfrei weiter.
Die Voraussetzung für SplitSite ist eine Netzwerkverbindung zwischen beiden Standorten mit ausreichender Bandbreite und niedriger Latenz. Die konkreten Anforderungen hängen von der Datenmenge und der Checkpoint-Frequenz ab. [Quelle: Stratus SplitSite Dokumentation]
SplitSite bietet unterbrechungsfreien Weiterbetrieb bei Standortausfall — 0 Sekunden Downtime. Disaster Recovery (z.B. DCW) bietet Wiederherstellung nach Totalverlust — mit minimaler, aber vorhandener Ausfallzeit. Beides schützt vor Standortrisiken, aber auf unterschiedlichen Ebenen.

everRun vs. VMware HA (FT-Modus)
VMware vSphere bietet sowohl HA als auch einen FT-Modus. Der Vergleich zeigt die technischen Einschränkungen. Mehr zu VMware-Alternativen nach der Broadcom-Übernahme
| Kriterium | Stratus everRun | VMware vSphere FT |
|---|---|---|
| Unterbrechung bei Ausfall | 0 Sekunden | Sekunden bis Minuten |
| Laufende Transaktionen | Bleiben erhalten | Gehen verloren |
| vCPU-Limit im FT-Modus | Keine Einschränkung | Max. 8 vCPUs (Enterprise Plus) / 2 vCPUs (Standard) |
| Max. FT-VMs pro Host | Keine Einschränkung | 4 VMs |
| Neustart der Anwendung nötig | Nein | Ja |
| Geo-Redundanz | SplitSite (integriert) | vSphere Replication (separat) |
| Dediziertes Monitoring | DCM verfügbar | Nicht integriert |
Quellen: Stratus/Penguin Solutions Produktdokumentation, VMware vSphere 8 FT-Dokumentation
Die vCPU-Limitierung bei VMware FT ist besonders relevant: Mit max. 8 vCPUs pro VM im FT-Modus (Enterprise Plus) bzw. nur 2 vCPUs (Standard) bleibt VMware FT deutlich eingeschränkter als Hardware-Lock-Step, das keine solche Limitierung kennt. Zudem erlaubt VMware maximal 4 FT-geschützte VMs pro Host, was die Skalierung einschränkt. Seit der Broadcom-Übernahme kommen erhebliche Preiserhöhungen hinzu. [Quelle: VMware vSphere 8/9 Dokumentation, Broadcom TechDocs]

Die Stratus-Produktfamilie
everRun ist das Software-Produkt für Rechenzentrumsumgebungen. Für spezialisierte Einsatzbereiche bietet Penguin Solutions (ehemals Stratus Technologies) zwei weitere Plattformen:
everRun
Software-basierte Fehlertoleranz auf Standard-Servern. Für ERP, Datenbanken, geschäftskritische Anwendungen.
Details →ztC Edge
Kompakt, lüfterlos, robust. Für dezentrale Standorte, Maschinensteuerungen, Arztpraxen.
Details →ztC Endurance
Vorausschauende Fehlertoleranz mit modularer Architektur. 99,99999% Verfügbarkeit.
Details →Diventus ist Gold Partner von Penguin Solutions (ehem. Stratus Technologies)
Passt everRun in Ihre Infrastruktur?
In einer technischen Erstberatung prüfen wir, ob und welche everRun-Konfiguration Ihre Anforderungen abdeckt. Unverbindlich, von den Spezialisten.
+49 30 802020990