Diventus – uptime.company
LeistungenÜber uns
WissenBlogFT vs. HochverfügbarkeitNIS2 & InfrastrukturVMware-Alternative
NIS2-CheckAusfallkosten-RechnerErstberatung anfragen+49 30 802020990
Fachwissen

Fehlertoleranz vs. Hochverfügbarkeit: Was schützt Ihre IT wirklich?

Netzwerk-Kabel als Symbol für redundante IT-Infrastruktur

Fehlertoleranz (FT) und Hochverfügbarkeit (HA) werden oft synonym verwendet — sind aber grundlegend verschiedene Technologien mit unterschiedlichen Schutzversprechen.

Hochverfügbarkeit: Bei Ausfall übernimmt ein Backup-System. Es gibt eine Unterbrechung (Sekunden bis Minuten) und potenziellen Datenverlust.

Fehlertoleranz: Zwei Systeme arbeiten synchron. Bei Ausfall eines Systems läuft das andere unterbrechungsfrei weiter — 0 Sekunden Downtime, 0 Datenverlust.

Definitionen

Was ist Hochverfügbarkeit (High Availability)?

Hochverfügbarkeit beschreibt Systeme, die eine bestimmte Betriebszeit garantieren — typischerweise gemessen in „Neunen“:

99,9%Three Nines
8,7 Stunden Ausfallzeit
99,99%Four Nines
52,6 Minuten Ausfallzeit
99,999%Five Nines
5,3 Minuten Ausfallzeit
99,9999%Six Nines
31,5 Sekunden Ausfallzeit
99,99999%Seven Nines
3,2 Sekunden Ausfallzeit

Was ist Fehlertoleranz (Fault Tolerance)?

Fehlertoleranz geht über Hochverfügbarkeit hinaus. Anstatt bei einem Ausfall umzuschalten, arbeiten zwei Systeme permanent synchron (Lock-Step-Technologie): Beide Server führen identische Operationen gleichzeitig aus. Bei Ausfall eines Servers läuft der andere sofort weiter — ohne Failover, ohne Neustart, ohne Datenverlust.

Typische FT-Technologien: Stratus everRun, ztC Edge, ztC Endurance.

Technischer Vergleich

Unterbrechung bei Ausfall
HA
Sekunden bis Minuten
FT
0 Sekunden
Datenverlust möglich
HA
Ja (Transaktionen, Cache)
FT
Nein
Failover nötig
HA
Ja (automatisch oder manuell)
FT
Nein
Neustart nötig
HA
Ja (VM oder Dienst)
FT
Nein
Synchronisationsart
HA
Shared Storage / Replikation
FT
Lock-Step (Speicher-Checkpoints)
Typische Verfügbarkeit
HA
99,99% (52 Min/Jahr)
FT
99,99999% (3,2 Sek/Jahr)
Komplexität
HA
Mittel (Cluster-Konfiguration)
FT
Gering (2 Server, Software regelt alles)
Kosten
HA
Niedriger
FT
Höher (zusätzliche Hardware)
Einsatzgebiet
HA
Tolerierbare kurze Ausfälle
FT
Zero-Downtime-Anforderung

VMware vSphere HA vs. Stratus everRun

VMware bietet mit vSphere sowohl HA als auch FT — aber mit Einschränkungen. Mehr zu VMware-Alternativen

Max vCPUs pro VM
VMware
max. 8 (Enterprise Plus, ab vSphere 6.7)
everRun
Keine Limitierung
Max FT-VMs pro Host
VMware
4
everRun
Keine Limitierung
Betriebssystem-Support
VMware
VMware-kompatible OS
everRun
Windows, Linux
Separates Monitoring
VMware
Nicht integriert
everRun
DCM verfügbar
Redundantes Internet
VMware
Nicht enthalten
everRun
becom.one verfügbar
Geo-Redundanz
VMware
vSphere Replication
everRun
SplitSite

Quellen: VMware vSphere 8 Dokumentation, Stratus everRun Datenblatt

Entscheidungshilfe: HA oder FT?

Kostet eine Minute Ausfall > 1.000 EUR?
Ja
FT
Nein
HA kann reichen
Fallen Sie unter NIS2 oder KRITIS?
Ja
FT empfohlen
Nein
HA kann reichen
Laufen Echtzeitprozesse (Fertigung, Leitstellen)?
Ja
FT
Nein
HA kann reichen
Ist Datenverlust im Cache inakzeptabel?
Ja
FT
Nein
HA
Reicht Ihr Budget nur für Cluster-Hardware?
Ja
HA
Nein
FT prüfen

Kosten eines Ausfalls

Die Frage ist nicht „Was kostet Fehlertoleranz?“ sondern „Was kostet ein Ausfall?“ Kostenfaktoren bei IT-Ausfall:

  • Produktivitätsverlust (Mitarbeiter können nicht arbeiten)
  • Umsatzausfall (Webshop, Transaktionssysteme, Produktion)
  • Vertragsstrafen (SLA-Verletzungen gegenüber eigenen Kunden)
  • Wiederherstellungskosten (IT-Personal, Überstunden, externe Hilfe)
  • Reputationsschaden (schwer quantifizierbar, aber real)
  • Regulatorische Konsequenzen (NIS2: bis 10 Mio. EUR oder 2% Jahresumsatz) [Quelle: OpenKRITIS]

[SCHÄTZUNG-Warnung: Ausfallkosten-Statistiken beziehen sich oft auf Enterprise-Unternehmen und sind nicht direkt auf den Mittelstand übertragbar]

Häufige Missverständnisse

Macht RAID meinen Server ausfallsicher?

RAID schützt vor Festplattenausfall — nicht vor Serverausfall, Netzwerkausfall oder Standortausfall. Es ist eine Komponenten-Redundanz, kein Ausfallsicherheitskonzept.

Reicht unser Backup als Disaster Recovery?

Ein Backup schützt Daten, nicht Verfügbarkeit. Die Wiederherstellung dauert Stunden bis Tage — abhängig von Datenmenge und Komplexität.

Ist Cloud automatisch hochverfügbar?

Cloud-Anbieter bieten SLAs für ihre Infrastruktur. Die Verfügbarkeit Ihrer Anwendung ist Ihre Verantwortung. AWS garantiert z.B. 99,99% für EC2 — das sind 52 Minuten Ausfallzeit pro Jahr.

Ist Fehlertoleranz nur für Großunternehmen?

Stratus-Systeme sind für den Mittelstand konzipiert. Die Einstiegskonfiguration besteht aus zwei Standard-Servern mit everRun-Software. Die Frage ist nicht die Unternehmensgröße, sondern die Ausfallkosten.

Fehlertoleranz oder Hochverfügbarkeit — was brauchen Sie?

In einer kostenlosen 30-Minuten-Analyse bewerten wir Ihre aktuelle Infrastruktur und empfehlen die passende Schutzstrategie. Unverbindlich, technisch fundiert.

+49 30 802020990