Fachwissen6 Min. Lesezeit17. Februar 2026Aktualisiert: 11. März 2026

Drei Maßnahmen gegen IT-Stillstand: Hochverfügbarkeit, Monitoring und Disaster Recovery

Netzwerk-Rack mit IT-Monitoring zur Vermeidung von Systemausfällen

IT-Ausfälle treffen Unternehmen dort, wo es am meisten schmerzt: bei laufenden Prozessen. Ein Serverausfall stoppt die Produktion. Ein Internetausfall kappt Cloud-Dienste und E-Mail. Ein Standortschaden vernichtet Hardware und Daten.

Drei präventive Maßnahmen decken diese Risiken ab — nicht als Einzellösungen, sondern als zusammenhängendes System. Diventus nennt das das Drei-Säulen-Modell: fehlertolerante Server, redundantes Internet und 24/7-Monitoring. Ergänzt durch Disaster Recovery für den Extremfall.

Maßnahme 1

Hochverfügbarkeit durch fehlertolerante Hardware

Die meisten Unternehmen setzen auf Cluster-Lösungen: Fällt ein Server aus, übernimmt ein zweiter. Das klingt vernünftig — bedeutet aber eine Unterbrechung von Sekunden bis Minuten. Laufende Transaktionen gehen verloren, Anwendungen müssen neu starten, Nutzer bemerken den Ausfall.

Fehlertoleranz geht einen Schritt weiter. Bei der Lock-Step-Technologie arbeiten zwei physische Server permanent synchron. Beide führen dieselben Operationen gleichzeitig aus. Speicher-Checkpoints stellen sicher, dass der Zustand beider Maschinen zu jedem Zeitpunkt identisch ist. Fällt ein Server aus, läuft der andere unterbrechungsfrei weiter — ohne Failover, ohne Neustart, ohne Datenverlust.

Stratus everRun ist die Software, die diese Synchronisation auf Standard-Server-Hardware ermöglicht. Die Einstiegskonfiguration besteht aus zwei physischen Servern mit everRun-Software — keine proprietäre Hardware nötig. Für Edge-Umgebungen und dezentrale Standorte stehen mit ztC Edge und ztC Endurance spezialisierte Plattformen zur Verfügung.

Zusätzlich zur Server-Fehlertoleranz muss die Internetanbindung abgesichert sein. Ein ausfallsicherer Server nützt wenig, wenn die Leitung zum Cloud-ERP oder zum E-Mail-Server wegbricht. Die Lösung: becom.one bündelt mehrere Internetleitungen (Glasfaser, DSL, LTE, 5G, Satellit) zu einer einzigen Verbindung mit einer IP-Adresse. Fällt ein Anschluss aus, läuft der Datenverkehr über die verbleibenden Leitungen weiter — ohne Umschaltung, ohne VPN-Abbruch.

Kernaussage

Hochverfügbarkeit bedeutet nicht „schneller Neustart nach Ausfall“. Bei geschäftskritischen Systemen bedeutet es: minimales Ausfallrisiko, maximaler Datenschutz, unterbrechungsfreier Betrieb — weder beim Server noch bei der Internetanbindung.

Quelle: Stratus/Penguin Solutions Produktdokumentation

Server-Rack mit redundanter Hardware-Konfiguration

Maßnahme 2

24/7-Monitoring — Probleme erkennen, bevor sie eskalieren

Fehlertoleranz schützt vor dem Totalausfall eines Servers. Aber was, wenn ein Lüfter defekt ist, eine Festplatte degradiert oder ein Netzwerk-Interface sporadisch Fehler wirft — und niemand es bemerkt? Aus einem beherrschbaren Problem wird eine Fehlerverkettung. Aus der Verkettung wird ein Ausfall, der vermeidbar gewesen wäre.

Monitoring ist die dritte Säule im Diventus-Modell. DCM (Diventus Continuous Monitoring) ist eine Eigenentwicklung der Diventus GmbH mit einem Designprinzip, das sich von marktüblichen Tools unterscheidet: DCM läuft auf externer Hardware, nicht auf dem zu überwachenden System.

Der Grund: Wenn das Monitoring-Tool auf dem System läuft, das es überwachen soll, fällt es mit dem System zusammen aus. DCM ist unabhängig vom überwachten System betriebsfähig und meldet Degradierungen, noch bevor sie für Nutzer spürbar werden: steigende Temperaturen, erhöhte Fehlerraten bei Speichermedien, ungewöhnliche Netzwerklatenzen.

Im Fehlerfall geht die Meldung nicht an ein anonymes Ticketsystem, sondern direkt an das Diventus-Team — die Spezialisten, die die Infrastruktur kennen und betreuen. 24 Stunden am Tag, 7 Tage die Woche, 365 Tage im Jahr.

Warum Monitoring die unterschätzte Säule ist

Ein defekter Lüfter führt zu Überhitzung. Überhitzung führt zu Throttling. Throttling führt zu Timeouts. Timeouts führen zu Datenverlust. DCM erkennt das erste Glied dieser Kette — und verhindert den Rest.

Maßnahme 3

Disaster Recovery — wenn alle anderen Maßnahmen nicht mehr greifen

Fehlertoleranz schützt vor Hardwareausfällen. Redundantes Internet schützt vor Verbindungsverlust. Monitoring erkennt Probleme frühzeitig. Aber was, wenn das gesamte Rechenzentrum betroffen ist? Brand, Hochwasser, Einbruchdiebstahl, großflächiger Ransomware-Befall — Szenarien, die keine Einzelkomponente abfangen kann.

Für diesen Fall gibt es DCW (Diventus Continuous Workload). DCW repliziert Veränderungen kontinuierlich auf ein entferntes Disaster-Recovery-System. Die Replikationsintervalle sind konfigurierbar — je kürzer, desto weniger Datenverlust im Ernstfall.

Die Wiederherstellung funktioniert über One Button Recovery: Ein Tastendruck stellt das gesamte System am Ausweich-Standort wieder her. Kein komplexes Wiederherstellungsverfahren, keine stundenlagen Rücksicherungen aus Bandlaufwerken. Und — entscheidend — die Wiederherstellung ist zeitpunktgenau: Sie können Ihr System auf jeden früheren Zeitpunkt zurücksetzen, beispielsweise auf den Zustand vor einem Ransomware-Befall.

Seit Dezember 2025 verlangt das NIS2-Umsetzungsgesetz explizit Business Continuity und dokumentierte Notfallpläne. Disaster Recovery ist keine optionale Versicherung mehr — für regulierte Unternehmen ist es eine Pflicht.

Backup ≠ Disaster Recovery

Ein Backup sichert Daten. Disaster Recovery sichert Verfügbarkeit. Ein Backup-Restore dauert Stunden bis Tage, abhängig von Datenmenge und Komplexität. DCW stellt das gesamte System (Betriebssystem, Anwendungen, Konfigurationen, Daten) in einem Bruchteil dieser Zeit wieder her.

Netzwerk-Server für Disaster Recovery Lösung

Das Zusammenspiel der drei Maßnahmen

Risiko	Maßnahme	Lösung
Server-Hardwareausfall	Fehlertoleranz	Stratus everRun / ztC Edge / ztC Endurance
Internetausfall	Redundante Anbindung	becom.one (Multi-Provider)
Schleichende Degradierung	24/7-Monitoring	DCM auf externer Hardware
Standort-Totalverlust	Disaster Recovery	DCW mit One Button Recovery

Keine dieser Maßnahmen ist für sich allein ausreichend. Ein fehlertoleranter Server ohne Monitoring kann schleichend degradieren. Monitoring ohne Fehlertoleranz kann nur warnen, aber keinen Ausfall verhindern. Und ohne Disaster Recovery fehlt der Schutz gegen den kompletten Standortausfall. Das Drei-Säulen-Modell mit ergänzendem Disaster Recovery deckt die gesamte Risikokette ab.

Weiterführende Artikel

FT vs. HA →NIS2 & Infrastruktur →Alle Leistungen →

Wie gut ist Ihre IT gegen Stillstand geschützt?

In einer kostenlosen 30-Minuten-Analyse bewerten wir Ihre aktuelle Infrastruktur und zeigen, an welchen Stellen Handlungsbedarf besteht. Unverbindlich, technisch fundiert.

Kostenlose Erstberatung

+49 30 802020990