Ablauf einer Datenrettung
Schritt 1
Ablauf Datenrettung: 1. Beratung
Kostenlose Beratung
Schritt 2
Ablauf Datenrettung: 2. Übergabe defekter Datenträger
Übergabe defekter Datenträger
Schritt 3
Ablauf Datenrettung: 3. Analyse Datenträger
Analyse Datenträger
Schritt 4
Ablauf Datenrettung: 4. Festpreisangebot für Datenrettung
Festpreisangebot für Datenrettung
Schritt 5
Ablauf Datenrettung: 5. Datenwiederherstellung
Datenwiederherstellung
Schritt 6
Ablauf Datenrettung: 6. Rückgabe der geretteten Daten
Rückgabe der geretteten Daten
Ablauf einer Datenrettung

Geschätzte Lesezeit: 2 Minuten, 25 Sekunden

RAID 10 Datenrettung von HP ProLiant DL380 G5 (Fallstudie)

datenrettung-raid10-proliant-dl-380-hotel-mercureFallstudie: Mercure Parkhotel Görlitz

Ausgangssituation: „Sporadischer Serverausfall und Downtime“

Der Hotelbetrieb des „Mercure Parkhotel Görlitz“ war aufgrund eines sporadischen Serverausfalls beeinträchtigt. Die Serverinfrastrutktur verfügte über grundsätzliche Sicherheitsmechanismen wie USV und Backup-Server. Eine entscheidende Live-Datenbank wurde jedoch nicht vollständig gesichert, so dass der Kunde an einer zeitnahen Wiederinbetriebnahme des bisherigen Systems stark interessiert war. Es lag ein Totalausfall vor.

Diagnose vor Ort

Nachdem ein Onsite-Techniker vom Serverteam Leipzig innerhalb von 3 Stunden nach Ticketeingang in Görlitz eintraf, wurden nach einer Sichtkontrolle, grundlegende Hardware-Tests durchgeführt. Die redundante Stromversorgung war einwandfrei, jedoch war ein Neustart des Serversystems nicht mehr möglich. Schnell stand fest, dass eine Fehlfunktion im Bereich des Servermainboards für den Ausfall des Gerätes verantwortlich war. Der Zustand der Datenträger konnte zunächst nicht näher bestimmt werden. Die enthaltenen SAS Datenträger vom Typ: ST973402SS (HP Label: DG072BB975) wurden entnommen, sicher verpackt und auf direktem Weg zum Standort Leipzig transportiert.

Datenträgerdiagnose in Leipzig

Nachdem die SAS-Festplatten ca. 3h später in Leipzig eintrafen, wurde alsbald mit der Diagnose begonnen. Es erfolgte zunächst eine 1:1 Kopie der vollständig physisch intakten SAS-Festplatten. Die darauffolgende Diagnose ergab eine Beschädigung des RAID-10 Arrays auf logischer Ebene. Die virtuell nachgebildete RAID-Struktur wies Inkonsistenzen auf und bedurfte einer Rekonstruktion für die weitere Bearbeitung. Die ermittelten RAID-Probleme wurden durch den abrupten Serverausfall und den darin befindlichen RAID-Controller verursacht. Die serverseitig vorhandene BBU (Backup Battery Unit) wies offensichtlich keine fehlerfreie Funktion auf.

Wiederherstellung RAID 10 und parallele Havarie-Konzeption

raid-datenrettung-von-ProLiant_DL_380_G5_HP-DG072BB975-ST973402SSNachdem der Kunde über den Schaden und den damit einhergehenden Aufwand zur Wiederherstellung informiert wurde, wurde umgehend mit der Wiederherstellung des RAID-10 Verbundes begonnen. Aufgrund des vorliegenden Hardware-Schadens des Servers und des nicht vorhandenen 24/7 Hardware-Supports über den Hersteller HP musste innerhalb des Wochenendes ein Havariekonzept zur schnellstmöglichen Wiederinbetriebnahme der IT-Systeme für den laufenden Hotelbetrieb erstellt werden.

Parallel zur bereits eingeleiteten Server-Datenrettung wurde ein Leihserver vom Systemhaus PC Dienst auf die Anforderungen des Mercure Hotels angepasst und konfektioniert. Die Bereitschaftsadministration des Server-Teams erstellten eine virtuelle Serverumgebung mittels Microsoft Server 2012 und Hyper-V 3.1. Host-System. 6 Stunden nach Beginn der Datenrekonstruktion im Datenrettungs-Team konnte die wiederhergestellten und konsistenten NTFS-Partitionen des RAID-Arrays als VHD Daten bereitgestellt werden.

Serverkonfiguration / Fehlerbeseitigung

server-2012-hyper-v-installation-konfigurationTrotz nahezu vollständiger Datenträgerkonsistenz mussten im Bereich der Bootpartition verschiedene Korrekturen und Anpassungen vorgenommen werden, bis der fehlerfreie Neustart des nun virtualisierten Windows 2003 Servers möglich war. Betroffen waren die DHCP- und DNS-Dienste, der Domaincontroller und Datenbankserver. Anhand der Registryinformationen wurden Altkonfigurationsdaten des DNS-Servers und der vorherigen Netzwerkkonfiguration nachgebildet und übernommen. Die eingesetzte Oracle-Datenbank konnte mit vorhandenen Boardmitteln nach kleineren Korrekturen fehlerfrei eingehangen und gestartet werden. Es waren keine Inkonsistenzen innerhalb der Datenbank feststellbar. Es erfolgte ein zusätzlicher Testlauf mit virtuellen Client-Computern, die der Kunden-Infrastruktur nachempfunden wurden, so dass die möglichst nahtlose bevorstehende Re-Integration des Servers beim Kunden problemlos und schnell erfolgen konnte.

Nach 26h lief der Hotelbetrieb im „Mercure Parkhotel Görlitz“ wieder uneingeschränkt .

Rollout/ Übergabe

26h nach dem ersten Vor Ort Einsatz erfolgte bereits die Auslieferung des bereitgestellten Havarie-Serversystems. Aufgrund der stringenten Vorkonfiguration des virtuellen Serversystems konnten nach dem Neustart des Host und Gastbetriebssystems sofort alle in der Domain befindlichen Netzwerkgeräte (Kassensystem/ Back-Office/ Buchungssysteme) wieder in Betrieb genommen werden. Durch die Bereitstellung in den frühen Morgenstunden konnte der Hotelbetrieb nach einer für die meisten Gäste nicht feststellbaren Downtime wieder uneingeschränkt fortgesetzt werden.

Aufgrund der nahtlosen und übergreifenen Zusammenarbeit zwischen Datenrettungs-Spezialisten und Serveradministratoren im Bereitschaftsteam konnte die zeitnahe Wiederinbetriebnahme nach nur 26 Stunden erfolgreich realisiert werden.

Zeitlicher Ablauf von Diagnose bis zur Datenwiederherstellung/ Serverproblemlösung:

  • Freitag, ca. 21:00: Uhr Eingangsticket mit Schadensbild „Systemausfall“
  • Samstag, 00:30 Uhr: Erste Vor-Ort Analyse durch Datenrettungs-Techniker in Görlitz (Anreise vom Standort Leipzig)
  • Samstag, 05:30 Uhr: Vorbereitungen zur Datenträgeranalyse
  • Samstag, 07:00 Uhr: Beginn der Datenträger- und RAID-Diagnose
  • Samstag, 12:00 Uhr: Freigabe und Beginn der Datenwiederherstellung/ Vorbereitungen Havarieserver
  • Samstag, 19:00 Uhr: Übernahme des ursprünglichen Windows 2003 Server als virtuelle Infrastruktur
  • Samstag, 23:00 Uhr: Abschluss aller Fehlerkorrekturen und Konfigurationen und Funktionstests des Havariesystems
  • Sonntag, 02:30 Uhr: Eintreffen des Onsite-Support Mitarbeiters in Görlitz, Rollout und Funktionsprüfung, Wiederinbetriebnahme der IT-Systeme

Haben Sie ein ähnliches Problem mit Ihrem Serversystem bzw. RAID-Array festgestellt?

Jetzt unverbindlich Diagnose anfragen

Möchten Sie weitere Fallstudien zur Datenrettung lesen? Wir haben verschiedene Abläufe von durch uns durchgeführten Datenwiederherstellungen dokumentiert und dargestellt. Fallstudien zur Datenrettung

24h Hotline - 0800 / 937 88 36
Jetzt Diagnose anfragen