Suche
unverbindliche Beratung
Ansprechpartner Datenrettung

Ausgangssituation: "Sporadischer Serverausfall und Downtime"

Der Hotelbetrieb des "Mercure Parkhotel Görlitz" war aufgrund eines sporadischen Serverausfalls beeinträchtigt. Die Serverinfrastrutktur verfügte über grundsätzliche Sicherheitsmechanismen wie USV und Backup-Server. Eine entscheidende Live-Datenbank wurde jedoch nicht vollständig gesichert, so dass der Kunde an einer zeitnahen Wiederinbetriebnahme des bisherigen Systems stark interessiert war. Es lag ein Totalausfall vor.

Lars Müller | Technischer Leiter
RAID 10 Datenrettung von HP ProLiant DL380 G5 (Fallstudie)
Wir bieten Ihnen bei Recoverylab
  • Eigenes Reinraumlabor & Ersatzteillager
  • 95% Datenrettungsgarantie
  • Qualitätssicherung nach ISO 9001:2015
  • Diskretion & Datenschutz nach DSGVO
  • Persönlicher Ansprechpartner
Pfeil Datenrettung anfragen

Diagnose vor Ort

Nachdem ein Onsite-Techniker vom Serverteam Leipzig innerhalb von 3 Stunden nach Ticketeingang in Görlitz eintraf, wurden nach einer Sichtkontrolle, grundlegende Hardware-Tests durchgeführt.

Die redundante Stromversorgung war einwandfrei, jedoch war ein Neustart des Serversystems nicht mehr möglich. Schnell stand fest, dass eine Fehlfunktion im Bereich des Servermainboards für den Ausfall des Gerätes verantwortlich war. Der Zustand der Datenträger konnte zunächst nicht näher bestimmt werden. Die enthaltenen SAS Datenträger vom Typ: ST973402SS (HP Label: DG072BB975) wurden entnommen, sicher verpackt und auf direktem Weg zum Standort Leipzig transportiert.

Datenträgerdiagnose in Leipzig

Nachdem die SAS-Festplatten ca. 3h später in Leipzig eintrafen, wurde alsbald mit der Diagnose begonnen. Es erfolgte zunächst eine 1:1 Kopie der vollständig physisch intakten SAS-Festplatten. Die darauffolgende Diagnose ergab eine Beschädigung des RAID-10 Arrays auf logischer Ebene. Die virtuell nachgebildete RAID-Struktur wies Inkonsistenzen auf und bedurfte einer Rekonstruktion für die weitere Bearbeitung. Die ermittelten RAID-Probleme wurden durch den abrupten Serverausfall und den darin befindlichen RAID-Controller verursacht. Die serverseitig vorhandene BBU (Backup Battery Unit) wies offensichtlich keine fehlerfreie Funktion auf.

Wiederherstellung RAID 10 und parallele Havarie-Konzeption

raid-datenrettung-von-ProLiant_DL_380_G5_HP-DG072BB975-ST973402SS

Nachdem der Kunde über den Schaden und den damit einhergehenden Aufwand zur Wiederherstellung informiert wurde, wurde umgehend mit der Wiederherstellung des RAID-10 Verbundes begonnen. Aufgrund des vorliegenden Hardware-Schadens des Servers und des nicht vorhandenen 24/7 Hardware-Supports über den Hersteller HP musste innerhalb des Wochenendes ein Havariekonzept zur schnellstmöglichen Wiederinbetriebnahme der IT-Systeme für den laufenden Hotelbetrieb erstellt werden.

Parallel zur bereits eingeleiteten Server-Datenrettung wurde ein Leihserver vom Systemhaus PC Dienst auf die Anforderungen des Mercure Hotels angepasst und konfektioniert. Die Bereitschaftsadministration des Server-Teams erstellten eine virtuelle Serverumgebung mittels Microsoft Server 2012 und Hyper-V 3.1. Host-System. 6 Stunden nach Beginn der Datenrekonstruktion im Datenrettungs-Team konnte die wiederhergestellten und konsistenten NTFS-Partitionen des RAID-Arrays als VHD Daten bereitgestellt werden.

Serverkonfiguration / Fehlerbeseitigung

server-2012-hyper-v-installation-konfiguration

Trotz nahezu vollständiger Datenträgerkonsistenz mussten im Bereich der Bootpartition verschiedene Korrekturen und Anpassungen vorgenommen werden, bis der fehlerfreie Neustart des nun virtualisierten Windows 2003 Servers möglich war. Betroffen waren die DHCP- und DNS-Dienste, der Domaincontroller und Datenbankserver. Anhand der Registryinformationen wurden Altkonfigurationsdaten des DNS-Servers und der vorherigen Netzwerkkonfiguration nachgebildet und übernommen. Die eingesetzte Oracle-Datenbank konnte mit vorhandenen Boardmitteln nach kleineren Korrekturen fehlerfrei eingehangen und gestartet werden. Es waren keine Inkonsistenzen innerhalb der Datenbank feststellbar. Es erfolgte ein zusätzlicher Testlauf mit virtuellen Client-Computern, die der Kunden-Infrastruktur nachempfunden wurden, so dass die möglichst nahtlose bevorstehende Re-Integration des Servers beim Kunden problemlos und schnell erfolgen konnte.

Nach 26h lief der Hotelbetrieb im "Mercure Parkhotel Görlitz" wieder uneingeschränkt .

Sehr gut
4.9 von 5 in 265 KundenmeinungenInfo
Jetzt Analyse für professionelle Datenrettung durch RecoveryLab anfragen

Rollout/ Übergabe

26h nach dem ersten Vor Ort Einsatz erfolgte bereits die Auslieferung des bereitgestellten Havarie-Serversystems. Aufgrund der stringenten Vorkonfiguration des virtuellen Serversystems konnten nach dem Neustart des Host und Gastbetriebssystems sofort alle in der Domain befindlichen Netzwerkgeräte (Kassensystem/ Back-Office/ Buchungssysteme) wieder in Betrieb genommen werden. Durch die Bereitstellung in den frühen Morgenstunden konnte der Hotelbetrieb nach einer für die meisten Gäste nicht feststellbaren Downtime wieder uneingeschränkt fortgesetzt werden.

Aufgrund der nahtlosen und übergreifenen Zusammenarbeit zwischen Datenrettungs-Spezialisten und Serveradministratoren im Bereitschaftsteam konnte die zeitnahe Wiederinbetriebnahme nach nur 26 Stunden erfolgreich realisiert werden.

Zeitlicher Ablauf von Diagnose bis zur Datenwiederherstellung/ Serverproblemlösung:

  • Freitag, ca. 21:00: Uhr Eingangsticket mit Schadensbild "Systemausfall"
  • Samstag, 00:30 Uhr: Erste Vor-Ort Analyse durch Datenrettungs-Techniker in Görlitz (Anreise vom Standort Leipzig)
  • Samstag, 05:30 Uhr: Vorbereitungen zur Datenträgeranalyse
  • Samstag, 07:00 Uhr: Beginn der Datenträger- und RAID-Diagnose
  • Samstag, 12:00 Uhr: Freigabe und Beginn der Datenwiederherstellung/ Vorbereitungen Havarieserver
  • Samstag, 19:00 Uhr: Übernahme des ursprünglichen Windows 2003 Server als virtuelle Infrastruktur
  • Samstag, 23:00 Uhr: Abschluss aller Fehlerkorrekturen und Konfigurationen und Funktionstests des Havariesystems
  • Sonntag, 02:30 Uhr: Eintreffen des Onsite-Support Mitarbeiters in Görlitz, Rollout und Funktionsprüfung, Wiederinbetriebnahme der IT-Systeme

Jetzt Experten kontaktieren

Haben Sie ein ähnliches Problem mit Ihrem Serversystem bzw. RAID-Array festgestellt?

Möchten Sie weitere Fallstudien zur Datenrettung lesen? Wir haben verschiedene Abläufe von durch uns durchgeführten Datenwiederherstellungen dokumentiert und dargestellt. Fallstudien zur Datenrettung

Jetzt: Datenrettung anfragen.











    Sehr gut
    4.9 von 5 bei 265 Kundenmeinungen
    SSL
    Autor: Stefan Berger
    Stefan Berger ist seit Ende der 90er Jahre in der IT-Branche zugegen. Seine Spezialgebiete sind IT-Sicherheit, Datenrettung und IT-Forensik im Zusammenhang mit Datenwiederherstellung. Für RecoveryLab.de schreibt er als Experte Fachartikel und Serviceartikel, um Betroffenen von Datenverlust ein sinnvolles und umfangreiches Hilfsangebot zur Wiederherstellung von Daten zu ermöglichen.

    Kommentare

    Schreiben Sie einen Kommentar

    Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert