In diesem Artikel erfahren Sie, wie Sie bei einem Dedicated Server Windows mit Software-RAID eine defekte Festplatte identifizieren und einen Festplattenaustausch vorbereiten.

Anmerkung

Dieser Artikel setzt grundlegende Kenntnisse der Serveradministration mit Microsoft Windows voraus. Wenn Sie bezüglich des Austauschs einer defekten Festplatte Fragen haben oder Unterstützung benötigten, kontaktieren Sie bitte den IONOS Kundenservice.

Damit die größtmögliche Ausfallsicherheit gewährleistet werden kann, ist es erforderlich, dass Sie das Software-RAID Ihres Dedicated Servers überwachen. Wenn Sie feststellen, dass eine Festplatte defekt ist, oder Sie eine Benachrichtigungs-E-Mail über eine defekte Festplatte erhalten, sollten Sie den Kundenservice kontaktieren, um den Festplattenaustausch zu veranlassen. Hierfür ist es zunächst erforderlich, dass Sie die defekte Festplatte identifizieren und den Server für den Austausch des defekten Datenträgers vorbereiten.

Achtung!

RAID-Systeme ermöglichen eine größere Ausfallsicherheit und/oder eine höhere Geschwindigkeit. Sie sind jedoch kein Ersatz für regelmäßige Backups. Um Datenverlust zu vermeiden, empfehlen wir Ihnen, regelmäßig ein Backup zu erstellen. Stellen Sie ferner sicher, dass Sie vor der Ausführung der unten aufgeführten Schritte ein Backup erstellen, um die Sicherheit Ihrer Daten zu gewährleisten. 

Fehlerdiagnose und Ermittlung der notwendigen Daten für den Festplattenaustausch

Um Festplattenfehler zu erkennen, empfehlen wir Ihnen, wie folgt vorzugehen:

Installieren Sie das Programm Smartctl. Smartctl ist ein Kommandozeilenprogramm, um Datenträger mittels SMART (Self-Monitoring, Analysis and Reporting Technology) zu überwachen. Mit diesem Programm können Sie prüfen, ob eine Festplatte defekt ist.

Hinweis

In manchen Fällen kann es vorkommen, dass ein Festplattendefekt nicht mittels der Smartwerte erkannt werden kann. Daher empfehlen wir Ihnen, stets zusätzlich eine Analyse der Log-Dateien Ihres Servers durchzuführen.

Smartctl installieren

Unter der folgenden URL finden Sie eine Anleitung zur Installation der Smartmontools:

https://www.smartmontools.org/wiki/Download#InstalltheWindowspackage

Detaillierte Informationen für die Fehlerdiagnose aufrufen

Smartctl verhält sich unter Windows genauso wie unter Linux. Aus diesem Grund können Sie die gleichen Befehle verwenden. Um Smartctl für die Fehlerdiagnose zu nutzen, müssen Sie die Eingabeaufforderung öffnen und in das Verzeichnis wechseln, in dem sich die Smartmontools befinden. Anschließend können Sie die unten aufgeführten Linux-Befehle eingeben, um detaillierte Informationen für die Fehlerdiagnose aufzurufen.

Um eine Liste der Festplatten aufzurufen, geben Sie den folgenden Befehl ein:

smartctl --scan

Beispiel:

C:\Program Files\smartmontools\bin>smartctl --scan

/dev/sda -d sat # /dev/sda [SAT], ATA device
/dev/sdb -d sat # /dev/sdb [SAT], ATA device
/dev/csmi0,2 -d ata # /dev/csmi0,2, ATA device
/dev/csmi0,3 -d ata # /dev/csmi0,3, ATA device

Um detaillierte Informationen für die Fehlerdiagnose aufzurufen, geben Sie den folgenden Befehl ein:

smartctl -iHAl error [NAMEDERFESTPLATTE]

Beispiel:

C:\Program Files\smartmontools\bin>smartctl -iHAl error /dev/sda

Hinweis

Bitte beachten Sie, dass die Schnittstellen der Geräte im folgenden Format angegeben werden müssen: 

SCSI / SATA Geräte: " smartctl - iHAl error /dev/sd[a-z]"

Beispiel:

C:\Program Files\smartmontools\bin>smartctl -iHAl error /dev/sda

Nach der Eingabe des Befehls werden z. B. die folgenden Informationen angezeigt:

C:\Program Files\smartmontools\bin>smartctl -iHAl error /dev/sda

smartctl 7.0 2018-12-30 r4883 [x86_64-w64-mingw32-2016] (sf-7.0-1)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi/HGST Ultrastar 7K2
Device Model:     HGST HUS722T1TALA604
Serial Number:    WMC6M0JAUEV8
LU WWN Device Id: 5 0014ee 00482c2ec
Firmware Version: RAGNWA07
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Jan 17 06:17:05 2019 CAST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG   VALUE WORST THRESH TYPE     UPDATED WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f 200   200   051    Pre-fail Always      -       0
  3 Spin_Up_Time            0x0027 141   140   021    Pre-fail Always      -       3933
  4 Start_Stop_Count        0x0032 100   100   000    Old_age  Always      -       15
  5 Reallocated_Sector_Ct   0x0033 200   200   140    Pre-fail Always      -       0
  7 Seek_Error_Rate         0x002e 200   200   000    Old_age  Always      -       0
  9 Power_On_Hours          0x0032 100   100   000    Old_age  Always      -       34
 10 Spin_Retry_Count        0x0032 100   253   000    Old_age  Always      -       0
 11 Calibration_Retry_Count 0x0032 100   253   000    Old_age  Always      -       0
 12 Power_Cycle_Count       0x0032 100   100   000    Old_age  Always      -       10
 16 Gas_Gauge               0x0022 000   200   000    Old_age  Always      -       1822115874
183 Runtime_Bad_Block       0x0032 100   100   000    Old_age  Always      -       0
192 Power-Off_Retract_Count 0x0032 200   200   000    Old_age  Always      -       6
193 Load_Cycle_Count        0x0032 200   200   000    Old_age  Always      -       9
194 Temperature_Celsius     0x0022 113   109   000    Old_age  Always      -       30
196 Reallocated_Event_Count 0x0032 200   200   000    Old_age  Always      -       0
197 Current_Pending_Sector  0x0032 200   200   000    Old_age  Always      -       0
198 Offline_Uncorrectable   0x0030 100   253   000    Old_age  Offline     -       0
199 UDMA_CRC_Error_Count    0x0032 200   200   000    Old_age  Always      -       0
200 Multi_Zone_Error_Rate   0x0008 100   253   000    Old_age  Offline     -       0

SMART Error Log Version: 1
No Errors Logged

Interpretation der Parameter und Fehlerdiagnose

Analysieren Sie die detaillierten Informationen, die Sie mittels des Befehls
smartctl -iHAl error [NAMEDERFESTPLATTE] aufgerufen haben. Im ersten Abschnitt sind Informationen aufgeführt, mit denen Sie die Festplatte identifizieren können:

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi/HGST Ultrastar 7K2
Device Model:     HGST HUS722T1TALA604
Serial Number:    WMC6M0JAUEV8
LU WWN Device Id: 5 0014ee 00482c2ec
Firmware Version: RAGNWA07
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Jan 17 06:17:05 2019 CAST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

In diesem Abschnitt werden unter anderem das Gerätemodell und die Seriennummer der geprüften Festplatte angezeigt. 

Im zweiten Abschnitt wird der aktuelle Zustand der Festplatte von Smartctl beurteilt. Wenn nicht der Wert „PASSED“, sondern z. B. der Wert „Failed“ oder „UNKNOWN“ angezeigt wird, sollten Sie schnellst möglich einen Austausch der betreffenden Festplatte veranlassen.

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Im dritten Abschnitt sind die ermittelten SMART-WERTE detailliert aufgeführt. Neben jedem aktuellen, prozentualen Wert (VALUE), sind der schlechteste, jemals gemessene Wert (WORST) und der jeweilige Grenzwert (THRESH) aufgeführt. Wenn der aktuelle, prozentuale Wert (VALUE) oder der schlechteste, jemals gemessene Wert (WORST) den Grenzwert (THRESH) überschreiten, wird in der Spalte WHEN_FAILED eine SMART-Warnung angezeigt (z. B. FAILING_NOW). 

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   141   140   021    Pre-fail  Always       -       3933
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       15
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       34
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       10
 16 Gas_Gauge               0x0022   000   200   000    Old_age   Always       -       1822115874
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       6
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       9
194 Temperature_Celsius     0x0022   113   109   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

Folgende Parameter können auf einen drohenden Festplattenausfall hinweisen, bevor eine SMART-Warnung angezeigt wird:

Reallocated_Sector_Ct: Gibt die Anzahl der Sektoren an, die aufgrund von Lesefehlern neu zugeteilt wurden. Wenn ein Sektor nicht mehr korrekt gelesen, beschrieben oder geprüft werden kann, wird diesem automatisch ein Ersatzsektor zugewiesen. Der fehlerhafte Sektor wird permanent als nicht lesbar markiert. Dies ist ein deutliches Warnzeichen für beginnende Oberflächenprobleme. Wenn dieser Wert ungleich null ist, steht oftmals ein Festplattenausfall bevor. Dieser Wert ist der wichtigste Indikator für einen Festplattenaustausch.

Current_Pending_Sector_Ct: Gibt die Anzahl der instabilen Sektoren an, die auf ein Remapping warten. Wenn ein Sektor nicht korrekt gelesen und beschrieben werden kann, erhält er zunächst den Status Current Pending Sector. Der Sektor wird in diesem Zustand nicht neu zugeteilt, da die auf dem Sektor liegenden Daten unbekannt sind. Erst nach mehreren erfolglosen Lese- bzw. Schreibversuchen wird ein Ersatzsektor zugewiesen und der fehlerhafte Sektor wird permanent als nicht lesbar markiert. Der Wert Current_Pending_Sector_Ct ist ein wichtiger Indikator für einen Festplattenaustausch. Wenn dieser Wert ungleich null ist, steht oftmals ein Festplattenausfall bevor.

Offline_Uncorrectable: Gibt die Anzahl der nicht korrigierbaren Fehler beim Schreib- und Lesezugriff auf Sektoren an.

Der letzte Abschnitt befasst sich mit dem festplatteninternen Log. Hier werden Fehler festgehalten wenn die Arbeitsaufträge des Servers von der Festplatte nicht ordnungsgemäß abgearbeitet wurden. Wenn in diesem Abschnitt eine mindestens zweistellige Fehlerzahl angezeigt wird, sollten Sie schnellst möglich einen Austausch der Festplatte veranlassen.

SMART Error Log Version: 1
No Errors Logged

Detaillierte Informationen für den Festplattenaustausch aufrufen

Damit ein Austausch der defekten Festplatte veranlasst werden kann, werden folgende Informationen benötigt: 

  • Bezeichnung der Festplatte im RAID

  • Seriennummer

  • Modell

  • Log (Optional)

SMART-Log erstellen

Um einen vollständigen SMART-Log zu erstellen, geben Sie den folgenden Befehl ein: 

smartctl –x [NAMEDERFESTPLATTE]

Beispiel: 

C:\Program Files\smartmontools\bin>smartctl -x /dev/sda -x

Hinweise
  • Wenn das SMART-Log wie oben beschrieben erstellt wurde, reicht dieses als Information aus.

  • Wenn Sie die Seriennummer der defekten Festplatte nicht mittels Smartctl aufrufen können, können Sie dem Kundenservice alternativ die Seriennummer der funktionierenden Festplatte(n) nennen.

Festplattenaustausch veranlassen

Anschließend können Sie den Austausch der defekten Festplatte veranlassen. Kontaktieren Sie hierzu bitte den IONOS Kundenservice

Erforderliche Schritte nach dem Austausch der Festplatte

Nach dem Austausch der defekten Festplatte ist es erforderlich, dass Sie das Software-RAID wiederaufbauen. Weitere Informationen zum Wiederaufbau eines Software-RAIDs finden Sie hier:

Software-RAID wiederaufbauen (Windows)