Wenn Sie eine Benachrichtigung über einen Festplattenfehler erhalten oder Unregelmäßigkeiten im System bemerken, ist schnelles Handeln gefragt, um die Redundanz Ihres RAID-Verbunds wiederherzustellen. In diesem Artikel erfahren Sie, wie Sie eine defekte Festplatte identifizieren und den Server für den Austausch des defekten Datenträgers vorbereiten.

Hinweis

  • Dieser Artikel setzt grundlegende Kenntnisse der Serveradministration mit Linux voraus. Wenn Sie bezüglich des Austauschs einer defekten Festplatte Fragen haben oder Unterstützung benötigen, kontaktieren Sie bitte den IONOS Kundenservice. Die Kontaktinformationen finden Sie auf der folgenden Seite: IONOS Kundenservice

  • Dieser Artikel beschreibt primär die Diagnose und Vorbereitung des Austauschs von SATA-/SAS-Laufwerken in Hardware-RAID-Systemen. Bei NVMes können sich Befehle, Gerätebezeichnungen, SMART-/Health-Werte und die Identifikation defekter Laufwerke unterscheiden. 

Damit die größtmögliche Ausfallsicherheit gewährleistet werden kann, ist es erforderlich, dass Sie das Hardware-RAID Ihres Dedicated Servers oder Bare Metal Servers überwachen. Wenn Sie eine Benachrichtigungs-E-Mail über eine defekte Festplatte erhalten oder einen Defekt einer Festplatte feststellen, müssen Sie die defekte Festplatte identifizieren und den Server für den Austausch des defekten Datenträgers vorbereiten. Kontaktieren Sie anschließend den IONOS Kundenservice, um den Festplattenaustausch zu veranlassen.

Achtung

RAID-Systeme ermöglichen eine größere Ausfallsicherheit und/oder eine höhere Geschwindigkeit. Sie sind jedoch kein Ersatz für regelmäßige Backups. Um Datenverlust zu vermeiden, empfehlen wir Ihnen, regelmäßig ein Backup zu erstellen. Stellen Sie ferner sicher, dass Sie vor der Ausführung der folgenden Schritte ein Backup erstellen, um die Sicherheit Ihrer Daten zu gewährleisten.

Weitere Informationen zur Erstellung von Backups finden Sie in der folgenden Kategorie des IONOS Hilfe-Centers: Backup-Lösungen
 

Hardware-RAID-Controller: Allgemeine Informationen

Ein Hardware-RAID-Controller ist ein physikalischer Controller, der als Hardware-Bauteil in den Server eingebaut ist. Dieser Controller besitzt für die Berechnung der RAID-Operationen einen eigenen Prozessor. Dieser Prozessor organisiert und verwaltet den Speicherplatz. Somit wird die CPU des Servers nicht durch RAID-Berechnungen belastet. Bei Hardware-RAID-Controllern ist die RAID-Funktionalität vom Betriebssystem unabhängig. Sie werden über spezielle Kommandozeilenprogramme (Command Line Interface, kurz CLI) verwaltet, die je nach herstellenden Unternehmen und Modell unterschiedlich sein können.

Diagnose von Festplattenfehlern

Um Festplattenfehler zu erkennen, empfehlen wir Ihnen, das Programm smartctl zu verwenden. smartctl ist ein Kommandozeilenprogramm, um Datenträger mittels SMART (Self-Monitoring, Analysis and Reporting Technology) zu überwachen. Mit diesem Programm können Sie prüfen, ob eine Festplatte defekt ist. Es ist ein Bestandteil der Smartmontools. Die Smartmontools sind als Pakete für viele Linux-Distributionen verfügbar. Weitere Informationen finden Sie auf der folgenden Seite: Smartmontools Packages

Hinweis

In manchen Fällen kann es vorkommen, dass ein Festplattendefekt nicht mittels der Smartwerte erkannt werden kann. Daher empfehlen wir Ihnen, zusätzlich die Systemprotokolle zu analysieren. 

Smartctl installieren

  • Um smartctl zu installieren, loggen Sie sich als Administrator auf dem Server ein.

  • Installieren Sie die erforderlichen Pakete je nach Distribution:

    AlmaLinux 9 und 10 sowie Rocky Linux 9 und 10:

    dnf install smartmontools

    Debian 12 und 13 sowie Ubuntu 24.04 und 26.04: 

    sudo apt install smartmontools

 

Hardware-Controller-Typ ermitteln

Um zu prüfen, welcher Hardware-Controller in Ihrem Server eingebaut ist, können Sie das Programm lshw verwenden. Dieses Programm erstellt detaillierte Informationen zu Hardwarekomponenten.

Um das Programm zu installieren, geben Sie den folgenden Befehl ein:

AlmaLinux 9 und 10 sowie Rocky Linux 9 und 10: 

dnf install lshw

Debian 12 und 13 sowie Ubuntu 24.04 und 26.04: 

sudo apt-get install lshw

 

Hardwareinformationen aufrufen

Um eine Kurzfassung der Hardwareinformationen anzuzeigen, geben Sie den folgenden Befehl ein:

lshw –short

Um die Hardwareinformationen als Textdatei auszugeben, geben Sie den folgenden Befehl ein:

lshw > lshw_ausgabe.txt

Im folgenden Beispiel ist im Server ein PERC H330 Hardware-Controller eingebaut:

root@829F6DF:~# lshw -short
H/W path             Device     Class          Description
==========================================================
                                system         PowerEdge R230 (SKU=NotProvided;ModelName=PowerEdge R230)
/0                              bus            0DWX9P
/0/0                            memory         64KiB BIOS
/0/400                          processor      Intel(R) Xeon(R) CPU E3-1270 v6 @ 3.80GHz
/0/400/700                      memory         256KiB L1 cache
/0/400/701                      memory         1MiB L2 cache
/0/400/702                      memory         8MiB L3 cache
/0/1000                         memory         32GiB System Memory
/0/1000/0                       memory         16GiB DIMM DDR4 Synchronous Unbuffered (Unregistered) 2133 MHz (0.5 ns)
/0/1000/1                       memory         16GiB DIMM DDR4 Synchronous Unbuffered (Unregistered) 2133 MHz (0.5 ns)
/0/1000/2                       memory         [empty]
/0/1000/3                       memory         [empty]
/0/100                          bridge         Intel Corporation
/0/100/1                        bridge         Skylake PCIe Controller (x16)
/0/100/1/0           scsi0      storage        MegaRAID SAS-3 3008 [Fury]
/0/100/1/0/2.0.0     /dev/sda   disk           799GB PERC H330 Adp
/0/100/1/0/2.0.0/1   /dev/sda1  volume         2047KiB BIOS Boot partition
/0/100/1/0/2.0.0/2   /dev/sda2  volume         27GiB EXT3 volume
/0/100/1/0/2.0.0/3   /dev/sda3  volume         9536MiB Linux swap volume
/0/100/1/0/2.0.0/4   /dev/sda4  volume         707GiB LVM Physical Volume
/0/100/1.1                      bridge         Skylake PCIe Controller (x8)
/0/100/14                       bus            Sunrise Point-H USB 3.0 xHCI Controller
/0/100/14/0          usb1       bus            xHCI Host Controller
/0/100/14/0/3                   bus            Gadget USB HUB
/0/100/14/1          usb2       bus            xHCI Host Controller
/0/100/14.2                     generic        Sunrise Point-H Thermal subsystem
/0/100/16                       communication  Sunrise Point-H CSME HECI #1
/0/100/16.1                     communication  Sunrise Point-H CSME HECI #2
/0/100/17                       storage        Sunrise Point-H SATA controller [AHCI mode]
/0/100/1d                       bridge         Sunrise Point-H PCI Express Root Port #9
/0/100/1d/0          eth0       network        NetXtreme BCM5720 Gigabit Ethernet PCIe
/0/100/1d/0.1        eth1       network        NetXtreme BCM5720 Gigabit Ethernet PCIe
/0/100/1d.2                     bridge         Sunrise Point-H PCI Express Root Port #11
/0/100/1d.2/0                   bridge         SH7758 PCIe Switch [PS]
/0/100/1d.2/0/0                 bridge         SH7758 PCIe Switch [PS]
/0/100/1d.2/0/0/0               bridge         SH7758 PCIe-PCI Bridge [PPB]
/0/100/1d.2/0/0/0/0             display        G200eR2
/0/100/1f                       bridge         Sunrise Point-H LPC Controller
/0/100/1f.2                     memory         Memory controller
/0/100/1f.4                     bus            Sunrise Point-H SMBus
RAID-Controller-Verwaltungsprogramme

Die zur Verwaltung der jeweiligen RAID-Controller erforderliche Software ist standardmäßig installiert. Falls die Software nicht auf Ihrem Server installiert ist, finden Sie im folgenden Artikel Links, unter denen Sie die Software herunterladen können: Hardware-RAID überwachen / wiederaufbauen (Linux)

CLI-Tool verwenden, um den Status des RAID-Verbunds anzuzeigen

Verwenden Sie das entsprechende CLI-Tool, um den Status des RAID-Verbunds (RAID 1, 5 oder 6) und der physischen Laufwerke abzufragen. 

Der Broadcom-RAID-Controller wird mit dem Kommandozeilenwerkzeug StorCLI verwaltet und gesteuert. Je nach Controller-Generation und Betriebssystem nutzen Sie:

storcli64: Für gängige Broadcom/LSI Controller (z.B. MegaRAID, AVAGO)
storcli2: Für die neueste Generation der Tri-Mode Controller (NVMe/SAS/SATA)

Der Dell-RAID-Controller wird mit dem Kommandozeilenwerkzeug PERCCLI verwaltet und gesteuert. Je nach Controller-Generation und Betriebssystem nutzen Sie:

perccli64: Für Dell-RAID-Controller älterer Generationen
perccli2: Für die neueste Dell-RAID-Controller-Generation (z. B. GraniteRapids/Blackwell Systeme)

Hinweis

  • Im folgenden Beispiel wird storcli64 verwendet. Sollten Sie einen Dell-Controller oder ein neueres System nutzen, ersetzen Sie den Befehl entsprechend durch perccli64, storcli2 oder perccli2. Die Syntax bleibt nahezu identisch.

  • Wenn Sie sich nicht sicher sind, welches Kommandozeilenwerkzeug für Ihren RAID-Controller vorgesehen ist, testen Sie die unten aufgeführten Befehle mit dem Zusatz show. Das Ausführen eines „falschen“ Tools führt lediglich zu einer Fehlermeldung, es beschädigt nichts.

Defekte Festplatte identifizieren

Mit dem folgenden Befehl können Sie die defekte Festplatte identifizieren: storcli64 /call show

Anschließend werden unter anderem folgende Informationen angegeben:

Controller = 0 
Status = Success
... 
Drive Groups = 1

TOPOLOGY : 
========
-----------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type  State BT Size PDC  PI SED DS3  FSpace      TR 
-----------------------------------------------------------------------------
0 -   -   -        -   RAID1 Optl  N  931.000 GB dflt N  N   dflt N      N  
0 0   -   -        -   RAID1 Optl  N  931.000 GB dflt N  N   dflt N      N  
0 0   0   16:4     0   DRIVE Onln  N  931.000 GB dflt N  N   dflt -      N  
0 0   1   16:6     1   DRIVE Onln  N  931.000 GB dflt N  N   dflt -      N  
-----------------------------------------------------------------------------

DG=Disk Group Index|Arr=Array Index|Row=Row Index|EID=Enclosure Device ID
DID=Device ID|Type=Drive or RAID Type|Onln=Online|Rbld=Rebuild|Optl=Optimal
Dgrd=Degraded|Pdgd=Partially degraded|Offln=Offline|BT=Background Task Active PDC=PD Cache|PI=Protection Info|SED=Self Encrypting Drive|Frgn=Foreign DS3=Dimmer Switch 3|dflt=Default|Msng=Missing|FSpace=Free Space Present TR=Transport Ready

Virtual Drives = 1

Prüfen Sie die Nummer des Controllers. Im Regelfall wird der Eintrag Controller = 0 angezeigt. Wenn eine andere Nummer angezeigt wird, müssen Sie dies bei den Befehlen für den Hardware-RAID-Controller berücksichtigen. Suchen Sie anschließend in der PD LIST nach dem Status Slt (Slot) und State. Eine fehlerfreie Festplatte hat den Status Onln (Online).

Eine defekte Festplatte wird oft als Failed, Missing, Offline oder Degraded angezeigt. Notieren Sie sich die EID:Slt (Enclosure ID und Slot-Nummer), z. B. 252:1.

Informationen zur Festplatte aufrufen

Um mit smartctl Informationen zur Festplatte aufzurufen, müssen Sie den entsprechenden Befehl stets in Kombination mit einer Option und einem Zielgerät angeben. Das Zielgerät ist abhängig vom herstellenden Unternehmen des Controllers.

Mit den unten aufgeführten Befehlen rufen Sie die für die Diagnose erforderlichen Informationen über die Festplatte auf:

ARECA:

  • Festplatte 1: smartctl -iHAl error /dev/sg1 -d areca,1

  • Festplatte 2: smartctl -iHAl error /dev/sg1 -d areca,2

LSI / 3Ware:

  • Festplatte 1: smartctl -iHAl error /dev/twe0 -d 3ware,0

  • Festplatte 2: smartctl -iHAl error /dev/twe0 -d 3ware,1

Adaptec:

  • Festplatte 1: smartctl -iHAl error /dev/sg2 -d sat

  • Festplatte 2: smartctl -iHAl error /dev/sg3 -d sat

  • Festplatte 3: smartctl -iHAl error /dev/sg4 -d sat

  • Festplatte 4: smartctl -iHAl error /dev/sg5 -d sat

Dell:

  • Festplatte 1: smartctl -iHAl error -d sat+megaraid,0 /dev/sda

  • Festplatte 2: smartctl -iHAl error -d sat+megaraid,1 /dev/sda

Broadcom:

  • Festplatte 1: smartctl -iHAl error -d sat+megaraid,0 /dev/sda

  • Festplatte 2: smartctl -iHAl error -d sat+megaraid,1 /dev/sda

Weitere Befehle für unterstützte Hardware-Controller finden Sie auf der folgenden Seite:

https://www.smartmontools.org/wiki/Supported_RAID-Controllers

Beispiel:

[root@localhost ~]# smartctl -iHAl error /dev/sg1 -d areca,1

smartctl 7.0 2018-12-30 r4883 [x86_64-w64-mingw32-2016] (sf-7.0-1)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi/HGST Ultrastar 7K2
Device Model:     HGST HUS722T1TALA604
Serial Number:    WMC6M0JAUEV8
LU WWN Device Id: 5 0014ee 00482c2ec
Firmware Version: RAGNWA07
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Jan 17 06:17:05 2019 CAST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   141   140   021    Pre-fail  Always       -       3933
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       15
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       34
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       10
 16 Gas_Gauge               0x0022   000   200   000    Old_age   Always       -       1822115874
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       6
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       9
194 Temperature_Celsius     0x0022   113   109   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

Interpretation der Parameter

Analysieren Sie die detaillierten Informationen, die Sie aufgerufen haben. Im ersten Abschnitt sind Informationen aufgeführt, mit denen Sie die Festplatte identifizieren können. In diesem Abschnitt werden z. B. das Gerätemodell, die Seriennummer und die Größe der geprüften Festplatte angezeigt.

 

Hinweis

Die aufgeführten SMART-Attribute sind Beispiele für ATA-/SATA-/SAS-Laufwerke. NVMes verwenden abweichende Gesundheitsparameter. 

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi/HGST Ultrastar 7K2
Device Model:     HGST HUS722T1TALA604
Serial Number:    WMC6M0JAUEV8
LU WWN Device Id: 5 0014ee 00482c2ec
Firmware Version: RAGNWA07
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Jan 17 06:17:05 2019 CAST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Im zweiten Abschnitt wird der aktuelle Zustand der Festplatte von smartctl beurteilt. Wenn nicht der Wert PASSED, sondern z. B. der Wert Failed oder UNKNOWN angezeigt wird, sollten Sie schnellstmöglich einen Austausch der betreffenden Festplatte veranlassen.

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Im dritten Abschnitt sind die ermittelten SMART-Werte detailliert aufgeführt. Neben jedem aktuellen, prozentualen Wert (VALUE), sind der schlechteste, jemals gemessene Wert (WORST) und der jeweilige Grenzwert (THRESH) aufgeführt. Wenn der aktuelle, prozentuale Wert (VALUE) oder der schlechteste, jemals gemessene Wert (WORST) den Grenzwert (THRESH) überschreiten, wird in der Spalte WHEN_FAILED eine SMART-Warnung angezeigt (z. B. FAILING_NOW).

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   141   140   021    Pre-fail  Always       -       3933
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       15
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       34
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       10
 16 Gas_Gauge               0x0022   000   200   000    Old_age   Always       -       1822115874
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       6
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       9
194 Temperature_Celsius     0x0022   113   109   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

Folgende Parameter können auf einen drohenden Festplattenausfall hinweisen, bevor eine SMART-Warnung angezeigt wird:

Reallocated_Sector_Ct: Dieser Parameter gibt die Anzahl der Sektoren an, die aufgrund von Lesefehlern bereits neu zugeteilt wurden. Wenn ein Sektor nicht mehr korrekt gelesen, beschrieben oder geprüft werden kann, weist der Controller ihm automatisch einen Ersatzsektor aus dem Reservebereich der Festplatte zu. Der ursprüngliche, fehlerhafte Sektor wird permanent als defekt markiert und nicht mehr verwendet.
 

Hinweis

Ein Wert größer als Null ist nicht zwangsläufig ein Grund zur Sorge, sofern er über einen langen Zeitraum stabil bleibt. Ein kritischer Indikator für einen bevorstehenden Festplattenausfall ist jedoch eine stetig wachsende Anzahl neu zugewiesener Sektoren. Um einen Defekt frühzeitig zu erkennen, sollten Sie diesen Wert daher regelmäßig protokollieren und bei einem kontinuierlichen Anstieg umgehend den Austausch veranlassen.

Current_Pending_Sector_Ct: Gibt die Anzahl der instabilen Sektoren an, die auf ein Remapping warten. Wenn ein Sektor nicht korrekt gelesen und beschrieben werden kann, erhält er zunächst den Status Current Pending Sector. Der Sektor wird in diesem Zustand nicht neu zugeteilt, da die auf dem Sektor liegenden Daten unbekannt sind. Erst nach mehreren erfolglosen Lese- bzw. Schreibversuchen wird ein Ersatzsektor zugewiesen und der fehlerhafte Sektor wird permanent als nicht lesbar markiert. Der Wert Current_Pending_Sector_Ct ist ein wichtiger Indikator für einen Festplattenaustausch. Wenn dieser Wert ungleich null ist, steht oftmals ein Festplattenausfall bevor.

Offline_Uncorrectable: Gibt die Anzahl der nicht korrigierbaren Fehler beim Schreib- und Lesezugriff auf Sektoren an.

Der letzte Abschnitt befasst sich mit dem festplatteninternen Log. Hier werden Fehler festgehalten, wenn die Arbeitsaufträge des Servers von der Festplatte nicht ordnungsgemäß abgearbeitet wurden. Wenn in diesem Abschnitt eine mindestens zweistellige Fehlerzahl angezeigt wird, sollten Sie schnellst möglich einen Austausch der Festplatte veranlassen.

SMART Error Log Version: 1
No Errors Logged
Alternative zu smartctl

Wenn mit smartctl keine Informationen aufgerufen werden können, passen Sie den folgenden Befehl an und geben Sie diesen anschließend ein:

Broadcom:

storcli64 /c[Controller-Nummer]/e[Enclosure-ID]/s[Slot-ID] show smart

Beispiel:

storcli64 /c0/e16/s4 show smart

Dell:

perccli64 /c[Controller-Nummer]/e[Enclosure-ID]/s[Slot-ID] show smart

Beispiel:

perccli64 /c0/e16/s4 show smart

Log-Dateien aufrufen

Informationen bezüglich des Aufrufs der Log-Dateien entnehmen Sie bitte der Dokumentation des jeweiligen herstellenden Unternehmens.

Areca
http://areca.starline.de/RaidCards/Documents/Manual_Spec/Software

3ware (jetzt Broadcom)
http://www.3ware.com/support/userdocs.asp

Adaptec (jetzt Microchip)
https://storage.microsemi.com/en-us/support/

Dell
https://www.dell.com/support/home/en-us

Broadcom
https://www.broadcom.com/products/storage/raid-controllers/

Festplattentausch vorbereiten

Detaillierte Informationen für den Festplattenaustausch aufrufen

Damit ein Austausch der defekten Festplatte veranlasst werden kann, werden folgende Informationen benötigt:

  • Bezeichnung der Festplatte im RAID

  • Seriennummer

  • Modell

  • Log-Datei (optional)

 

SMART-Log erstellen

Mit den unten aufgeführten Befehlen erzeugen Sie ein vollständiges SMART-Log:

ARECA-Systeme:

  • Festplatte 1: Verwenden Sie den Befehl smartctl -x /dev/sg1 -d areca,1

  • Festplatte 2: Verwenden Sie den Befehl smartctl -x /dev/sg1 -d areca,2

LSI- / 3Ware-Systeme:

  • Festplatte 1: Verwenden Sie den Befehl smartctl -x /dev/twe0 -d 3ware,0

  • Festplatte 2: Verwenden Sie den Befehl smartctl -x /dev/twe0 -d 3ware,1

Adaptec-Systeme:

  • Festplatte 1: Verwenden Sie den Befehl smartctl -x /dev/sg2 -d sat

  • Festplatte 2: Verwenden Sie den Befehl smartctl -x /dev/sg3 -d sat

  • Festplatte 3: Verwenden Sie den Befehl smartctl -x /dev/sg4 -d sat

  • Festplatte 4: Verwenden Sie den Befehl smartctl -x /dev/sg5 -d sat

Dell-Systeme:

  • Festplatte 1: Verwenden Sie den Befehl smartctl -x -d sat+megaraid,0 /dev/sda

  • Festplatte 2: Verwenden Sie den Befehl smartctl -x -d sat+megaraid,1 /dev/sda

Broadcom-Systeme:

  • Festplatte 1: Verwenden Sie den Befehl smartctl -x -d sat+megaraid,0 /dev/sda

  • Festplatte 2: Verwenden Sie den Befehl smartctl -x -d sat+megaraid,1 /dev/sda

Hinweise

  • Wenn das SMART-Log wie oben beschrieben erstellt wurde, reicht dieses als Information aus.  Anschließend können Sie den Austausch der defekten Festplatte veranlassen. Kontaktieren Sie hierzu bitte den IONOS Kundenservice.

  • Wenn Sie die Seriennummer der defekten Festplatte nicht mittels smartctl aufrufen können, können Sie dem Kundenservice alternativ die Seriennummer der funktionierenden Festplatte(n) nennen.

  • Wenn Sie die für den Austausch erforderlichen Informationen nicht ermitteln können und einen Austausch der Festplatte wünschen, muss die Hardware vor dem Austausch geprüft werden. Während dieser Prüfung ist der Server in der Regel temporär nicht erreichbar. Wenn im Rahmen dieser Prüfung ein Defekt der Festplatte festgestellt wird, wird diese ausgetauscht.

Festplattenaustausch veranlassen

Anschließend können Sie den Austausch der defekten Festplatte veranlassen. Kontaktieren Sie hierzu bitte den IONOS Kundenservice. Die Kontaktinformationen finden Sie auf der folgenden Seite: IONOS Kundenservice

Erforderliche Schritte nach dem Austausch der Festplatte

Nach dem Austausch der defekten Festplatte startet der Rebuild des RAID-Systems in der Regel automatisch. Bitte prüfen Sie, ob der Rebuild des RAID-Systems gestartet und erfolgreich durchgeführt wird. Überwachen Sie hierzu den Fortschritt mit dem Controller-Tool: 

Broadcom:

storcli64 /c0 /eall /sall show rebuild

Dell:

perccli64 /c0 /eall /sall show rebuild

Weitere Informationen zur Überwachung von Hardware-RAIDs finden Sie im folgenden Artikel: Hardware-RAID überwachen / wiederaufbauen (Linux)