fbpx

Poškozený RAID a 5x Seagate ST3000DM001 - the morning croissant breakfast

Záchrana dat z RAID může být komplikovaná. Uvádíme jeden z příkladů.

 

Problémy s disky Seagate ST3000DM001 kolega jednou nazval “Seagate DM - the morning croissant breakfast” a od té doby tyto případy označujeme SCS (Seagate Croissant Scenario). A v případě řešeného RAID jsme museli pracovat hned s 5, respektive 7 croissanty Seagate DM.

Každý odborník na záchranu dat se s tím někdy setkal - zhavarovaný RAID, urgentní potřeba obnovy dat, ale klient se nejdříve pokoušel poškozený RAID opravit svépomocí a výsledkem bylo přeházené pořadí disků. Scénářů tohoto typu je v oblasti záchrany dat nesčetně a pokud je takový scénář zkombinovaný s několika disky Seagate ST3000DM001, nebo podobnými s označením xxxxxxDMxxx, někdy už může být záchrana dat nemožná a klient tím mohl přijít i o několik let práce uložených v poli RAID.

V tomto konkrétním případě bylo v NAS použito 5 disků Seagate ST3000DM001, RAID 6, tedy 2 disky mohly zhavarovat a data by byla stále dostupná. K dispozici jsme měli i 2 již dříve vyměněné disky, též se jednalo o model Seagate ST3000DM001. Klient se patrně při dřívějších hlášeních NAS o vadných discích pokoušel obnovit funkčnost NAS svépomocí, kdy pravděpodobně byl do jedné pozice vložen disk, který již dříve vykazoval nějaké vady, nebyl ale ještě zcela nefunkční.

V případě, že NAS nebo server hlásí 1 nebo dokonce více disků nefunkčních, je potřeba je okamžitě vyměnit za nové, aby se RAID dopočítal a zařízení mohlo bezchybně pokračovat v práci. To se bohužel při posledním varovném signálu NAS nestalo, varování o havarijním stavu byla ignorována a podle zákonů schválnosti došlo k selhání dalšího disku. Data tedy byla zcela nedostupná.

Dalo by se to téměř nazvat „všehochuť Seagate DM croissantů“, protože zde bylo možné si vyzkoušet záchranu dat jak z hardwarově poškozených disků Seagate ST3000DM001, tak softwarově poškozených (poškozená servisní oblast) a jeden z disků měl i vadnou PCB. Všechny nejběžnější vady těchto disků Seagate v rámci jednoho případu, a to celé zpestřené o zjišťování, kdy který disk přestal fungovat a v jaké pozici v RAID, se v té době nacházel.

S RAID máme mnohaleté zkušenosti a úspěšnost obnovy dat z RAID více, jak 90%. Přesto se některé případy vyřešit nedají, ač snaha našich techniků nikdy nekončí konstatováním: „Tohle je moc těžké, na dlouho, s velkými náklady, malou šancí, tak to odpískáme“ a na případu pracují, dokud si nejsou absolutně jisti, zda vyřešit půjde nebo nepůjde. 

Tedy jako u všech jiných případů, i zde jsme věnovali veškeré úsilí obnově dat z naposledy použitých 5 disků. Bohužel 3 z nich byly poškozeny natolik závažně, že data obnovit nešla a jelikož NAS byla v konfiguraci s použitým RAID 6, při třech nefunkčních a neobnovitelných discích, by již data byla nadobro ztracena. 

Malá šance zde ovšem byla, protože jsme měli k dispozici i 2 disky, které selhaly již dříve. Jeden z nich měl vydřený povrch a šance na záchranu dat byla nulová. Z konfiguračních souborů NAS jsme ovšem věděli, že tento disk by nám stejně byl k ničemu, protože jeden z již obnovených disků byl jeho novější verze (nahradil v minulosti tento disk při selhání). A tak tu byla poslední malá šance. Disk číslo 7 - Seagate ST3000DM001, cvaká, žádnou softwarovou úpravou ROM se nepodařilo získat přístup k servisní oblasti disku, ani k uživatelským datům.

Po vyjmutí čtecích hlav disku a jejich prozkoumání pod mikroskopem bylo zřejmé, že hlava č. 2 je poškozená. K takovémuto poškození nejčastěji dochází, když je v některé části ploten disku poškozen jejich povrch (výrobní vada, náraz...) a následně při normální práci disku, kdy se čtecí hlavy pokouší z povrchu číst, dochází k postupné degradaci hlav. Zejména právě u některých modelů Seagate následně dojde i k totální likvidaci povrchu, kdy ve výsledku je svrchní ochranná vrstva ploten “rozemleta na prach” a samozřejmě následuje datová vrstva. Tak či tak, v tomto případě by byl s diskem konec. 

Přes všechny shody událostí, které vedly k nepřístupnosti dat na této NAS, se nám opakovaným čištěním čtecích hlav podařilo získat přístup k datům a po delším čtení za pomoci specializovaných hardwarových a softwarových nástrojů jsme data z tohoto posledního disku Seagate ST3000DM001 zachránili.

Následovala rekonstrukce RAID, kdy vzhledem k tomu, že poslední zachráněný disk zhavaroval asi o měsíc dříve a při čtení se vyskytlo několik chyb, tak data nebyla zcela kompletní a v poslední verzi, ale i tak se podařilo drtivou většinu dat zachránit a klient byl maximálně spokojený.

Na závěr nezbývá než doporučit: zálohujte důležitá data, žádný RAID ani jiné datové médium samo o sobě negarantuje 100% bezpečnost uložených dat, pouze snižuje šanci jejich ztráty.

Pokud se vám stala podobná nepříjemnost, kontaktujte nás a objednejte bezplatnou diagnostiku.

Tento web využívá k poskytování služeb cookies. Používáním tohoto webu udělujete souhlas s využitím cookies.