Používání NAS je velmi pohodlné - data jsou dostupná odkudkoli, více uživatelů může pracovat současně a díky RAID 5 máte navíc pocit jistoty, že při výpadku jednoho disku o data nepřijdete. RAID 5 ukládá data rozloženě se započítanou paritou, takže dokáže dopočítat chybějící obsah. V praxi to však neznamená stoprocentní jistotu. Někdy nemusí vše běžet podle ideálního scénáře, a celé pole se zhroutí.
Časté příčiny selhání diskového pole v NAS
Fyzické selhání jednoho či více disků - nejčastější příčina výpadku RAID pole. Disky v NASu běží nepřetržitě 24/7 a mají vyšší tepelnou i mechanickou zátěž. Postupem času se objevují vadné sektory, hluk ložisek nebo problémy s elektronikou. Pokud selže jeden disk v RAID 5, pole by mělo fungovat dál, ale při selhání druhého disku už data obvykle nejsou dostupná.
Náhlé ATA nebo SMART chyby - i disk, který vypadá na první pohled zdravě, může začít hlásit chyby v komunikaci – tzv. ATA errors. Podobně SMART atributy dokážou odhalit vadné sektory nebo nestabilní povrch datových ploten. Tyto chyby způsobí, že NAS označí disk jako vadný, i když ještě fyzicky funguje, a vyřadí ho z pole.
Neúspěšný rebuild po výměně disku - při výměně disku NAS spustí rebuild – přepočítávání parity a znovuvytváření dat. Pokud se v průběhu objeví chyba (vadný nový disk, přerušení napájení, chyba zápisu), rebuild se nedokončí a celé pole může selhat. To je ostatně příčina selhání i této NAS Netgear.
Porucha řadiče nebo napájení v samotném NAS - selhat nemusí jen disky. Vadný RAID řadič, napájecí zdroj nebo firmware NASu mohou způsobit nedostupnost pole. V takovém případě jsou disky fyzicky v pořádku, ale NAS je neumí správně načíst.
Poškození souborového systému (např. Btrfs nebo EXT4) - i když je RAID sestavený správně, stále může být problém v souborovém systému. Stačí výpadek proudu v nevhodný okamžik, selhání zápisu nebo chybný disk a Btrfs či EXT4 se dostanou do nekonzistentního stavu. Uživatel pak nevidí žádná data, i když jsou fyzicky na discích přítomná.
Snaha o zvětšení kapacity diskového pole vedla k jeho selhání
Uživatel této NAS Netgear se rozhodl postupně nahradit původní 3TB disky novými 6TB modely. Vyměnil jeden disk, nechal pole dopočítat, vyměnil druhý disk, nechal pole dopočítat atd. Problém nastal ve chvíli, kdy nově vložený 6TB disk selhal. NAS začal hlásit chyby disku (ATA errors) a diskové pole se zhroutilo.
Nicméně proti selhání jednoho disku by měl RAID 5 být odolný. Při pozdější rekonstrukci pole vyšlo najevo, že i další disk byl z pole vyřazený. Příčina není zcela zřejmá, protože disk samotný testem prošel, žádné chyby nevykazoval.
Při analýze jsme zjistili, že každý disk obsahoval více oddílů – systémové, swap a dvě velké RAID oblasti. Původní data byla stále na první RAID části (~2,7 TB), zatímco nově vytvořená oblast na 6TB discích byla nedokončená.
ReadyNAS nepracuje s RAIDem úplně standardně. Místo klasického „jednoho“ pole RAID 5 využívá vlastní technologii X-RAID, která disky rozděluje na několik částí (tzv. zones). Každá zóna má vždy velikost podle nejmenšího disku v poli. Pokud je do NASu vložen větší disk, ReadyNAS zachová kompatibilitu tím, že využije pouze část odpovídající menším diskům. Zbylá kapacita se oddělí do nové zóny a vytvoří se z ní další RAID 5, který se následně logicky připojí k tomu původnímu. Proto se na 6TB discích objevily dva RAID oddíly – první, shodný s původními 3TB disky (~2,7 TB), a druhý, připravený pro rozšíření kapacity. V tomto konkrétním případě ale nová oblast nebyla nikdy plně sestavena, protože k jejímu dokončení chyběly další disky stejné velikosti. V metadatech se tak objevovali členové navíc a celé pole se stalo nedostupným.
To způsobilo menší komplikace při rekonstrukci diskového pole. Dále byl poškozený i souborový systém Btrfs. Po vyloučení „vadného“ disku a dohledání správných superbloků Btrfs se podařilo obnovit kompletní adresářovou strukturu a data byla zpět.
Jak ztrátě dat z NAS / RAID předejít
RAID není záloha. Výměna disků a rozšiřování pole vždy nese riziko.
Nepokoušejte se o opakované rebuildy s vadným nebo neověřeným diskem - riziko poškození dat roste.
Používejte kvalitní a shodné disky, ideálně doporučené výrobcem NAS.
Pravidelně zálohujte důležitá data mimo NAS – na jiný disk, cloud nebo externí úložiště. Nikdy nedůvěřujte NASu jako jediné záloze.
Při selhání NAS kontaktujte odborníky na obnovu dat - domácí neodborné pokusy mohou vést ke zhoršení stavu disků nebo celého pole.
RAID 5 v NAS může působit bezpečně, ale i jediná chyba při výměně disku dokáže způsobit úplnou nedostupnost dat. V tomto případě byl problém způsoben selhávajícím novým 6TB diskem, který zastavil rebuild a poškodil konzistenci pole. Díky specializovaným postupům jsme ale data z Netgear ReadyNAS dokázali získat zpět.








