パソコン・メモメモ備忘録

気の向くままパソコン関係等で気になることを書き記す。時々更新!

Adaptec RAID の復旧

先の記事に書いたように職場で使っていたPCは色々ダメージを受けた。その中に AdaptecRAID カード(AAR-2410SA)に 250GB SATA の HDD が3台つながって RAID5 (ファイルシステムLinux ext3)を構成していたPCがあった。HDD 1台はほぼ正常に動いていたのだが、残り2台はモータも回らない状態。1台はしばらくするとモータが回るようになって*1、一瞬中のデータが見えたこともあったのだが、しばらくするとモータは回ってもデータは見えない状態に。とっかえひっかえしてみたが二度とデータは見えず。

そこで、弊社社長の案で、HDD の基板だけ取り替えようということになった。しかし、社内に同型の HDD は無かった。そこは大胆すぎる某社長、同メーカで違う型番の基板と取り替えてしまった。当然ながらまともには稼動せず。

そこで日本橋へ使者を送った。ソフマップで同型の中古 HDD、製造時期もかなり近いものを2台もGET! 怪しい2台の HDD の基板を交換。モータも無事回り、RAID カードは3台の HDD を認識し、それらが同じ RAID ボリュームを構成していることも認識した!! だが、RAID ボリュームは FAILED 状態。ボリュームを構成する物理 HDD のリストの HDD 名がグレーになってしまっている(当初は、少なくとも正常な1台は白く表示されていた)。

RAID カードの BIOS 設定画面を色々調べてみると、Enable/Restore RAID というコマンドが。ただ、コマンドを選択すると、注意書きがでて Y/N を聞いてくる。注意書きの最後には、「永久にデータが失われるかもしれません(原文は英語。意訳)」との言葉が。

とりあえず、各 HDDに対して RAID カードの BIOS で、Verify を行った。Verify が通ってない HDD がある状態で、上記コマンド実行はかなりやばいらしいという情報があったためだ。最初は、基板交換前に一度もモータが回らなかった HDD で、Verify がエラー終了したのだが、しばらくしてもう一度やってみると、Verify が通った。

これでもう、あのコマンド以外には、できることは無くなった。いちかばちか、百数十GBytes のデータ達の運命は、この一瞬にかかっているのだぁ.... と祈りをこめて気合をいれて Y を押した!!!

一瞬のうちに RAID が FAILED から OPTIMAL に。RAID ボリュームが復活した。CentOS 5 を起動すると、RAID カードをデフォルトで認識して、勝手にマウントしてくれた。あとは、別のディスクへ急いで丸ごとコピーだ。特にエラーも無くコピーは完了した。データが狂っていないかは、もう少し調査の必要があるが、ほぼ復活を遂げたと言ってもいいだろう。

多分、起動時におかしかった HDD は、使えない HDD としてフラグが立てられていたのでは無いだろうか。上記コマンドはこのフラグをクリアするだけかと。RAID を操作するメニューに入る際に、RAID の構成が変わったことを受け入れる(Accept)かそうでないか(Reject)を聞いてくるのだが、ここは受け入れてはいけなかったのかもしれない。何度か受け入れてしまったため、フラグが立ったのかも。

今振り返ってみると、全てがわかっていれば、基板の交換なしでもデータの復活はできた可能性も。まぁ、結果オーライということで、今回はハッピーエンドでパチパチパチ。

*1:回るようになるきっかけは超危険なことをしたからだが..これは秘密