RAID Admin: イベントログの Logical Block Address (LBA) エラーについて

Xserver RAID のイベントログに、Logical Block Address (LBA) に関するエラーメッセージが表示される場合があります。読み込みまたは書き出し処理が成功しないと、Xserver RAID は LBA エラーメッセージを記録します。

通常、これらの処理の成功しない原因は次のいずれかです。

対象ドライブのランプがオレンジもしくは赤色

Xserve RAID のドライブが物理的に信頼性がない場合、Apple Drive Module は緑色からオレンジもしくは赤色の点灯に変わります。この場合には Apple Drive Module の交換が必要です。AppleCare にお問い合わせください。注意:Apple Drive Module が“再構築中”である間、ドライブのステータスランプが緑色とオレンジで交互に点灯していないか注意してください。これは普通のことです。

Xserve RAID に挿入した時、他の RAID セットの一部に以前なっていた Apple Drive Module がオレンジに点灯するのは普通のことです。以前の RAID セットの情報を削除し、 Apple Drive Module を現在の RAID セットで使用できるようにするには、「RAID Admin」で「ドライブを使用できるようにする」を使用する必要があります。この機能は「RAID Admin」バージョン 1.5 以降(ファームウェアのバージョン 1.5 以降)にある「ユーティリティ」タブにあります。この手順には「RAID Admin」バージョン 1.5 以降が必要です。

対象ドライブが使用できない

Xserve RAID がディスクと通信できない場合、次のようなエラーメッセージがイベントログに表示されることがあります:

Warning Upper Controller 06/18/07 02:50:44 PM Disk 13 Failed To Respond. Retrying. RETRY COUNT:0 LBA:0x507600

該当する Apple Drive Module を新品と交換する場合は、どの物理ディスクを交換する必要があるか判断しなければなりません。このためにイベントログのエラーメッセージを参照します。対象ディスクは 1 〜 14 の値で示されます。この数字は、左から順に Apple Drive Module の位置を示します(一番左が 1)。たとえば、上の例では「Disk 13」が応答しなかったドライブです。これは、左から 13 番目のドライブを示します。このドライブを交換する必要があります。Apple Drive Module の交換が必要な場合は、AppleCare にお問い合わせください。

ドライブのターゲットブロックが「不良」

「不良ブロック」は、確実な読み書きができなくなったブロックです。ハードドライブに不良ブロックが生じるのは普通のことで、特に Apple Drive Module の動作時間が長くなると生じます。不良ブロックが見つかると、RAID コントローラはこの不良ブロックへのアクセスを 5 回試み、5 回ごとに次のイベントを記録します。

Warning Upper Controller 06/18/07 02:50:44 PM Disk 4 Reported An Error. COMMAND:0x25 ERROR:0x40 STATUS:0x51 LBA:0x91E6980

不良ブロックがあると、Apple Drive Module はこの不良ブロックを無効にし、予約済みのスペアブロックに置き換えます。予約済みのスペアブロックがある限り、不良ブロックは予約済みのスペアブロックに置き換えられます。すべての予約済みのスペアブロックが使用されると、Apple Drive Module は不良ブロックを予約済みブロックに置き換えません。Apple Drive Module が JBOD のメンバーであるか RAID セットのメンバーであるかによって、Apple Drive Module の信頼性の有無が判断されます。

  • RAID のメンバーである Apple Drive Module:
    Apple Drive Module が RAID セットのメンバーである場合、使用可能な予約済みブロックがなくなった Apple Drive Module は信頼性があると判断されます。これは、Xserve RAID が、不良だが予約済みのスペアブロックに交換されていないとわかっているブロックへの書き込みを避けるためです。しかしながら、不良ブロックがあると、 RAID コントローラは不良ブロックを予約済みブロックにマップする必要があり、その作業は通信を一時停止します。したがって、作業中に通信が途切れないように、先を見越して RAID のドライブの不良ブロックを再配置してマップするために「RAID Admin」>「アレイのバックグラウンド調整」を使用することができます。

    以下の手順で「アレイのバックグラウンド調整」を実行します:
    1. 「RAID Admin」を起動し、RAID のリストから Xserve RAID を選択します。
    2. 「ユーティリティ」ボタンをクリックします。
    3. 「アレイのバックグラウンド調整」を選択します。
    4. 調整するアレイを選択します。
    5. 優先順位を選択し、RAID コントローラの帯域を調整プロセスにどのくらい割り当てるか設定してください。 
      (優先順位をより高く設定すると、より多くのRAID コントローラのリソースが調整プロセスに割り当てられ、標準の RAID 機能のパフォーマンスは低下することに注意してください。)
    6. 「調整を開始」をクリックします。

  • JBOD のメンバーである Apple Drive Module:
    Apple Drive Module がJBOD のメンバーである場合、使用可能な予約済みブロックがないドライブは、データの読み書きの信頼性がないと判断されます。不良ブロックが予約済みのスペアブロックと交換可能であることを確認するには、使用可能な予約済みスペアブロックの有無を判断する必要があります。次のいずれかの方法を使用して、使用可能な予約済みスペアブロックの有無を判断します。

    Apple Drive Module がすべての予約済みスペアブロックを使用したことを確認するには、dd コマンドを使用して不良ブロックからデータを読み取ります。

    注意:次の手順は、エラーメッセージが表示されたときに JBOD ディスクに書き込んでいたコンピュータで実行してください。エラーメッセージが表示された後にコンピュータを再起動した場合は、実行しないでください。対象デバイスを示すデバイス識別子が再起動中に変わっています。

    次の手順に従って不良ブロックからデータを読み込みます:
    1. 次の手順で、対象の Apple Drive Module が対応している OS デバイスを判断します:
      問題が発生したときに対象の JBOD にアクセスしていたコンピュータで、Xserve RAID イベントログから、LBA エラーメッセージのタイムスタンプに対応するシステムログのエントリを読み取ります。たとえば、Xserve RAID イベントログのタイムスタンプが 6/18/07 2:50:44:44 PM の場合、システムログの同じタイムスタンプにアクセスします。次のようなログエントリが見つかるはずです:

      Jun 18 14:52:05 hostname kernel[0]: disk8: I/O error

      このログエントリは、OS が対象の Apple Drive Module を Disk 8 として分類したことを示します。

    2. LBA 値を 16 進数から 10 進数に変換します。 
      このために、「ターミナル」で次のコマンドを使用します:

      $ printf "%d\\n\\n" [LBA_Value]

      ここで LBA_value はエラーメッセージに示されている 16 進数の値です。たとえば、値が 0x1777CD00 と報告される場合は次のコマンドを使用します。

      $ printf "%d\\n\\n" 0x1777CD00

      このコマンドを使用すると次の 10 進数が得られます:393727232

    3. dd コマンドを使用して対象ブロックからデータを読み取ります。

      $ dd if=/dev/[device] of=/dev/null skip=[decimalValue] count=10

      ここで [device] は手順 1 で得られた値、[decimalValue] は手順 2 で得られた値です。

      ブロックからの読み取りを試みた場合にエラーメッセージが表示されなければ、不良ブロックは予約済みのスペアブロックに正しく置き換えられています。ただし、コマンドを実行した結果、次のようなエラーメッセージが表示される場合は、使用可能な予約済みスペアブロックはありません。

      dd: /dev/disk8: Input/output error

    4. Apple Drive Module の予約済みスペアブロックを使い切ったと判断し、新しい Apple Drive Module と交換する場合には、どの物理ドライブを交換すべきかを判断する必要があります。 

      このためにイベントログのエラーメッセージを参照します。対象ディスクは 1 〜 14 の値で示されます。この数字は、左から順にドライブの位置を示します(一番左が 1)。たとえば:

      Warning Upper Controller 06/18/07 02:50:44 PM Disk 12 Reported An Error. COMMAND:0x25 ERROR:0x40 STATUS:0x51 LBA:0x91E6980

      この例で、エラーメッセージを報告したドライブは「Disk 12」です。これは、左から 12 番目のドライブを示します。この Apple Drive Module を交換する必要があります。

Apple Drive Module の交換が必要な場合は、AppleCare にお問い合わせください。

公開日: