ベアメタルサーバのハードウェア障害と復旧対応

対象リージョン:東日本第3/西日本第3

お客様が使用しているベアメタルサーバで、ハードウェア障害が発生した場合の復旧対応について説明します。

ハードウェア障害と復旧対応

お客様が使用しているベアメタルサーバでハードウェア障害が発生した場合、富士通は以下を実施します。

  • 障害の検知
  • 障害発生を通知
  • 復旧作業

復旧対応は、故障個所、OS稼働状態、および活性保守可否によって対応パターンが異なります。

表 1. ハードウェア障害箇所復旧対応フロー
ハードウェア障害箇所 OS稼働状態 活性保守可否 復旧対応パターン
iRMC 稼働 非活性 パターン1
iRMCを除くサーバ内部パーツ 稼働 活性 パターン2
稼働 非活性 パターン3
障害により停止 非活性 パターン4

復旧対応

復旧対応パターンの詳細は以下のとおりです。

表 2. 復旧対応パターン1
  作業 役割分担 備考
お客様 富士通
ステップ1 障害検知    
ステップ2 障害発生通知  
  • iRMC障害であり、OS状態やハード異常を検知できない状態である旨を通知
  • 復旧にはサーバ停止が必要なため、保守希望日時の指定および事前のサーバ停止を依頼
ステップ3 復旧希望日時のヘルプデスクへの通知およびサーバの事前停止    
ステップ4 復旧対処    
ステップ5 復旧通知    

表 3. 復旧対応パターン2
  作業 役割分担 備考
お客様 富士通
ステップ1 障害検知    
ステップ2 障害発生通知  
  • 障害が発生しているが、活性保守が可能である旨を通知
ステップ3 復旧対処    
ステップ4 復旧通知    

表 4. 復旧対応パターン3
  作業 役割分担 備考
お客様 富士通
ステップ1 障害検知    
ステップ2 障害発生通知  
  • 障害が発生しており、活性保守は不可である旨を通知
  • 復旧にはサーバ停止が必要なため、保守希望日時の指定および事前のサーバ停止を依頼
ステップ3 復旧希望日時のヘルプデスクへの通知およびサーバの事前停止    
ステップ4 復旧対処    
ステップ5 復旧通知    

表 5. 復旧対応パターン4
  作業 役割分担 備考
お客様 富士通
ステップ1 障害検知    
ステップ2 障害発生通知  
  • 障害が発生しており、OSも停止中である旨を通知
  • 復旧完了までお客様側でサーバ起動を実施しないよう依頼
  • 復旧完了後、サーバは起動状態となる旨を通知
ステップ3 復旧対処    
ステップ4 復旧通知