監視・保守体制

サーバールームSPPDの専用サーバーは監視・保守体制を重視しており、24時間365日有人体制でのサーバー死活監視を行っております。サーバーのダウン時には24時間365日対応にて復旧の作業を行います。

サーバーが収容されているNTTPCデータセンターには、UPS(無停電電源装置)が設置され、ガスタービンにより給油無しで48時間給電できる自家発電設備を完備、震度7クラスの地震にも耐えうる免震設備も完備しています。

オプションで、バックアップや RAID1構成(スマート・エントリーコース以外)を行うこともできますので、不慮の事故による損失を最小限におさえることができます。

24時間365日体制での有人監視体制

● 5分毎の Pingによる死活監視
Pingによる死活監視のイメージ外部からのPingによる監視を5分毎に行います。Pingの反応が無かった場合は、アラームが発生し、24時間365日体制でのサーバーのリセット等の復帰作業を行います。
障害を検知した時点で、登録先のメールアドレス宛てに障害検知の通知を致します。また、復旧時にも同様に通知を致します。
● 5分毎に各TCPポートの死活監視
各TCPポートの死活監視のイメージ外部からの smtp / http / ftp / https の主要4種のTCPポートの死活監視を5分毎に行います。2回連続でTCPポートからの反応が無かった場合は、アラームが発生し、24時間365日体制での障害復帰作業を行います。
なお、TCPポートの監視は、スマート・エントリーコースでは有償オプションです。
● プロセス監視と自動復帰システム(OSがLinuxの場合のみ)
プロセス監視のイメージサーバー内に postfix (sendmail) / httpd / xinetd / PostgreSQL / MySQL / ssh / syslog など主要なアプリケーションのプロセスの自動監視・復帰システムを導入済です。これにより、プロセスがダウンした場合は、自動的にサーバー自身がプロセスの再起動を試みます。
● 依頼ベースのリブート
リブートのイメージ24時間365日体制にて、お客様からのPC/携帯から依頼ベースのリブートを受け付けております。 遠隔でサーバーへログインできる場合は、ソフトウェアリブート (rebootコマンド)を、ログインできない場合は、ハードウェアリブート (電源ボタンのOFF/ON) を行います。

お客様がRoot権限を所有されている場合、Ping監視と依頼ベースのリブートのみのご提供となります。

OSがWindows系のサーバーの場合は、プロセス監視と自動復帰システムのご提供はありません。

障害時、復旧作業の流れ

SPPDレンタルサーバーでは、以下の手順に沿って、障害発生時には万全の体制で復旧作業を行います。この復旧作業はすべてのコースで標準提供されるサービスです。

遠隔保守(ネットワーク監視センターでの作業)

  1. 監視システムが障害を検知した場合はアラームが発生し、ネットワーク監視センターにて遠隔保守(Ping監視で障害を検知した場合は、即時にハードウェアリブート)の手続きが開始されます。また、弊社とお客様宛にEメールで障害発生通知が届きます。【所要時間 20分程度】
  2. 遠隔保守で復旧しない場合、ハードウェアリブートの手続きが開始されます。【所要時間 40分程度】

オンサイト保守(データセンター作業)

  1. ハードウェアリブートで復旧しない場合、ネットワークセンターの担当者が現地データセンターに向かい復旧作業を行います。【所要時間 2-5時間程度】
  2. 現地作業で復旧しない場合、代替機の準備(OSインストール)を開始します。代替機は弊社データセンター内に設置してある予備機を使用します。なお、HDDのみの障害であった場合で、予備の同型HDD保守部品がすぐにご用意できた場合は、HDDのみの交換作業を行います。【所要時間 2時間程度】
  3. 代替機に各種アプリケーションのインストールを行います。【所要時間 Linuxで2時間程度、Windowsで6時間程度】
  4. 本番機データ抽出が可能な場合、データを抽出しデータを移動します。【所要時間 1時間-6時間程度】
  5. 本番機の不良部品を交換します。HDDの故障の場合は、OSと各種アプリケーションのインストール、および初期設定を行います。【所要時間 1〜3営業日】
  6. 本番機へデータを戻して復旧となります。本番機への切り戻しは、平日営業時間内(11:00-17:00)の作業となります。(データ抽出が可能だった場合) 【所要時間 15分〜6時間】
  7. データが抽出できない場合は、有償のオプションとして専門のサルベージ業者に委託して、可能な限り復元することも可能です。 【所要時間 2日〜14日】

復旧後のご報告

  1. サーバーの復旧が確認出来ましたら、即時に障害の原因調査を開始します。また、弊社営業時間内に発生した障害の場合は、お客様に復旧の旨をメールにてご連絡致します。
  2. 障害の原因が判明次第、お客様向けの障害報告書を作成します。障害報告書には、「障害発生日時」「対象サーバー」「影響の出たサービス」「障害の原因」「障害中の対処作業の時系列」「原因に対する対処と対策」を記載します。なお、弊社営業時間外に発生した障害の場合は、翌営業日でのご報告となります。