私たちが日常を送る上で当たり前のように使う水道や電気が止まると、瞬く間に生活がストップしますよね。
それらのような生活に不可欠なものが供給される経路や設備のことを「ライフライン」と呼びます。
企業活動においては情報ネットワークは非常に重要なライフラインです。
ネットワークが止まれば、取引先にメールが送れない、ネットで調べものができない、他拠点のサーバにアクセスできない、IP電話を使っている企業については電話もつながらなくなり、仕事が何も進まないという状況に陥るでしょう。
まさに命綱ですよね。
しかし、絶対に切れないLANケーブルや、絶対に故障しない機器、絶対に障害が起きないネットワーク網は現代には存在しません。
「100%止まらないネットワーク」は実現不可、情報システム担当者は「もしかしたら止まるかもしれないネットワーク」だという事を前提に構築を行わないといけません。
本日は社内ネットワーク構築で大事な冗長化についてお話したいと思います。

冗長化とは?その意味や必要性について?

まずは総務省が提言する情報セキュリティの3要素についてご紹介します。
総務省曰く、
「企業や組織における情報セキュリティとは、企業や組織の情報資産を「機密性」、「完全性」、「可用性」に関する脅威から保護することです。」
とのことです。

企業は政府から上記の3要素において、それを脅かす脅威から守るように言われているんですね。
冗長化はこの3要素のうちの可用性(Availability)の維持に有効な対策となります。
つまり、「冗長化」とは、機器やシステムの構成要素について、同じ機能や役割の要素をあらかじめ複数用意しておき、異状が発生した時に肩代わりできるよう待機させておくことを指します。
そうすることで、一部の機能が損なわれてもシステム全体が停止してしまうことを防ぎ、運用を継続することができます。
また、システムの持つそのような性質を「冗長性」(redundancy)といいます。
企業が事業を継続していく為には冗長性の高いシステム構築が必要不可欠でしょう。

ネットワークの冗長化とは?

「冗長性を脅かす脅威」と言われると、サイバー攻撃の事か?と思いませんか。
「うちはある程度セキュリティ対策もしているし、元より狙われるような企業じゃない」と考えた方はいないでしょうか?
冗長性を脅かす脅威は外部からの攻撃のみではありません。
トラフィック増によるサーバダウンやネットワーク機器故障、キャリア網障害による回線の通信断も、冗長性を脅かす脅威となり得るのです。
あらゆるところに原因要素があり、ひとつでも発動してしまえば業務が停止します。
全てに対応したいところですが、だからと言って全てを二重化・多重化しておくというのは、使わないかもしれないものに多額に投資するという事になりますよね。
そんな無駄はご免です。

しかし、一度想像してみましょう。例えばゲートウェイのUTMが故障したとします。
冗長構成がとられていない場合、新しいUTMを業者に手配して、設定を入れてつなぎなおして動作確認をしますが、これらは一日で終わる作業ではありません。
例えばそれに1週間かかるとして、1週間突然会社を休みにする事なんてできません。
また、3日でも1日でもゲートウェイのセキュリティ機能が停止する事のリスクは大きく、UTM復旧までの間に不正アクセスの侵入を許してしまった場合には更に損失は大きくなります。
自社の生産活動がストップする損失の他、取引先への損害賠償までとなったら…
想像しただけで冷や汗が止まりません。UTM故障の一件で突発的にいくらの出費があったでしょうか。
個人の事に置き換えると、大怪我をして入院や手術費用を払わなければいけない上に、仕事が出来なくて収入が途絶えては家族の生活に支障が出てしまう…。
もしもの時、取り返しのつかない事にならない為に保険に入りますよね。
冗長化の為の投資は、掛け捨ての保険と同じです。
後になってから、あの時こうしておけばよかった…と後悔しないようにしたいですね。

※UTM:「Unified Threat Management」の略。
和訳は「統合脅威管理」といい、コンピュータウイルスやハッキングなどの脅威からコンピュータネットワークを効率的かつ包括的に保護する管理手法。 ファイアウォール、VPN、アンチウイルス、不正侵入防御、コンテンツフィルタリング、アンチスパムなどの機能をセキュリティアプライアンスとしてゲートウェイ1台で処理ができる。

何を冗長化すればいいのか

それではどこに保険をかけるか?
ピアニストは自分の手に保険をかけたりするそうですが、それは「この手が故障する事は命を失う事と同じ」という考えがあるからでしょう。
同様に、自社にとってどこが壊れたら致命的かを検討していきます。
最重要ポイントから順に、ネットワーク上の単一障害点(SPOF:Single Point Of Failure)を払拭していく事を目指していきましょう。
逆の視点で言うと、致命傷とならないネットワーク停止はある程度許容し、可及的速やかに復旧できる運用を予め想定しておく事もひとつの方法と言えます。
ECサイトやゲームアプリ、オンライン株取引などのインターネット上でサービスを展開している業態の企業であれば、サービス提供が止まる事が致命傷となります。
サービス停止だけでなく遅延も許されない世界かもしれません。
近年ではインターネット上でサービスを提供していない企業でも、インターネットに繋がらなければ業務が全く出来ない状態になる企業が殆どですので、インターネットの出入り口の設備は冗長化をお薦めします。

冗長構成はどのように作るのか

冗長構成とは、同じ機能を持つシステムを2つ以上用意しておき、メインが異常をきたした際にサブを稼働させることでシステムそのものを動かし続ける構成のことです。
この時、メインとサブの切り替えが自動で行われるものをホットスタンバイと言います。
サブの方も、体あったまってるのでいつでも動けます!という状態です。
自動で切り替えるという事は、サブも常時ネットワークに繋がっている状態ということになりますが、電源数やラックの空きスペース、コストの兼ね合いで手動切替を選択する事もあると思います。
手動で切り替えが行われるものをコールドスタンバイと言います。
こちらは待機時に電源が入ってないので、文字通り体あったまってないので準備運動が必要です!
という状態で、メインとして動かす迄の間に必ずダウンタイムが発生します。
また、常に同期する事が出来るホットスタンバイと違い、コールドスタンバイは過去に入れた設定状態となっている為、運用の最中にメインにのみ設定変更を加えている場合は、設定内容にずれが生じてしまいます。

もしもの事が起こらなければ使うことのない保険(サブ)にお金をかけるのは勿体ないと感じる方もいるかもしれません。
どうせお金をかけるなら、サブも平常時から使ってしまおうという考え方もあります。
ホットスタンバイの方は、メインが稼働している間、サブに待機させている状態のアクティブ/スタンバイ構成と、メインもサブも平常時から稼働させておいて負荷分散をし、有事の際には故障していないいずれかに通信を集約させるアクティブ/アクティブ構成が存在します。
ホットスタンバイなアクティブ/アクティブ構成であれば、「使わない物に投資している」事はなくなる上に、平常時は高速レスポンスな、有事の際には止まらない通信が確立できます。

ちなみにクラウドサービスなんかは当然冗長構成になっているわけですが、複数のサーバを連携させて利用者側から見た時に全体のサーバが1台で構成されているように振舞うクラスタ構成をとっています。
障害のリスクに備えてクラスタリングをする事で可用性の高いシステムが構築されます。
サーバ運用においてのアクティブ/スタンバイ構成のことはHAクラスタ・HA構成などといい、アクティブ/アクティブ構成のことを負荷分散クラスタといいます。
もちろんクラウドサービスだけではなく、オンプレミスで多くの物理サーバを運用する企業はこのような構成になっていることでしょう。

まとめ

ユーザーにとって、ネットワークインフラは止まらない事が前提となりますが、冒頭お話した通り、通信の世界に「100%止まらないネットワーク」はありません。
それでも100%の可用性を目指し、単一障害点ゼロを心がけて試行錯誤するのが情報システム担当者です。
致命的な業務停止に繋がらないよう、冗長化が必要なポイントがどこかを検討していきましょう。