三菱総研DCS株式会社 様

金融系企業を始めとする数多くのビジネスを支える「FINEQloud」の監視に求められたのは、高品質な監視製品と可用性。
オープンソースの監視製品であるZabbix(当時Version 3.0)を採用し、Active-Active構成による冗長化を実現。

三菱総研DCS株式会社
テクノロジー事業本部 基盤サービス部 クラウドグループ
課長 岡田 英貢 氏
澤田 真一 氏

株式会社三菱銀行(現 三菱UFJ銀行)のコンピューター受託計算部門から分離独立された歴史をもつ三菱総研DCS株式会社(以下、「DCS」という)様は、銀行、クレジットカード等金融関連システムの構築で豊富な経験・実績を誇り、システム運用やBPO業務などでも強みを持っていらっしゃいます。現在は三菱総合研究所様と共に、三菱UFJフィナンシャル・グループ様、三菱UFJリサーチ&コンサルティング様との強力なタッグで、コンサルティング・企画・提案から運用・業務支援に至るまで、高品質なトータルITソリューションを展開されています。

DCS様が提供するエンタープライズマネージドクラウドサービス「FINEQloud」
https://www.dcs.co.jp/fineqloud/

01

導入前の課題

FINEQloudを支えるための監視基盤の要件とは?

FINEQloudはマルチテナント型のプライベートクラウド環境であり、DCS様が提供しているエンタープライズマネージドクラウドサービスの総称です。多くのミッションクリティカルな業務が稼動するクラウドサービスであるため、その監視基盤は金融系システムの大規模環境の監視にも耐えられる高い可用性・信頼性を持つ製品であることと、利用規模が拡大してもライセンスコスト・ソフトウェア保守コストが増加しない製品であることが求められていました。DCS様は機能やサポート・ロードマップについてもご認識をお持ちでしたが、金融系システムの大規模環境の監視を任せるに足る性能や製品サポート品質があるのか、そしてそれらがコストに見合うのかを慎重に見極める必要がありました。

当社はDCS様がZabbix導入をご検討するにあたり、Zabbixの不具合や機能改善の見込みや、Zabbix LLCおよびZabbix Japan LLCの活動内容などを始め各種情報提供という形でサポートさせていただいておりましたが、2015年にFINEQloud構築及びその監視をZabbixで実施する方針が決まり、当社に監視機能部分の構築提案依頼をいただきました。FINEQloudのSLAを遵守するためには監視基盤にも高い可用性を確保したいというご要望をうけ、当時(2016年2月16日)リリースされた最新版Zabbix 3.0での冗長構成をご提案させていただきました。

02

選定・導入決定ポイント

Zabbixの決め手は、配慮の行き届いた
メーカーと提供ベンダーが一体となった
丁寧なサービス

金融系システムの監視にオープンソースソフトウェアを利用することについては、慎重に見極める必要がありましたが、2015年の時点でワールドワイドでは、金融系を始めとするエンタープライズシステムの監視にZabbixを適用する実績が多数出てきており、各構築事例もカンファレンスなどで紹介されることが多くなっていました。また、Zabbix LLCの企業としての長年の開発への取り組み姿勢や高品質なサポートについてもご評価いただき、今回Zabbixを採用いただくことになりました。

今回、DCS様からZabbixサーバー構築に求められた要件は下記の通りです。

  • 冗長化やパフォーマンスチューニングなど、より専門的な知見が必要な領域を外部ベンダーに任せたい
  • Zabbixサーバー障害時にも監視中断時間を極小化するために冗長構成とする
  • FINEQloudの2016年8月サービスカットオーバーを鑑み、設計・構築期間は2016年4月-6月の3か月で行う

これらのご要件に対し、当社から以下のポイントを踏まえて提案し、ご採用を頂きました。

  • 提案範囲を専門的な知見が必要な箇所に絞り、DCS様と当社の作業分担を明確化した上でプロジェクトを開始する
  • DB レプリケーション方式 + High-Availability Add-Onを利用したActive-Standbyの冗長構成で構築する

03

導入決定から本番稼働までのプロセス

ZabbixサーバーのActive-Active構成で
苦労するポイントとは?

当初計画ではメーカーの保証が期待できる構成(Active-Standby冗長化)を構築する予定でしたが、Active-Standby冗長化構成の場合、障害時の系切り替えの際に監視が一時停止してしまうという課題がありました。

DCS様の「Zabbix障害時であってもFINEQloudサービスの監視中断を極限まで少なくしたい」というご要望にお応えするため、Zabbix Japan LLC製バックアップツール(及び設定同期ツール)を利用した監視設定のバックアップ及び設定の同期に加え、下記機能を独自に開発、構築することで監視中断を伴わないActive-Active構成での冗長化を提案しました。

Active-Active冗長化構成の実現にあたり、当社が独自実装した機能

  • 同一の障害の多重発報の抑制
  • 系切り替えの自動化
  • 監視設定の同期ツールの起動及び、同期タイミング制御

※ Zabbix Japan LLCが提供しているのは、監視設定のバックアップツールと設定同期ツールのみ

当時Zabbix 3.0がリリースされて間もないタイミングであったため、Zabbix 3.0環境用のActive-Active構成のための必要なスクリプトも稼働実績もありませんでした。短い構築期間にて機能開発する必要がありましたが、これまでの監視環境構築の実績とノウハウをフルに活用し、当社にて開発・テストを実施しDCS様環境に実装しました。

今回の構築で当社が重要視したことは下記の2点です。

  • Zabbix Japan LLC製の設定バックアップツールには、仕様上Zabbixサーバー従系のアクションステータスを個別に無効化する機能がない。そのため、直接Zabbix DB上の当該テーブルに対しUpdate文を発行し必要なアクション設定のみを有効化する必要があったこと
  • Active-Active構成で使用するZabbix設定同期ツールからのZabbixサーバー起動時に正常起動できないケースがあった。原因は設定同期ツールの不具合およびRHEL7.1のsystemdの仕様であったが、Zabbix Japan LLCと共同で設定同期ツールの改修を行う必要があったこと

上記の通り、不足する機能を当社で新たに実装し、開発元であるZabbix Japan LLCと密に連携することで、DCS様のご要望を満たす高品質かつ高可用な監視環境を構築することができました。

04

導入効果や製品・サービスの評価

FINEQloudサービスを支える監視基盤として
高い安定性を確保し、DCS様の
他サービスへの横展開も実現

高いサービスレベルが求められるFINEQloudの監視基盤として、Zabbixはサービスイン後約3年、ほぼ障害もなく安定したサービスを提供しています。

また当社の構築した監視基盤はFINEQloudの監視環境だけでなく、その後にサービスリリースされたAWSやAzureを活用したマネージドクラウドサービスでの監視基盤にも横展開されDCS様のクラウドサービスを支えています。

05

同様な課題を持つ企業へ

当社のサービスとしてパッケージ化

今回のプロジェクト完了後、当社ではZabbixサーバーのActive-Active構成の冗長化をZabbix構築サービスである「まるごとおまかせZabbix」の高可用性オプションとしてパッケージ化することにしました。これにより、今回のプロジェクトで明らかになったActive-Active構成の考慮ポイントを網羅的にカバーしつつ、構築も短納期で実現可能となっています。

DCS様と同様、ミッションクリティカルなシステムの監視にZabbixを採用されているお客様において、今回の経験を通じて得ることができた知見とノウハウをベースに、システムの安定稼働に寄与する当社の監視ソリューションをご提供させて頂ければと考えております。

※ 掲載内容ならびに社名等の記載は、取材当時のものです。