株式会社ゼンリンデータコム 様

革新的なナビゲーションサービス、多様なビジネスをサポートする地図活用ソリューションを中心に多くの業務システムを有するゼンリンデータコム。加速するビジネススピードに追随しつつも、多様な業務システムを安定稼働させるために必要となる監視基盤の標準化とレベルアップにチャレンジ。

株式会社ゼンリンデータコム
ビジネスサポート室
副部長 川口 晃平 氏
エキスパートエンジニア 伊藤 正義 氏

「未来を導く、コンパスになる」- ゼンリンデータコム(以下、「ZDC」という)様は、住宅地図メーカー最大手ゼンリンの連結子会社であり、「いつもNAVI」、「tredina」、「配達アプリ」などのサービス展開やゼンリン地図のAPI提供、店舗検索、地図作成など、位置情報付コンテンツや地図情報を活用したリアルタイムサービスを提供する会社です。インバウンド向けサービスやIoT関連のスマートシティソリューション、ドローンや自動運転などに代表される高度ITSソリューション、行動分析、行動予測を主体としたビッグデータソリューションなど、豊かな社会の実現を目指した多様なサービスを展開されています。

01

導入前の課題

加速するビジネススピードに追随しつづける
運用監視基盤の課題とは

革新的なサービスを幅広く展開するZDC様は、加速するビジネススピードに追随しながら多種多様なサービスを高品質かつ高安定に提供するため日々対応と改善に力を注がれてきました。特にサービス提供状態を把握する上で重要となるシステム監視運用については、サービスを支えるシステムそれぞれの特性にあわせたきめ細かい監視設定をZabbixによって実装しており、システム障害の予兆をいち早く察知し、障害発生を未然に防ぐことを可能としていました。

一方でシステム特性ごとにきめ細かく監視設定を実装してきたことにより、監視設定項目は膨大な数となり、それを支える監視基盤もシステムが増えるたびに個別対応の環境が混在し、肥大する状況となっていました。限られた体制で品質を落とさず監視基盤を維持管理しながら運用し続けるためには、標準的な監視環境の整備、さらには「今後を見据えた監視基盤と運用の見直し」が必要でした。

膨大な数の監視項目を有する各運用監視基盤において、パフォーマンス、キャパシティを踏まえてそれらを改善・整備するにはどのような解決策があるのか? EOSLが迫る現行のZabbixから最新Versionへ移行した場合、運用監視にどのような影響があるのか?可能な限り運用コストを削減するためには、どのような構成にすべきなのか?解決すべき課題が山積していました。

02

選定・導入決定ポイント

大規模かつ急速に進化を続けるシステムを
安定稼働させるために必要不可欠な
Zabbixのチューニング

これら喫緊の課題を解決すべく、Zabbix認定パートナーである当社に統合監視基盤の設計構築支援について打診をいただきました。

支援にあたってのZDC様から頂いたご要望は以下の通りです。

  • 将来的な統合監視基盤として必要な設計構築を行うこと
  • キャパシティ、パフォーマンスの観点で収容能力の最大化と、拡張契機を明確とすること
  • Zabbix 3.0に関する知見、ノウハウを提供すること

監視対象となるシステムの大半はAWS上で動作しており、スケールアウト/スケールインにより動的に構成を変えるものも多く存在していました。柔軟に変化するシステム構成に追随し、その監視を可能な限り低コストで実現するために高い収容能力と柔軟な監視方式、多彩な運用自動化機能を持つオープンソースの監視ソリューションとしてZabbixの当時の最新版であったv3.0を採択されました。

特に、AWS環境におけるAmazon AuroraでのZabbix環境の構築や、パフォーマンスを最大化するための工夫など、当社としても初めてのチャレンジとなるテーマが数多く含まれていましたが、当社のZabbixに関する長年の実績と知見をフルに発揮し、将来の処理量の増加に対応可能なシステム構成やチューニングポイントの検討と事前提示を行いました。加えて、設計・構築だけではなく環境引き渡し後の継続的な課題解決を行うために「QA支援」のご提案、また、当社のサービス・パッケージである「まるごとおまかせZabbix」を活用することによって環境構築支援コストの最小化を実現し、お客様のご要望に寄り添った提案内容をご評価いただきました。

03

導入決定から本番稼働までのプロセス

仮説から実証へ~
緻密な試験を実施して課題を解決

今回のご支援にあっては、ZDC様がご認識されていたZabbixサーバーのキャパシティ、パフォーマンスの課題解決に向けて、以下の仮説を設定しました。

「履歴データの肥大によるハウスキープ処理、トレンド生成処理の長期化が多くのDisk I/Oを発生させ、HistorySyncerを中心に各内部プロセスのパフォーマンスの低下を誘発している可能性が高い」

当社では、パフォーマンスの改善を図るため、データベースのパーティショニングとZabbixサーバーのチューニングを施したPoC環境にて、緻密な重負荷試験を行いました。

ZabbixサーバーはEC2インスタンス上に2台構成として導入を行い、クラスタソフトを用いた相互監視と自動での本番系/待機系の切り替えを実現。ZabbixのデータベースはAmazon Aurora MySQLを採用することでデータベースサーバの構成を意識させずに高い可用性を得るとともに、バックアップやリソース拡張などの運用負荷の削減を目指しました。

Zabbix サーバーのチューニングでは、Zabbixの内部プロセス起動数に加え、各種キャッシュパラメータの調整を行い、その他にもApacheやPHP、MySQLに対してもパラメータの調整を行うことで、処理能力の最大化を図りました。

重負荷試験では、監視対象数や監視間隔など様々なパターンでZabbixサーバーに長期間の高負荷をかけ続け、Zabbixサーバーの最適なチューニング値と、特定のインスタンスタイプでの最大収容能力の見極めと課題の抽出を実施しました。

試験時にはAWSに存在する様々な仕様制約や制限値などにより、期待する結果を得ることができないことも多々ありましたが、それぞれの課題に対して、粘り強く調査を行うことで原因を明確にし、課題に対する的確な対策を可能としました。

また設計、構築作業と並行して、従来のZabbixからVersion3.0への変更点を調査・抽出し、ZDC様環境での影響度合いを明確にすることに取り組み、今後の運用に関する考慮点を洗い出すことができました。

04

導入効果や製品・サービスの評価

データベースパーティショニングにより
履歴データのハウスキープを不要に

データベースのパーティショニングによりZabbixの履歴データを削除するハウスキープ処理が不要となり、データベースに対するI/O負荷が大幅に削減された結果、Web UIのレスポンス、監視収容能力など、Zabbix全体のパフォーマンスが大幅に改善し、運用監視基盤の刷新によりEOSLを迎えようとしていた各種コンポーネントの最新化も実現しています。

当初の目的であった、将来的な統合監視基盤として必要なパフォーマンス、キャパシティを兼ね備えた監視基盤の標準化を意識した取り組みによって設計・構築を行い、重負荷試験の実施により監視の最大収容能力と拡張契機の明確化を実現し、Zabbix 3.0への変更点をレポートすることで、運用への影響と新機能の活用方法についても提供できました。

プロジェクトの推進にあたっては、お客様との協働作業で進めて参りました。ZDC様での運用特性やシステム環境を踏まえて、AWS 基盤構築、クラスタリング環境構築、バックアップ・リストアを中心とする運用設計などはZDC様にご担当をいただきました。ZDC様と当社の間で適切な役割分担を行うことで、実質3か月という短い期間ではありましたが、当初の目的を達成するとともに、的確な判断と柔軟なプロジェクト推進が実現できました。

05

同様な課題を持つ企業へ

長年に渡ってキャッチアップしてきたZabbix
および監視運用のノウハウをフルに活用して
ご提案します

当社は2004年からの長きに渡ってZabbixのキャッチアップを進めて参りました。また創業以来、監視に限らず IT システムの最適な運用環境を実現することに注力して参りました。

当社では、2004年のZabbix Version1.1の時代からZabbixのキャッチアップを進め、監視ソリューションとしての活用に取り組んでまいりました。以下のような優位性を持って、お客様の統合監視環境構築と運用のニーズに応えてまいります。

  • Zabbixを用いたシステム監視構築ノウハウを整備・標準化しているため、スピーディかつリーズナブルな構築サービスが提供可能であること
  • 数多くのシステム構築や運用サービスで培ったノウハウを活かして、お客様の状況に応じた適切な監視設計、実装が可能であること
  • 製品技術を活かしつつ実質的な運用に耐えうる環境を構築するため、Zabbix の機能を補完しつつ統合監視を実現するソリューションを有していること
  • Zabbixはもちろん、従来の商用製品を用いた監視環境構築および運用の実績を多く有していること

システムインフラ環境、運用管理に関わるあらゆる局面において、さまざまな方法での課題解決のお手伝いをさせて頂きます。当社の Zabbix に関連するノウハウを集積したサービスパッケージ「まるごとおまかせZabbix」については、こちらのページをご参照ください。

システム運用・監視について課題をお持ちのお客様は、是非ともお声がけを頂ければ幸いです。

06

製品・サービス提供会社への感想や今後の期待

監視運用に関するノウハウと製品利用技術を
駆使して満足感の高いサポートを提供

「今回のプロジェクトでは、アークシステムから初めて技術支援を受けたが、経験豊富な知識や適切な監視設定、テンプレートの案も提案していただき、結果には100%満足している」(伊藤氏)

ZDC様では、数年前からZabbixを監視基盤として活用し、自ら構築・運用を行ってノウハウを蓄積していたものの、Zabbixの適用範囲が拡大する中で性能限界が見えてきたことと、本来業務である運用サービスの推進のためには、外部サービスの活用が必要であった、と語って頂きました。

「Zabbixのコアなテクノロジーを使いこなしている自負はあったが、性能やチューニングなどの面では不安はありました。アークシステムは細かい要求にも応えてくれて、運用に即したアドバイスも頂きました。これまで構築してきた他のZabbix環境に比べても高性能な環境を維持できています。」(伊藤氏)

今回のプロジェクトは、リモートサポートを主体とした効率的な方法で、かつ的確な対面コミュニケーションを図りながら、およそ3か月余りで完遂させました。

「製品として完璧なものはないと思うが、アークシステムは、OSSであるZabbixの良いところと悪いところをよく知っていて、ナレッジのレベルが高いと感じました。不足するところはその代替策を考えてくれたり、本来の委託範囲ではないミドルウェアなどの関連技術にもアドバイスをくれたり、単純に構築して終わりではなく、プロフェッショナルとしての技術力と取り組み姿勢に頼もしさを感じました」(川口氏)

今後に向けて、当社の果たすべき役割やサービスの展開についてもお聞きしました。

「Zabbixに関して言えば、Version 4.0対応を進めていかなくてはなりません。また世の中のサービスは益々新しくなっていく中で、ZDCとしてはAWSを基本とはするものの、多様化する環境をサポート可能にするためにも各クラウドサービスに対する監視ソリューションを高めてもらえると嬉しいです。」(川口氏)

お客様では、より効率的かつ一元的な監視運用を実現するために、監視データの集約を進めてきました。アプリケーションの稼働プラットフォームが増えることはあっても、監視・運用の仕組みを都度構築するようなことなく、Zabbixを真の統合監視環境として活かしていくために、ZDC様でのチャレンジは続きます、当社としても、新たなテクノロジーに追従しながら、お客様の運用品質の維持と最適化のために、たゆまぬ努力を続けて参ります。

※ 掲載内容ならびに社名等の記載は、取材当時のものです。