検索検索
English

HASコンソーシアムでの検証成果を報告 ~ EnterpriseDB Summit 2017 Tokyo

より高いHA(高可用性)を追求する「Higher Availability Solutions(HAS)」コンソーシアム。そこで実施されたLifeKeeperを活用した検証の成果がEnterpriseDB Summit 2017 Tokyoで報告されました。

テクノロジー2017年6月 8日

LifeKeeperを活用した業務復旧のベストプラクティスを探る

企業活動や社会基盤を支えるITプラットフォーム。そのシステム障害から業務再開に至る時間短縮に対する要求レベルが厳しさを増す中、2016年11月に設立された「Higher Availability Solutions(HAS)コンソーシアム」の活動に注目が集まっています。
「Higher Availability」に込めた"より高いHA(高可用性)を追求する"というコンセプトのもとで、コンソーシアムの参加各社が取り組む活動の一つに、コストを抑えつつ、システム障害時のダウンタイムを最小限に留め、素早い業務の復旧を可能とするソリューションのデザイン・検証があります。
サイオスも、HASコンソーシアムの創立メンバーの一社として、市場で幅広いユーザー層を獲得するOSSのデータベース「PostgreSQL」をLifeKeeperでHA構成化した環境にフォーカスし、障害検出からフェイルオーバー完了までの時間短縮にチャレンジしてきました。


HASコンソーシアムでの検証活動成果を報告するサイオステクノロジー 第1事業部 BC事業企画部 エバンジェリスト 小野寺章

2017年5月18日に開催されたEnterpriseDB Summit 2017 Tokyoのセッションでは、その成果がまずは報告されました。
「サイオスではLifeKeeper PostgreSQL ARKのチューニングにより、リソース監視間隔および、ノード監視間隔の実効的な最小値の検証、またダウンした稼働系ノードにおける復旧処理(ローカルリカバリ)を無効化して待機系のサービス再起動へ即座に移行させる場合の影響測定、などを進めました。その結果、障害検出からフェイルオーバー完了までに、従来少なくとも数分程度要していた処理を、HASコンソーシアムで目標とする30~60秒程度以内に短縮が可能であることが確認できました」と、サイオスのBC事業企画部に所属するエバンジェリストの小野寺章は説明しました。

LifeKeeperと EDBのxDB MMRを活用した検証成果を発表

「LifeKeeper PostgreSQL ARKのチューニングだけでも、十分に短時間ではないか」と思われるかもしれません。
「しかし、障害検知からフェイルオーバー完了(待機系でのサービス再開)までさらに短い時間で完了したいという要望が高まっています。この課題をクリアするためには、根本的な対応が必要でした」(小野寺)
そこでサイオスが着目したのが、待機系でのリソース起動に要する時間の短縮です。具体的にはPostgreSQLの商用版であるEnterpriseDB(EDB)の「xDB マルチマスターレプリケーション(MMR)」を用いるアプローチでした。MMRは、複数のDBサーバーが相互にテーブルの同期(レプリケーション)を行い、どのDBサーバーにアクセスしても参照・更新が可能となっています。この仕組みを利用することで待機ノードでリソース起動をする時間を省けるのではないか、という仮説を立ててサイオスでは検証を行いました。


小野寺は、実機でのデモンストレーションを交えて成果を報告しました。
「待機系でのサービス再開は、LifeKeeperによるIPリソースの切り替えのみで瞬時に完了しました。障害発生からサービス復旧までの時間は30秒を大幅に短縮する、わずかな時間でおこなわれることが検証できました」(小野寺)
ただ障害検出の時間は、仮想IPを切り替えるトリガーによっても変化します。「そこでユーザーの利用環境やニーズを考慮した、最適な監視スクリプトを実装することでさまざまな障害に柔軟に対応できると考え、さらに検証を進めます」と小野寺は今後の展望を述べました。

HASコンソーシアムの参加各社の活動成果は、2017年7月に予定されているイベントでも紹介される予定です。引き続き、今後の取り組みにご期待ください。

*1ARK(Application Recovery Kit): Oracle DatabaseやApacheなど高い可用性が求められるソフトウェア向けに、LifeKeeperで容易にHAクラスターシステムを構築するためのオプション製品

記事の関連情報