【技術解説】~エージェント監視~ JP1を採用したシステム構成を例に徹底解説

テクノロジー

システム監視は、今回紹介するエージェント監視と前回解説した死活監視などと組み合わせたハイブリッドな構成でシステム監視を行うことが多いでしょう。今回はそのうちの「エージェント監視」について解説します。

※クラウド環境上でシステム監視を行う場合は、AWSで採用しているCloudWatchに代表されるようなクラウド環境専用の監視方式でシステム監視を行う場合もあります。その解説は別途行うこととします。

システム監視の基本は以下の記事で解説しています

【システム開発】システム監視とは ~基本的なシステム構成と監視方法~
企業のDX化は加速の一途を辿り、コンピューターシステムの重要性が一層増す中、ひとたびシステム障害を起こせば、システムを提供する企業は社会的信頼およびブランド失墜のリスクを抱えることになります。みずほ銀行やKDDIのシステム障害は記憶にReadMore...
 
スポンサーリンク(Cocoon)

エージェント監視

各サーバが自身に導入された監視エージェント(ソフトウェア)を使って自分自身を監視し、自身でイベントが発生した際に監視マネージャに通知するシステム監視方式です

監視対象となるサーバ内で監視を行います。そのため、監視マネージャーやネットワーク経路に障害が発生していても監視継続が可能です。監視マネージャー、ネットワーク経路が復旧したら自動で通知を再開します。サーバ内部のエージェントが監視する機能として、OSのシステムログにおける特定の文字列やサーバリソースの利用状況を抽出し指定のしきい値を超えたら警告、アラームなどのメッセージを送信可能です。随時、サーバ稼働状況とログ出力状況をチェックしています。

エージェント監視が可能な製品は、日立製作所のJP1 、富士通のSystemwalker、NTTデータのHinemosなどがあります。

JP1を想定したエージェント監視のシステム構成

日立製作所のJP1を利用した場合のシステム監視構成例です。

エージェント監視は監視マネージャJP1-PFM Mangerと監視エージェントJP1-PFM Agentで構成されます。各サーバのソフトウェアスタック図に、実際にインストールされている製品を示しています。

監視マネージャJP1-PFM Mangerが監視エージェントJP1-PFM Agentに対して監視内容の送信要求(ポーリング)を行い、監視エージェントは応答として監視対象項目の情報を監視マネージャに送ります。
この仕組みにより、監視エージェントで監視している内容が監視マネージャーでも確認可能となります。死活監視は、サーバの疎通確認が主でしたが、エージェント監視では、サーバの詳細(syslog内のメッセージ詳細、Linuxのプロセス数、起動状況など)が監視できます。DBサーバにOracleが実装されている場合は、JP1-PFM Agent for Oracleといった追加オプション製品を導入することで、Oracleの稼働状況詳細を取得することも可能となります。

監視結果は、PCなどのwebブラウズからJP1-PFM Web Consoleが導入されている監視マネージャーへアクセスすることで確認できます。

webブラウザから次のURLでアクセスします。

 
http://監視マネージャー名:20358/PFMWebConsole/login.do

エージェント監視の特徴

説明してきたように、JP1、Systemwalker、Hinemosなどの商用製品であればサーバプロセス、リソースに対する監視対象項目も多く、あらゆる監視要件に対応可能です。CPU使用率が3分以上100%に高止まりしていたら警告メールを発砲するといった使い方です。時間や使用率、メール発砲先など任意で変更可能です。

このような監視項目をあらかじめ定義したプリセット(テンプレート)も用意されており、システム監視を比較的簡単に開始できます。JP1であれば、マーケットに有識者も多く、サポートも充実しており、何よりナレッジが豊富なので導入の敷居は下がります。さらに、監視マネージャやネットワークが停止していてもサーバの監視自体は続けることが可能なので、24時間365日常時監視が必要となる場合はむしろ必須と言えます。

ただし、ソフトウェアスタックからも明らかなように、必要なソフトウェアが多くなるほど導入コストは高くなります。余談ですが、商用システム開発のソフトウェアに対するコスト感覚がない人は、JP1のライセンス費用をみて驚愕することでしょう。

まとめ

システム監視は、死活監視とエージェント監視(およびエージェントレス監視)を組み合わせて構築することが一般的です。最近はクラウド環境で指定される標準の監視方式で行うことも増えてきましたが、基本的な考え方にかわりはなく、今回紹介したシステム構成や特徴をおさせておきましょう。

コメント

タイトルとURLをコピーしました