アプリケーション・パフォーマンス

Traffic Sentinelは、アプリケーション・パフォーマンスの分析のためのツールを、いくつも備えています。

アプリケーション・モニタリングのセットアップ

Traffic Sentinelを用いてアプリケーション・パフォーマンスのモニタリングを行うには、いくつか、事前の設定が必要です。

1. ホストsFlow

Traffic Sentinelは、sFlowを用いたパフォーマンス統計値のエクスポートを、ホスト情報に依存して受信できます。UDPポート6343上のTraffic SentinelサーバーにsFlowを送信できるように、ホスト側に設定する必要があります。

注:host-sflow.sourceforge.netから、オープンソースの(Host) sFlowエージェントが無料でダウンロードできます。

2. アプリケーションsFlow

Traffic Sentinelは、sFlowを用いたパフォーマンス統計値のエクスポートを、アプリケーション・ソフトウェア情報に依存して受信できます。通常はアプリケーションが、
Host sFlowエージェントから設定を自動的に取得するので、追加設定の必要はありません。現時点でsFlowモニタリングをサポートしているアプリケーションのリストは、 host-sflow.sourceforge.net/relatedlinks.phpからダウンロードできます。

3. ゾーンとグループの設定

Host sFlowエージェントをゾーンとグループに集めることで、多数のホストをナビゲートしやすくなり、パフォーマンス・メトリクスをグループやゾーンごとにまとめられるようになります

4. しきい値の設定

ホスト・パフォーマンス・メトリクスのしきい値を設定すると、ホストがオーバーロードになった時にアラート(警告)が発せられ、注意を要する異常値をハイライトするのに役立ちます

アプリケーションのモニタリング

Traffic Sentinelには、Services(サービス)メニューの下に、4つのタブがあり、それぞれ、異なるアプリケーション・パフォーマンス統計値が表示されます。

1. Services>Status (サービス>ステータス)

Services>Status (サービス>ステータス)ページでは、データセンター全体のアプリケーションのステータスや、それらが依存するサーバー・リソースが表示されます。

グリッド内の四角をクリックすると、そのステータスについて、より詳細な情報がドリルダウン表示されます。Status(ステータス), CPU, Memory(メモリ), IO カラムは、ホスト・メトリックスと関連付けられ、 Hosts>Statistics (ホスト>統計値)ページにリンクしています。Operations(オペレーション)、Errors(エラー)カラムは、サービス・メトリクスと関連付けられ、 Services>Statistics(サービス>統計値)ページにリンクしています。

ロー・ラベルをクリックすると、選択したサーバー・グループの詳細が開かれます。階層のどのレベルでも、Explore(エクスプローラー)ボタンをクリックすれば、選択したサーバー・グループのアプリケーション・スタティクスがリポートされます。Hosts(ホスト)ボタンをクリックすると、アプリケーションが利用できるリソースが表示されます。いつでも、Services>Statistics(サービス>統計値)タブ、Services>Trend(サービス>トレンド)タブ、Services>Top N(サービス>トップN)タブをクリックして、選択したサーバーのパフォーマンス・メトリクスを確認できます。

エージェントをドリルダウンすると、アプリケーション統計値をレポートする各エージェントのIPアドレスとドメインネームが表示されます。

エージェントをクリックすると、そのエージェントがレポートするアプリケーション・インスタンスが表示されます。

上図では、エージェントganglia が、4つのMemcacheインスタンスと1つHTTPインスタンスをレポートしています。各インスタンスは、Data Source Index(データソース・インデックス)で特定されます。これは、通常は、ネットワーク・リクエストを受け取るのにアプリケーションが用いるネットワーク・ポートです。この例では、Memcacheは、11211、11311、11411、11511のポートをリスンし、HTTPインスタンスは、ポート80をリスンしています。

2. Services>Statistics(サービス>スタティスティクス)

Services>Statistics(サービス>スタティスティクス)テーブルでは、現在のFilter(フィルター):パスのサーバーで実行中の選択されたサービスについて、そのパフォーマンスが、選択されたメトリクスごとにソートされて表示されます:

上図では、テーブルには、HTTPサービスのメトリクスが表示されています。テーブルの各ローは、一つのアプリケーション・インスタンスを表しています。カラム・ラベルをクリックすると、そのメトリクスでテーブルがソートされます。テーブルのバーをクリックすると、そのアプリケーション・インスタンスに関する統計のServices>Trend(サービス>トレンド)ビューがドリルダウン表示されます。

注: 統計テーブルでは、ホスト・メトリクスとサービス・メトリクスを混在させることができます。ホスト・メトリクスに関連付けられたバーをクリックすると、Hosts>Trend(ホスト>トレンド)ページに移動します。

3. Services>Trend(サービス>トレンド)

Services>Trend(サービス>トレンド)ページでは、トレンド・チャート一式が表示されます。これは、現在のFilter:パスのサーバーで実行中の選択されたサービスについて、そのパフォーマンス特性を示すものです。

上図では、チャートは、HTTPサービスのパフォーマンスをトレンディングしています。Show:(表示)設定がAll(全て)に設定されている場合には、そのパス内の全てのサーバーのパフォーマンスのロールアップ・サマリーが表示されます。

チャートをクリックすると、選択したメトリクスごとに、グループのメンバーが分けられます。

上図では、California St.グループ内の各エージェントについて、HTTP Method(HTTPメソッド)チャートが表示されています。

さらに詳しくドリルダウン表示するには、チャートをクリックします。上図の場合なら、xenvm1チャートをクリックすると、サーバーで実行中のHTTPインスタンスについての詳細が表示されます。.

4. Services>Top N(サービス>トップN)

Services>Top N(サービス>トップN) チャートでは、現在のFilter:パスのサーバーで実行中の選択されたサービスが処理しているトランザクションについて、詳細な情報が表示されます。

上図では、チャートは、URI パスごとのHTTPサービスについて、1秒あたりのオペレーションを表示しています。チャートのバーをクリックすると、選択された時間にフォーカスが移り、そのインターバル中の上位コントリビューターが表示されます。凡例のリンクをクリックすると、選択したアイテムをInclude(含める)あるいはExclude(除外)して、データをフィルタリングできます。

注: Truncate(切り捨て)パス設定を用いて、データをまとめることで、パターンが見やすくなります。上図では、各UPIパスの上位2つのトークンだけを表示することで、ほとんどのリクエストが、/imagesパス内のオブジェクトに対するものであることがはっきりします。

レポーティング

Reports>Explore(レポート>エクスプローラー)ページでは、サービスの長期のパフォーマンス・スタティスティクスを表示できます。

Database(データベース)でApplication Performance(アプリケーション・パフォーマンス)を選択すると、アプリケーション・パフォーマンス・カウンターがリポートされます。上図では、HTTPオペレーション・カウンターがトレンディングされています。

Database(データベース)でApplication Transactions(アプリケーション・トランザクション)を選択すると、アプリケーション・トランザクション属性がリポートされます。上図では、URIエクステンションごとのオペレーションが表示されています。

ホスト・パフォーマンス

アプリケーション・パフォーマンスは、ベースとなる演算インフラのパフォーマンスに左右されます。Filter(フィルター):バーのHosts(ホスト)ボタンをクリックすると、ホスト・モニタリング・タブを切り替わって、現在のパスが選択されます。これによって、サービスをホスティングしているサーバーのパフォーマンスが表示されます。例えば、Services>Top N(サービス>トップN)チャートから、レスポンス・タイムが長くなっていることが分かるかもしれません。Hostsボタンをクリックすると、問題が、サーバーのオーバーロードによるものか、過剰なスワッピングによるものか、などが分かります。

トラフィック

アプリケーション・パフォーマンスは、ベースとなるネットワーク・インフラのパフォーマンスにも左右されます。Drill-down traffic analysis(ドリルダウン・トラフィック解析)を用いて、ネットワーク・パフォーマンスを確認します。例えば、Memcacheクラスターでパフォーマンスが落ちているのは、ネットワークでのパケット破棄によるものかもしれません。