Elasticオブザーバビリティ:Kubernetesクラスターの監視
概要
Elasticオブザーバビリティの概要
Elasticオブザーバビリティについて詳細に説明し、Elastic Cloudを使用してアプリケーションからカスタマーログを取り込み、表示、分析する方法について概要を紹介します。
Kubernetesクラスターを設定する
Elastic Cloudアカウントを作成する
14日間の無料トライアルを開始しましょう。cloud.elastic.coに移動して、アカウントを作成した後は、この動画に従い、世界中の50以上の対象リージョンのいずれかで最初のElastic Stackを立ち上げる方法についてご覧ください。
デプロイが完了したら、[オブザーバビリティ]タブで[Kubernetesクラスターの監視]を選択し、表示されたガイダンスに従います。Kubernetesクラスターの管理の詳細については、ぜひこのブログを確認してください。
KubernetesデータをElasticに取り込む
初めてElasticを使用する場合は、Kubernetes統合を監視および構成するKubernetesクラスターに、Elasticエージェントを追加する必要があります。
[Kubernetesクラスターの監視]を選択した後に、[開始]をクリックすると、Kubernetes統合を追加するように指示されます。
[Kubernetesの追加]を選択すると、Kubernetesデータを取り込むための3つの簡単なステップが表示されます。
まず、Kubernetes統合でElasticエージェントを追加します。統合はすべてのKubernetesデータを収集するようにあらかじめ設定されていますが、収集したいデータのみを選択することができます(例:ポッドメトリック、コンテナーログなど)。
Elasticエージェントを使用したKubernetes統合で何ができるかを大まかに把握するには、こちらのブログを確認してください。
KubernetesのElasticエージェント統合は、標準のKubernetesコンポーネントのほかに、Kubernetesクラスター監視で広く使用されている追加コンポーネントであるkube-state-metrics(ksm)からの収集もサポートします。ksmはほとんどのKubernetesディストリビューションで既定では付属していないため、個別にインストールする必要があります。
KubernetesでElasticエージェントを実行する方法について詳しくは、こちらのドキュメントを確認してください。
Elasticオブザーバビリティの使用
Kubernetesクラスターからデータを取り込んだ後は、収集されたログとメトリックを分析します。そして、最後に、注意が必要な問題が発生したときに認識できるようにアラートを設定します。
ElasticオブザーバビリティでKubernetesログを取り扱う
Kubernetesログは、ElasticのDiscover機能で検索して分析できます。Discoverを利用するには、左のメニューに移動して、[分析]の下で[Discover]を選択します。
ここでは、Kubernetesログを検索、レビュー、分析する方法を確認します。
また、Discoverでは、メトリックを確認することもできます。
ElasticオブザーバビリティでKubernetesのメトリックを可視化する
また、Kubernetesには、さまざまなすぐに使えるダッシュボードがあり、Kibana内でKubernetesのメトリックを分析できます。左側の[分析]の下にある[ダッシュボード]に移動し、Kubernetesを検索します。
[Kubernetes概要]では、Kubernetesクラスター全体のメトリックを確認できます。すべてのノード、ポッド、CPU、メモリの使用状況。
Kibanaを使用すると、インタラクティブなダッシュボードを使用してログを分析し、インサイトを引き出したり、ワークフローを自動化したり、異常や傾向を特定したりすることができます。以下のチュートリアルライブラリを見て、Kibanaについて詳しく知り、ダッシュボードをカスタマイズしたり、独自のダッシュボードを作成したりできるようになりましょう。
[分析]の下にある[ダッシュボード]を選択すると、ダッシュボードを作成し、新しいすぐに使えるダッシュボードをニーズに合わせてカスタマイズできます。
うまく行かず、先に進めない場合は、このガイドツアーを確認して、データを取り込んでください。
Kibana、ダッシュボードの作成、Discoverの使用に関する詳細をご覧ください。
問題の予防、予測、修正
アラートを設定する
[オブザーバビリティ]の下の左側のナビゲーションで、[アラート]と[ルールの作成]を選択します。これにより、さまざまなイベント(例:異常なレイテンシ、メトリック集約がしきい値を超過したなど)が発生したときに、電子メール、Jira、Slackなどで通知を受信できます。
機械学習を活用して、インサイトを発見する
このセクションを開始する前に、機械学習にノードをデプロイしていることを確認してください。
最後に、メニューの[分析]の下にある[機械学習]に移動します。[機械学習概要]ページの左側のメニューで、[異常検知]の下の[ジョブ]を選択して、機械学習ジョブを作成します。機械学習ジョブを設定することで、メモリの使用率が一定の割合(例:50%、80%など)に達したときにアラートを生成するといった方法ではなく、使用状況で異常が発生したときに把握できます。
次のステップ
Elastic CloudでKubernetesクラスターを監視する方法を説明しました。Elasticを初めて使う場合は、まずは無料の14日間のトライアルをお試しください。
また、Elasticの導入を始めるにあたって、環境全体でデプロイを行うときにユーザーとして管理すべき運用、セキュリティ、データの要素について理解しておいてください。