Elasticオブザーバビリティ ― 「平均復旧時間ゼロ」を目指して

blog-thumb-release-observability.png

Elasticのオブザーバビリティプロダクト担当バイスプレジデント、ターニャ・ブラーギンとElasticオブザーバビリティチームは先般のElasticON Global 2021に登壇し、今後実装が予定される開発中のイノベーションについてプレゼンテーションを実施しました。具体的には、アクション可能なインサイト、迅速な根本原因検知、MTTR(平均復旧時間)の短縮をもたらすイノベーションについて発表しました。

クラウドやマイクロサービス、エフェメラルなインフラの導入によって環境の複雑化が進んだ今、オブザーバビリティソリューションは、エンドツーエンドの可視性というニーズに応えるものでなければなりません。GartnerGigaOmEMAも各々の評価分析で言及しているように、Elasticオブザーバビリティは次に挙げる機能性をすべて搭載する包括的なソリューションであり、継続的な開発が行われています。

  • すべてのテレメトリデータをインジェストする統合的なエージェントと、一元的な管理機能
  • クラウドネイティブなテクノロジー(例:Kubernetes)の統合機能
  • Amazon Web Services、Microsoft Azure、Google Cloud Platformを含む主要なクラウドプロバイダーとのネイティブ統合機能
  • APM(アプリケーションパフォーマンス監視)における、機械学習を活用した自動の根本原因分析
  • ログ、サードパーティ依存、バックエンドサービス統合機能によるAPMトラブルシューティングのワークフロー強化
  • コンテクストに沿ったトラブルシューティングのための直感的なサービスマップ
  • OpenTelemetry(OTel)のサポート
  • シンセティック監視とリアルユーザー監視(RUM)の強化
Elasticのオープンソースコミュニティへのコミットメントは、Elasticオブザーバビリティを今後も常にオープンかつ拡張可能なプラットフォームとして提供する、ということを含意します。Elasticは、オープン標準と、オープンソースイニシアチブの採用、および、コントリビューションにコミットしています。その目標は、ユーザーにおける柔軟性を最大化し、ベンダーロックインを最小化する包括的なオブザーバビリティプラットフォームをお客様に提供することです。
Elasticオブザーバビリティ ― 概要とコンポーネント
 

有用で、コンテクストに満ち、アクション可能な情報へデータを変換する

メトリックやログ、トレース向けのサイロ化されたツール群が、運用チームや開発チームの前に立ちはだかって行く手を阻む、というのはよくある光景です。仮にツールが1つであっても、データがサイロ化されていたり、コンテクストがない、あるいは有用なメタデータ(次元数)が失われている、ということは珍しくありません。このような問題は、MTTD(平均検知時間)とMTTR(平均復旧時間)が長くなる原因となります。Elasticオブザーバビリティはシームレスにスケールして、大量の高次元なハイカーディナリティデータを処理することができ、想定外のパフォーマンス低下やコストの増大はほとんど生じません。

スムーズにデプロイできるElastic Agentや一元的な管理機能を使って、Kubernetesをはじめとするクラウドネイティブなテクノロジーのテレメトリデータをシンプルに収集することができます。またElasticは、テレメトリデータをネイティブにインジェストする新しい統合機能をMicrosoft AzureとGoogle Cloud Platform向けにリリースしており、今後も複数の統合機能のリリースを予定しています。

Elasticオブザーバビリティ ― インターフェース
 

インシデントのトラブルシューティングを効率的に、迅速に実施するには、コンテクストが必要です。Elastic APMサービスマップはアプリのトポロジーを可視化し、またサービスのステータスや検知された異常、トランザクションのコンテクスト内のログを表示する機能を提供して、迅速なトラブルシューティングを手助けします。APMサービスマップでは、あらゆる時間軸のベースラインでサービスパフォーマンスを比較することもでき、サービスの異常な振る舞いを検知する作業が簡単になります。Elasticは最近、サードパーティサービスの依存性に対するパフォーマンスビューのサポートを開始しました。ユーザーはこの機能を利用して、環境内の死角を排除することができます。APMの機能の拡充も進めており、Mobile iOSエージェントへのサポートがテクニカルプレビューに登場しています。

Elasticオブザーバビリティ ― APM(アプリケーションパフォーマンス監視)
 

“点と点を結ぶ”Elasticが次のステップとして取り組んでいるのは、アプリとインフラをつなぐコンテクストの提供です。アプリのパフォーマンス低下はしばしば、インフラのパフォーマンスの問題によって引き起こされます。Elasticは、インフラのパフォーマンスをアプリのパフォーマンス、および関連するログのコンテクスト内で表示する機能のリリースを予定しています。この機能は、一元的なオブザーバビリティをもたらします。また以前より、バージョンやクラウドリージョン、アベイラビリティゾーン、その他のメタデータを横断してサービスパフォーマンスを比較する機能へのリクエストがElasticに寄せられています。したがって将来的には、A/B間、あるいはカナリーデプロイのパフォーマンス比較に対応し、デプロイの問題の迅速なトラブルシューティングを可能にする機能を追加する予定です。

Elasticオブザーバビリティ ― APMサービスUI
 

アドホック分析と機械学習

最新のアプリは分散型に設計され、毎日数ペタバイトものテレメトリデータを生成します。こうした状況では、チームや個人がすべての依存関係について完全な全体像を把握しているということはありえません。複雑な問題を効果的に解決するには、アクション可能なインサイトを提供する機械学習が必要です。同時に、データに関する質問を問いかける能力も欠かせません。

Elasticのプラットフォームは設定不要のリッチな機械学習機能を備えている一方、ユーザーはカスタムの機械学習ジョブを構築することが可能です。機械学習をベースに提供されるAPM相関付け機能は、アプリパフォーマンスにおける逸脱を分析して、挙動に問題があるサービスを特定します。つまりデータを検索したり、分析したりする必要がなく、ダウンタイムを短縮して開発者の生産性を高めることができます。

Elasticオブザーバビリティ ― トランザクション監視
 

システムは複雑であり、IT Ops、SRE、DevOpsチームはデータを分析、調査して、“未知”の内容を把握しなければなりません。Elasticはこの点に注目し、新しい直感的なUIを開発しました。まもなくGA(一般公開)でリリースされるこのUIには、異なるコーホートに対して質問を投げかける機能や、データ探索のためのキュレーション機能が搭載されます。具体的には、多様なソースからくるデータや、タイプの異なるデータに対してオーバーレイ、フィルタリングの操作を行い、探索的な調査を実施することが可能です。アドホックなデータ探索結果がキュレーション表示されるこのインタラクティブなビューは、データを深く探索する、あるいは“未知”を把握する、根本原因調査の時間を最小化するなど、ユーザーの様々な取り組みを実現可能にします。

Elasticオブザーバビリティ ― データ探索とアドホック分析
 

ElasticのDNAは“オープンであること”

Elasticオブザーバビリティの土台はオープンであり、ユーザーはパフォーマンス監視データを完全に制御し、フレキシブルに扱うことができます。オープンソースプロジェクトを継続的にサポートするElasticの取り組みは、Elasticプロダクトのロードマップ設計や定義にも役立っています。OpenTracingにはじまり、OpenMetrics、Jaeger、Prometheus、そして今回のOpenTelemetryに至るまで、Elasticは一貫してオープン標準とオープンプロトコルのアーリーアダプターとして活動しています。

現在Prometheusはメトリックのデファクトスタンダートであり、ユーザーにとって「オープン標準でメトリックを格納する」という1つの選択肢となっています。ユーザーがメトリックを格納、分析する際の選択肢となるよう、Elasticオブザーバビリティは、Prometheusの統合をサポートしています。OpenTelemetry(OTel)は、メトリック、ログ、トレース向けに、共通のオープン標準を開発するCNCFプロジェクトです。Elasticは、OTel protocol(OTLP)エンドポイント経由、またはKafkaを介してElasticプラットフォームへストリーミングするという形で、OpenTelemetryをネイティブにサポートしています。Elasticオブザーバビリティはオープンソースに継続的に投資して支援しており、またElasticは、運用に関する選択肢や、運用を制御する能力がユーザーの側に確保されるべきだと信じています。

Elasticオブザーバビリティ ― オープン標準、タイムラインサポート ― Prometheus、Jaeger、OpenTelemetry
 

ユーザー支援を掲げるElasticの継続的な取り組み

Elasticは継続してお客様の声に真摯に耳を傾け、包括的かつ一元的なオブザーバビリティプラットフォームを提供しています。市場で最も堅牢なエンタープライズ検索プラットフォームの提供から出発したElasticは、現在も複雑なIT環境を支援するためのイノベーションを進めています。活動的なコミュニティと連携し、Elasticオブザーバビリティは今後も、クラウドネイティブ環境やハイブリッド環境に優れた可視性を確立するオープンかつ拡張可能なプラットフォームを提供してまいります。

Elasticオブザーバビリティのビジョンについて詳しくは、ElasticON Globalの基調講演、その他のオブザーバビリティセッションをオンデマンドでご視聴いただけます。また、Elastic WebサイトのElasticオブザーバビリティページも併せてご覧ください。

本記事に記述されているあらゆる機能ないし性能のリリースおよびタイミングは、Elasticの単独裁量に委ねられます。現時点で提供されていないあらゆる機能ないし性能は、すみやかに提供されない可能性、または一切の提供が行われない可能性があります。