AIOpsとは?

AIOpsの定義

IT運用のための人工知能(AIOps)は、ビッグデータと機械学習を活用することで、異常検知、イベントの相関付け、インジェスチョン、運用データの処理といったITプロセスを自動化します。

AIOpsでは、インシデントを大規模に検出、把握、調査、解決するために必要な時間と作業を大幅に削減できます。トラブルシューティングの時間を削減できれば、IT部門はより価値の高いタスクやプロジェクトに集中できます。

AIOpsの仕組み

AIOpsは監視を統合し、機械学習と統計分析を追加することで、リアルタイムで脅威を特定し、問題を修正します。一般的には、すべての種類のITデータをまとめて取り込むために、拡張可能なデータプラットフォームが使用されます。これには次のようなデータが含まれます。

  • 履歴データ
  • ログとメトリック
  • パフォーマンスおよびイベントデータ
  • インフラおよびネットワークデータ
  • インシデント関連データ
  • トレースなどのアプリケーションデータ

このデータがすべて一元化され、AIOpsツールは高度な分析と機械学習を適用して、注意が必要な問題を正確に能動的に特定します。現代の組織が生成する膨大な量の未加工のオブザーバビリティデータを分析するには、これらのツールが必要です。多くの場合、アプリケーション、ワークロード、デプロイがクラウド(ハイブリッドまたはマルチクラウド)に分散し、散在し続けているため、このデータは複雑です。

AIOpsプラットフォームでは、最新の環境の特徴である複雑さと急速な変化を管理できます。これらのツールを使用すると、IT部門は次のことができるようになります。

  • 重要なアラートを特定する:すべてのイベントが等しく作成されるわけではありません。AIOpsはノイズ(他のすべてのイベント)からシグナル(異常)を分離できます。
  • 根本原因分析を可能にする:AIOpsツールはより大きい問題の兆候を特定し、相関する要因を明らかにし、問題を修正するための解決策を提案します。
  • リアルタイムで監視する:基本的なレベルでは、AIOpsツールは多くの異なるシステムの異常を監視できます。問題が発生した場合は、適切なチームに通知できます。さらに、アラートによってシステム対応をトリガーする自動修正機能を導入することで、さらに一歩踏み込むことができます。自動修正機能を使うと、エンドユーザーが問題の発生を認識する前に、問題を解決できます。
  • 継続的に改善される:機械学習を活用する場合は、時間の経過に伴い能力が改善されていきます。問題を特定し、解決することで、モデルは学習、適応することができ、将来の問題に効率的に対処できるようになります。

AIOpsの能力 — システムで必要なもの

ツールへの投資を最大限に活用するためには、AIOpsソリューションに適切な能力が必要です。これには次のような機能が含まれます。

  • 統合:AIOpsツールの効果を発揮するためには、すでに導入されているツールやシステムに包括的に統合される必要があります。これにより、さまざまなソースからデータを取り込み、機能している分野と問題が発生している分野を組織内で特定することができます。
  • マッピングとトレース:インフラ、プロセス、トランザクションフロー、依存関係を直感的なビジュアライゼーションで表示できるため、チームは俯瞰的な視点から何が起きているのかを効果的に把握できます。このため、テレメトリーデータの調査をサポートするために、サービス依存関係のマッピング機能や分散トレーシングが必要です。
  • プラットフォームアプローチ:オブザーバビリティAPMなどをサポートするAIOpsの統合プラットフォームを活用すると、データを一元化し、従来のサイロの問題を解消できます。
  • クラウドネイティブテクノロジーのサポート:AIOpsツールには、コンテナー、マイクロサービス、Kubernetesなどのオーケストレーションツールからデータを集約する機能が必要です。これにより、AIOpsツールはアプリケーションとインフラの両方のレベルで何が起こっているのかを認識し、DevOpsワークフローとスケーラビリティをサポートできます。

AIOpsのユーザー

AIOpsは、IT部門やDevOpsチームが、異なる情報源から発生する大量のデータを分析し、そこからインサイトを得るために使用されます。AIOpsは高度な分析と機械学習を利用できるため、複雑なデジタルエコシステムを抱える先進的な企業にとって不可欠なソリューションです。

AIOpsが重要である理由

AIOpsが重要である理由は、IT運用におけるトラブルシューティングの時間を削減できるということです。目標を構想し、実行するために、時間をもっと有効に使うことができるのです。AIと機械学習を活用することで、AIOpsは次のことを支援できます。

複数のデータソースを集約する
多くのAIOpsソリューションは、ログファイル、構成データ、メトリック、イベント、アラートを監視できます。これには、組織に固有の非構造化データタイプが含まれます。このようなデータを抽出して集約することで、組織のデータを一元的に管理できます。一元化されたデータは、はるかに効率的な方法で確認できます。

問題の根本原因を調査する
AIOpsの主な利点の1つは、根本原因分析です。AIOpsは、複数のシステム全体で発生した問題の原因を特定できるように支援します。問題が特定された後は、IT部門がその原因に対応し、修正できます。

潜在的な問題のあるシナリオを予測する
AIOpsは、予測分析や機械学習を使用して、IT部門が気付かない可能性がある異常を捉え、将来の傾向まで予測することがあります。AIOpsの異常検知アルゴリズムは、異なるソースからのリアルタイムデータと履歴データを比較し、異常で問題のあるパターンを探します。優先度の高い警告を発行するほどではなくても、重大な問題を引き起こす可能性のある警告を捉えることができます。場合によっては、AIOpsは自動修正により、データの問題を完全に単独で解決できます。人間の介入は必要ありません。

誤報のアラームを特定してフィルター
AIOpsによるイベントの相関は、"ホワイトノイズ"であるイベントをピンポイントでフィルタリングできます。 このようなホワイトノイズは警報を発する場合がありますが、実際には重要な問題ではありません。そして、システムはこのような問題を優先度の低い項目に分類します。この自動整理により、IT運用チームはまず最も重要なタスクに集中できます。

データストリームから継続的に学習
AIOpsの機械学習ジョブは、すべてのデータフローを分析しながら、それ自体を改善します。MLモデルが進化するにつれ、ビジネスが直面する異常を特定する能力が高まります。教師あり機械学習モデルは、ユーザーのインプットを取り込みます。そして、時間の経過に伴い、優先事項を理解する精度が上がります。ビジネスの進化に合わせて、AIOpsも進化し、運用チームにとって一層有益になります。

AIOpsの5つの利点

  1. 従業員をサポート
    高いスキルを持つDevOpsや運用チームは、手作業で面倒なデータ分析作業に追われることになります。AIOpsは、これらのタスクを自動化し、作業負荷の一部を解消できます。面倒な分析をAIOpsソリューションに委ねることで、より重要な必要とされている部分に専門知識を集中させることができます。
  2. 新しいサービスや製品の開発を高速化
    AIOpsでは、ビジネスの進化のスピードを高めることができます。AIベースの分析のサポートにより、新しいITサービスや機能を迅速に開発できます。また、AIOpsは、圧倒的なイベントとテレメトリーデータの中から最も関連性の高い情報を明らかにすることで、インシデント管理のプロセスを効率化します。
  3. IT環境を幅広く把握
    AIOpsソリューションは、データレイクやデータウェアハウスを活用して、異種のデータストリームを効率的に保存し、一元化された場所に集約できます。部門横断的なダッシュボードと分析では、すべてのデータが一元的に集約されているため、運用チームは複数のサイロ化されたビューに注意を分散する必要がありません。
  4. 顧客満足度の向上
    AIOpsは、対応時間、使用状況、可用性といったパフォーマンス要素も監視します。予測分析により、インシデントや障害による停止を防止できます。また、問題を解決し、アップグレードをより迅速に効果的に展開できます。このため、AIOpsでは、エンドユーザーにとってシームレスなエクスペリエンスを実現し、企業やブランドの価値を高めることができます。
  5. 支出を削減する
    AIOpsは、平均解決時間(MTTR)を短縮し、障害による停止が発生しないうちに防止します。また、組織内でどのような作業がコストを押し上げているのかを分析することもできます。AIOpsを通して、高いコストにつながるエラーを迅速に修正し、チームのリソースをより効率的に利用することで、予算に余裕を持たせることができます。

DevOpsやMLOpsと、AIOpsの違い

AIOpsとMLOpsは補完関係にある分野です。DevOpsはその両方の利点を生かすことができる手順やツールの集合です。

AIOpsとDevOps

DevOpsは組織にとっての文化の転換を表します。開発と運用全体のプロセスが合理化され、効率性の高いソフトウェアリリースと開発サイクルを実現できます。AIOpsもDevOpsも、強調している点は自動化の利点です。つまり、時間のかかる手作業を解消し、チームがよりスマートな方法で業務を遂行できるようにするということです。

DevOpsは、ソフトウェア開発部門やIT部門が作業を効率化できるように、ソフトウェアを使用して、ソフトウェア開発やITのプロセスを自動化および統合します。また、継続的統合と継続的デプロイ(CI/CD)の導入により、開発作業を合理化します。

AIOpsは、AIや機械学習の技術を取り入れ、システムを監視および管理することで、迅速な問題の解決を目的としています。つまり、データ分析を自動化することでDevOpsプロセスを補完し、開発者や運用チームが雪崩のようなデータを整理する作業に圧倒されることがないようにします。このため、チームは手作業で何時間もかけて分析する必要がなくなり、充実した情報に基づく意思決定ができるようになり、チームメンバーに能動的に問題点を通知できます。

AIOpsとDevOpsを組み合わせることで、特定のツールやインフラの層に集中するのではなく、システム全体を見渡せるようになります。

 

 

AIOpsとMLOps

機械学習運用(MLOps)は、AIOpsを補完する分野です。AIOpsは、機械学習を採用して、IT運用の効率化を実現します。それに対して、MLOpsは、機械学習モデルのデプロイを標準化することが目的です。MLOpsは、本番でのモデルのデプロイ、保守、監視に関係しています。これには、改善されたモデルを再デプロイするためのフィードバックインプットの取り込みが含まれる場合があります。

金融サービスでのAIOpsの活用方法

金融サービスのAIOpsは、データ分析の自動化と大規模な監視を支援します。多数の金融機関では、AIOpsソリューションは、従来のオンプレミスシステムをクラウドに移行する際のセキュリティネットとなっています。このようなソリューションには次のような効果を期待できます。

  • 運用効率の向上:問題を総体的に把握できるため、複数のシステム全体を手作業で整理しているチームの負荷が減ります。
  • 顧客の期待以上の成果:金融業界では、オンラインのカスタマーエクスペリエンスが重要な戦略上の優先項目です。AIOpsを導入すると、インシデントを迅速に解決することで、顧客が必要とするリアルタイムのアクセスを保証できます。
  • データガバナンス:AIOpsソリューションは、データソースを特定し、文書化することで、ガバナンスに必要な証跡を提供できます。
  • コストの削減:AIOpsは、ログインの問題やパスワード忘れなど、サポートチームが現在対応しているような反復的なタスクの多くを自動化できます。これにより、IT部門の時間が解放され、重要性の高い課題に取り組むことができます。

金融サービス業界のお客様事例:PSCU
SCUはElasticを利用して、取り込めるデータソースの数を大幅に増やしました。AIOpsの導入によって、PSCUはコールセンターへの対応の遅れを改善するだけでなく、自然災害など顧客に直接影響が及ぶ可能性のある事態にも適切に対応できるようになりました。

金融サービス業界向けElasticの詳細

連邦政府と地方政府でのAIOpsの活用方法

AIOpsで、政府機関の運用データの分析と修復を自動化できます。自動化により、職員が新しいスキルを習得したり、追加のスタッフを採用したりしなくても、デジタルトランスフォーメーションの目標を達成できます。AIOpsソリューションは、技術的なものでも業務に関するものでも、膨大な量のデータを取り込んだり、監視したりできます。AIOpsが見つけた異常を担当チームが確認して、より大きなパターンを特定し、今後のためにアラートを設定したり、サイバー脅威に対する防御を強化したりできます。

公共部門のお客様事例:ある米国州政府機関は、Elasticを使用してIT環境をエンドツーエンドで可視化しています。また、以前は手作業で行っていたプロセスを自動化して、80%以上の効率化を実現しています。

公共部門向けのElasticのAI/MLサービスについて詳しく見る

小売業界でのAIOpsの活用方法

今日の小売業の顧客はデジタルの知識が豊富で、シームレスなユーザーエクスペリエンスを求めています。AIOpsは、能動的に問題を検出して解決することで、小売業者における顧客満足度を高めることができます。AIOpsを利用することで、小売業者は運用効率を改善し、顧客に影響を与える前に一般的な問題に自動的に対応できます。問題が大きくなる前に解決できれば、収益が拡大し、顧客ロイヤリティも向上します。

また、履歴データを分析して将来の傾向を予測し、どのような製品やサービスを提供すべきかという意思決定を支援することもできます。一元化されたシステムにより、急速に変化するグローバル在庫を可視化し、Webサイトから商品を削除するタイミングをより的確に予測できます。

小売業界のお客様事例:Home DepotHome Depotで一連のネットワーク停止が発生したときには、ロードバランサーサーバーで検知される前に、Elasticが問題を自動的に修正しました。この大手ホームセンターのシニアITアーキテクト/マネージャーは、Elasticは「サーバーの損失をとても優雅に処理する」と指摘しています。

小売業界向けElasticの詳細

ElasticからAIOpsソリューションを使用して組織の能力を高める

Elasticオブザーバビリティは、複雑なクラウドネイティブ環境をフルスタックで可視化するAIOpsソリューションです。Elasticは、2022年度第4四半期に、The Forrester Wave™:Artificial Intelligence for IT Operations(AIOps)でStrong Performerと評価されました。

Elasticオブザーバビリティでは次のことができます。

  • ログを監視し、ペタバイト規模のログを簡単に一元化して検索
  • アプリケーションパフォーマンス監視(APM)を使用して、デプロイを高速化し、コードの品質を改善
  • 大規模なインフラ監視をシンプルに実行
  • ユーザーインタラクションとパフォーマンスを測定&追跡
  • 顧客エクスペリエンスを能動的に監視して検証

組織でElasticオブザーバビリティを使用してAIOpsソリューションを活用する方法の詳細

次にやるべきこと

  1. 無料トライアルを開始して、Elasticがビジネスにどのように役立つのかを実感してください。
  2. プロダクトのツアーで、Elasticsearchプラットフォームの仕組みと、ソリューションがニーズにフィットする仕組みをご確認ください。
  3. オブザーバビリティ:最先端のオブザーバビリティに関するガイドを読んで、オブザーバビリティソリューションを最大限に活用するためにどのような準備が必要なのかを把握してください。
  4. 興味を持ってくれそうな人とこの記事を共有してください。メール、Twitter、Facebookで共有しましょう。