opensearchとは-その2- | 全国個人事業主支援協会

COLUMN コラム

opensearchとは-その2-

2025年02月01日
opensearchとは-その2-
- 未分類

前回の記事はこちら

Opensearchが提供する機能についてまとめる。（出典元：https://aws.amazon.com/jp/what-is/opensearch/）

特徴	利点
高度なセキュリティ	暗号化、認証、承認、および監査機能を提供します。これには、アクティブディレクトリ、LDAP、SAML、Kerberos、JSON ウェブトークンなどとの統合が含まれます。OpenSearch では、インデックス、ドキュメント、フィールドへのきめ細かいロールベースのアクセス制御も行えます。
組み込みの検索機能	フルテキストクエリ、オートコンプリート、スクロール検索、カスタマイズ可能なスコアリングとランキングなど、検索体験をカスタマイズするのに役立つ多くの機能を提供します。
SQL クエリ構文	一般的な SQL クエリ構文を提供します。aggregations、group by、where 句を使用して、データを調査します。データを JSON ドキュメントまたは CSV テーブルとして読み取るため、最適な形式を柔軟に使用できます。
SQL での検索サポート	使い慣れた SQL のクエリ構文を使用しながら、ファジーマッチング、ブースティング、フレーズマッチングなど、豊富な検索機能にアクセスすることができます。
Data Prepper	Data Prepper は、サーバーサイドのデータコレクターで、ダウンストリーム分析や可視化に向けた、データのフィルタリング、リッチ化、変換、正規化、集計を行うことができます。Data Prepper は、アプリケーションの運用を改善するためのカスタムパイプラインを構築することができます。
トレース分析	トレース分析は、OpenSearch の OpenTelemetry データを取り込み、視覚化する方法を提供します。このデータは、分散型アプリケーションのパフォーマンス問題を発見し、修正するのに役立ちます。
アプリケーションの分析	アプリケーション分析を使用して、システムの可用性ステータスを表示するカスタムオブザーバビリティアプリケーションを作成し、ログイベントをトレースおよびメトリクスデータと組み合わせて、システム全体の健全性の単一ビューにすることができます。これにより、ログ、トレース、メトリクス間を迅速に行き来して、問題の原因を突き止めることができます。
パイプ処理言語	パイプ処理言語は、パイプ (\|) で区切られた包括的なコマンドセットを備えた使い慣れたクエリ構文を提供し、データをクエリできます。
操作パネル	パイプ処理言語 (PPL) を使用して生成されたオブザーバビリティ視覚化を整理するための操作パネルを構築します。
イベント分析	パイプ処理言語 (PPL) クエリを使用して、トレースログの相関関係を含むデータのさまざまな視覚化をインタラクティブに構築して表示できます。
機械学習コモンズライブラリ	kmeans や異常検出など、さまざまな機械学習アルゴリズムを使って、モデルをトレーニングし、データの傾向を予測します。機械学習コモンズは、PPL や REST API と直接統合されています。
レポート	ダッシュボード、保存された検索、アラート、および視覚化からレポートをスケジュール、エクスポート、および共有します。
異常検出	Random Cut Forest (RCF) アルゴリズムに基づく機械学習の異常検出を活用して、データの取り込み時に異常を自動的に検出します。アラートと組み合わせて、ほぼリアルタイムでデータをモニタリングし、アラート通知を自動的に送信します。
インデックス管理	ロールオーバーや削除などの日常的なインデックス管理タスクを自動化するカスタムポリシーを定義し、それらをインデックスとインデックスパターンに適用します。
インデックス変換	特定のフィールドを中心としたデータの要約ビューを作成し、データをさまざまな方法で視覚化または分析することができます。例えば、航空データが複数のフィールドやカテゴリに分散しており、エアライン、四半期、そして料金の順に整理されたデータの概要を表示したいとします。変換ジョブを使用して、これらの特定のカテゴリで構成された、要約された新しいインデックスを作成できます。
インデックスのロールアップ	関心のあるフィールドを選び、インデックスのロールアップを使用して、それらのフィールドのみをより粗い時間バケットに集約した新しいインデックスを作成します。数か月から数年分の履歴データを、同じクエリパフォーマンスで、わずかなコストで保存することができます。
パフォーマンスアナライザーと RCA フレームワーク	多数のクラスターパフォーマンスメトリクスと集計をクエリします。コマンドラインインターフェイス (CLI) である PerfTop を使用して、メトリクスをすばやく表示および分析します。根本原因分析 (RCA) フレームワークを使用して、クラスターのパフォーマンスと信頼性の問題を調査します。
非同期検索	クエリのタイムアウトを気にせずに複雑なクエリを実行し、非同期検索クエリをバックグラウンドで実行します。クエリの進行状況を追跡し、利用可能になったときに部分的な結果を取得します。
トレース分析	分散アプリケーションの OpenTelemetry データを取り込んで視覚化します。アプリケーション間のイベントの流れを視覚化して、パフォーマンスの問題を特定します。
アラート	データを自動的にモニタリングし、ステークホルダーにアラート通知を自動的に送信します。直感的なインターフェイスと強力な API により、アラートを簡単に設定、管理、モニタリングできます。OpenSearch の完全なクエリ言語とスクリプト機能を使用して、非常に具体的なアラート条件を作成します。
バケットレベルアラート	アラートポリシーを作成し、データのグループ化されたトレンドに対してアラートを出すことができます。例えば、平均 CPU が指定した閾値を超えた各ホストに対してアラートを出すことができます。
クラスター間レプリケーション	インデックス、マッピング、メタデータを OpenSearch クラスター間で複製し、クラスター間の冗長性を実現したり、セカンダリクラスターに対し、レポートクエリをオフロードすることができます。
k-NN 検索	機械学習を使用して、通常の OpenSearch クエリを実行するのと同じくらい簡単に、数千のディメンションにわたる数十億のドキュメントに対して最近傍探索アルゴリズムを実行します。aggregations と filter 句を使用して、類似検索操作をさらに絞り込みます。 k-NN 類似検索は、製品の推奨、不正検出、画像と動画の検索、関連ドキュメントの検索などのユースケースで活用できます。
ダッシュボードノートブック	ダッシュボード、視覚化、テキストなどを組み合わせて、データを分析するときにコンテキストと詳細な説明を提供します。
OpenSearch クライアント	OpenSearch は、Go、JavaScript、Python、Java など、さまざまな言語クライアントをサポートしています。これらのクライアントを使用して、OpenSearch と直接統合するアプリケーションを構築します。