一般社団法人 全国個人事業主支援協会

COLUMN コラム

  • AWSのAthenaについて②

時代はクラウドということで、クラウド関連の案件が増えて来ましたので、
Amazon Web Servicesに関する知識を深めようと思います。

続きで、Athena を使う際には、Glue Data Catalog(または Athena のデータカタログ)にテーブル定義を登録します。これは「S3 のどのパスに、どんな形式のデータが、どんなカラム構造で置かれているか」を定義するだけのもので、実際にデータをロードする処理はありません。テーブルを作成した瞬間から、そのデータに対して SQL を投げられるのが特徴です。

Athena はログ分析との相性が非常に良いです。例えば、ALB や CloudFront、アプリケーションログを S3 に集約しておけば、障害調査や利用状況の集計を SQL 一発で行えます。Redshift のように事前にスキーマを厳密に決めてロードする必要がないため、「まず貯めて、あとから分析する」スタイルに向いています。一方で、頻繁な小さなクエリや、トランザクション処理のような用途には適していません。

Firehose や CloudWatch と組み合わせるケースも多く見られます。CloudWatch Logs で短期的な監視やアラートを行い、そのログを Firehose 経由で S3 に保存します。そして、溜まったログを Athena で横断的に分析する、という流れです。この構成にすると、運用監視とデータ分析を分離でき、コスト管理もしやすくなります。

The following two tabs change content below.

DSES

最新記事 by DSES (全て見る)

この記事をシェアする

  • Twitterでシェア
  • Facebookでシェア
  • LINEでシェア