山市 祥大 wrote a new post, Amazon Redshiftの便利な関数:LISTAGG() 3週間 2日前
LISTAGG()は、グループ化されたデータの値を1つの文字列に連結する集計関数です。複数行のデータを1行にまとめたい場合に特に便利で、カンマ区切りやその他の区切り文字で値を結合できます。
構文:
LISTAGG(expression [, ‘delimiter’]) WITHIN GROUP (ORDER BY order_list)
使用例:
sql
— 部署ごとの従業員名を連結
SELECT[…]
山市 祥大 wrote a new post, Amazon RedshiftのDATEADD()関数について 3か月 3週間前
Amazon[…]
山市 祥大 wrote a new post, Kaggleについて 7か月 3週間前
Kaggleは、初心者からプロフェッショナルまでを対象としたデータ分析コンピューションプラットフォームです。全世界の情報、質問、教材、データセットと連携し、データサイエンスに興味がある全てのレベルに対応しています。
Kaggleは二つ主要な機能を提供します。まず、ユーザーがデータセットを掲載し、そのデータを元にした議論や分析を共有するプラットフォーム。そして、様々な企業が主催するデータ分析コンテスト。これらのコンテストで[…]
山市 祥大 wrote a new post, Amazon RedshiftでPERCENTILE_CONTを使用して中央値を求める 9か月 2週間前
Amazon[…]
山市 祥大 wrote a new post, Docker に MySQL を用意する手順 10か月 1週間前
1. ディレクトリ構成の決定
以下のようなディレクトリワークスペースを作成します。
/my-docker-mysql
├── Dockerfile
├── config
│ └── my.cnf
└── data
Dockerfile : Dockerイメージを構成するための指示書
config/my.cnf : MySQLの設定ファイル[…]
山市 祥大 wrote a new post, Amazon Redshift RANK()関数について 10か月 3週間前
RANK()関数は、特定のパーティション内の行にランキングを付けるためのウィンドウ関数です。この関数は、同一値に対して同じ順位を割り当て、次の順位はスキップされます。たとえば、2つの行が1位の場合、次の行は3位になります。
具体的な使用法は次の通りです:
SELECT department, sales, RANK() OVER (PARTITION BY department ORDER BY sales DES[…]
山市 祥大 wrote a new post, BIツール「Redash」とは 11か月 3週間前
業務でRedash(リダッシュ)を使用しているので、当ツールに関して簡単にまとめました。
Redash(リダッシュ)は、企業や組織がデータを可視化し、インサイトを共有するためのオープンソースのBIツールです。
SQLやGraphQLなど多様なデータソースにクエリを実行し、結果をダッシュボードやグラフとして視覚的に表示します。
Redashを活用することで、非技術者でもデータに基づいた意思決定を行いや[…]