はむはむエンジニアぶろぐ

このブログのコンセプトは"ハッキングの為なら愛する家族を傷つけることをいとわない" 自分にとってエンジニアリングは "手段ではなく生きる目的" である

EC2にRedashを導入してみた

EC2環境にBIツールのRedashを導入してみたので、インストール手順からある程度触ったところをメモφ(..)メモメモ。
Query機能とChart機能を試してみました。

公式ドキュメント: https://redash.io/
GitHub: https://github.com/getredash/redash

Redashについて

DBやBig Dataなどのデータソースからデータを引っこ抜いてきて、グラフにできるBIツール。
作成した分析結果をwebでシェアできるので共有が簡単。
アラート機能もあり、一定のしきい値を超えた場合、アラートを流すことができる。

Redashは、OSSなのでソースコードも公開されていて、無料で使えます。
Hosted版とSelf hosted版があり、自分でサーバ用意したり運用するのが面倒ならHosted版を使うといいです。(もちろん有料だけど)

EC2にRedashを導入する

公式のガイダンス に沿って導入を行う。
公式が提供しているAMI(Amazon machine images)を使えばインストール作業など不要です。

ap-northeast-1(日本)のami-34cfe853を使用してインスタンスを作成します。
インスタンス作成したらhttpリクエストするともうRedashが使える。

Query機能を使う

Query機能で、データソースからデータを引っこ抜いてビジュアライズします。
データソースの登録作業は割愛。

こんな感じにクエリを登録できる。
日付型は加工せずに(/区切りとか)返してあげると、Redashがよしなに解釈してくれる。

f:id:secret_hamuhamu:20170504162248p:plain

Chart機能を使う

Query機能で作成したデータセットをChart機能でビジュアライズできます。
例えば、X軸(横)に年月, Y軸(縦)に登録数を定性的なカテゴリ情報(性別など)を比較して表示。 f:id:secret_hamuhamu:20170504162529p:plain


設定項目はこんな感じ。
f:id:secret_hamuhamu:20170504162318p:plain

Chart以外にもビジュアライズする手段はいっぱいあるので、目的にあったグラフを使いましょう。
https://redash.io/help/visualization/visualization.html

それから、ジョブスケジューリングできるので、1時間ごととか1日ごとでチャートを更新できるのでcron登録は不要。