コラム

Looker Studio データ抽出でデータ読み込みパフォーマンスを向上する

マーケティングデータアナリスト
八木 耕祐(文責)

Looker Studioで利用できる『データ抽出』機能とは

Looker StudioはGoogleが提供している無料のBIツールです。直観的なマウス操作で、見やすく分かりやすいマーケティングダッシュボードを構築できます。さらに、様々なコネクタを活用して複数のデータソースを一つのダッシュボードに統合することで、一元的な分析が可能です。
しかし、リアルタイムで大量のデータを扱う場合、以下のような課題が発生することがあります。

・読み込み速度の低下:ダッシュボードに配置したコンポーネント(※表やグラフなどのデータ参照部品)の表示が遅くなる。
・操作性の低下:インタラクティブな操作(フィルタ適用や期間変更など)がスムーズに行えなくなる。

これらの課題を解決するために役立つのが、Looker Studio の『データ抽出』機能です。

『データ抽出』機能の概要

『データ抽出』機能を利用することで、データソースから特定のフィールドを指定し、そのフィールドだけを含む「抽出済みデータソース」を作成することができます。これは、Looker Studio(Googleのサーバー)に集計テーブルを保持するイメージです。

参考)パフォーマンス向上のためにデータを抽出する
https://support.google.com/looker-studio/answer/9019969?hl=ja

具体的には、以下のような仕組みで動作します。

1.通常のデータ参照
Looker Studioがコネクタを通じてデータソースを参照する場合、各種サービス(例えば、GoogleアナリティクスやBigQueryなど)に都度アクセスする必要があります。そのため、読み込み速度が遅くなる可能性があります。

2.抽出済みデータソースの利用
一方で、『データ抽出』機能を使って抽出済みデータソースを利用する場合は、必要最低限のデータソースのみをLooker Studio内に保持します。これにより以下のメリットが得られます。
・読み込み速度の向上:コンポーネントの表示がスムーズになる。
・操作性の向上:期間設定やフィルタ適用の反映速度が速くなる。

『データ抽出』の活用ポイント

『データ抽出』は、以下のようなシーンで特に有効です。

・大規模データの処理
リアルタイムで大量のデータを扱う場合、抽出済みデータを使用することでパフォーマンス改善が期待できます。

・頻繁な分析が必要な場合
抽出したデータを事前にまとめておくことで、繰り返し行う分析作業の効率化が図れます。

・システム負荷の軽減
データソースへのアクセス回数を減らすことで、元のデータソースやシステムへの負荷を軽減できます。

『データ抽出』機能は、Looker Studioでのデータ分析体験を快適にし、効率的なダッシュボード運用を実現する重要なツールです。特に大量のデータを扱う際には、この機能を活用することで、より迅速かつスムーズなデータ分析が可能になります。

利用上の注意点(仕様)

『データ抽出』機能を利用する際、いくつか注意点があるためご紹介します。

1.「抽出済みデータソース」のデータ量の上限は100MB
データ量が100MBを超えると、エラーメッセージが表示されます。ただし、後述の自動更新でエラーが発生した場合は、エラーメッセージは表示されず、コンポーネント自体にエラーが表示されます。
指定したフィールドのデータ量を確認する方法が現時点ではないため、試行錯誤で最適な抽出設定を探すしかありません。

2.静的データであるため、データを最新化する際は更新が必要
『データ抽出』機能実行時の実行結果を保持する機能であるため、リアルタイム性はありません。最新の結果を抽出する際は、後述の自動更新を設定する必要があります。

3.統合データソースはデータ抽出に利用できない
Looker Studioでは複数のデータソースを統合して単一のデータソースを作成する機能(※SQLにおけるJOIN)がありますが、この機能で作成した「統合データソース」は、『データ抽出』機能の実行対象として指定することはできません。

4.再利用可能にできない
Looker Studioで利用できるデータソースの種類として、現在編集しているレポートのみで利用できる【埋め込みデータソース】と、様々なレポートで利用できる【再利用可能なデータソース】があります。「抽出済みデータソース」は、『データ抽出』機能を設定したレポートでしか利用することができません。

具体的な活用例

Looker Studio の『データ抽出』機能は、様々な場面で活用できます。以下に具体的な活用例をご紹介します。

Googleアナリティクス4(以下、GA4)の割り当てエラーへの対策

Looker StudioのGoogle ConnectorsであるGA4コネクタを利用してレポートを作成する時、GA4データの取得に関してGoogle Analytics Data APIの仕様や制限に準拠する為、上限を超えた場合は各コンポーネントで割り当てエラーが発生することがあります。

詳細)割り当て | Google Analytics | Google for Developers
https://developers.google.com/analytics/devguides/reporting/data/v1/quotas?hl=ja

「抽出済みデータソース」を利用することで、APIリクエストを『データ抽出』機能実行時のみに限定することで、割り当てエラーの発生を抑制することができます。

Partner Connectors 利用時のAPI制限への対策

Partner Connectorsはサードパーティサービスへ接続できる一方、サービスのデータ量が多い場合は、レポートの表示速度が著しく低下することがあります。また、サードパーティ側のAPI制限として、1時間あたりのリクエスト回数、1日あたりのリクエスト回数などの制限が設けられていることがあり、そもそもレポートにデータが表示されない可能性もあります。

「抽出済みデータソース」はGoogleのサーバーにデータソースを保持する為、APIリクエスト数の削減と、データ量の削減が期待できます。

BigQuery スキャンの改善(コスト削減)

BigQueryは大規模データ分析を行うデータウェアハウス(以下、DWH)であり、利用するデータ量(スキャン量)に応じて利用料が発生します。
BigQueryテーブルをデータソースとした場合、レポートが閲覧されたり、期間設定・フィルタを利用するごとにクエリが実行され、BigQueryの利用料が発生します。

「抽出済みデータソース」を利用することで、スキャン量を最低限にすることで、BigQuery利用料を抑制することができます。

設定方法

『データ抽出』機能は以下5つの手順で利用することができます。

1.「データの抽出」コネクタを選択

ヘッダーの「データを追加」をクリックし、「データの抽出」を選択します。

2.抽出対象のデータソースを選択

「Select a data source」をクリックして、抽出対象のデータソースを選択します。
なお、抽出対象として選択可能なデータソースは、作業しているレポートに追加されているデータソースか、再利用可能なデータソースである必要があります。

今回はGA4プロパティを対象として、データ抽出を行います。

3.抽出するディメンションと指標を選択

抽出するディメンションと指標を選択します。
今回は下記を選択します。

ディメンション
・セッションのメディア
・セッションの参照元

指標
・セッション
・総ユーザー数
・新規ユーザー数
・コンバージョン

4.データの抽出期間を設定

指標の下にある期間「自動期間」をクリックすると、カレンダーが表示されます。
カレンダーを操作して、データの抽出期間を設定します。

期間設定は、絶対指定(例:8月1日~8月10日と固定の期間を指定すること)や、今日を起点に過去n日前~1日前など、詳細期間を設定することが可能です。

期間を設定後、「適用」を押下します。

本コラムではGA4コネクタでデータソースを選択しており、内部的にevent_dateが指定されているため抽出期間のディメンションを選択する必要がありませんが、例えばBigQueryテーブルをコネクタとしてデータソースを作成した場合は、抽出期間とするディメンションを指定する必要があります。

5.データソースの自動更新を設定

「抽出済みデータソース」を定期的に更新する場合は、【自動更新】にチェックを入れて自動更新の開始日・開始時間と、リピート間隔を設定します。

開始時刻とリピート間隔を設定後、「保存して抽出」をクリックして、「抽出済みデータソース」を作成します。

「抽出済みデータソース」作成に失敗した場合の表示
「抽出済みデータソース」作成に失敗した場合、下記キャプチャのようなメッセージが表示されます。

多くは、データ量上限の100MBを超えている場合ですので、ディメンションを取捨選択したり、抽出期間を調整するなどの対策を講じてください。

まとめ

Looker Studioの『データ抽出』機能は、利用するデータ量を制限することで、データ読み込みに関するパフォーマンスを向上させることができます。一方、データ量が制限されるため、新しい分析テーマに取り掛かる際に、必要なデータが不足していることがあり、新たな発見や洞察を得ることが難しくなります。
メリット、デメリットを理解し、ご自身の可視化の目的に合わせて利用ください。

マーケティング・データマネージメント推進支援サービスはこちら

八木 耕祐

マーケティングデータアナリスト

八木 耕祐

Web行動履歴やアプリデータによる顧客行動分析

アナリストとして、50社のアクセスログ分析に携わる。現在は、データ設計、データマート構築などの基盤づくりから、ダッシュボード作成、分析まで、データ活用を極めている。セミナー登壇は50回以上、満足度90%以上のセミナーも多数。
リモートワークになり、海の近くでマリンスポーツをエンジョイ中。

TOP