[B! BigQuery] oinumeのブックマーク

Export Datastore to BigQuery using Google Dataflow

oinume 2022/06/30

リンク

集中演習 SQL入門 Google BigQueryではじめるビジネスデータ分析|Tech Book Zone Manatee

データ分析のためのSQLが最速で身につく！データ分析のためのSQLが最速で身につく！昨今では、ノンエンジニアのビジネスパーソンでも、CRMの顧客情報、EC・実店舗の注文ログ、Webサイトの行動ログなどの大量のデータを入手し、分析する機会が増えました。その結果、Excelだけでは集計・分析が困難になるケースも生まれています。本書は、データの抽出・整形に用いられる言語「SQL」について、プログラミング未経験でも取り組める入門書です。Googleアカウントがあればすぐに利用でき、実務にもそのまま使える「BigQuery」をSQLの学習・実行環境として解説しています。本書のゴールは、データ分析の実務に使えるSQLのスキルをマスターした状態です。そのため、初心者向けでありながら、難易度の高い「分析関数」（ウィンドウ関数）についても解説しています。データベースの管理やメンテナンスについては省き

oinume 2021/08/21

リンク

GitHub - gcpug/ds2bq: Google Cloud Datastore ExportのデータをBigQueryにLoadするアプリケーション

oinume 2021/08/17

DatastoreのデータをBQにコピーしてくれるやつ

リンク

Best Practice to migrate data from MySQL to BigQuery

I tried several csv-formats (different escape characters, quotes and other settings) to export data from MySQL and to import it into BigQuery, but I was not able to find a solution that works in every case. Google SQL requires the following Code for importing/exporting from/to MySQL. Although, Cloud SQL is not BigQuery, it is a good starting point: SELECT * INTO OUTFILE 'filename.csv' CHARACTER SE

oinume 2020/07/18

BigQuery

リンク

スキーマ自動検出の使用 | BigQuery | Google Cloud

フィードバックを送信コレクションでコンテンツを整理必要に応じて、コンテンツの保存と分類を行います。スキーマの自動検出の使用スキーマの自動検出スキーマの自動検出により、BigQuery は CSV、JSON、Google スプレッドシートのデータのスキーマを推測できます。スキーマの自動検出は、BigQuery にデータを読み込む場合や、外部データソースに対してクエリを行う場合に使用できます。自動検出を有効にすると、BigQuery は各列のデータ型を推測します。BigQuery は、データソース内でランダムにファイルを選択し、データの最初の最大 500 行をスキャンして、代表的なサンプルとして使用します。BigQuery は、各フィールドを検証し、そのサンプル内の値に基づいてそのフィールドにデータ型を割り当てようとします。列内のすべての行が空の場合、自動検出はデフォルトで列の S

oinume 2020/07/18

BigQuery

リンク

ZOZOTOWNの事業を支えるBigQueryの話 / BigQuery behind ZOZOTOWN

全部見せます！ BigQueryのコスト削減の手法とその効果 / BigQuery Cost Reduction Methods

oinume 2020/07/18

BigQuery

リンク

IntelliJ系(DataGrip含む)でBigQueryに接続する方法 - Qiita

注意注: この記事の内容は古いです。IntelliJのバージョンが2021.1以上の人は以下の方法で接続したほうが良いです。 IntelliJ便利ですよね。 JavaのIDEとして有名ですが、その他にも様々な言語のIDEとしても使えますし、さらにはDBクライアントとしても優秀です。対応しているDBの種類が豊富ですし、機能もリッチです。ですが、BigQueryにはデフォルトで対応していないので、そこだけちょっと惜しいです。この記事ではIntelliJ系のIDEからBigQueryに接続する方法を説明します。参考にした手法とその問題点 IntelliJ BigQuery でGoogle検索すると以下の記事が最初に見つかります。 https://blog.jetbrains.com/datagrip/2018/07/10/using-bigquery-from-intellij-bas

oinume 2020/07/14

リンク

近年のデータ分析基盤構築における失敗はBigQueryを採用しなかったことに全て起因している - データエンジニアの酩酊日記

久しぶりにペラペラな思いつきを書き捨てて、寝ます。 2、3年前ぐらいにSIerやコンサルでTreasure Dataとか使ってマネージドDWH作ろうぜっていう風潮が流行って、今は運用フェーズに入ってどこも結構苦しんでるってのが僕のすごく狭い観測範囲での印象。 AWSのReadshiftしかり。なぜ苦しんでるかっていうと、言うほどスケールしないからであり、言うほどマネージドじゃないから。 Treasure Dataは基本的に割当メモリが固定でオートスケールしないので、ピーク時に合わせて必要なメモリを確保しておかないといけない。そうなるとメモリ使用量とか負荷とかをモニタリングしないといけないわけだけど、Saasだから内部のアーキテクチャが隠蔽されていていちいちサポートに問い合わせないといけなかったりする。 Redshiftの場合はそもそも自前でクラスタ管理しなくちゃいけないのでそれが大変って

oinume 2019/10/23

BigQuery

リンク

Big data and analytics resources | Cloud Architecture Center | Google Cloud

Accelerate your digital transf ormation Whether your business is early in its journey or well on its way to digital transf ormation, Google Cloud can help solve your toughest challenges.

oinume 2019/07/31

RDBからBQにDataflowでデータをsyncする方法

BigQuery

リンク

地理空間分析スタートガイド | BigQuery | Google Cloud

フィードバックを送信地理空間分析スタートガイドコレクションでコンテンツを整理必要に応じて、コンテンツの保存と分類を行います。このチュートリアルでは、地理空間分析について紹介します。地理空間分析を使用すると、BigQuery で地理空間データを分析して可視化できます。目標このチュートリアルの内容は次のとおりです。地理空間分析関数を使用して、緯度と経度の列を地理上の点に変換する 30 台を超える自転車がレンタル可能なシティバイクステーションをすべて検索するクエリを実行する BigQuery Geo Viz で結果を可視化する費用このチュートリアルでは、Google Cloud の課金対象となるコンポーネントを使用します（BigQuery を含む）。次の料金が発生します。 BigQuery 一般公開データセットに含まれるデータのクエリ。毎月、最初の 1 TB は無料です。

oinume 2019/05/20

BigQuery

リンク

Googleアナリティクスの計測ログをBigQueryに送る（無料版対応） – marketechlabo

Googleアナリティクスで収集しているデータ（メジャメントプロトコル）をBigQueryに送り、集計・可視化できるようにする。無料版のGAにも対応し、しかもサーバレスでシンプルに実装できる。本来BigQueryを使ったウェブ行動の詳細分析はGA360を使うべきなのだが、限りなく低コストでこんなことができるという参考程度で紹介する。通常無料版のGoogleアナリティクスではできないログベースの行動分析をするのに使ったり、有料版であったとしてもGAはどのようなトラフィックを除外して集計しているのか、Googlebotなどのクローラがどんな動きをしているのかなどを検証するのに使うといいかもしれない。原理はGoogleアナリティクスのJavaScriptがGoogleの計測サーバに送っているパケットを自前のサーバに送ってログ化するというシンプルなものである。従来はデータ収集用のサーバを構

oinume 2019/02/05

リンク

GitHub - GoogleCloudPlatform/protoc-gen-bq-schema: protoc-gen-bq-schema helps you to send your Protocol Buffer messages to BigQuery.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

oinume 2019/01/10

BigQuery

リンク

https://google-cloud-python.readthedocs.io/en/latest/bigquery/usage.html

oinume 2017/07/18

リンク

BigQueryの課金、節約しませんか

13. 課金の対象ストレージ - $0.020 per GB / month クエリ - $5 per TB processed (scanned) ストリーミングインサート - $0.01 per 100,000 rows until July 20, 2015. After July 20, 2015, $0.01 per 200 MB, with individual rows calculated using a 1 KB minimum size. 注目すべきはストレージ 14. 簡単な例 1TBのテーブルを毎日ロード、それぞれを一ヶ月間保持日々のデータを毎日5回スキャンして集計ストレージ : 1TB * 30 (tables) = $0.020 * 1000 * 30 = $600 クエリ: 1TB * 5 (Queries) * 30 (days) = $750

oinume 2015/11/17

リンク

Google BigQueryにMySQLのデータを入れる | Ore no homepage

肋骨が折れたかもしれん。痛え。それは置いといて…BigQuery。処理能力を体感したかったのでとりあえずMySQLの本番データをつっこんだ。fluentdでログも突っ込んでるんだけど、そっちはデータが溜まってないからまだおもしろくないかな。それについてはまた別途。まあ、fluentdでデータ突っ込むのはいろんな人がqiitaとかブログに上げてるし書くまでもないかもしれないけどね。 0. 作業の流れ MySQLからダンプを抜くダンプをCloud Storageにuploadする Cloud Storage からbigqueryにインポートするクエリ投げるという流れになる。この記事では深く言及しないが、Google Compute Platformのコンソールでプロジェクトの作成やら課金の登録やらが済んでいて、作業を行うマシンにはコマンドラインツールがインストール済みであるとする。コマ

oinume 2015/10/15

BigQuery

リンク

BigQueryを簡単にグラフにするGoogle Apps Script : TORETA（トレタ）ブログ

アプリを作ると、ユーザなどへサービスを提供する部分以外に、管理画面やサービス統計などの裏方のページを作る必要がでてきます。

oinume 2015/09/30

BigQuery

リンク

O'Reilly Japan - Google BigQuery

TOPICS Data Science , Database 発行年月日 2015年03月 PRINT LENGTH 524 ISBN 978-4-87311-716-4 原書 Google BigQuery Analytics FORMAT PDF EPUB 本書は、クラウド上でSQLを使ってビッグデータを解析するGoogle BigQueryについて包括的に解説する書籍です。Google BigQueryの使い方から内部動作、そしてBigQueryならではのSQLの活用法、サードパーティのツールとの連携までを詳しく解説します。また、BigQueryを支えるGoogleのインフラストラクチャについても総覧しており、現代最高の超巨大インフラストラクチャの姿を知ることができます。BigQueryの全体像をマスターできる本書は、ビッグデータをSQLで活用したいデータサイエンティスト、ソフトウェ

oinume 2015/03/19

リンク

'An Inside Look at Google BigQuery'を読んだ - blue_field

Google BigQueryを使ってみようと思って、最近少し勉強している。Googleがホワイトペーパーを出していたので、読んでみた。（※2012年の文献） BigQuery についてのホワイトペーパーを公開しました - Google Developer Relations Japan Blog 以下、内容の簡単なメモ。もともとGoogle社内で利用されていた Google社内で利用されてきた'Dremel'というサービスがある。巨大なデータに対してSQLライクなクエリを実行すると、数秒で結果が返ってくる。Googleでは、エンジニアだけでなくアナリストなど非エンジニアの人も利用している。 Dremelがベースとなり、外部に公開されたのがBig Query。フルマネージドなクラウドサービス。サードパーティの開発者は、REST APIやCLI, Web UIなどを利用してこのサービスにア

oinume 2015/03/16

BigQuery

リンク

BigQueryとGoogleAnalytics - Qiita

互いにGoogleのサービスです。さて、この２つ。 2013年のGoogle I/Oで連携されると発表されて早１年。実際に使われているところをあまり聞いた事ないという人も多いのでは。まぁ、これの使い方って社外秘だったりというところも多いのかなと思います。私自身もそんなにおおっぴらにお話しすることが出来なかったりなのですが、やんわり『こんな感じで使えるよ』ということをお話ししたいと思います。コストがかかるようで、コスト削減。アクセス解析基盤を作るのって結構面倒じゃないですか？うちも無いわけじゃなかったんですけど、正直チープでした。最初からアクセス解析を意識してシステムを設計して、構築されている素晴らしいものなら良いのですが、そうじゃない場合はユーザーを認識するためにプログラムを改修したり、様々なところからログを収集して、合体させたり非常に面倒なわけですよ。しかも、それをオンラインで色

oinume 2014/12/05

BigQuery

リンク

BigQueryことはじめ。あとBigQueryについて料金とか運用とか調査 - Qiita

まだ入門もしてないので「ことはじめ」じゃないです。大体触ってみたのを載せます。 Wikipedia 集計サンプルデータのwikipediaを集計してみました。データは3億行ほどあり、サイズは36GBほどあります。今回は、contributor_usernameを集計し、wikipediaに貢献している人ランキングをつくりました。上位陣はbotさん達ですね。結果としては、3億行のデータを、何も考えずに書いて 16.2秒で集計することが出来ました。 3億行を16秒。 countしなければ3秒くらいで終わります。 MapReduceみたいなのを一切書いてないのにこの速度。ちなみにテーブルはインデックスしているわけではなく毎回フルスキャンしているらしい。わお。料金データ保管: $0.026/GB/mo クエリ: $5/TB (スキャンしたデータのサイズで課金) 今回のwiki

oinume 2014/07/17

BigQuery

リンク

はてなブックマーク

タグ

関連タグで絞り込む (9)

BigQueryに関するoinumeのブックマーク (21)

お知らせ

今週のはてなブックマーク数ランキング（2025年2月第2週）

月間はてなブックマーク数ランキング（2025年1月）

今週のはてなブックマーク数ランキング（2025年2月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス