Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

BigQueryに関するmisshikiのブックマーク (66)

  • ジョブエクスプローラでBigQueryのボトルネックをリサーチする - バイセル Tech Blog

    こちらはバイセルテクノロジーズ Advent Calendar 2024 の20日目の記事です。 昨日は辻岡さんによる「品質とスピードを両立するためにチーム体制を変えている話」でした。 こんにちは。データエンジニアの遠藤です。現在、私はデータサイエンス部に所属して「Pocket」と呼ばれる全社データ基盤の開発・運用に従事しています。 記事では、ジョブエクスプローラを用いることでBigQueryのボトルネックを容易にリサーチできるようになった件について報告します。 Pocketについて ダッシュボードでのBigQueryモニタリング Google Cloudが標準で提供するダッシュボードの利用 ダッシュボードの自作 ジョブエクスプローラ ジョブエクスプローラを実際に使ってみる ジョブエクスプローラのメリット ボトルネックが容易に特定できるようになった クエリコストをかけずにボトルネックを探

    ジョブエクスプローラでBigQueryのボトルネックをリサーチする - バイセル Tech Blog
    misshiki
    misshiki 2024/12/20
    “ジョブエクスプローラを用いることでBigQueryのボトルネックを容易にリサーチできるようになった”
  • BigQueryエミュレータを使ったETLのインテグレーションテスト - MonotaRO Tech Blog

    TL;DR BigQuery Emulator と fake-gcs-server を組み合わせることでbqコマンドでCSVファイルを読み込んでETLのインテグレーションテストができた。 はじめに こんにちは。先日こちらの記事を書いたCTO-Officeの藤です。そこでは書ききれなかったETLについて書いておきたいと思います。 ビッグデータを扱うETLのテストを行いたい場合に、DBからExtractするEの部分など、ユニットテストやモックでは担保できないところが出てきます。 そのようなインテグレーションテストに、OSSのBigQuery Emulatorを活用できる場合があります。 背景 モノタロウでは、マイクロサービスで実装したGoのロジックをApache Beam Go SDKでラップして、Cloud Dataflowで定期実行することで商品の出荷目安のデータを生成して様々なチャネル

    BigQueryエミュレータを使ったETLのインテグレーションテスト - MonotaRO Tech Blog
    misshiki
    misshiki 2024/12/19
    “BigQuery Emulator と fake-gcs-server を組み合わせることでbqコマンドでCSVファイルを読み込んでETLのインテグレーションテストができた。”
  • Google BigQueryからSnowflakeへ。バクラクのデータ基盤技術移管事例 - Findy Tools

    公開日 2024/12/10更新日 2024/12/10Google BigQueryからSnowflakeへ。バクラクのデータ基盤技術移管事例 はじめにLayerXでは、「バクラク」という企業のバックオフィス業務を効率化するクラウドサービスを提供しています。稟議、経費精算、法人カード、請求書受取、請求書発行といった経理業務に加え、勤怠管理といった人事領域(HRM)の業務を効率化するサービスも展開しています。最新のAI技術を活用し、お客様の業務が、より「ラク」になる環境の実現を目指しています。導入実績は10,000社を超え、多くのお客様に選んでいただいております。 バクラク | バックオフィスから全社の生産性を高める このようなサービスを支えるためには、ビジネスニーズに迅速に応えられる拡張性の高い効率的なデータ基盤が不可欠です。バクラクでは、サービスの成長と共に増大するデータ量や複雑化する

    Google BigQueryからSnowflakeへ。バクラクのデータ基盤技術移管事例 - Findy Tools
    misshiki
    misshiki 2024/12/10
    “この移行プロジェクトの紹介を通じて、バクラクがデータ基盤の主要技術をGoogle BigQueryからSnowflakeへ刷新した理由について詳しく述べます。”
  • データウェアハウスをRedshiftからSnowflakeに移行するために考えたこと(1) - Uzabase for Engineers

    この記事は NewsPicks Advent Calendar 2024 の6日目の記事です。 ソーシャル経済メディア「NewsPicks」の中村です。最近はデータ基盤の開発運用、データアナリストのサポート、LLM活用等をやっています。 現在、NewsPicksではデータウェアハウスとして長年利用してきたAmazon RedshiftからSnowflakeへの移行を進めています。まだ移行作業の途上ではありますが、完了の目処が立ったので、なぜデータ基盤の移行を行なっているのか、どのように移行計画を立てたか、実際に移行作業を進めてみてどうだったか等を紹介したいと思います。データ基盤を運用している方、データウェアハウスの比較検討をされている方などの参考になれば幸いです。 なぜデータウェアハウスを移行するのか Redshiftのパフォーマンスとコストの問題 まず、NewsPicksの従来のデータ基

    データウェアハウスをRedshiftからSnowflakeに移行するために考えたこと(1) - Uzabase for Engineers
    misshiki
    misshiki 2024/12/09
    “パフォーマンスとコスト管理の点では、Snowflakeがやや有利 生成AIと分析者体験の点では、BigQueryがやや有利”
  • Google、Gemini in BigQueryを正式公開!データ分析に革命が起きそう — 自然言語でデータ分析可能、更に分析用プロンプトをAIが提案

    8月29日、GoogleはGemini in BigQueryの複数の新機能を正式に提供開始した。 Gemini in BigQueryとは、Google Cloudのデータ分析プラットフォームであるBigQueryにAI機能を統合した新しいサービスであり、データ分析作業の効率を飛躍的に向上させる。これにより、ユーザーはAIを活用して複雑なデータセットの分析や重要な情報の抽出を、より簡単かつ迅速に行うことができる。 特に注目すべきは、自然言語での指示を通じてAIが適切なSQLクエリやPythonコードを生成する機能である。たとえば、ユーザーは次のように指示を出すことができる: 「このテーブルの各製品ごとの総売上を計算して。」 「pandasを使って、製品の売上と顧客レビュー数の相関を求めるPythonコードを書いて。」 「サブスクライバータイプ別に平均旅行時間を計算して。」 これらの指示を

    Google、Gemini in BigQueryを正式公開!データ分析に革命が起きそう — 自然言語でデータ分析可能、更に分析用プロンプトをAIが提案
    misshiki
    misshiki 2024/09/02
    “8月29日、GoogleはGemini in BigQueryの複数の新機能を正式に提供開始した。 Gemini in BigQueryとは、Google Cloudのデータ分析プラットフォームであるBigQueryにAI機能を統合した新しいサービスであり、データ分析作業の効率を飛躍的に
  • BigQueryの承認済みビューを利用した社内データ公開設計 - enechain Tech Blog

    はじめに 旧BigQuery構成と課題点 新GCP Project/BigQuery構成 承認済みビューの設定 結果 終わりに はじめに enechainのデータプラットフォームデスクで2年目エンジニアをしている菱沼です。 記事では、社内ユーザに対する閲覧権限をBigQueryの承認済みビューを用いて改善した例をご紹介します。 事業規模の拡大に伴い、各種データへのアクセス権限整備の重要性が増し、BigQuery上のデータも厳密な権限管理が求められるようになりました。 今回は、我々が抱えていたBigQueryアーキテクチャの権限管理上の課題と、その課題に対する取り組みについて具体的にご紹介します。 ぜひ最後までお付き合いください! 旧BigQuery構成と課題点 データプラットフォームデスクで構築しているデータ基盤の1つに、 外部データソースから取得したデータを収集・蓄積するためのETLパ

    BigQueryの承認済みビューを利用した社内データ公開設計 - enechain Tech Blog
    misshiki
    misshiki 2024/07/30
    “社内ユーザに対する閲覧権限をBigQueryの承認済みビューを用いて改善した例をご紹介”
  • BigQueryとGemini 1.5 Proによるラーメン店クチコミの定量分析 - G-gen Tech Blog

    G-gen の神谷です。記事では、Google Maps API から取得したラーメン店のクチコミデータに対する定量分析手法をご紹介します。 従来の BigQuery による感情分析の有用性を踏まえつつ、Gemini 1.5 Pro の導入によって可能となった、より柔軟なデータの構造化や特定タスクの実行方法を解説します。 分析の背景と目的 可視化イメージ 分析の流れとアーキテクチャ クチコミデータ取得と BigQuery への保存 API キーの取得 データ取得のサンプルコード クチコミ数の制限と緩和策 料金 感情分析とデータパイプライン Dataform の利点 Dataform を使った感情分析のパイプライン定義例 感情分析の結果解釈 ML.GENERATE_TEXT(Gemini 1.5 Pro) 関数を使用した高度な分析 ユースケースに応じた独自の評価観点によるクチコミの定量化

    BigQueryとGemini 1.5 Proによるラーメン店クチコミの定量分析 - G-gen Tech Blog
  • BigQuery縦持ちデータを動的に横持ちデータにする方法 - ドワンゴ教育サービス開発者ブログ

    はじめに ドワンゴ教育事業でデータアナリストとして働いている小林です。 一般的にデータアナリストはデータの収集・分析を通して組織の意思決定を支援する役割を期待されることが多く、ドワンゴ教育事業における私のミッションもKPI動向の可視化やダッシュボード / レポートの作成・提供を通してデータドリブンな組織に貢献するところにあります。 私たち教育事業には施策を実行する企画者やビジネス上の意思決定者だけでなく、サービスを活用して教育の現場に立っている方々、サービスに展開している教材を制作しているチームなど多様な方面からデータ収集・分析の需要があります。それだけにやりがいも大きく楽しい日々を過ごしています。 課題について(導入に代えて) クエリを書いて、結果を分析して、資料にまとめて、展開して、共有して・・・みたいな仕事をしているとSQLで抽出した縦持ちのデータを横持ちに作り変えたいことがよくあり

    BigQuery縦持ちデータを動的に横持ちデータにする方法 - ドワンゴ教育サービス開発者ブログ
    misshiki
    misshiki 2024/07/17
    “以上までの内容をチームの同僚に見てもらったところ「PIVOTは動的に使えますよ、EXECUTE IMMEDIATE FORMATを利用して!」と教えてもらい、膝から崩れ落ちました。”
  • BigQueryとLookerStudioのニッチな落とし穴についてまとめてみた - Timee Product Team Blog

    こんにちは、タイミーでデータアナリストをしているyuzukaです。 主にプロダクトの分析に携わっています。 ビジネス職からデータアナリストに転向して約1年経った私が、1年前の自分に教えてあげたい、BigQueryや LookerStudioに関する落とし穴を、いくつか挙げてみようと思います。 はじめに 弊社では、分析環境として BigQueryを採用しています。LookerStudioを使って、 BigQueryのデータを参照してダッシュボードを作ることもよくあります。 BigQueryの SQLを使った分析を進めていく中で、想定と異なるデータが出てきてしまい、原因を特定するのに苦労し、無駄な時間を費やしてしまった経験が何度もあります(実際には、そんな過程もきっと無駄ではないと信じたい)。 こちらのブログを読んでいただいたみなさまには、同じ苦労を味わっていただきたくないので、私が今までにハ

    BigQueryとLookerStudioのニッチな落とし穴についてまとめてみた - Timee Product Team Blog
    misshiki
    misshiki 2024/07/01
    “同じ苦労を味わっていただきたくないので、私が今までにハマってきた落とし穴をいくつか紹介します。 1. BigQueryで使える一部の記法は、LookerStudioでサポートされておらず、接続エラーになる”
  • BigQueryを補完する技術: DuckDBとDataflowでのデータ処理入門 - yasuhisa's blog

    背景 & Disclaimer DuckDB 概念や代表的なユースケース 使ってみる 1週間〜一ヶ月などある程度の期間、分析で使いたい場合 便利なCLIツールとして使う 所感 参考 Dataflow 代表的なユースケース 具体例 参考 背景 & Disclaimer BigQueryは非常に便利で、BigQueryにさえ上がってしまえばSQLで巨大なデータを簡単に相手にできます とはいえ、BigQueryに行きつくまでが大変な場合もありえます 例: 個人情報を含むsensitiveなデータで、BigQueryに気軽に上げられないケース 一時的であっても、相談なしにその手のデータを気軽にアップロードするのはやめてください... 数万件程度であれば手元のエクセルで開いて、問題ない行/列だけに絞る、ということもできるが、もっと量が多いデータだとそういうわけにもいかない。そもそも分析はSQLでやり

    BigQueryを補完する技術: DuckDBとDataflowでのデータ処理入門 - yasuhisa's blog
  • BigQuery RAG による LLM 機能の強化 | Google Cloud 公式ブログ

    Gemini 1.5 モデル をお試しください。Vertex AI からアクセスできる、Google のもっとも先進的なマルチモーダル モデルです。 試す ※この投稿は米国時間 2024 年 5 月 21 日に、Google Cloud blog に投稿されたものの抄訳です。 生成 AI の台頭により、興味深い未来の AI 活用法が多く語られていますが、一方で限界もあります。生成 AI の主力である大規模言語モデル(LLM)は、特定のデータやリアルタイムの情報を活用できないことが多いため、特定のシナリオで効果を十分発揮できないことがあります。検索拡張生成(RAG)は、自然言語処理における手法で、2 段階のプロセスによって、より有益で正確なレスポンスを提示します。まず、提示された質問との類似性に基づき、より大規模なデータセットから関連するドキュメントまたはデータポイントを検索します。次に、生

    BigQuery RAG による LLM 機能の強化 | Google Cloud 公式ブログ
  • 自然言語でデータ分析ができるGemini in BigQuery(データキャンバス)を試してみた - G-gen Tech Blog

    はじめまして!4月に G-gen に入社した奥田梨紗です。この度 Google Cloud Next '24 in Las Vegas で発表された Gemini in BigQuery を試してみたので手順等をご紹介します。 はじめに Gemini in BigQuery とは 試したこと Google Cloud 側へ利用申請を行う BigQuery キャンバスを作成 Gemini in BigQuery を用いて SQL やグラフを作成 例1: 特定の数値でデータを分類する 例2: 分類分け 例3:グラフを作成 関連記事 はじめに Gemini in BigQuery とは Google Cloud Next '24 で発表された Gemini for Google Cloud の機能の1つです。 データキャンバスを作成し、自然言語(いわゆる普段話す言葉)をプロンプトに入力することで

    自然言語でデータ分析ができるGemini in BigQuery(データキャンバス)を試してみた - G-gen Tech Blog
    misshiki
    misshiki 2024/04/12
    “Gemini in BigQuery とはGemini for Google Cloudの機能の1つで、データキャンバスを作成し、自然言語をプロンプトに入力することでSQLやPythonの構文を作成してデータ分析ができる機能。”
  • GitHub - goccy/bigquery-emulator: BigQuery emulator server implemented in Go

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - goccy/bigquery-emulator: BigQuery emulator server implemented in Go
    misshiki
    misshiki 2024/03/12
    “Go で実装された BigQuery エミュレータ サーバー。 BigQuery エミュレータは、テストと開発のためにローカル マシン上で BigQuery サーバーを起動する方法を提供します。”
  • BigQuery Emulator をアップデートしました - Route54

    BigQuery Emulator の v0.6.0 をリリースしました。 今回のリリースでは、Recidiviz社 の @ohaibbq さんが多大な貢献をしてくださいました。Recidiviz社ではかなり前から BigQuery Emulator を使ってくれているようで、以前から Issue や DM などでそのことを伝えてくれていましたが、@ohaibbq さんが今Qエミュレータの改善にコミットできるということで、 Recidiviz社側で fork して使っていたものに加えていた patch をたくさん送ってくれました。 かなり多くの改善が入っているので、以前エミュレータを試して動かなかったクエリを再度試す良い機会かなと思っています。 @ohaibbq さんからは、嬉しいことに今後も貢献してくださると言っていただけているので、今後の改善も速いペースで進んでいくと思います。素晴らし

    BigQuery Emulator をアップデートしました - Route54
    misshiki
    misshiki 2024/03/12
    “BigQuery Emulator は Google から特に支援を頂いていたりはしません。 ...4年かかって何も出てこない以上、残念ですが今後も Google からのエミュレータ提供には期待できなさそうです。”
  • クラスメソッド データアナリティクス通信(機械学習編) – 2024年3月号 | DevelopersIO

    データアナリティクス事業部 インテグレーション部 機械学習チームの鈴木です。 クラスメソッド データアナリティクス通信(機械学習編) の2024年3月号です。2024年2月分のアップデート情報をお届けできればと思います。 はじめに AWSでは、S3 Express One Zoneを使ったAmazon SageMakerのモデルトレーニング高速化の一般提供開始がアナウンスされました。またAmazon Rekognitionで新しいモデレーションラベルが追加され、より精度高く利用できるようになったことも嬉しいお知らせでした。 Google Cloudでは、なんといってもVertex AI Geminiの一般提供開始が目玉だったと思います。これに合わせてBigQuery MLからも利用ができるようになりました。また、BigQuery MLからVertex AI PaLM2 APIへエンべディ

    クラスメソッド データアナリティクス通信(機械学習編) – 2024年3月号 | DevelopersIO
    misshiki
    misshiki 2024/03/04
    “AWSでは、S3 Express One Zoneを使ったAmazon SageMakerのモデルトレーニング高速化の一般提供開始がアナウンス。...Google Cloudでは、なんといってもVertex AI Geminiの一般提供開始が目玉だった。”
  • Vertex AIとBigQueryでつくる、簡単ベクトル検索&テキスト分析システム | DevelopersIO

    Vertex AIパイプラインを使うことで、BigQueryおよびBigQueryから参照できるデータを対象にしつつも、Google Cloud Pipeline ComponentsやVertex AIメタデータなどVertex AIの機能の恩恵もできるだけ受けることができます。 データアナリティクス事業機械学習チームの鈴木です。 BigQueryでは、Vertex AIと連携して格納したデータを生成AIで処理することが可能です。 例えばテーブルに格納済みのテキストをもとに埋め込みベクトルや別のテキストを生成することができます。 特に埋め込みベクトルがあれば興味があるテキストに類似したテキストをBigQuery内で検索し、類似レコードの特徴から関心のあるテキストを分析することもできます。また、RAGに使用することもできます。 今回はBigQueryとVertex AIを使って、テー

    Vertex AIとBigQueryでつくる、簡単ベクトル検索&テキスト分析システム | DevelopersIO
  • クラスメソッド データアナリティクス通信(機械学習編) – 2024年2月号 | DevelopersIO

    データアナリティクス事業部 インテグレーション部 機械学習チームの鈴木です。 クラスメソッド データアナリティクス通信(機械学習編) の2024年2月号です。2024年1月分のアップデート情報をお届けできればと思います。 はじめに AWSでは、Amazon SageMaker Feature Storeのプロビジョンド型キャパシティモードの提供がありました。Amazon RekognitionのコンテンツモデレーションもAPIが更新され、なんの理由で不適切とされたのか分かるようになり、さらに使いやすくなったと思います。 Google Cloudでは、BigQueryのベクトルサーチ機能のプレビュー提供はとても嬉しいニュースでした。Google Cloud Next ’23でロードマップとなっていた機能だと思いますが、早速プレビューで利用できるので、ぜひ使ってみて今後リリースに備えたいなと

    クラスメソッド データアナリティクス通信(機械学習編) – 2024年2月号 | DevelopersIO
    misshiki
    misshiki 2024/02/05
    “Google Cloudでは、BigQueryのベクトルサーチ機能のプレビュー提供はとても嬉しいニュースでした。”
  • BigQuery で Vertex AI の LLM を使用して SQL のみで RAG を構築する

    はじめに こんにちは、Google Cloud Partner Top Engineer 2024 を受賞いたしました、クラウドエース データソリューション部の松です。 クラウドエース データソリューション部 について クラウドエースのITエンジニアリングを担う システム開発統括部 の中で、特にデータ基盤構築・分析基盤構築からデータ分析までを含む一貫したデータ課題の解決を専門とするのが データソリューション部 です。 弊社では、新たに仲間に加わってくださる方を募集しています。もし、ご興味があれば エントリー をお待ちしております! 今回は、BigQuery で Vertex AI の LLM を使用して SQL のみで RAG を構築する方法についてご紹介します。 この記事はこんな人にオススメ BigQuery の SQL のみで LLM を使った問合せシステムを構築したい BigQue

    BigQuery で Vertex AI の LLM を使用して SQL のみで RAG を構築する
    misshiki
    misshiki 2024/01/24
    “BigQuery の SQL のみで LLM を使った問合せシステムを構築したい”
  • Feature Storeについて考える:(中小企業にとっての)意義は何なのか?

    はじめに 皆さんの組織では、Feature Storeを使っているでしょうか。 AI機械学習をしていると、MLOPsとセットでFeature Storeについて様々なメリットを謳う記事を見るのですが、データサイエンティストをしている知人に聞いても、実はあまり使っていない・導入を考えたけど止めたという人が多いように思います。(私の周りだけかもしれませんが) よく、Feature Storeのメリットとして「特徴量を共有できる」ということが挙げられるのですが、大企業でデータサイエンティストが多数いる環境であればまだしも、中小企業やベンチャー企業にとっては、データサイエンティストの数が限られている(または1人しかいない)ので、そこまでそのメリットが見えないことが、導入につながっていない要因かもしれません。 しかし、実際に試してみると、それ以上のメリットがあるのではと思えてきました。 そこで、改

    Feature Storeについて考える:(中小企業にとっての)意義は何なのか?
    misshiki
    misshiki 2024/01/24
    “特徴量の共有に苦労するほどの人員数もいない企業にとってFeature Storeのメリットは何でしょうか。 それが「最新の特徴量と過去の断面で保存した特徴量」というものを使い分けられるということです。”
  • BigQueryがDocument AIを統合。請求書など画像データの内容をSQLで検索可能に、AIが画像から項目や数値を自動抽出

    BigQueryがDocument AIを統合。請求書など画像データの内容をSQLで検索可能に、AIが画像から項目や数値を自動抽出 Google Cloudは、大規模並列データ処理サービスのBigQueryに、画像データから自動的に内容を抽出するAI機能「Document AI」を統合したと発表しました。 Document AIは、請求書や領収書、パスポート、契約書といったドキュメントの画像データを与えると、その項目と内容を生成AIによって自動的に抽出する機能を提供します。 BigQueryがDocument AIを統合することで、BigQueryからSQL文を用いてドキュメントの画像データ群に対して問い合わせが可能になります。 例えば、Google Cloud Storageに請求書の画像スキャンをまとめて保存しておき、BigQueryで今月の日付の請求書の合計金額をSQLで求める、など

    BigQueryがDocument AIを統合。請求書など画像データの内容をSQLで検索可能に、AIが画像から項目や数値を自動抽出
    misshiki
    misshiki 2024/01/10
    “BigQueryに、画像データから自動的に内容を抽出するAI機能「Document AI」を統合したと発表しました。”