はじめに
この記事は、ラスベガスで開催されている Google Cloud Next 2025 のセッション聴講記事です。
セッションタイトル:
Build AI agents on Cloud Run
セッション内容は、AI AgentをCloud Run で構築する方法や、Agent 向けのツールに関する内容です。
AI Agentのアーキテクチャって?
何度もユーザにレスポンスを返したり、モデルや DB などとのやり取りが発生するなど、アーキテクチャは複雑になりがちです。
また、Streaming は Agent の中でも重要な機能の一つです。
理由としては、基本的に Agent の処理はプランして推論して評価して…など行うため、処理が長くなりがちです。
ユーザからすると、何が起こっているのか分からないまま、長時間待たされるのは苦痛の極みでしょう…。
そのため、UX の観点からみても、Streaming で Agent の状態を知らせてあげることが重要です。
そして、複雑になりがちな AI Agent に必要なランタイムには、以下のような要件が必要です。
- スケーラビリティ
- コスト効率
- 高性能・高信頼性
- 優れた開発者体験
- LLM やツールとの統合
- 任意の言語や AI エージェントフレームワークに対する柔軟性
- ストリーミングのサポート
なかなかに、要求スペックが高め系ですね…。
そうです、そこで、Cloud Run
ということで、お待ちかね Cloud Run の出番です!
はい!Cloud Run なら先ほどの AI Agent に必要なランタイムの条件を全て満たします!さすが、天下無双の Cloud Run
Cloud Run は、需要に応じて自動的にスケールし、使った分だけ料金を支払う従量課金制です。
また、アイドル時にはゼロまでスケールダウンするためコスト効率も最高で、
尚且つ、組み込みの認証機能があるため、API キーを管理不要で Gemini API などの Google Cloud サービスを呼び出すことができますね。
さらにさらに、AI オーケストレーションのプログラミング言語には、Python や JavaScript が多いですが、
任意の言語と AI フレームワークを使用できます!
また、標準で HTTPS エンドポイントとストリーミング(WSなど)のサポートまでしています!
これまでか!というくらい Cloud Run の華麗なるコンボが決まりましたね。フルコンボだどん
ということで、先ほどの AI Agent を Cloud Run で構築した場合のアーキテクチャはこんなふうになりました!
まずは、主役の Cloud Run が、アプリのサービングを行います。
また、その中で、好きな AI Agent フレームワークを動かすことができます!LangGraph や、Agent Development Kit (ADK) など…!
さらにさらに、Cloud Run は GPU を使用することができるため、一緒に生成 AI までホストする…なんてことも叶っちゃいますね。なんということでしょう。
ちなみに、Cloud Run の GPU サポートは晴れて GA しています!!うおーーーーーー
Cloud Run の GPU についての詳細はこちら
Agent のツールも構築したい!
ところで、Agent が使用するツールには、計算処理などを行う関数や、DB アクセス、API や、高度なブラウザツール、コードサンドボックスツールも欲しい…あれもしたいこれもしたい、などなど…ツールにも色々ありますね。だって人間だもの。
- Basic tools(基本ツール):
- 計算機、単位変換、時刻・タイムゾーンなど
- APIs (API):
- 自社またはサードパーティAPIへの読み取り(&書き込み)アクセス
- Browser and web search (ブラウザとウェブ検索):
- 実際のウェブブラウザを使ったウェブサイト閲覧、検索エンジン
- Database access (データベースアクセス):
- より多くのコンテキストを提供するための検索拡張生成(RAG)、単純なデータベースクエリ
- Image or Chart generation (画像・グラフ生成):
- 画像(例 Imagen)の作成、入力データからの可視化(グラフなど)生成
- Code sandbox (コードサンドボックス):
- サンドボックス化された環境で生成されたコードを実行
このうち、Browser と Code sandbox の2つについて説明がありました!
Browser tool
Cloud Run は、コンテナを自由に実行できるので、もちろん、Chromium も動かすことができます!
完全な Desktop OS を Cloud Run 上で実行し、画面をストリーミングすることも可能なため、
Agent にWebサイトを操作させることができますね。
Code sandbox tool
また、Cloud Run は、標準で2層のサンドボックス環境を提供しているため、信頼できないコードを安全に実行するためのコードサンドボックスツールを構築することもできます。
他に、同期的な実行には長めのタイムアウトを持つ Cloud Run サービスが利用し、非同期なサンドボックス実行には Cloud Run ジョブを使用する、と、
同期・非同期どちらも対応することができるのも Cloud Run ならではの魅力ですね!
さいごに
今回のセッションでは、AI Agent を Cloud Run で構築する方法について学べました!
Cloud Run の機能十二分に活かすことで、Agent とそのツール群をホストできる環境を実現できます。
開発者にも大変フレンドリーな Cloud Run を使ってじゃんじゃんばりばり Agent を作っていきましょう!