Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

MLOpsに関するmisshikiのブックマーク (290)

  • https://www.soumu.go.jp/main_content/000899843.pdf

    misshiki
    misshiki 2025/01/09
    全72ページのスライド資料。「AIの判断に対するヒトの最終決定権の限界 Human-in-the Loopの問題」
  • 信頼性の高い機械学習―SRE原則を活用したMLOps を読んだ

    オライリー様よりご恵贈いただきました。ML寄りのエンジニアとして継続的なモデルの訓練とデリバリーを伴なうMLシステムの信頼性をどう向上させるのかが気になって読みました。 書では、ソフトウェアシステムの信頼性と安定性を保つことに優れたアプローチであるSRE(サイトリライアビリティエンジニアリング)の原則を適用し、信頼性が高く、効果的で、責任のある機械学習システムを構築し運用するための方法を紹介します。毛糸を販売している仮想のオンラインストア「yarnit.ai」を例に用いつつ、番環境でのモデルモニタリングの方法から、製品開発組織で調整されたモデル開発チームを運営する方法まで解説します。 目次 1章 はじめに 2章 データマネジメント 3章 ML モデルの基礎 4章 特徴量と訓練データ 5章 モデルの確実性と品質の評価 6章 公正さ、プライバシー、倫理的なML システム 7章 ML モデル

    信頼性の高い機械学習―SRE原則を活用したMLOps を読んだ
    misshiki
    misshiki 2024/12/18
    “その様なつらみと日々向きあっている開発者は得る物が多い本でしょう。私は特に9章の「モデルの監視と可観測性」と11章「障害対応」が興味深く読めました。”
  • MLflow を Vertex AI Experiments に置き換えられるってホント? - NTT Communications Engineers' Blog

    この記事では、NTT Communications Advent Calendar 2024 16 日目の記事です。記事では MLflow という実験管理 OSS を Google Cloud の Vertex AI Experiments に置き換えを検討してみた話について記載しています。 はじめに 結論 話題の中心となる実験管理機能 浮き彫りになった課題 パフォーマンス面 セキュリティ面 Vertex AI Experiments によるアプローチ 検討の中でぶち当たった壁 前提知識の整理 テスト実行のメタデータの扱い方 API コールの上限 考察と今後 さいごに はじめに こんにちは、イノベーションセンターの林です。普段はノーコード AI 開発ツールである「Node-AI」というプロダクトでソフトウェアエンジニアとして開発に携わっています。また、SRE・オブザーバビリティ・Goog

    MLflow を Vertex AI Experiments に置き換えられるってホント? - NTT Communications Engineers' Blog
    misshiki
    misshiki 2024/12/16
    “簡単に本記事の結論をまとめると、現時点での MLflow の利用方法では Vertex AI Experiments に置き換えるのは厳しいという結果でした。”
  • MLOps の現場から

    2024 年12月現在の MLOps と LLMOps について述べました。 ・MLOps とは ・MLOps の技術・プロセス・文化 ・LLMOps ・MLOps の今後 ソフトウェア品質管理研究会 2024年度 第7回例会 特別講義の資料です。https://www.juse.or…

    MLOps の現場から
    misshiki
    misshiki 2024/12/16
    全98ページのスライド資料。
  • Managed MLflow on SageMakerを試す - Qiita

    はじめに この記事はMLOps Advent Calendar 2024の14日目の記事です。 Databricksという会社でソフトウェアエンジニアをしている渡辺と申します。普段は業務でMLflowのCore maintainerをしています。 2024年6月に、Amazon SageMakerでのフルマネージド型MLflowが提供開始されました。MLflowを開発している身ながら、SageMaker上でのセットアップ方法やプロダクト全体についてはあまり把握できていなかったので、今回実際にサービスを使って理解を深めることにしました。 MLflowとは MLflowはオープンソースの機械学習プラットフォームで、主に実験やモデルの管理、評価、デプロイメント、トレーシングなどの機能を備えています。 これまでのMLflowの使い方 MLflowでは、「トラッキングサーバー」というサーバーを中心に

    Managed MLflow on SageMakerを試す - Qiita
    misshiki
    misshiki 2024/12/16
    “SageMaker Studioの中で、これまでのような複雑なセットアップなしでMLflowが利用できるのはかなり便利”
  • ペアーズにおける評価ドリブンなリリースサイクル:Langfuseをフル活用したLLMOps基盤

    LLMOps基盤のシステムアーキテクチャ目次− 目次 − 対象読者 − TL;DR − 背景:LLMアプリケーション運用の課題 − LLMOps基盤のシステムアーキテクチャ −− 主なコンポーネントと役割 −− Langfuseを採用した理由 − 評価ドリブンなリリースライフサイクルの全体像 − オンライン評価プロセス −− 1. ログ・トレースデータの保存 −− 2. 評価とアノテーション − オフライン評価プロセス −− プロンプト実験 −− LLMアプリケーション統合実験 − 今後の展望 − 終わりに − 参考文献 こんにちは!Eureka AI Teamで、Pairs(ペアーズ)のMLOps Engineerをしているnariです。 こちらは、Eureka(Pairs) Advent Calendar 2024 の10日目の記事です。 日は、私たちが構築した「LLMOps基盤」と

    ペアーズにおける評価ドリブンなリリースサイクル:Langfuseをフル活用したLLMOps基盤
    misshiki
    misshiki 2024/12/11
    “Langfuseをフル活用してLLMOps基盤を構築することで、LLMアプリケーションの品質向上のための評価ドリブンなリリースサイクルを実現”
  • MLOpsの「あるある」課題の解決と、そのためのライブラリgokart - エムスリーテックブログ

    こちらはエムスリー Advent Calendar 2024 2日目の記事です。 こんにちは、AI機械学習チームの池嶋(@mski_iksm)です。 近年、機械学習は多くのアプリケーションで当たり前のように使われるツールになりつつあります。ですが機械学習は、ライブラリを呼び出すだけで簡単に使える、というわけにはいかない特有の難しさもありますよね。 例えば、モデルの学習実験を試行錯誤しながら何度も繰り返しているうちに、「どのデータを使い、どんな設定で学習させたモデルが一番良かったのか分からなくなった」という経験はないでしょうか。 また、番環境で使用するモデルが実験環境で作ったものを再現できず、「実験ではうまくいったのに、番ではイマイチ…」といった問題に直面したことがある方も多いかと思います。 こうした課題に取り組みながら機械学習プロジェクトの生産性を向上させるため、近年ではMLOpsの

    MLOpsの「あるある」課題の解決と、そのためのライブラリgokart - エムスリーテックブログ
    misshiki
    misshiki 2024/12/03
    “課題1: 実験した機械学習モデルの再現性がない、課題2: モデルのバージョン管理が面倒、 課題3: 特徴量作成をモデルごとにやり直すのが面倒、課題4: 開発者によって書き方にばらつきがあり、...”
  • The Rise of LLMOps

    第11回 Data-Centric AI勉強会 ~MLOps勉強会コラボ回~ / 第46回 MLOps 勉強会 の登壇資料です

    The Rise of LLMOps
    misshiki
    misshiki 2024/11/21
    全46ページのスライド資料。○○Opsという名称がDevOpsから続いているけど、独自の言葉を定義した方がいいのではとちらっと思った。
  • MLflowとJupyter Notebookを活用した機械学習環境構築 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに MLflowの環境構築はできましたが、機械学習関連の開発はNotebook上でインタラクティブに進める方が便利です。私もNotebookに慣れているため、今回は MLflow+Jupyter Notebook の環境を構築しました。 そもそも何が良いの? MLflowとJupyter Notebookの統合により、以下のようなメリットがあります。 迅速なプロトタイピングとトラッキングの連携 Jupyter Notebook はインタラクティブなデータ解析やプロトタイピングに適しています。Notebookで実験しながら、MLfl

    MLflowとJupyter Notebookを活用した機械学習環境構築 - Qiita
    misshiki
    misshiki 2024/10/28
    “機械学習関連の開発はNotebook上でインタラクティブに進める方が便利です。私もNotebookに慣れているため、今回は MLflow+Jupyter Notebook の環境を構築しました。”
  • LLMアプリにhuman-in-the-loopを追加する「HumanLayer」を試す

    GitHubレポジトリ HumanLayer HumanLayer: AIエージェントがツールベースおよび非同期ワークフローで人間とコミュニケーションできるようにするPythonツールキット。人間をループに組み込むことで、エージェントツールはより強力で意味のあるツールコールやタスクへのアクセスが可能になります。 あなたのLLM(OpenAI、Llama、Claudeなど)やフレームワーク(LangChain、CrewAIなど)を持ち込み、AIエージェントに安全に世界へのアクセスを提供しましょう。 なぜHumanLayerなのか? 機能やツールは、エージェントワークフローの重要な要素です。これらは、LLM(大規模言語モデル)が外部の世界と意味のある形でやり取りし、広範囲にわたる重要な作業を自動化することを可能にします。正確で正しい機能呼び出しは、AIエージェントがアポイントメントを予約したり

    LLMアプリにhuman-in-the-loopを追加する「HumanLayer」を試す
    misshiki
    misshiki 2024/10/28
    “HumanLayer: AIエージェントがツールベースおよび非同期ワークフローで人間とコミュニケーションできるようにするPythonツールキット。人間をループに組み込む...”
  • LLMOps : ΔMLOps

    v1.0 (2024/10/21) LLM と従来 ML との差異 (delta, Δ) に基づく MLOps の修正 伊藤駿汰 (Cloud Solution Architect) 栗田宗平(Cloud Solution Architect)

    LLMOps : ΔMLOps
    misshiki
    misshiki 2024/10/22
    全58ページのスライド資料。
  • GenOps: マイクロサービスと従来の DevOps の世界から学ぶ | Google Cloud 公式ブログ

    ※この投稿は米国時間 2024 年 8 月 31 日に、Google Cloud blog に投稿されたものの抄訳です。 生成 AI アプリケーションは誰が管理すべきでしょうか。AI 関連の所有権はデータチームが持つことが多いものの、生成 AI アプリケーションに固有の要件はデータチームや AI チームの要件とは明らかに異なり、DevOps チームとの類似点が多いこともあります。このブログ投稿では、これらの類似点と相違点を探り、生成 AI アプリケーション独自の特性を扱う新たな「GenOps」チームの必要性について検討します。 「データからモデルを作成する」ことを目的とするデータ サイエンスとは対照的に、生成 AI は「モデルから AI 対応サービスを作成する」ことに関連しており、既存のデータ、モデル、API の統合に関与するものです。このように見ると、生成 AI は従来のマイクロサービス

    GenOps: マイクロサービスと従来の DevOps の世界から学ぶ | Google Cloud 公式ブログ
  • GenOps: 生成 AI 向けに MLOps が進化 | Google Cloud 公式ブログ

    ※この投稿は米国時間 2024 年 9 月 21 日に、Google Cloud blog に投稿されたものの抄訳です。 組織が生成 AI ソリューションを大規模にデプロイしようとすると、多くの場合、運用上の課題に直面します。GenOps(生成 AI 向け MLOps)は、これらの課題に対処します。 GenOps は、DevOps の原則と ML ワークフローを組み合わせて、番環境で生成 AI モデルのデプロイ、モニタリング、メンテナンスを行います。GenOps により、生成 AI システムがスケーラブルかつ高い信頼性のもと、継続的に改善されるようになります。 なぜ MLOps では生成 AI にとって難しいのか?生成 AI モデルには、従来の MLOps の手法では不十分な独自の課題があります。 スケーリング: 何十億ものパラメータには特殊なインフラストラクチャを要する。 コンピューテ

    GenOps: 生成 AI 向けに MLOps が進化 | Google Cloud 公式ブログ
    misshiki
    misshiki 2024/10/15
    “組織が生成 AI ソリューションを大規模にデプロイしようとすると、多くの場合、運用上の課題に直面します。GenOps(生成 AI 向け MLOps)は、これらの課題に対処します。”
  • 現場から学ぶMLOps: MonotaROでの実践的アプローチ~オンライン推論編~ - MonotaRO Tech Blog

    はじめに こんにちは。MonotaROで機械学習エンジニア兼、Tシャツのモデルを務めている新卒3年目の長澤です! 最近は健康のためにスポーツをしているのですが、そのスポーツの疲れで日々が辛くなってきました。観戦と自分で身体を動かす方の割合(重み)をバンディットを使ってうまく最適化していきたいこの頃です。 今回は、自分がここ1,2年(2023~2024)で取り組んできたMonotaROにおけるMLOpsの取り組みについて、実例を交えながら紹介します。MLOpsの実例はあまり世の中に出回っていないので、一つの事例として読んでもらえれば嬉しいです。 はじめに この記事で紹介すること この記事で紹介しないこと MonotaROにおける機械学習エンジニア パーソナライズドランキングとは MLOpsに取り組むにあたっての背景と課題 MLOpsのプロジェクトスタート時 MLOpsとりあえず始めてみる期

    現場から学ぶMLOps: MonotaROでの実践的アプローチ~オンライン推論編~ - MonotaRO Tech Blog
    misshiki
    misshiki 2024/10/10
    “直近ではより高度なパーソナライズ化に向けて機械学習モデルを使用しています。今回は、機械学習モデルによるリアルタイム推論とその運用に焦点を当てた例を紹介します。”
  • 機械学習パイプラインLuigiのタスク同士の関係を良い感じに可視化する方法 - ドワンゴ教育サービス開発者ブログ

    はじめに ドワンゴ教育事業でデータサイエンティストとして働いている中井です。 この記事では、PythonのパイプラインパッケージであるLuigiで構築したパイプラインにおいて、それを構成するタスク間の依存関係・タスクのグループ間(task_namespace で分けられる)の依存関係を良い感じに出力する方法についてお話しします。想定する読者はある程度Luigiを使ったことのある方としています。 Luigiではタスク全体の依存関係を出力できますが、大規模なタスクだともう少し荒い粒度であったり、全体のうちの一部だけ見たいといったこともあると思います。この記事を読むことでそのような荒い粒度の可視化やパイプラインの一部分に注目した可視化ができるようになります。この記事ではまずLuigiを使っていて課題に感じている部分について説明した後に、可視化対象のサンプルパイプラインについて少し触れて、そのパイ

    機械学習パイプラインLuigiのタスク同士の関係を良い感じに可視化する方法 - ドワンゴ教育サービス開発者ブログ
    misshiki
    misshiki 2024/10/09
    “PythonのパイプラインパッケージであるLuigiで構築したパイプラインにおいて、それを構成するタスク間の依存関係・タスクのグループ間(task_namespace で分けられる)の依存関係を良い感じに出力する方法について”
  • データと機械学習で顧客体験を革新する、次世代ECの舞台裏 - MonotaRO MLエンジニアリングチームの軌跡と展望 - MonotaRO Tech Blog

    MonotaRO(モノタロウ)では、全社的にデータ活用研修を行うなど、数字に基づいた意思決定を行うデータドリブンな経営が根付いています。事業者向けECサイトとして、モノを買う時にかかる手間や時間を短縮し、顧客である事業者の時間を創出することが、モノタロウの提供価値です。この価値をさらに高めるため、「ほしいものがすぐ見つかる」という顧客体験の向上に注力しています。 その中心的な役割を担うのが、機械学習(ML)を活用した顧客体験の最適化です。MLエンジニアリング(MLE)チームは、この重要なテーマの最前線に立ち、日々革新的なソリューションの開発に取り組んでいます。 データサイエンスのアルゴリズムを実用的なサービスへと昇華させる重要な役割を果たすMLEチーム。高度な検索・推薦システムの構築から、大規模データパイプラインの設計、リアルタイムユーザー行動データを用いた実装まで、幅広い技術的課題にチャ

    データと機械学習で顧客体験を革新する、次世代ECの舞台裏 - MonotaRO MLエンジニアリングチームの軌跡と展望 - MonotaRO Tech Blog
    misshiki
    misshiki 2024/10/03
    “「ほしいものがすぐ見つかる」という顧客体験の向上に注力しています。 その中心的な役割を担うのが、機械学習を活用した顧客体験の最適化です。MLエンジニアリング(MLE)チームは、この重要なテーマの最前線...”
  • 信頼性の高い機械学習

    Cathy Chen、Niall Richard Murphy、Kranti Parisa、D. Sculley、Todd Underwood 著、井伊 篤彦、張 凡、樋口 千洋 訳 TOPICS System/Network 発行年月日 2024年10月 PRINT LENGTH 388 ISBN 978-4-8144-0076-8 原書 Reliable Machine Learning FORMAT Print PDF EPUB 書では、ソフトウェアシステムの信頼性と安定性を保つことに優れたアプローチであるSRE(サイトリライアビリティエンジニアリング)の原則を適用し、信頼性が高く、効果的で、責任のある機械学習システムを構築し運用するための方法を紹介します。毛糸を販売している仮想のオンラインストア「yarnit.ai」を例に用いつつ、番環境でのモデルモニタリングの方法から、製品開

    信頼性の高い機械学習
    misshiki
    misshiki 2024/09/27
    新刊 “2024年10月23日 発売予定”
  • 8年間の進化!CARTA MARKETING FIRMが機械学習基盤を刷新した理由とその成果 - CARTA TECH BLOG

    TL;DR CARTA MARKETING FIRMのデータサイエンスチームは、8年間にわたり機械学習基盤を進化させてきました。Luigi、AWS SageMaker、Prefectと変遷する中で、「データサイエンティストが最も付加価値を生み出す部分に集中し、時間を費やすことができる基盤」という目標に着実に近づいています。 Luigiでは開発環境構築や運用負荷が高く、柔軟性に欠けていました。 SageMakerではインフラ構築の複雑さやStep Functionsの制約が課題でした。 Prefectの導入により、Pythonのみでインフラからバッチ処理まで記述可能になり、A/Bテストの実施が容易になりました。また、ログ監視の一元化により運用効率が大幅に向上しました。 この進化を通じて、データサイエンティストの生産性と施策の実験サイクルが大幅に改善されました。 概要 CARTA MARKET

    8年間の進化!CARTA MARKETING FIRMが機械学習基盤を刷新した理由とその成果 - CARTA TECH BLOG
    misshiki
    misshiki 2024/09/05
    “ARTA MARKETING FIRMのデータサイエンスチームが過去8年間で経験した機械学習基盤の変遷を詳細に解説します。Luigiを使用した初期の基盤から、AWS SageMakerを経て、現在のPrefectベースの基盤に至るまでの道のりを紹”
  • Netflixが大規模ワークフローの管理システム「Maestro」をオープンソース化

    Netflixが自社製ワークフローオーケストレーター「Maestro」をオープンソース化しました。MaestroはNetflix社内で現役稼働しており、データパイプラインや機械学習パイプラインといった大規模ワークフローの管理に使われているそうです。 Maestro: Netflix’s Workflow Orchestrator | by Netflix Technology Blog | Jul, 2024 | Netflix TechBlog https://netflixtechblog.com/maestro-netflixs-workflow-orchestrator-ee13a06f9c78 Netflixは「ユーザーが次に視聴する作品の予測」などを目的に機械学習を活用しており、記事作成時点では何千もの機械学習ワークフローインスタンスを起動し、平均して1日当たり50万のジョブを

    Netflixが大規模ワークフローの管理システム「Maestro」をオープンソース化
  • Maestro: Netflix’s Workflow Orchestrator

    By Jun He, Natallia Dzenisenka, Praneeth Yenugutala, Yingyi Zhang, and Anjali Norwood TL;DRWe are thrilled to announce that the Maestro source code is now open to the public! Please visit the Maestro GitHub repository to get started. If you find it useful, please give us a star. What is MaestroMaestro is a horizontally scalable workflow orchestrator designed to manage large-scale Data/ML workflows

    Maestro: Netflix’s Workflow Orchestrator
    misshiki
    misshiki 2024/07/24
    “Maestro は、データ パイプラインや機械学習モデルのトレーニング パイプラインなどの大規模なワークフローを管理するために設計された、汎用的で水平にスケーラブルなワークフロー オーケストレーターです。”