生成AI×データ活用で組織を大幅アップデート!~新規事業やDXにおけるAI活用のユースケース発掘方法やRAG実装の成功事例までご紹介します~
NitroFusion: High-Fidelity Single-Step Diffusion through Dynamic Adversarial Training Abstract We introduce NitroFusion, a fundamentally different approach to single-step diffusion that achieves high-quality generation through a dynamic adversarial framework. While one-step methods offer dramatic speed advantages, they typically suffer from quality degradation compared to their multi-step counterp
以下の文章は、コリイ・ドクトロウの「AI’s “human in the loop” isn’t」という記事を翻訳したものである。 Pluralistic AIが重要な意思決定を行う、あるいは意思決定を支援する能力には問題がある。しばしばAIは、人間のリソースの限界を超えるスピードと規模で、優れた精度で物事を分類する。その一方で、時として極めて深刻な間違いを犯し、取り返しのつかない事態を招くこともある。 官僚機構と、彼らにAIを売り込もうとするセールスマンたちは、労働集約的なプロセスをアルゴリズムで自動化することで、大幅にコスト削減できると期待に胸を膨らませている。比較的リスクが低く、導入の判断が容易なケースもある。たとえば先日、ブリュースター・ケールは、図書館から廃棄される予定の大量のマイクロフィルム化されたジャーナルをスキャンするInternet Archiveのプロジェクトについて語
この記事のポイント Suno AIはテキストから高品質な音楽を生成するAIサービスで、音楽制作の知識がなくても利用可能最新バージョンV3.5では、4分までの楽曲生成や構造・ボーカルフローの改善など、機能が大幅に向上無料プランから商用利用可能な有料プランまで、ニーズに応じた3段階の料金体系を提供YouTubeの収益化やストリーミングサービスへの楽曲アップロードなど、商用利用には有料プランが必要AIによる音楽創作の可能性を広げる一方で、著作権や倫理的課題についても考慮が必要 Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、Li
sponsored Backlogに招待するだけでは「使ってくれない」、ではどうする? うまくいく! 複数人チームでのプロジェクト・タスク管理立ち上げの方法 sponsored 手軽に“壁100インチ”の大画面を楽しもう! 自宅が映画館になる「JMGO N1S Ultra 4K」を推す理由 sponsored JN-38i160U-H-C9をレビュー PS5 Proの4K/120fpsプレイを大迫力で!38型でKVM機能付きのゲーミング液晶がかなりイイ sponsored CyborgやThin、Clawなどが最大25%オフ! AmazonブラックフライデーでMSIのゲーミングPCが即ポチレベルの格安価格で買えるぞ! sponsored リモートワーク環境はまだまだセキュリティ対策が不十分 ハイブリッドワーク中の社員PCがフィッシング詐欺被害! どうやったら防げた? sponsored 高
広く使われている画像生成AIのStable Diffusionは「ControlNetを組み合わせてポーズ抽出やポーズ指定生成を実行する」「IP-Adapterを組み合わせて類似画像を生成する」といったように拡張機能を用いて多様な作業を実行できます。「OmniGen」はControlNetなどの拡張機能を使わず単一のモデルだけで多様な生成作業を実行可能にすることを目指して開発されたマルチモーダル画像生成AIで、単体で「画像生成」「ポーズ抽出」「ポーズ指定生成」「画像内の物体置換」「被写体指定生成」といった作業を実行可能です。 [2409.11340] OmniGen: Unified Image Generation https://arxiv.org/abs/2409.11340 GitHub - VectorSpaceLab/OmniGen: OmniGen: Unified Imag
はじめに 本日AnthropicがClaude3.5SonnetのアップデートとClaude3.5Haikuの発表(今月末リリース予定)、そして突如として現れた「computer use」をパブリックベータ版として公開しました。 はじめは「ふむふむ、モデルの性能が向上したのね」とベッドに潜りながら眺めていたのですが、見慣れない単語に気付き早速試してみようと跳ね起きました。 computer useとは クロードが個々のタスクを完了するのを支援するための特定のツールを作成するのではなく、一般的なコンピューター スキルを教えることで、人間向けに設計されたさまざまな標準ツールやソフトウェア プログラムを使用できるようにします。 最新バージョンの Claude 3.5 Sonnet は、適切なソフトウェア セットアップを実行すると、ユーザーのコマンドに従ってコンピューターの画面上でカーソルを移動し
The upgraded Claude 3.5 Sonnet model is capable of interacting with tools that can manipulate a computer desktop environment. Computer use is a beta feature. Please be aware that computer use poses unique risks that are distinct from standard API features or chat interfaces. These risks are heightened when using computer use to interact with the internet. To minimize risks, consider taking precaut
Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku Today, we’re announcing an upgraded Claude 3.5 Sonnet, and a new model, Claude 3.5 Haiku. The upgraded Claude 3.5 Sonnet delivers across-the-board improvements over its predecessor, with particularly significant gains in coding—an area where it already led the field. Claude 3.5 Haiku matches the performance of Claude 3 Opus, o
本物の人間と区別がつかない! グーグルが先月リリースした新種の生成AIが米国で今、注目を浴びている。各種の文書を読み込んで、それをベースに(ポッドキャストを想定した)軽妙な音声会話を生成するAIだ。 本来、同社の文書管理・編集AI「NotebookLM」の派生機能として提供が始まったが、これがユーザーの間で実際に使われ出すと本家を凌ぐ人気となった。とにかく、このAIが生成する男女の音声会話は、本物の人間と全く区別がつかないほどリアルなのだ。また会話の内容も驚くほど充実している。 未だベータ版(試験利用)の段階だが日本でもすでに使えるし、日本語の文書も受け付ける。ただし出力される音声会話は今のところ英語のみだ。ちなみに、これによるポッドキャスト番組は「Deep Dive」と呼ばれているが、これは番組のホストとなる生成AI製の男女が自分たちの会話の中でそう呼んでいるに過ぎない。 つまりあくまで
AIにフルスタックアプリの生成を指示、Webブラウザ上のNode.js環境でそのまま実行できる「bolt.new」、StackBlitzが公開 WebAssemblyを用いてWebブラウザ上でNode.js環境を実現する「WebContainer」などを提供するStackBlitzは、Webブラウザ上でAIにフルスタックアプリの生成を指示し、そのままWebブラウザ上のNode.js環境で実行やデバッグなどを行える新サービス「bolt.new」を公開しました。 bolt.newはGitHubでサインオンすることにより誰でも無料で試すことができます。 bolt.newの大きな特徴は3つあります。 1つ目は、AIがフルスタックアプリケーションの生成を、必要なパッケージやライブラリの導入からコードの生成、ビルドまで含めて最初から最後まで実行してくれる点。 2つ目は、AIが生成したフルスタックアプリ
RIG is 何?RAG の妹?DataGemma の論文を翻訳しながら RIG を読み解く〜①まずは翻訳〜RigragDataGemma DataGemma がリリースされました。外部情報を使ってハルシネーションを抑止する手法として RAG が有名ですが、Datagemma では RAG だけではなく RIG という手法も提案・利用していました。 RIG というのがよくわからなかったので論文を読みました。そしてそのときの翻訳を残します。 RIG が一体なんなのかはそのうち… 論文の原本はこちら 注) RIG の Retrieval Interleaved Generation は勝手に検索交互生成としました。 以下原文を LLM の助けを借りながら翻訳したもの 要旨 大規模言語モデル(LLM)は、数値や統計データ、あるいは時事的な事実に関連するクエリに応答する際、事実に反する情報を生成し
Generate your next app with Llama 3.1 405B
はじめに 前にも別のモデルでやってる ただ o1-preview は、やり取りを重ねるよりも一発で終わらせるほうがいいらしいので、最終的なテスト全体を渡すようにした。 情報の提示方法が異なると当然結果も変わるので、 gpt-4o でも同様なことを試した。 材料 プロンプトは以下。 基本的に最初にやったときと同じ。ペアプロではないのでその部分の調整をしている - 私がテストコードを提示するのでそのテストケースをパスする最小限の実装をしてください - Vue.js のバージョン 3 と Typescript で実装を行ってください - コードのみを示してくださいコードの解説などは必要ありません - スタイリングは必要ありません - テストケースに失敗したらその内容をチャットで送信するので最小限のコードの修正をしてください - テストのコードには vitest を利用しています jest と互換
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く