このページの本文へ

前へ 1 2 3 4 5 次へ

Stable Diffusion入門 from Thailand 第17回

人気の画像生成AI、違いは? Stable Diffusion XL、Midjourney、DALL-E、Playgroundの画風を比較する

2024年07月10日 20時00分更新

文● 田口和裕

　テキストによるプロンプト（指示）から精細な画像を生成する画像生成AI。無料もしくは安価で利用できる環境が増えるなか、「どのAIを利用すればいいの？」という疑問も自然と出てくる。

　費用、手軽さ、描画速度など比較項目はいくつか考えられるが、やはりいちばん気になるのは“画風”ではないか。

　もちろんプロンプトなどにより好みの画風にすることはある程度可能だが、モデルそれぞれの特徴や得意分野があるため、ある程度の傾向は存在する。

　この記事は、現在注目を集める4つの主要な画像生成AIモデルに同じプロンプトを与えて生成された画像を比較することでそれぞれの傾向を明らかにし、モデル選択の助けになることを目的としている。

^{※一部の配信先では画像や図表等が正確に表示されないことがあります。その場合はASCII.jpで配信中の記事をご確認ください}

取り上げる4つのモデル

　それでは、本記事で比較する4つのAIモデルを紹介しよう。

Midjourney

　Midjourneyが提供する画像生成AIサービス。コミュニケーションプラットフォーム「Discord」経由での利用が必須だったがブラウザーから利用できるUIもテスト中。以前は無料でも利用できたが現在は月額10米ドル（およそ1600円）からのプランを購入する必要がある。最新のモデルバージョンは「v6」。

　なお、使い方はこちらの記事を参照。

DALL-E 3（Microsoft Copilot Designer）

　OpenAIが開発し、マイクロソフトがCopilotサービスに統合した画像生成AI。ChatGPTの有料プランであるChatGPT Proでも利用できるが、Copilot経由だと制限はあるが無料で生成できる。自然言語による詳細な指示が可能で、高品質な画像生成が特徴。

Stable Diffusion XL（SDXL）

　Stability.AIが開発したオープンソースの画像生成AIモデル「Stable Diffusion」の拡張版で、より高解像度で詳細な画像生成が可能。ユーザーは直接このモデルをダウンロードしてローカルで利用できるのが最大の特徴だ。ただしそれなりのマシン環境が必要になる。ユーザーが作成した派生モデルも多数出回っているが今回はその大元であるベースモデル（stable-diffusion-xl-base-1.0）を使用した。

　インストールや各種設定が初心者にはハードルが高いが、Stability Matrixを使えばかなりハードルが下がる。

Playground

　Playground AI社が提供する画像生成AIモデル。現在のバージョンは2.5。DALL-E 3やMidjourney同様ブラウザーから利用可能。直感的なUIと素早い画像生成が特徴で、アーティストやデザイナー向けの機能も充実している。無料でも1日50枚の画像生成が可能。

8つの異なるジャンルで比較

　それぞれのモデルの特徴を明らかにするため、「リアル美少女」「アニメ風美少女」「メカ系美少女」「男性キャラ」「自然風景」「サイバーパンク」「不気味な怪物」「料理」の8つの異なるジャンルの画像を生成してみた。

　各ジャンルにつき1つのプロンプトを作成し、4つのAIモデルすべてに同じプロンプトを与えて画像を生成し、比較・分析する。各モデルの強みと弱み、そして特徴的な表現を把握し、自分の好みに最も適したAIモデルを選択する助けになることを目指している。

　プロンプトの質も重要だ。ただ「リアル美少女」とひとこと入力しただけでも生成はされるだろうが、あまりにも漠然としすぎているため、1枚ごとにバラバラの画像になってしまうだろう。

「リアル美少女」のみで生成（Midjouney）

　ある程度内容を細かく指定したプロンプトを用意することで、プロンプトに対する忠実度もわかるので、大規模言語モデル（LLM）に考えてもらうことにした。また、一般的に日本語よりも英語によるプロンプトの方が追随性も高いのでそこもLLMにおまかせだ。

プロンプト：画像生成AIで「リアルな美少女」を生成するプロンプトを英語で書いて

　まずはChatGPTに聞いてみると、期待通り長めのプロンプトを生成してくれた。ただ、気を回してくれたのか「inspired by japanese anime」という文字が入っているのでこれはNG。

ChatGPT（GPT-4）

　キーワードによってはこのように回答を拒否されることもあるが、聞き方を工夫することで回避できる。以後、プロンプトはChatGPTとClaude 3.5 Sonnetを併用して作成している。

Claude 3.5 Sonnet

　個人的にはClaude 3.5 Sonnetの方がプロンプトのセンスはいいと感じた。

　それでは、8つのジャンルそれぞれについて、4つのAIモデルが生成した画像を詳しく見ていこう。

前へ 1 2 3 4 5 次へ

ツイートする

カテゴリートップへ

この連載の記事

AIオススメ記事

2024年12月09日

AI

画像生成AIの進化が早すぎる　2024年に起きたことまとめ
2024年12月02日

AI

イラストに強すぎる画像生成AIモデル　SDXL系「NoobAI-XL」の衝撃
2024年11月25日

AI

3DモデリングにAI革命の兆し　1枚のイラストから3Dデータが完成
2024年11月18日

AI

グーグルのAIがいきなり「死んでください」と言ってきたという報告
2024年11月18日

AI

あなたの作業を超効率化する、すごいAIサービス10選【2024年最新版】
2024年12月09日

AI

AI、人間超えた説　OpenAIの従業員が「AGIを達成した」との見方示す
2024年12月09日

AI

人気の画像生成AIツール「ComfyUI」デスクトップアプリがめっちゃラク　初心者にオススメ
2024年12月10日

AI

【速攻解説】OpenAI「Sora」の使い方　月額3000円で出来ること、出来ないこと
2024年11月25日

AI

業界トップ級の画像生成AIツール「Recraft」　Adobeユーザーは体験する価値あり
2024年12月09日

AI

X、AI「Grok」無料で試せるように　写真みたいな画像も生成できる

ピックアップ

sponsored

狭い机でも縦置き／横置きどちらもOK！高性能な小型デスクトップパソコンでノートPC以上の作業効率アップを狙う
sponsored
ファーウェイ製スマートウォッチは、家族や知人、自分（!?）へのプレゼントにもピッタリ！

バッテリー長持ちのスマートウォッチで2025年こそ健康的な生活！クリスマスプレゼントに合う製品を紹介！
sponsored
JAPANNEXTの「JN-IB375C144UQR-H」をレビュー

144Hzで21：9の3840×1600ドット37.5型ウルトラワイドディスプレー、ゲームの没入感や仕事の効率アップがスゴイ
sponsored
ポータブルゲーミングスピーカー「TQ-PG300」

パイオニアの小型ゲーミングスピーカー、想像を超える没入感でめちゃくちゃ驚きなんですけど！
sponsored
今回も医療機器認証取得で、かつ前モデルよりも薄く軽いサイズを実現！

スマートウォッチのようでこれは血圧計でもある!? 「HUAWEI WATCH D2 ウェアラブル血圧計」レビュー
sponsored
1本のサウンドバーで360立体音響が実現！

自宅で映画を見るならソニー「HT-A9000」が最高の選択だ
sponsored
「QuTS hero」はランサムウェア対策、安価なSSD／大容量HDDの導入など、中小企業オフィスでも役立つ

NASのデータ保護強化におすすめ！ QNAPのハイエンドOSが中小企業向けモデルにも対応
sponsored

狭い机という課題は「二刀流」で解決、いまあえて選ぶべき一体型パソコンが「IdeaCentre AIO 27IRH9」
sponsored
ゲーマーからクリエイター向けまで、オススメマザーを紹介！

Core Ultra 200Sで自作するならコレ！ASUSのクラス別Z890マザーボード5選
sponsored
自作の煩雑さやトラブルシューティングの手法は軽減！MSI「MAG Z890 TOMAHAWK WIFI」

光らない！ドラゴンなし！ Core Ultra 200S世代の硬派なゲーミングPC向けZ890マザーボードは、自作PC初心者にも簡単で分かりやすくておすすめ
sponsored
Backlogに招待するだけでは「使ってくれない」、ではどうする？

うまくいく！複数人チームでのプロジェクト・タスク管理立ち上げの方法
sponsored

手軽に“壁100インチ”の大画面を楽しもう！自宅が映画館になる「JMGO N1S Ultra 4K」を推す理由
sponsored
JN-38i160U-H-C9をレビュー

PS5 Proの4K/120fpsプレイを大迫力で！38型でKVM機能付きのゲーミング液晶がかなりイイ
sponsored
CyborgやThin、Clawなどが最大25%オフ！

AmazonブラックフライデーでMSIのゲーミングPCが即ポチレベルの格安価格で買えるぞ！
sponsored
リモートワーク環境はまだまだセキュリティ対策が不十分

ハイブリッドワーク中の社員PCがフィッシング詐欺被害！どうやったら防げた？
sponsored
高価格にも納得できるサウンド

7万円の高額ワイヤレスイヤホン「B&W Pi8」の音が、泣けるほど良かった
sponsored
JN-IPS27WQHDR-C65W-FLD-Tをレビュー

27型WQHDディスプレー最強格現る、昇降式・USB給電・KVM・タッチの超多機能で4万円台
sponsored
180Hzで0.5ms（GTG）のRAPID VAバネルを採用した「MAG 275CQRF QD E2」

5万円弱も納得の高速進化したゲーミングディスプレー。27インチならWQHDがおすすめなのにはワケがある
sponsored
UPS搭載で自作派・ゲーマーにも便利、防災の備えこそ、日常的に使いたい

防災用に「ポタ電」を買いたいなら、まずこの１台！　緊急時も日常でもちょうどいい「Jackery ポータブル電源 1000 New」
sponsored
Core Ultra 200搭載でAIという武器を得た2-in-1ノートPC「Summit 13 AI+ Evo A2VM」

AI PCでどれを買うか迷っている人におすすめ、ペンもタブレット機能も使える最新ノートパソコン
sponsored
インテル Core Ultra プロセッサー（シリーズ 2）を搭載した最新モデル登場

今後のPCはAI対応が当たり前になる、それならエイサーのCopilot+ PCがいいーー「Swift 14 AI」で生産性アップ
sponsored
「サイコム冬の特大キャンペーン2024」は2025年1月20日まで！

モンハンワイルズ推奨環境を満たすゲーミングPCが約20.5万円！デュアル水冷は2万円引きの祭が開宴
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！