2023年08月23日 13時00分ネットサービス

OpenAIが「GPT-3.5 Turbo」のファインチューニング機能をリリース、用途に合わせた独自のカスタマイズが可能に

対話型AIのChatGPTを開発したOpenAIが、2023年3月にリリースしたGPTモデルファミリー「GPT-3.5 Turbo」のファインチューニング(微調整)機能を発表しました。GPT-3.5 Turboをファインチューニングすることにより、「出力する言語を固定する」「応答の言葉遣いをブランドや企業のイメージに沿ったものにする」など、ユーザーの用途に合わせたカスタマイズが可能になるとのことです。

GPT-3.5 Turbo fine-tuning and API updates
https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates

OpenAI brings fine-tuning to GPT-3.5 Turbo | TechCrunch
https://techcrunch.com/2023/08/22/openai-brings-fine-tuning-to-gpt-3-5-turbo/

OpenAI opens GPT-3.5 Turbo up for custom tuning - The Verge
https://www.theverge.com/2023/8/22/23842042/openai-gpt-3-5-turbo-fine-tuning-enterprise-business-custom-chatbot-ai-artificial-intelligence

機械学習におけるファインチューニングとは、トレーニング済みモデルを新たなデータセットを用いて再トレーニングすることで、細かいタスクに適したパラメーターへ微調整することを指します。大規模言語モデルをファインチューニングすることで、企業や開発者は特定のタスクに適したモデルを作成し、ユーザーに対してユニークかつ差別化されたエクスペリエンスを提供できます。

新たにOpenAIは2023年8月22日のブログで、GPT-3.5 Turboのファインチューニングが可能になったことを発表し、GPT-4のファインチューニング機能も2023年秋にリリース予定であると報告しました。

OpenAIによると、GPT-3.5 Turboをファインチューニングしたバージョンは、特定のタスクでベーシックなGPT-4に匹敵するか、それを上回る性能を発揮する可能性が示されているとのこと。また、ファインチューニングのために送受信されるデータが、OpenAIやその他の組織によって利用されることはないと説明しています。

すでにプライベートベータ版ではGPT-3.5 Turboのファインチューニング機能が提供されているそうで、以下のような一般的なユースケースでGPT-3.5 Turboのパフォーマンスを大幅に向上させられたとOpenAIは述べています。

・操作性の向上
ファインチューニングによって、企業は「簡潔に答える」「特定の言語で応答する」といった指示に対し、モデルがより適切に従うようにすることができます。たとえば、開発者はファインチューニングを利用して、「常にドイツ語で答える」といった指示に対してモデルが常にドイツ語で答えるようにすることが可能だそうです。

・信頼性の高い出力フォーマット
モデルが常に一定の書式に従って応答するようにしたい場合も、ファインチューニングが役立ちます。これはコードの補完やAPI呼び出しの作成、JSONスニペットへの変換といった、特定の応答形式が必要なアプリケーションにとって重要です。

・カスタムトーン
ファインチューニングはモデルが出力する文章の質感を洗練させる上で優れた方法であり、GPT-3.5 Turboがブランドイメージに沿った口調を崩さないように調整することができます。

OpenAIによると、ファインチューニングはパフォーマンスを向上させるだけでなく、パフォーマンスを維持しつつ入力プロンプトを短縮することも可能だとのこと。初期のテスターはプロンプトのサイズを最大90％減少させ、API呼び出しを高速化すると共にコストを削減することができたとOpenAIは述べています。

記事作成時点では、ファインチューニングには「データの準備」「ファイルのアップロード」「ファインチューニングジョブの作成」といった手順が必要です。OpenAIは近いうちに、進行中のファインチューニングジョブや完成モデルのスナップショットなどへのアクセスを容易にするUIをリリース予定だとしています。なお、ファインチューニングを行ってもデフォルトモデルの安全機能を維持するため、ファインチューニング用のデータはモデレーションAPIおよびGPT-4搭載のモデレーションシステムを経由し、安全でないトレーニングデータの検出が行われるとのこと。

ファインチューニングのコストはトレーニングで1000トークンあたり0.008ドル(約1.16円)、入力で1000トークンあたり0.012ドル(約1.75円)、出力で1000トークンあたり0.016ドル(約2.33円)となっています。10万トークン(約7万5000語)のトレーニングファイルを使用したGPT-3.5 Turboのファインチューニングには、約2.4ドル(約350円)のコストがかかると推定されています。

この記事のタイトルとURLをコピーする

・関連コンテンツ

2023年08月23日 13時00分00秒 in ソフトウェア, ネットサービス, Posted by log1h_ik

You can read the machine translated English article here.