OpenAIは、アップグレードされた画像生成ツールを開発者向けに提供開始しました。

OpenAIは、アップグレードされた画像生成ツールを開発者向けに提供開始しました。

OpenAIは水曜日、ChatGPTの新しい画像生成機能の技術をAPIにも提供し、開発者が自分のアプリやサービスに統合できるようにしました。

この新しい画像生成ツールは3月下旬に多くのChatGPTユーザー向けに公開され、ジブリ風のリアルな写真や「AIアクションフィギュア」を作れることで話題となりました。OpenAIにとっては嬉しくもあり困難でもある出来事で、何百万人もの新規ユーザーがChatGPTに登録する一方で、同社の処理能力には大きな負担がかかりました。OpenAIによると、このツールの公開後最初の1週間で、1億3000万人以上のChatGPTユーザーが7億枚以上の画像を生成したとのことです。

APIでの画像生成は「gpt-image-1」と呼ばれるAIモデルによって行われます。このモデルはネイティブにマルチモーダルであり、さまざまなスタイルの画像を作成し、カスタムガイドラインに従い、世界知識を活用し、文字の描写も可能です。

開発者はgpt-image-1を使用して複数の画像を同時に生成でき、生成品質(つまり速度)をコントロールすることも可能です。

OpenAIによれば、gpt-image-1はChatGPTの画像生成と同じ安全対策が施されており、ポリシーに反するコンテンツの生成を防ぐ仕組みがあります。開発者はモデレーション感度を「自動(auto)」または「低(low)」に設定でき、「低」に設定すると、年齢制限が必要な可能性のあるコンテンツカテゴリの制限が緩和されます。

さらに、OpenAIは、gpt-image-1で生成されたすべての画像にはC2PAメタデータによる透かしが埋め込まれており、対応プラットフォームやアプリでAI生成画像として識別できるとしています。

価格は、テキストに対しては入力100万トークンあたり5ドル、画像に対しては入力100万トークンあたり10ドル、画像の出力トークンについては100万トークンあたり40ドルです(トークンはモデルが処理するデータの単位です)。OpenAIによれば、画像1枚あたりの費用は品質によって異なり、低品質で約2セント、中品質で7セント、高品質の正方形画像では約19セントになるとのことです。

OpenAIは、Adobe、Airtable、Wix、Instacart、GoDaddy、Canva、Figmaなどの企業が、すでにgpt-image-1を使用している、あるいは実験中であると述べています。たとえばFigmaのFigma Designプラットフォームでは、gpt-image-1を用いて画像の生成や編集が可能になっており、Instacartはレシピや買い物リスト用の画像にこのモデルを試験的に利用しています。

Open AIカテゴリの最新記事