DALL·E 3は、OpenAIによって開発されたテキストから画像を生成するシステムです。
このシステムは、以前のバージョンよりも高度なニュアンスと詳細を理解する能力を持っています。
これにより、ユーザーが考えるアイデアを非常に正確な画像として簡単に翻訳できます。
主な特徴は下記の通りです。
精度の向上
DALL·E 3は、ユーザーが提供するテキストに非常に忠実に画像を生成する能力があります。
これは、従来のテキストから画像への変換システムがしばしば無視する単語や説明を考慮に入れる大きな進歩です。
ChatGPTとの連携
DALL·E 3はChatGPTを基盤としています。
これにより、ChatGPTを使用してアイデアをブレインストーミングしたり、プロンプトを洗練させることができます。
たとえば、特定の画像が気に入ったが完璧ではない場合、ChatGPTに数語で調整を依頼することができます。
カスタマイズと利用可能性
DALL·E 3は、ChatGPT PlusとEnterpriseの顧客に対して、10月にAPIおよびLabsを通じて利用可能になる予定です。
生成された画像は、ユーザーが自由に使用、販売、商品化することができます。
コンテンツ制限
DALL·E 3は、暴力的、成人向け、または憎悪的なコンテンツを生成する能力が制限されています。
また、公共の人物に関するリクエストや、生きているアーティストのスタイルでの画像生成も拒否されます。
リスク評価と緩和
OpenAIは、リスク評価と緩和の努力を専門家と共に行っています。
これには、プロパガンダやデマなどのリスク領域に関する安全性の向上も含まれます。
従来モデルDALL・2との比較
左の画像が従来のモデルであるDALL・E2で生成した画像
右の画像が最新のモデルDALL・E3で生成した画像
OpenAI releases third version of DALL-E
OpenAI integrated DALL-E 3 with ChatGPT.
コメント