OpenAIはChatGPTに新しい音声と画像の機能を導入し始めています。
これにより、ユーザーは音声会話を持ったり、ChatGPTに何を話しているのかを示すことができるようになり、より直感的なインターフェースが提供されます。
Use your voice to engage in a back-and-forth conversation with ChatGPT. Speak with it on the go, request a bedtime story, or settle a dinner table debate.
— OpenAI (@OpenAI) September 25, 2023
Sound on 🔊 pic.twitter.com/3tuWzX0wtS
旅行中にランドマークの写真を撮ってそれについてのライブ会話を楽しんだり、家にいるときに冷蔵庫や食料品棚の写真を撮って夕食のメニューを考えたり、数学の問題を解決するために写真を撮って問題を共有したりすることができます。
この新機能は、今後2週間でPlusおよびEnterpriseユーザーに順次展開され、音声はiOSおよびAndroidで利用可能になり、画像はすべてのプラットフォームで利用可能になります。
音声機能は新しいテキストから音声へのモデルによって動作し、人間のような音声を生成することができます。
画像理解は、多様な画像、例えば写真やスクリーンショット、テキストと画像を含むドキュメントに対する言語推論スキルを適用するGPT-3.5およびGPT-4によって動作します。
これらの新しい機能は、OpenAIの目標である安全で有益なAGIの構築に向けた進歩を示しています。
コメント