ChatGPTの進化:見る、聞く、話す新機能登場!

ChatGPT

OpenAIはChatGPTに新しい音声と画像の機能を導入し始めています。

これにより、ユーザーは音声会話を持ったり、ChatGPTに何を話しているのかを示すことができるようになり、より直感的なインターフェースが提供されます。

旅行中にランドマークの写真を撮ってそれについてのライブ会話を楽しんだり、家にいるときに冷蔵庫や食料品棚の写真を撮って夕食のメニューを考えたり、数学の問題を解決するために写真を撮って問題を共有したりすることができます。

この新機能は、今後2週間でPlusおよびEnterpriseユーザーに順次展開され、音声はiOSおよびAndroidで利用可能になり、画像はすべてのプラットフォームで利用可能になります。

音声機能は新しいテキストから音声へのモデルによって動作し、人間のような音声を生成することができます。

画像理解は、多様な画像、例えば写真やスクリーンショット、テキストと画像を含むドキュメントに対する言語推論スキルを適用するGPT-3.5およびGPT-4によって動作します。

これらの新しい機能は、OpenAIの目標である安全で有益なAGIの構築に向けた進歩を示しています。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次