أعلنت Odaily Planet Daily News OpenAI أن منتجها ChatGPT سيخضع لترقية كبيرة، مما يضيف وظائف التفاعل الصوتي والصورة. يمكن للمستخدمين الآن إجراء محادثات صوتية مع ChatGPT والبحث باستخدام الصور.
يتم تشغيل ميزة الكلام بواسطة نموذج جديد لتحويل النص إلى كلام يقوم بإنشاء أصوات تشبه الأصوات البشرية من النص وثواني من عينات الكلام. قالت OpenAI إنها عملت مع ممثلين صوتيين معروفين لإنشاء خمسة أصوات مختلفة، وتم استخدام نظام التعرف على الكلام Whisper مفتوح المصدر الخاص بها لتحويل الكلمات المنطوقة إلى نص.
بالإضافة إلى ذلك، أطلقت شركة Spotify، شريك الإطلاق، ميزة جديدة تسمح لمنشئي البث بترجمة عروضهم من الإنجليزية إلى لغات أخرى مع الاحتفاظ بالصوت الأصلي.
سيبدأ طرح الميزات الجديدة لمشتركي Plus وEnterprise المدفوعين خلال الأسبوعين المقبلين. (تك كرانش)