علوم تكنولوجية

“أوبن إيه أي” تطرح إمكانات الصوت والصورة لـ ChatGPT.. إليك كل ما تريد معرفته

نقدم لكم عبر موقع “نص كم” علوم تكنولوجية محدثة باستمرار نترككم مع “”أوبن إيه أي” تطرح إمكانات الصوت والصورة لـ ChatGPT.. إليك كل ما تريد معرفته”

أعلنت OpenAI عن بعض الميزات الجديدة التي ستجعل ChatGPT أكثر ذكاءً، مع اقتراب الذكرى الأولى لتطبيق الذكاء الاصطناعي التوليدى، حيث تطرح الشركة بانتظام ميزات جديدة في برنامج الدردشة الآلى الخاص بها.


 


وفي منشور بالمدونة، كشفت “أوبن إيه أي”، أن إمكانيات الصوت والصورة قادمة إلى ChatGPT. “لقد بدأنا في طرح إمكانات جديدة للصوت والصورة في ChatGPT.” وقالت الشركة إنها توفر نوعًا جديدًا وأكثر سهولة من الواجهة من خلال السماح للمستخدم بإجراء محادثة صوتية أو إظهار “شات جي بي تي”ما تتحدث عنه.


 


ويمكن لمستخدمي “شات جي بي تي”، النقر على صور ثلاجتهم ومخزن المؤن لمعرفة ما سيتم تناوله على العشاء (وطرح أسئلة متابعة للحصول على وصفة خطوة بخطوة).


 


“نحن نطرح الصوت والصور في “شات جي بي تي”، لمستخدمي Plus وEnterprise خلال الأسبوعين المقبلين. قال أوبن إيه أي: “الصوت قادم على نظامي iOS وأندرويد (قم بالاشتراك في إعداداتك) وستكون الصور متاحة على جميع الأنظمة الأساسية”.


 


يمكن لمستخدمي ” شات جي بي تي”، النقر على صور ثلاجتهم ومخزن المؤن لمعرفة ما سيتم تناوله على العشاء (وطرح أسئلة متابعة للحصول على وصفة خطوة بخطوة).


 


“نحن نطرح الصوت والصور في ChatGPT لمستخدمي Plus وEnterprise خلال الأسبوعين المقبلين، قال OpenAI: “الصوت قادم على نظامي iOS وAndroid (قم بالاشتراك في إعداداتك) وستكون الصور متاحة على جميع الأنظمة الأساسية”.




احصل على ChatGPT للتحدث معك


يمكن للمستخدمين ببساطة تنشيط ChatGPT من خلال المطالبات الصوتية والمشاركة في محادثة ذهابًا وإيابًا مع المساعد. 


 


ويتم تشغيل القدرة الصوتية الجديدة من خلال نموذج جديد لتحويل النص إلى كلام، قادر على توليد صوت يشبه صوت الإنسان من مجرد نص وبضع ثوانٍ من عينة الكلام. “لقد تعاونا مع ممثلين صوتيين محترفين لإنشاء كل صوت. كما نستخدم Whisper، وهو نظام التعرف على الكلام مفتوح المصدر الخاص بنا، لتحويل كلماتك المنطوقة إلى نص.


اعرض الصور واطلب من ChatGPT الإجابة

يمكنك عرض صورة واحدة أو أكثر لـ ChatGPT، للتركيز على جزء معين من الصورة، يمكن للمستخدمين استخدام أداة الرسم في تطبيق الهاتف المحمول. يتم دعم فهم الصور بواسطة الوسائط المتعددة GPT-3.5 وGPT-4. تطبق هذه النماذج مهاراتها في التفكير اللغوي على مجموعة واسعة من الصور، مثل الصور الفوتوغرافية ولقطات الشاشة والمستندات التي تحتوي على نصوص وصور، وفقًا لـ OpenAI.


 

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى