يبدو أن النظام يستجيب بشكل مناسب. لكن الجواب لم يأخذ في الاعتبار ارتفاع المدخل ، والذي قد يمنع أيضًا دبابة أو سيارة من العبور.
قال الرئيس التنفيذي لشركة OpenAI ، سام ألتمان ، إن الروبوت الجديد يمكن أن يفكر قليلاً. لكن مهاراتها المنطقية تتعطل في العديد من المواقف. تعامل الإصدار السابق من ChatGPT مع السؤال بشكل أفضل قليلاً لأنه أدرك أن الطول والعرض مهمان.
يمكن أن تفوق الاختبارات الموحدة.
وقالت OpenAI إن النظام الجديد يمكن أن يسجل بين أعلى 10 في المائة أو نحو ذلك من الطلاب في امتحان المحامين الموحد ، الذي يؤهل المحامين في 41 ولاية وإقليم. يمكن أيضًا أن يسجل 1300 (من 1600) في SAT وخمسة (من أصل خمسة) في امتحانات المستوى المتقدم للمدارس الثانوية في علم الأحياء وحساب التفاضل والتكامل والاقتصاد الكلي وعلم النفس والإحصاء والتاريخ ، وفقًا لاختبارات الشركة.
فشلت الإصدارات السابقة من التكنولوجيا في امتحان الشريط الموحد ولم تسجل درجات عالية تقريبًا في معظم اختبارات تحديد المستوى المتقدم.
بعد ظهر أحد الأيام مؤخرًا ، لإثبات مهاراته في الاختبار ، قام السيد بروكمان بإطعام الروبوت الجديد بسؤال امتحان شريطي بطول فقرات حول رجل يدير أعمالًا لإصلاح شاحنات الديزل.
كانت الإجابة صحيحة ولكنها مليئة بالشرعية. لذلك طلب السيد بروكمان من الروبوت شرح الإجابة بلغة إنجليزية بسيطة لشخص عادي. لقد فعلت ذلك أيضًا.
ليس من الجيد مناقشة المستقبل.
على الرغم من أن الروبوت الجديد بدا وكأنه يفكر في الأشياء التي حدثت بالفعل ، إلا أنه كان أقل مهارة عندما طُلب منه تكوين فرضيات حول المستقبل. يبدو أنه يعتمد على ما قاله الآخرون بدلاً من خلق تخمينات جديدة.
عندما سأل الدكتور إتزيوني الروبوت الجديد ، “ما هي المشكلات المهمة التي يجب حلها في أبحاث البرمجة اللغوية العصبية خلال العقد القادم؟” – بالإشارة إلى نوع بحث “معالجة اللغة الطبيعية” الذي يقود تطوير أنظمة مثل ChatGPT – لم يتمكن من صياغة أفكار جديدة تمامًا.
ولا تزال هلوسة.
لا يزال الروبوت الجديد يصنع الأشياء. تطارد المشكلة التي يطلق عليها “الهلوسة” جميع روبوتات المحادثة الرائدة. نظرًا لأن الأنظمة لا تفهم ما هو صحيح وما هو غير صحيح ، فقد تولد نصًا خاطئًا تمامًا.
عندما سئل عن عناوين المواقع التي وصفت أحدث أبحاث السرطان ، كان ينتج أحيانًا عناوين إنترنت لم تكن موجودة.
اكتشاف المزيد من نص كم
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.