قبل أربعة أشهر ، أصبحت شركة صغيرة في سان فرانسيسكو حديث صناعة التكنولوجيا عندما قدمت روبوت محادثة جديد عبر الإنترنت يمكنه الإجابة على الأسئلة المعقدة وكتابة الشعر وحتى تقليد المشاعر البشرية.
الآن عادت الشركة بإصدار جديد من التكنولوجيا التي تشغل روبوتات المحادثة الخاصة بها. سيعمل النظام على زيادة الرهان في سباق وادي السيليكون لاحتضان الذكاء الاصطناعي وتحديد من سيكون الجيل القادم من القادة في صناعة التكنولوجيا.
قالت شركة OpenAI ، التي يعمل بها حوالي 375 موظفًا ولكن تم دعمها بمليارات الدولارات من الاستثمارات من Microsoft والمشاهير في الصناعة ، يوم الثلاثاء إنها أصدرت تقنية أطلقت عليها اسم GPT-4. تم تصميمه ليكون المحرك الأساسي الذي يقوم بتشغيل برامج الدردشة وجميع أنواع الأنظمة الأخرى ، من محركات البحث إلى المعلمين الشخصيين عبر الإنترنت.
سيستخدم معظم الأشخاص هذه التقنية من خلال إصدار جديد من برنامج الدردشة ChatGPT الخاص بالشركة ، بينما ستقوم الشركات بدمجها في مجموعة متنوعة من الأنظمة ، بما في ذلك برامج الأعمال ومواقع التجارة الإلكترونية. تعمل التكنولوجيا بالفعل على تشغيل chatbot المتاح لعدد محدود من الأشخاص الذين يستخدمون محرك بحث Bing من Microsoft.
أدى تقدم OpenAI ، في غضون بضعة أشهر فقط ، إلى هبوط صناعة التكنولوجيا في واحدة من أكثر اللحظات التي لا يمكن التنبؤ بها منذ عقود. يعتقد العديد من قادة الصناعة أن التطورات في الذكاء الاصطناعي تمثل تحولًا تقنيًا أساسيًا ، لا يقل أهمية عن إنشاء متصفحات الويب في أوائل التسعينيات. أذهل التحسن السريع علماء الكمبيوتر.
يعمل GPT-4 ، الذي يتعلم مهاراته من خلال تحليل كميات هائلة من البيانات المستخرجة من الإنترنت ، على تحسين ما يدعم ChatGPT الأصلي بعدة طرق. إنه أكثر دقة. يمكنه ، على سبيل المثال ، الحصول على اختبار Uniform Bar Exam ، وحساب المسؤولية الضريبية لشخص ما على الفور وتقديم أوصاف مفصلة للصور.
لكن التكنولوجيا الجديدة لـ OpenAI لا تزال بها بعض أوجه القصور الغريبة التي تشبه الإنسان والتي أزعجت المطلعين في الصناعة وأثارت أعصاب الأشخاص الذين عملوا مع أحدث برامج الدردشة الآلية. إنه خبير في بعض الموضوعات ومهتم في البعض الآخر. يمكن أن يكون أداءً أفضل في الاختبارات المعيارية أكثر من معظم الأشخاص ويقدم نصائح طبية دقيقة للأطباء ، ولكنه قد يفسد أيضًا العمليات الحسابية الأساسية.
قد يتعين على الشركات التي تراهن بمستقبلها على التكنولوجيا – على الأقل في الوقت الحالي – أن تتحمل عدم الدقة ، والتي كانت من المحرمات منذ فترة طويلة في صناعة مبنية من الألف إلى الياء على فكرة أن أجهزة الكمبيوتر أكثر دقة من صانعيها البشريين.
قال سام التمان ، الرئيس التنفيذي لشركة OpenAI ، في مقابلة: “لا أريد أن أجعل الأمر يبدو وكأننا قد حللنا التفكير أو الذكاء ، وهو ما لم نفعله بالتأكيد”. “لكن هذه خطوة كبيرة إلى الأمام مما هو موجود بالفعل.”
من المحتمل أن تقوم شركات التكنولوجيا الأخرى بتضمين ميزات GPT-4 في مجموعة من المنتجات والخدمات ، بما في ذلك برامج Microsoft لأداء مهام العمل ومواقع التجارة الإلكترونية التي ترغب في منح العملاء طرقًا جديدة لتجربة منتجاتهم افتراضيًا. يعمل عدد من عمالقة الصناعة مثل Google والشركة الأم لـ Facebook ، Meta ، أيضًا على برامج الدردشة وتقنية الذكاء الاصطناعي الخاصة بهم.
تعمل ChatGPT والتقنيات المماثلة بالفعل على تغيير سلوك الطلاب والمعلمين الذين يحاولون فهم ما إذا كان ينبغي تبني الأدوات أو حظرها. نظرًا لأن الأنظمة يمكنها كتابة برامج الكمبيوتر وأداء مهام تجارية أخرى ، فهي أيضًا على وشك تغيير طبيعة العمل.
حتى أكثر الأنظمة إثارة للإعجاب تميل إلى استكمال العمال المهرة بدلاً من استبدالهم. لا يمكن استخدام الأنظمة بدلاً من الأطباء أو المحامين أو المحاسبين. لا تزال هناك حاجة إلى الخبراء لتحديد أخطائهم. لكن يمكن أن يحلوا قريبًا محل بعض المساعدين القانونيين (الذين تتم مراجعة عملهم وتحريره من قبل محامين مدربين) ، ويعتقد العديد من خبراء الذكاء الاصطناعي أنهم سيحلون محل العمال الذين يديرون المحتوى على الإنترنت.
قال جريج بروكمان ، رئيس OpenAI: “هناك بالتأكيد اضطراب ، مما يعني اختفاء بعض الوظائف وإنشاء بعض الوظائف الجديدة”. “لكنني أعتقد أن التأثير الصافي هو أن الحواجز التي تحول دون الدخول تنخفض ، وترتفع إنتاجية الخبراء.”
يوم الثلاثاء ، بدأت OpenAI بيع الوصول إلى GPT-4 بحيث يمكن للشركات ومطوري البرامج الآخرين إنشاء تطبيقاتهم الخاصة فوقها. استخدمت الشركة أيضًا هذه التقنية لبناء إصدار جديد من برنامج chatbot الشهير ، وهو متاح لأي شخص يشتري الوصول إلى ChatGPT Plus – وهي خدمة اشتراك بسعر 20 دولارًا شهريًا.
تعمل حفنة من الشركات بالفعل مع GPT-4. تقوم Morgan Stanley Wealth Management ببناء نظام يقوم على الفور باسترداد المعلومات من مستندات الشركة والسجلات الأخرى ، ويخدمها للمحللين الماليين في نثر المحادثة. تستخدم Khan Academy ، وهي شركة تعليمية عبر الإنترنت ، التكنولوجيا لبناء معلم آلي.
قال الرئيس التنفيذي ومؤسس أكاديمية خان ، سال خان: “يمكن أن تعمل هذه التكنولوجيا الجديدة كمدرس”. “نريد أن نعلم الطالب تقنيات جديدة بينما يقوم الطالب بمعظم العمل.”
مثل التقنيات المماثلة ، فإن النظام الجديد “يهلوس” أحيانًا. يولد معلومات خاطئة تمامًا دون سابق إنذار. عند سؤاله عن مواقع الويب التي تعرض أحدث الأبحاث في مجال السرطان ، فقد يقدم العديد من عناوين الإنترنت غير الموجودة.
GPT-4 هي شبكة عصبية ، وهي نوع من الأنظمة الرياضية التي تتعلم المهارات من خلال تحليل البيانات. إنها نفس التقنية التي يستخدمها المساعدون الرقميون مثل Siri للتعرف على الأوامر المنطوقة والسيارات ذاتية القيادة التي تستخدمها لتحديد هوية المشاة.
حوالي عام 2018 ، بدأت شركات مثل Google و OpenAI في بناء شبكات عصبية تعلمت من كميات هائلة من النصوص الرقمية ، بما في ذلك الكتب ومقالات ويكيبيديا وسجلات الدردشة وغيرها من المعلومات المنشورة على الإنترنت. يطلق عليهم نماذج اللغة الكبيرة ، أو LLMs
من خلال تحديد بلايين الأنماط في كل هذا النص ، يتعلم LLM إنشاء نص بمفرده ، بما في ذلك التغريدات والقصائد وبرامج الكمبيوتر. قامت شركة OpenAI بإلقاء المزيد والمزيد من البيانات في LLM المزيد من البيانات ، كما كانت تأمل الشركة ، أن تعني إجابات أفضل.
قامت OpenAI أيضًا بتحسين هذه التقنية باستخدام التعليقات من المختبرين البشريين. عندما اختبر الأشخاص ChatGPT ، قاموا بتصنيف ردود chatbot ، وفصلوا تلك التي كانت مفيدة وصادقة عن تلك التي لم تكن كذلك. بعد ذلك ، وباستخدام تقنية تسمى التعلم المعزز ، أمضى النظام شهورًا في تحليل تلك التصنيفات واكتساب فهم أفضل لما يجب عليه وما لا ينبغي فعله.
قال Luke Metz ، الباحث في OpenAI: “يقوم البشر بتقييم الأشياء التي يرغبون في رؤيتها والأشياء التي لا يرغبون في رؤيتها”.
اعتمد ChatGPT الأصلي على نموذج لغة كبير يسمى GPT-3.5. تعلمت GPT-4 الخاصة بـ OpenAI من كميات أكبر بكثير من البيانات.
رفض المسؤولون التنفيذيون في OpenAI الكشف عن مقدار البيانات التي تعلمها روبوت الدردشة الجديد ، لكن السيد بروكمان قال إن مجموعة البيانات كانت “مقياس الإنترنت” ، مما يعني أنها امتدت إلى عدد كافٍ من مواقع الويب لتقديم عينة تمثيلية لجميع المتحدثين باللغة الإنجليزية على الإنترنت.
قد لا تكون القدرات الجديدة لـ GPT-4 واضحة للشخص العادي الذي يستخدم التقنية أولاً. لكن من المحتمل أن يتم التركيز عليهم بسرعة مع استمرار الأشخاص العاديين والخبراء في استخدام الخدمة.
بالنظر إلى مقال مطول من New York Times وطلب تلخيصه ، سيعطي الروبوت ملخصًا دقيقًا في كل مرة تقريبًا. أضف بضع جمل عشوائية إلى هذا الملخص واسأل روبوت الدردشة عما إذا كان الملخص الذي تمت مراجعته دقيقًا ، وسيشير إلى الجمل المضافة باعتبارها الأخطاء الوحيدة.
وصف السيد ألتمان السلوك بأنه “تفكير”. لكن التكنولوجيا لا يمكنها تكرار التفكير البشري. إنه جيد في تحليل وتلخيص والإجابة على الأسئلة المعقدة حول كتاب أو مقال إخباري. إنه أقل مهارة بكثير إذا سئل عن الأحداث التي لم تحدث بعد.
يمكن أن تكتب نكتة ، لكنها لا تُظهر أنها تفهم ما الذي سيجعل شخصًا ما يضحك بالفعل. قال أورين إيتزيوني ، الرئيس التنفيذي المؤسس لمعهد ألين للذكاء الاصطناعي ، وهو مختبر بارز في سياتل: “إنها لا تفهم الفروق الدقيقة في ما هو مضحك”.
كما هو الحال مع التقنيات المماثلة ، قد يجد المستخدمون طرقًا لإقناع النظام بسلوك غريب ومخيف. عندما يُطلب من هذا النوع من الروبوتات تقليد شخص آخر أو أسلوب اللعب ، ينحرف أحيانًا إلى المناطق التي صُمم للابتعاد عنها.
يمكن لـ GPT-4 أيضًا الاستجابة للصور. بالنظر إلى صورة أو رسم بياني أو رسم بياني ، يمكن للتقنية أن تقدم وصفًا مفصلاً لفقرات للصورة والإجابة على أسئلة حول محتوياتها. يمكن أن تكون تقنية مفيدة للأشخاص ضعاف البصر.
بعد ظهر أحد الأيام ، أظهر السيد بروكمان كيف كان رد فعل النظام على الصور. أعطى روبوت المحادثة الجديد صورة من تلسكوب هابل الفضائي وطلب منه وصف الصورة “بتفاصيل مضنية”. استجابت مع وصف من أربع فقرات ، والذي تضمن شرحًا للخط الأبيض الأثيري الذي امتد عبر الصورة. كتب الشات بوت “أثر من قمر صناعي أو شهاب”.
قال المسؤولون التنفيذيون في OpenAI إن الشركة لم تصدر على الفور جزء وصف الصورة من التكنولوجيا لأنهم لم يكونوا متأكدين من كيفية إساءة استخدامها.
يعد إنشاء روبوتات المحادثة وتقديمها أمرًا مكلفًا للغاية. نظرًا لأنه يتم تدريبه على كميات أكبر من البيانات ، فإن برنامج الدردشة الآلي الجديد لـ OpenAI سيزيد من تكاليف الشركة. قالت ميرا موراتي ، كبيرة مسؤولي التكنولوجيا في شركة OpenAI ، إن الشركة يمكن أن تحد من الوصول إلى الخدمة إذا كانت تولد الكثير من الزيارات.
ولكن على المدى الطويل ، تخطط شركة OpenAI لبناء ونشر أنظمة يمكنها التوفيق بين أنواع متعددة من الوسائط ، بما في ذلك الصوت والفيديو وكذلك النصوص والصور.
قال السيد بروكمان: “يمكننا أخذ كل هذه المهارات المعرفية ذات الأغراض العامة ونشرها في جميع أنواع المجالات المختلفة”. “هذا يأخذ التكنولوجيا إلى مجال جديد تمامًا.”
اكتشاف المزيد من نص كم
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.