في الثاني لدينا سلسلة من خمسة أجزاء، سأشرح كيف تعمل التكنولوجيا بالفعل.
يمكن للذكاء الاصطناعي الذي يشغل ChatGPT و Bing chatbot من Microsoft و Google Bard إجراء محادثات شبيهة بالبشر وكتابة نثر طبيعي وسلس في مجموعة متنوعة لا حصر لها من الموضوعات. يمكنهم أيضًا أداء مهام معقدة ، من كتابة التعليمات البرمجية إلى التخطيط لحفلة عيد ميلاد للأطفال.
لكن كيف يعمل كل هذا؟ للإجابة على ذلك ، نحتاج إلى إلقاء نظرة خاطفة على شيء يسمى نموذج اللغة الكبير – نوع الذكاء الاصطناعي الذي يقود هذه الأنظمة.
تعد نماذج اللغات الكبيرة ، أو LLM ، جديدة نسبيًا على مشهد الذكاء الاصطناعي. ظهرت الأولى منذ حوالي خمس سنوات فقط ، ولم تكن جيدة جدًا. لكن يمكنهم اليوم صياغة رسائل البريد الإلكتروني والعروض التقديمية والمذكرات وتعليمك بلغة أجنبية. من المؤكد أن المزيد من الإمكانات ستظهر في الأشهر والسنوات المقبلة ، مع تحسن التكنولوجيا وسرعة تحقيق Silicon Valley للاستفادة منها.
سأقوم بتوجيهك خلال إعداد نموذج لغوي كبير من الصفر ، وتبسيط الأمور وترك الكثير من الرياضيات الصعبة. دعنا نتظاهر بأننا نحاول بناء LLM لمساعدتك في الرد على رسائل البريد الإلكتروني الخاصة بك. سنسميها MailBot.
الخطوة 1: حدد هدفًا
كل نظام ذكاء اصطناعي يحتاج إلى هدف. يطلق الباحثون على هذا اسم دالة الهدف. يمكن أن يكون الأمر بسيطًا – على سبيل المثال ، “اربح أكبر عدد ممكن من ألعاب الشطرنج” – أو معقدًا ، مثل “توقع الأشكال ثلاثية الأبعاد للبروتينات ، باستخدام تسلسل الأحماض الأمينية فقط.”
معظم نماذج اللغات الكبيرة لها نفس الوظيفة الهدف الأساسية: بالنظر إلى تسلسل النص ، خمن ما سيأتي بعد ذلك. سنمنح MailBot أهدافًا أكثر تحديدًا لاحقًا ، لكن دعنا نلتزم بهذا الهدف في الوقت الحالي.
الخطوة الثانية: جمع الكثير من البيانات
بعد ذلك ، نحتاج إلى تجميع بيانات التدريب التي ستعلم MailBot كيفية الكتابة. من الناحية المثالية ، سنجمع مستودعًا ضخمًا للنصوص ، والذي يعني عادةً بلايين الصفحات التي تم إزالتها من الإنترنت – مثل منشورات المدونات والتغريدات ومقالات ويكيبيديا والقصص الإخبارية.
للبدء ، سنستخدم بعض مكتبات البيانات المجانية والمتاحة للجمهور ، مثل مستودع الزحف المشترك لبيانات الويب. لكننا سنرغب أيضًا في إضافة صلصة سرية خاصة بنا ، في شكل بيانات خاصة أو خاصة. ربما سنقوم بترخيص بعض النصوص المكتوبة بلغة أجنبية ، حتى يتعلم MailBot إنشاء رسائل بريد إلكتروني باللغتين الفرنسية أو الإسبانية وكذلك الإنجليزية. بشكل عام ، كلما زادت البيانات المتوفرة لدينا ، وكلما كانت المصادر أكثر تنوعًا ، كان نموذجنا أفضل.
قبل أن نتمكن من إدخال البيانات في نموذجنا ، نحتاج إلى تقسيمها إلى وحدات تسمى الرموز المميزة ، والتي يمكن أن تكون كلمات أو عبارات أو حتى أحرفًا فردية. يساعد تحويل النص إلى أجزاء صغيرة الحجم النموذج على تحليله بسهولة أكبر.
الخطوة 3: بناء شبكتك العصبية
بمجرد تحويل بياناتنا إلى رموز رمزية ، نحتاج إلى تجميع “دماغ” الذكاء الاصطناعي – وهو نوع من النظام يُعرف باسم الشبكة العصبية. هذه شبكة معقدة من العقد المترابطة (أو “الخلايا العصبية”) التي تعالج المعلومات وتخزنها.
بالنسبة إلى MailBot ، سنرغب في استخدام نوع جديد نسبيًا من الشبكات العصبية يُعرف باسم a نموذج المحولات. يمكنهم تحليل أجزاء متعددة من النص في نفس الوقت ، مما يجعلها أسرع وأكثر كفاءة. (نماذج المحولات هي المفتاح لأنظمة مثل ChatGPT – التي يرمز اختصارها الكامل إلى “Generative Pretrained Transformer.”)
الخطوة 4: تدريب شبكتك العصبية
بعد ذلك ، سيقوم النموذج بتحليل البيانات ، رمزًا رمزيًا ، وتحديد الأنماط والعلاقات. قد تلاحظ غالبًا أن كلمة “عزيزي” يتبعها اسم ، أو أن عبارة “مع أطيب التحيات” تأتي عادةً قبل اسمك. من خلال تحديد هذه الأنماط ، يتعلم الذكاء الاصطناعي كيفية تكوين رسائل منطقية.
يطور النظام أيضًا إحساسًا بالسياق. على سبيل المثال ، قد يتعلم أن “البنك” يمكن أن يشير إلى مؤسسة مالية أو جانب من النهر ، اعتمادًا على الكلمات المحيطة.
بينما يتعلم نموذج المحولات هذه الأنماط ، يرسم خريطة: تمثيل رياضي معقد للغاية للغة البشرية. يتتبع هذه العلاقات باستخدام القيم العددية المعروفة باسم حدود. يحتوي العديد من أفضل LLM اليوم على مئات المليارات من المعلمات أو أكثر.
قد يستغرق التدريب أيامًا أو حتى أسابيع ، وسيتطلب قدرًا هائلاً من القوة الحاسوبية. ولكن بمجرد الانتهاء ، سيكون جاهزًا تقريبًا لبدء كتابة رسائل البريد الإلكتروني الخاصة بك.
بشكل غريب ، قد يطور مهارات أخرى أيضًا. بينما يتعلم LLMs التنبؤ بالكلمة التالية في تسلسل ، مرارًا وتكرارًا ، يمكنهم التقاط قدرات أخرى غير متوقعة ، مثل معرفة كيفية البرمجة. يسمي باحثو الذكاء الاصطناعي هذه السلوكيات الناشئة ، ولا يزالون في بعض الأحيان في حيرة من أمرهم.
الخطوة 5: صقل النموذج الخاص بك
بمجرد تدريب نموذج لغوي كبير ، يجب معايرته لوظيفة معينة. قد يحتاج برنامج الدردشة الآلي المستخدم من قبل المستشفى إلى فهم المصطلحات الطبية ، على سبيل المثال.
لضبط MailBot ، يمكننا أن نطلب منه إنشاء مجموعة من رسائل البريد الإلكتروني ، وتوظيف أشخاص لتقييمها على أساس الدقة ، ثم إعادة التصنيفات إلى النموذج حتى تتحسن.
هذا تقريب تقريبي للنهج الذي تم استخدامه مع ChatGPT ، والذي يُعرف باسم تعزيز التعلم مع ردود الفعل البشرية.
الخطوة 6: الإطلاق ، بعناية
تهانينا! بمجرد تدريب MailBot وضبطه ، يصبح جاهزًا للاستخدام. بعد إنشاء نوع من واجهة المستخدم له – مثل امتداد Chrome الذي يتم توصيله بتطبيق البريد الإلكتروني الخاص بك – يمكنه البدء في إرسال رسائل البريد الإلكتروني.
ولكن بغض النظر عن مدى جودة ذلك ، ستظل ترغب في مراقبة مساعدك الجديد. نظرًا لأن شركات مثل Microsoft و Meta تعلمت بالطريقة الصعبة ، يمكن أن تكون أنظمة الذكاء الاصطناعي غير منتظمة ولا يمكن التنبؤ بها ، أو حتى تصبح مخيفة وخطيرة.
غدًا ، سنسمع المزيد عن كيف يمكن أن تسوء الأمور بطرق غير متوقعة ومزعجة في بعض الأحيان.
واجبك
دعنا نستكشف واحدة من أكثر القدرات الإبداعية في LLM: القدرة على الجمع بين المفاهيم والأشكال المتباينة في شيء غريب وجديد. على سبيل المثال ، طلب زملاؤنا في Well من ChatGPT “كتابة أغنية بصوت تايلور سويفت تستخدم موضوعات من كتاب دكتور سوس.”
بالنسبة للواجب المنزلي اليوم ، حاول المزج والتنسيق بين التنسيق والأسلوب والموضوع – مثل ، “اكتب ليمريك بأسلوب سنوب دوج حول ظاهرة الاحتباس الحراري.”
لا تنس مشاركة إنشاءك كتعليق.
اختبار
السؤال 1 من 3
ما هي الوظيفة الموضوعية الأساسية لنماذج اللغات الكبيرة مثل ChatGPT؟
ابدأ الاختبار باختيار إجابتك.
قائمة المصطلحات
-
نموذج المحولات: بنية شبكة عصبية مفيدة لفهم اللغة ، والتي لا يتعين عليها تحليل الكلمات واحدة تلو الأخرى ولكن يمكنها النظر إلى جملة كاملة مرة واحدة. تسمح تقنية تسمى الانتباه الذاتي للنموذج بالتركيز على كلمات معينة مهمة في فهم معنى الجملة.
-
حدود: القيم العددية التي تحدد بنية وسلوك نموذج لغة كبير ، مثل القرائن التي تساعده على تخمين الكلمات التي ستأتي بعد ذلك. يُعتقد أن الأنظمة الحديثة مثل GPT-4 تحتوي على مئات المليارات من المعلمات.
-
تعزيز التعلم: تقنية تُعلِّم نموذجًا للذكاء الاصطناعي للعثور على أفضل نتيجة عن طريق التجربة والخطأ ، وتلقي المكافآت أو العقوبات من خوارزمية بناءً على نتائجها. يمكن تحسين هذا النظام من خلال إعطاء الإنسان ملاحظات حول أدائه.
انقر هنا لمزيد من المصطلحات.