اخبار

تُصدر Databricks Dolly 2.0 ، أول ماجستير مفتوح يتبع التعليمات للاستخدام التجاري


انضم إلى كبار المديرين التنفيذيين في سان فرانسيسكو يومي 11 و 12 يوليو ، لمعرفة كيف يدمج القادة استثمارات الذكاء الاصطناعي ويحسنونها لتحقيق النجاح. يتعلم أكثر


أصدرت Databricks اليوم Dolly 2.0 ، الإصدار التالي من نموذج اللغة الكبيرة (LLM) مع تفاعل بشري يشبه ChatGPT (ويعرف أيضًا باسم التعليمات التالية) الذي أصدرته الشركة قبل أسبوعين فقط.

تقول الشركة إن Dolly 2.0 هو أول مصدر مفتوح المصدر ، يتبع التعليمات LLM تم ضبطه بدقة على مجموعة بيانات شفافة ومتاحة مجانًا ومفتوحة المصدر أيضًا للاستخدام لأغراض تجارية. وهذا يعني أن Dolly 2.0 متاح للتطبيقات التجارية دون الحاجة إلى الدفع مقابل الوصول إلى واجهة برمجة التطبيقات أو مشاركة البيانات مع أطراف ثالثة.

وفقًا للرئيس التنفيذي لشركة Databricks علي قدسي ، في حين أن هناك LLMs أخرى يمكن استخدامها لأغراض تجارية ، “لن يتحدثوا إليك مثل Dolly 2.0.” وأوضح أنه يمكن للمستخدمين تعديل وتحسين بيانات التدريب لأنها متاحة مجانًا بموجب ترخيص مفتوح المصدر. قال “لذا يمكنك صنع نسختك الخاصة من Dolly”.

أصدرت Databricks مجموعة البيانات التي تم تدريب Dolly 2.0 عليها

بالإضافة إلى ذلك ، قالت Databricks أنه كجزء من التزامها المستمر بفتح المصدر ، فإنها تقوم أيضًا بإصدار مجموعة البيانات التي تم تدريب Dolly 2.0 عليها ، والتي تسمى databricks-dolly-15k. هذه مجموعة تضم أكثر من 15000 سجل تم إنشاؤها بواسطة الآلاف من موظفي Databricks ، وتقول Databricks إنها “أول مجموعة تعليمات مفتوحة المصدر أنشأها الإنسان مصممة خصيصًا لتمكين اللغة الكبيرة من إظهار التفاعل السحري لـ ChatGPT.”

حدث

تحويل 2023

انضم إلينا في سان فرانسيسكو يومي 11 و 12 يوليو ، حيث سيشارك كبار المسؤولين التنفيذيين في كيفية دمج استثمارات الذكاء الاصطناعي وتحسينها لتحقيق النجاح وتجنب المزالق الشائعة.

سجل الان

كانت هناك موجة من إصدارات LLM التي تشبه ChatGPT على مدار الشهرين الماضيين والتي تعتبر مفتوحة المصدر من خلال العديد من التعريفات (أو تقدم مستوى معينًا من الانفتاح أو الوصول عبر بوابات) ، بما في ذلك Meta’s LLaMA ، والتي بدورها ألهمت آخرين مثل Alpaca و Koala و Vicuna و Databricks ‘Dolly 1.0.2 تحديث

قال قدسي إن العديد من هذه النماذج “المفتوحة” كانت تحت “الاستحواذ الصناعي” ، لأنها تدربت على مجموعات البيانات التي تحد شروطها من الحد من الاستخدام التجاري – مثل مجموعة بيانات 52000 سؤال وجواب من مشروع ستانفورد ألباكا الذي كان تم تدريبه على الإخراج من ChatGPT الخاص بـ OpenAI. لكن شروط استخدام OpenAI ، كما أوضح ، تتضمن قاعدة أنه لا يمكنك استخدام مخرجات الخدمات للتنافس مع OpenAI.

ومع ذلك ، اكتشفت Databricks كيفية التغلب على هذه المشكلة: Dolly 2.0 هو نموذج لغة 12B للمعلمة يعتمد على عائلة طراز Eleuther AI pythia مفتوحة المصدر ويتم ضبطه بشكل حصري على مجموعة صغيرة ومفتوحة المصدر من سجلات التعليمات (databricks-dolly -15k) تم إنشاؤها بواسطة موظفي Databricks. تسمح شروط ترخيص مجموعة البيانات هذه باستخدامها وتعديلها وتوسيعها لأي غرض ، بما في ذلك التطبيقات الأكاديمية أو التجارية.

كانت النماذج التي تم تدريبها على إخراج ChatGPT ، حتى الآن ، في منطقة قانونية رمادية. قال قدسي: “كان المجتمع بأسره يدور حول هذا الأمر ويطلق الجميع هذه النماذج ، لكن لا يمكن استخدام أي منها تجاريًا”. “لذلك نحن متحمسون للغاية.”

Dolly 2.0 صغير ولكنه عظيم

أكدت إحدى مشاركات مدونة Databricks على أنه مثل إصدار Dolly الأصلي ، فإن الإصدار 2.0 ليس أحدث ما توصلت إليه التقنية ، ولكنه “يعرض مستوى قادرًا بشكل مدهش على سلوك متابعة التعليمات نظرًا لحجم مجموعة التدريب” ، مضيفًا أن مستوى الجهد والنفقات ضرورية لبناء تقنيات ذكاء اصطناعي قوية هي “أوامر بأحجام أقل مما كان يتصور سابقًا”.

قال قدسي عن حجم دوللي الضئيل: “كل شخص آخر يريد أن يصبح أكبر ، لكننا مهتمون حقًا بالحجم الأصغر”. “ثانيًا ، إنها ذات جودة عالية. نظرنا في جميع الإجابات “.

وأضاف غودي أنه يعتقد أن Dolly 2.0 سيبدأ تأثير “كرة الثلج” – حيث يمكن للآخرين في مجتمع الذكاء الاصطناعي الانضمام والتوصل إلى بدائل أخرى. وأوضح أن الحد من الاستخدام التجاري كان عقبة كبيرة يجب التغلب عليها: “نحن متحمسون الآن لأننا وجدنا أخيرًا طريقة للتغلب عليها. أعدك بأنك سترى أشخاصًا يطبقون 15000 سؤال على كل نموذج موجود هناك ، وسوف يرون عدد هذه النماذج التي أصبحت فجأة نوعًا من السحر ، حيث يمكنك التفاعل معهم “.

مهمة VentureBeat هو أن تكون ساحة المدينة الرقمية لصناع القرار التقنيين لاكتساب المعرفة حول تكنولوجيا المؤسسات التحويلية والمعاملات. اكتشف إحاطاتنا.


اكتشاف المزيد من نص كم

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من نص كم

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading