نقدم لكم عبر موقع “نص كم” علوم تكنولوجية محدثة باستمرار نترككم مع “يستخدم وكيل Google SIMA 2 الجوزاء للتفكير والتصرف في عوالم افتراضية
”
شاركت Google DeepMind يوم الخميس معاينة بحثية لـ SIMA 2، الجيل التالي من وكيل الذكاء الاصطناعي العام الذي يدمج اللغة والقوى المنطقية لـ Gemini، نموذج اللغة الكبير من Google، لتجاوز مجرد اتباع التعليمات لفهم بيئتها والتفاعل معها.
مثل العديد من مشاريع DeepMind، بما في ذلك AlphaFold، تم تدريب الإصدار الأول من SIMA على مئات الساعات من بيانات ألعاب الفيديو لتعلم كيفية لعب ألعاب ثلاثية الأبعاد متعددة مثل الإنسان، حتى بعض الألعاب التي لم يتم التدريب عليها. يمكن لـ SIMA 1، الذي تم الكشف عنه في مارس 2024، اتباع التعليمات الأساسية عبر مجموعة واسعة من البيئات الافتراضية، لكن معدل نجاحه بلغ 31% فقط في إكمال المهام المعقدة، مقارنة بـ 71% للبشر.
وقال جو مارينو، كبير علماء الأبحاث في DeepMind، في مؤتمر صحفي: “يعد SIMA 2 خطوة تغيير وتحسين في القدرات مقارنةً بـ SIMA 1”. “إنه وكيل أكثر عمومية. يمكنه إكمال مهام معقدة في بيئات غير مرئية من قبل. وهو عامل تحسين ذاتي. لذا يمكنه في الواقع تحسين نفسه بناءً على تجربته الخاصة، وهي خطوة نحو المزيد من الروبوتات ذات الأغراض العامة وأنظمة الذكاء الاصطناعي العام بشكل عام.”
يتم تشغيل SIMA 2 بواسطة نموذج Gemini 2.5 flash-lite، ويشير AGI إلى الذكاء العام الاصطناعي، والذي تعرفه DeepMind بأنه نظام قادر على مجموعة واسعة من المهام الفكرية مع القدرة على تعلم مهارات جديدة وتعميم المعرفة عبر مجالات مختلفة.
يقول باحثو ديب مايند إن العمل مع ما يسمى بـ “الوكلاء المتجسدين” أمر بالغ الأهمية للذكاء المعمم. أوضح مارينو أن العامل المتجسد يتفاعل مع العالم المادي أو الافتراضي عبر الجسم – حيث يراقب المدخلات ويتخذ إجراءات تشبه إلى حد كبير الروبوت أو الإنسان – في حين قد يتفاعل الوكيل غير المتجسد مع التقويم الخاص بك، أو يسجل الملاحظات، أو ينفذ التعليمات البرمجية.
قالت جين وانغ، عالمة الأبحاث في DeepMind والتي تتمتع بخلفية في علم الأعصاب، لـ TechCrunch أن SIMA 2 تذهب إلى ما هو أبعد من اللعب.
وقال وانغ: “نحن نطلب منها أن تفهم فعليًا ما يحدث، وأن تفهم ما يطلب منه المستخدم القيام به، ومن ثم تكون قادرًا على الاستجابة بطريقة منطقية وهو أمر صعب للغاية في الواقع”.
حدث تك كرانش
سان فرانسيسكو
|
13-15 أكتوبر 2026
من خلال دمج Gemini، ضاعفت SIMA 2 أداء سابقتها، ووحدت لغة Gemini المتقدمة وقدراتها المنطقية مع المهارات المتجسدة التي تم تطويرها من خلال التدريب.
قام مارينو بعرض SIMA 2 في No Man’s Sky، حيث وصف العميل المناطق المحيطة به – سطح كوكب صخري – وحدد خطواته التالية من خلال التعرف على منارة الاستغاثة والتفاعل معها. تستخدم SIMA 2 أيضًا برج الجوزاء للتفكير داخليًا. في لعبة أخرى، عندما طُلب منه المشي إلى المنزل الذي هو بلون الطماطم الناضجة، أظهر العميل تفكيره – الطماطم الناضجة حمراء، لذلك يجب أن أذهب إلى المنزل الأحمر – ثم عثر عليه واقترب منه.
إن كونها مدعومة من الجوزاء تعني أيضًا أن SIMA 2 تتبع التعليمات بناءً على الرموز التعبيرية: “قم بإرشادها 🪓🌲، وسوف تقطع شجرة،” كما قال مارينو.
أظهر مارينو أيضًا كيف يمكن لـ SIMA 2 التنقل في عوالم واقعية تم إنشاؤها حديثًا من إنتاج Genie، نموذج العالم الخاص بـ DeepMind، وتحديد الأشياء والتفاعل معها بشكل صحيح مثل المقاعد والأشجار والفراشات.

وأضاف مارينو أن الجوزاء يتيح أيضًا تحسين الذات دون الحاجة إلى الكثير من البيانات البشرية. حيث تم تدريب SIMA 1 بالكامل على أسلوب اللعب البشري، تستخدمه SIMA 2 كخط أساس لتوفير نموذج أولي قوي. عندما يضع الفريق العميل في بيئة جديدة، فإنه يطلب من نموذج الجوزاء الآخر إنشاء مهام جديدة ونموذج مكافأة منفصل لتسجيل محاولات الوكيل. باستخدام هذه التجارب المولدة ذاتيًا كبيانات تدريب، يتعلم العميل من أخطائه ويؤدي أداءً أفضل تدريجيًا، ويعلم نفسه بشكل أساسي سلوكيات جديدة من خلال التجربة والخطأ كما يفعل الإنسان، مسترشدًا بردود الفعل المستندة إلى الذكاء الاصطناعي بدلاً من البشر.
ترى DeepMind أن SIMA 2 هي خطوة نحو فتح المزيد من الروبوتات ذات الأغراض العامة.
وقال فريدريك بيس، كبير مهندسي الأبحاث في DeepMind، خلال مؤتمر صحفي: “إذا فكرنا في ما يحتاج النظام إلى القيام به لأداء المهام في العالم الحقيقي، مثل الروبوت، فأعتقد أن هناك مكونين منه”. “أولا، هناك فهم رفيع المستوى للعالم الحقيقي وما يجب القيام به، فضلا عن بعض المنطق.”
إذا طلبت من روبوت في منزلك التحقق من عدد علب الفاصوليا الموجودة في الخزانة، فسيحتاج النظام إلى فهم جميع المفاهيم المختلفة – ما هي الفاصوليا، وما هي الخزانة – والانتقال إلى هذا الموقع. يقول Besse إن SIMA 2 تتناول هذا السلوك عالي المستوى أكثر مما تتناوله في الإجراءات ذات المستوى الأدنى، والتي يشير إليها بالتحكم في أشياء مثل المفاصل الجسدية والعجلات.
رفض الفريق مشاركة جدول زمني محدد لتنفيذ SIMA 2 في أنظمة الروبوتات المادية. أخبر Besse TechCrunch أن نماذج الأساس الروبوتية التي كشفت عنها DeepMind مؤخرًا – والتي يمكنها أيضًا التفكير في العالم المادي وإنشاء خطط متعددة الخطوات لإكمال المهمة – تم تدريبها بشكل مختلف ومنفصل عن SIMA.
على الرغم من عدم وجود جدول زمني لإصدار أكثر من معاينة لـ SIMA 2، قال وانغ لـ TechCrunch إن الهدف هو أن يُظهر للعالم ما تعمل عليه DeepMind ومعرفة أنواع التعاون والاستخدامات المحتملة الممكنة.





