أداوت وتكنولوجيا

يتطلب تدريب ChatGPT AI 185000 جالون من المياه: دراسة


نماذج اللغات الكبيرة الشائعة (LLMs) مثل برنامج ChatGPT الخاص بـ OpenAI و جوجل بارد تستهلك الكثير من الطاقة وتتطلب مزارع خوادم ضخمة لتوفير بيانات كافية لتدريب البرامج القوية. يؤدي تبريد نفس مراكز البيانات أيضًا إلى جعل روبوتات الدردشة المدعومة بالذكاء الاصطناعي متعطشة بشكل لا يصدق. يقترح بحث جديد التدريب لـ GPT-3 وحيد مستهلك 185000 جالون (700000 لتر) من الماء. وفقًا للدراسة الجديدة ، فإن تبادل محادثات المستخدم العادي مع ChatGPT يرقى أساسًا إلى إلقاء زجاجة كبيرة من المياه العذبة على الأرض. بالنظر إلى برنامج chatbot شعبية غير مسبوقة، يخشى الباحثون من أن كل تلك الزجاجات المنسكبة يمكن أن تؤثر سلبًا مقلقًا على إمدادات المياه ، لا سيما وسطها حالات الجفاف التاريخية وعدم اليقين البيئي الذي يلوح في الأفق في الولايات المتحدة.

نشر باحثون من جامعة كولورادو ريفرسايد وجامعة تكساس أرلينغتون تقديرات استهلاك المياه باستخدام الذكاء الاصطناعي في ورقة مطبوعة مسبقًا بعنوان “تقليل عطش الذكاء الاصطناعي.وجد المؤلفون أن كمية المياه العذبة النقية المطلوبة لتدريب GPT-3 تعادل الكمية المطلوبة ملء برج تبريد المفاعل النووي. لم تكشف شركة OpenAI عن طول الوقت اللازم لتدريب GPT-3 ، مما يعقد تقديرات الباحثين، لكن Microsoft ، التي أبرمت شراكة متعددة السنوات بمليارات الدولارات مع شركة AI الناشئة والبناء ممتازأجهزة كمبيوتر للتدريب على الذكاء الاصطناعي، يقول أن أحدثها كمبيوتر عملاق يتطلب جهاز تبريد واسع النطاق ، يحتوي على 10000 بطاقة رسومات وأكثر من 285000 نواة معالج ، مما يعطي لمحة عن النطاق الواسع لـ عملية وراء الذكاء الاصطناعي. يمكن أن ينتج هذا العدد الهائل من الغالونات خلايا بطارية لـ 320 تسلا ، أو ، بعبارة أخرى ، يحتاج ChatGPT ، الذي جاء بعد GPT-3 ، إلى “شرب” زجاجة ماء سعة 500 مليلتر لإكمال التبادل الأساسي مع المستخدم تتكون من 25-50 سؤالًا تقريبًا.

يفترض أيضًا العدد الهائل من الغالونات اللازمة لتدريب نموذج الذكاء الاصطناعي أن التدريب يحدث في مركز بيانات أمريكي حديث من Microsoft ، تم تصميمه خصيصًا لـ OpenAI يصل إلى عشرات الملايين. إذا تم تدريب البيانات في مركز بيانات آسيا الأقل كفاءة في استخدام الطاقة التابع للشركة ، فإن التقرير يشير إلى أن استهلاك المياه يمكن أن يكون أعلى بثلاث مرات. يتوقع الباحثون أن هذه المتطلبات المائية ستزداد فقط مع الطرز الأحدث ، مثل تم إصداره مؤخرًا GPT-4، التي تعتمد على مجموعة من معلمات البيانات أكبر من سابقاتها.

قال الباحثون: “لم يعد بإمكان البصمة المائية لنماذج الذكاء الاصطناعي البقاء تحت الرادار”. “يجب معالجة البصمة المائية كأولوية كجزء من الجهود الجماعية لمكافحة تحديات المياه العالمية.”

كيف تستخدم روبوتات المحادثة الماء؟

عند حساب استهلاك المياه للذكاء الاصطناعي ، يميز الباحثون بين “سحب” المياه و “استهلاك”. المثال الأول هو ممارسة إزالة المياه فعليًا من نهر أو بحيرة أو مصدر آخر ، بينما يشير الاستهلاك تحديدًا إلى فقدان المياه عن طريق التبخر عند استخدامه في مراكز البيانات. يركز البحث حول استخدام المياه في الذكاء الاصطناعي بشكل أساسي على جزء الاستهلاك من تلك المعادلة ، حيث لا يمكن إعادة تدوير المياه.

يعرف أي شخص قضى بضع ثوانٍ في غرفة خادم الشركة أنك بحاجة إلى حزم سترة أولاً. يتم الاحتفاظ بغرف الخوادم باردة ، عادةً ما بين 50 و 80 درجة فهرنهايت لمنع تعطل المعدات. يعد الحفاظ على درجة الحرارة المثالية تحديًا مستمرًا لأن الخوادم نفسها تحول طاقتها الكهربائية إلى حرارة. غالبًا ما يتم نشر أبراج التبريد مثل تلك الموضحة أدناه لمحاولة مواجهة هذه الحرارة والحفاظ على الغرف في درجة حرارتها المثالية عن طريق تبخير الماء البارد.

أبراج التبريد التبخيري في عملية مركز البيانات

تنجز أبراج التبريد المهمة ، لكنها تتطلب كميات هائلة من المياه للقيام بذلك. يقدر الباحثون أن حوالي جالونًا من الماء يتم استهلاكه مقابل كل كيلو واط / ساعة يتم إنفاقه في مركز بيانات متوسط. لا يمكن استخدام أي نوع من المياه أيضًا. تقوم مراكز البيانات بسحب مصادر المياه العذبة النظيفة من أجل تجنب التآكل أو نمو البكتيريا التي يمكن أن تأتي مع مياه البحر. المياه العذبة ضرورية أيضًا للتحكم في الرطوبة في الغرف. وبالمثل ، يحاسب الباحثون مراكز البيانات عن المياه اللازمة لتوليد كميات كبيرة من الكهرباء التي تستهلكها ، وهو ما أطلق عليه العلماء “الاستهلاك غير المباشر للمياه خارج الموقع”.

صور مركز بيانات جوجل

لا تقتصر مشكلات استهلاك المياه على نماذج OpenAI أو AI. في عام 2019 ، طلبت Google أكثر من 2.3 مليار جالون ماء لمراكز البيانات في ثلاث ولايات فقط. الشركة لديها حاليا 14 مركزا للبيانات منتشرة في جميع أنحاء أمريكا الشمالية والتي تستخدمها لدعم بحث Google ومجموعة منتجاتها في مكان العمل ومؤخراً لامدا و بارد نماذج اللغات الكبيرة. ووفقًا للورقة البحثية الأخيرة ، قد يتطلب LaMDA وحده ملايين اللترات من الماء للتدريب ، أكبر من GPT-3 لأن العديد من مراكز البيانات المتعطشة لشركة Google موجودة في ولايات ساخنة مثل تكساس ؛ أصدر الباحثون تحذيرًا بهذا التقدير ، مع ذلك ، ووصفوه بأنه “نقطة مرجعية تقريبية”.

بصرف النظر عن الماء ، تتطلب LLMs الجديدة بالمثل كمية هائلة من الكهرباء. صدر تقرير ستانفورد للذكاء الاصطناعي الأسبوع الماضي الاختلافات في استهلاك الطاقة بين أربعة نماذج بارزة للذكاء الاصطناعيو تقدير تم إصدار GPT-3 من OpenAI 502 طن متري من الكربون أثناء التدريب. بشكل عام ، يمكن للطاقة اللازمة لتدريب GPT-3 أن تزود منزلًا أمريكيًا عاديًا لمئات السنين.

قال كيفين كينت ، الرئيس التنفيذي لحلول كفاءة المرافق الحرجة في مقابلة مع الوقت. “لا يمكنهم دائمًا اتخاذ أفضل الخيارات من الناحية البيئية.”

يمكن أن يؤدي تغير المناخ وتفاقم حالات الجفاف إلى تضخيم المخاوف بشأن استخدام الذكاء الاصطناعي للمياه

بالفعل ، المنتدى الاقتصادي العالمي التقديرات يفتقر حوالي 2.2 مليون مقيم في الولايات المتحدة إلى المياه والسباكة الداخلية الأساسية. يعيش 44 مليون آخرين في أنظمة مياه “غير ملائمة”. يخشى الباحثون أن مزيجًا من تغير المناخ وزيادة عدد سكان الولايات المتحدة سيجعل هذه الأرقام أسوأ بحلول نهاية القرن. بحلول عام 2071 ، ستانفورد التقديرات ما يقرب من نصف أحواض المياه العذبة البالغ عددها 204 في البلاد لن تكون قادرة على تلبية الطلب الشهري على المياه. وبحسب ما ورد يمكن أن تشهد العديد من المناطق انخفاض إمدادات المياه بمقدار الثلث في السنوات الخمسين المقبلة.

أدى ارتفاع درجات الحرارة الذي يغذيه النشاط البشري جزئيًا إلى تسجيل الغرب الأمريكي له أسوأ جفاف منذ 1000 عام التي تهدد أيضًا المياه العذبة ، على الرغم من أن الفيضانات الأخيرة ساعدت في درء بعض المخاوف الشديدة. دبليومستويات ater في الخزانات مثل لقد انحسرت بحيرة ميد حتى الآن كشف بقايا بشرية عمرها عقود. كل هذا يعني أن الطلب الهائل على المياه للذكاء الاصطناعي من المرجح أن يصبح نقطة خلاف متنامية ، خاصة إذا كانت التكنولوجيا مدمجة في المزيد من القطاعات والخدمات. بيانات تزداد متطلبات LLMs أكبر ، مما يعني أنه سيتعين على الشركات إيجاد طرق لزيادة كفاءة المياه في مراكز البيانات الخاصة بهم.

يقول الباحثون إن هناك بعض الطرق الواضحة نسبيًا لخفض سعر المياه للذكاء الاصطناعي. بالنسبة للمبتدئين ، أين ومتى يتم تدريب نماذج الذكاء الاصطناعي. يمكن أن تؤثر درجات الحرارة الخارجية ، على سبيل المثال ، على كمية الماء المطلوبة للتبريد مراكز البيانات. يمكن لشركات الذكاء الاصطناعي افتراضيًا تدريب النماذج في منتصف الليل عندما يكون الجو أكثر برودة أو في مركز بيانات مع كفاءة أفضل في استخدام المياه لخفض المياه ، فهم على حق. من ناحية أخرى ، يمكن لمستخدمي Chatbot اختيار التعامل مع الوحدات أثناء “water-ساعات فعالة ،“بقدر ما تشجع السلطات البلدية استخدام غسالة الصحون خارج ساعات العمل. ومع ذلك ، فإن أيًا من هؤلاء المطالب-ستتطلب التغييرات الجانبية مزيدًا من الشفافية من جانب شركات التكنولوجيا التي تبني هذه النماذج ، وهو أمر يقول الباحثون إنه يعاني من نقص مثير للقلق.

كتب الباحثون: “نوصي مطوري نماذج الذكاء الاصطناعي ومشغلي مراكز البيانات بأن يكونوا أكثر شفافية”. “متى وأين يتم تدريب نماذج الذكاء الاصطناعي؟ ماذا عن نماذج الذكاء الاصطناعي التي تم تدريبها و / أو نشرها في مراكز بيانات مواقع مشتركة خارجية أو سحابة عامة؟ ستكون هذه المعلومات ذات قيمة كبيرة لمجتمع البحث وعامة الناس “.

هل تريد معرفة المزيد عن الذكاء الاصطناعي وروبوتات المحادثة ومستقبل التعلم الآلي؟ تحقق من تغطيتنا الكاملة لـ الذكاء الاصطناعي، أو تصفح أدلةنا إلى أفضل مولدات فنية مجانية لمنظمة العفو الدولية و كل ما نعرفه عن ChatGPT الخاص بـ OpenAI.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى