اخبار

الجانب المظلم من Web3: كيف تغذي اللامركزية تحيز الذكاء الاصطناعي


لقد غيّر الذكاء الاصطناعي (AI) بسرعة طريقة عيشنا وعملنا. ومع ذلك ، فإن التحدي المتمثل في تحيز بيانات الذكاء الاصطناعي قد احتل مكان الصدارة. بينما نتجه نحو مستقبل Web3 ، من الطبيعي أن نرى منتجات وحلول وخدمات مبتكرة جديدة تستخدم كلاً من Web3 و AI معًا. وبينما يؤكد بعض المعلقين أن التقنيات اللامركزية يمكن أن تكون الإجابة على تحيز البيانات ، فإن هذا أبعد ما يكون عن الحقيقة.

لا يزال حجم سوق Web3 صغيرًا نسبيًا ويصعب تحديده ، نظرًا لأن النظام البيئي Web3 لا يزال في مراحله الأولى من التطوير ولا يزال التعريف الدقيق لـ Web3 قيد التطوير. بينما قدر حجم السوق في عام 2021 بحوالي 2 مليار دولار ، أبلغ العديد من المحللين وشركات الأبحاث عن معدل نمو سنوي مركب متوقع (CAGR) يقارب 45٪ ، والذي يقترن بالنمو السريع في حلول Web3 واعتماد المستهلك يضع سوق Web3 في مسار يصل إلى حوالي 80 مليار دولار بحلول عام 2030.

في حين أنها تنمو بسرعة ، فإن الحالة الحالية للصناعة جنبًا إلى جنب مع عوامل صناعة التكنولوجيا الأخرى هي السبب في أن التحيز في بيانات الذكاء الاصطناعي يسير على المسار الخطأ.

تعتمد أنظمة الذكاء الاصطناعي على كميات كبيرة من البيانات عالية الجودة لتدريب خوارزمياتها. تم تدريب GPT-3 الخاص بـ OpenAI ، والذي يتضمن نموذج ChatGPT ، على كمية هائلة من البيانات عالية الجودة. لم تكشف شركة OpenAI عن المقدار الدقيق للبيانات المستخدمة في التدريب ، ولكن يُقدر أنها في حدود مئات المليارات من الكلمات أو أكثر.

تمت تصفية هذه البيانات ومعالجتها مسبقًا للتأكد من أنها ذات جودة عالية وذات صلة بمهمة توليد اللغة. استخدمت OpenAI تقنيات التعلم الآلي المتقدمة (ML) مثل المحولات لتدريب النموذج على مجموعة البيانات الكبيرة هذه ، مما يسمح لها بتعلم الأنماط والعلاقات بين الكلمات والعبارات وإنشاء نصوص عالية الجودة.

تؤثر جودة بيانات التدريب على الذكاء الاصطناعي بشكل كبير على أداء نموذج ML ، ويمكن أن يكون حجم مجموعة البيانات أيضًا عاملاً حاسمًا في تحديد قدرة النموذج على التعميم على البيانات والمهام الجديدة. ولكن ، من الصحيح أيضًا أن كلاً من الجودة والحجم لهما تأثير كبير على تحيز البيانات.

خطر التحيز الفريد

يعد التحيز في الذكاء الاصطناعي قضية مهمة لأنه يمكن أن يؤدي إلى نتائج غير عادلة وتمييزية وضارة في مجالات مثل التوظيف والائتمان والإسكان والعدالة الجنائية ، من بين أمور أخرى.

في عام 2018 ، أُجبرت أمازون على إلغاء أداة توظيف للذكاء الاصطناعي أظهرت تحيزًا ضد النساء. تم تدريب الأداة على السير الذاتية التي تم إرسالها إلى أمازون على مدى 10 سنوات ، والتي تضمنت المرشحين الذكور في الغالب ، مما دفع الذكاء الاصطناعي إلى تقليل السير الذاتية التي تحتوي على كلمات مثل “أنثى” و “امرأة”.

وفي عام 2019 ، وجد الباحثون أن خوارزمية الذكاء الاصطناعي المتاحة تجاريًا والمستخدمة للتنبؤ بنتائج المرضى كانت متحيزة ضد المرضى السود. تم تدريب الخوارزمية على بيانات المريض التي يغلب عليها البيض ، مما أدى إلى الحصول على معدل إيجابي كاذب أعلى للمرضى السود.

تشكل الطبيعة اللامركزية لحلول Web3 جنبًا إلى جنب مع الذكاء الاصطناعي خطرًا فريدًا يتمثل في إحداث التحيز. يمكن أن تشكل جودة البيانات وتوافرها في هذه البيئة تحديًا ، مما يجعل من الصعب تدريب خوارزميات الذكاء الاصطناعي بدقة ، ليس فقط بسبب عدم وجود حلول Web3 قيد الاستخدام ، ولكن بسبب السكان الذين يمكنهم استخدامها.

يمكننا استخلاص مقارنة من البيانات الجينومية التي جمعتها شركات مثل 23andMe ، والتي هي متحيزة ضد المجتمعات الفقيرة والمهمشة. التكلفة والتوافر والتسويق المستهدف لخدمات اختبار الحمض النووي مثل 23andMe يحد من الوصول إلى هذه الخدمات للأفراد من المجتمعات منخفضة الدخل أو أولئك الذين يعيشون في منطقة لا تعمل فيها الخدمة ، والتي تميل إلى أن تكون أفقر وأقل نموًا.

نتيجة لذلك ، قد لا تعكس البيانات التي جمعتها هذه الشركات بدقة التنوع الجيني للسكان على نطاق أوسع ، مما يؤدي إلى تحيزات محتملة في البحث الجيني وتطوير الرعاية الصحية والطب.

وهذا يقودنا إلى سبب آخر وهو أن Web3 يزيد من تحيز بيانات الذكاء الاصطناعي.

تحيز الصناعة والتركيز على الأخلاق

يعد الافتقار إلى التنوع في صناعة بدء تشغيل Web3 مصدر قلق كبير. اعتبارًا من عام 2022 ، تشغل النساء 26.7٪ من وظائف التكنولوجيا. ومن بين هؤلاء ، 56٪ من النساء ذوات البشرة الملونة. المناصب التنفيذية في التكنولوجيا لديها تمثيل أقل للمرأة.

في Web3 ، يتفاقم هذا الخلل. وفقًا للعديد من المحللين ، فإن أقل من 5٪ من الشركات الناشئة Web3 لديها مؤسسة أنثى. يعني هذا النقص في التنوع أن هناك احتمالًا قويًا بأن يتم تجاهل التحيز في بيانات الذكاء الاصطناعي دون وعي كمسألة من قبل المؤسسين الذكور والقوقازيين.

للتغلب على هذه التحديات ، يجب على صناعة Web3 إعطاء الأولوية للتنوع والشمول في كل من مصادر البيانات وفرقها. علاوة على ذلك ، تحتاج الصناعة إلى تغيير قصة أهمية التنوع والمساواة والشمول.

من منظور مالي وقابلية للتوسع ، من المرجح أن تعمل المنتجات والخدمات المصممة من خلال وجهات نظر مختلفة لمليارات العملاء بدلاً من الملايين ، مما يجعل تلك الشركات الناشئة التي تضم فرقًا متنوعة أكثر عرضة لتحقيق عائدات عالية وقدرات على نطاق عالمي. يجب أن تركز صناعة Web3 أيضًا على جودة البيانات ودقتها ، مما يضمن أن البيانات المستخدمة لتدريب خوارزميات الذكاء الاصطناعي خالية من التحيز.

هل يمكن أن يحمل Web3 الإجابة على تحيز بيانات الذكاء الاصطناعي؟

أحد الحلول لهذه التحديات هو تطوير أسواق البيانات اللامركزية التي تسمح بتبادل آمن وشفاف للبيانات بين الأفراد والمؤسسات. يمكن أن يساعد ذلك في التخفيف من مخاطر البيانات المتحيزة ، حيث يسمح باستخدام نطاق أوسع من البيانات في تدريب خوارزميات الذكاء الاصطناعي. بالإضافة إلى ذلك ، يمكن استخدام تقنية blockchain لضمان شفافية البيانات ودقتها بحيث لا تكون الخوارزميات متحيزة.

لكن في النهاية ، سنواجه تحديًا كبيرًا يتمثل في إيجاد مصادر بيانات واسعة لسنوات عديدة حتى يتم استخدام حلول Web3 من قبل الجمهور العادي.

بينما تستمر Web3 و blockchain في الظهور في الأخبار السائدة ، من المرجح أن تجذب هذه المنتجات والخدمات الأشخاص في مجتمعات بدء التشغيل والتكنولوجيا – التي نعلم أنها تفتقر إلى التنوع ولكنها أيضًا جزء صغير نسبيًا من الفطيرة العالمية.

من الصعب تقدير النسبة المئوية لسكان العالم الذين يعملون في الشركات الناشئة. في السنوات الأخيرة ، أوجدت الصناعة ما يقرب من ثلاثة ملايين وظيفة في الولايات المتحدة مقابل إجمالي عدد سكان الولايات المتحدة – مع مراعاة الوظائف المفقودة – فإن صناعة التكنولوجيا لا تمثل عن بُعد المواطنين في سن العمل.

حتى تصبح حلول Web3 أكثر انتشارًا وتوسع نطاق جاذبيتها واستخدامها بما يتجاوز تلك التي لها مصلحة متأصلة في التكنولوجيا وتصبح ميسورة التكلفة ويمكن الوصول إليها بما يكفي لسكان أوسع ، سيظل الوصول إلى البيانات عالية الجودة بأحجام كافية لتدريب أنظمة الذكاء الاصطناعي عقبة كبيرة . يجب على الصناعة اتخاذ خطوات لمعالجة هذه المشكلة الآن.

ألكسندرا كاربوفا هي رئيسة قسم التسويق في Lumerin.

صانعي القرار

مرحبًا بك في مجتمع VentureBeat!

DataDecisionMakers هو المكان الذي يمكن للخبراء ، بما في ذلك الأشخاص الفنيون الذين يقومون بعمل البيانات ، مشاركة الأفكار والابتكارات المتعلقة بالبيانات.

إذا كنت تريد أن تقرأ عن الأفكار المتطورة والمعلومات المحدثة ، وأفضل الممارسات ، ومستقبل البيانات وتكنولوجيا البيانات ، انضم إلينا في DataDecisionMakers.

يمكنك حتى التفكير في المساهمة بمقال خاص بك!

قراءة المزيد من DataDecisionMakers


اكتشاف المزيد من نص كم

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

اكتشاف المزيد من نص كم

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading