ثورات البيانات تندلع ضد الذكاء الاصطناعي

ثورات البيانات تندلع ضد الذكاء الاصطناعي


لأكثر من 20 عامًا ، كتبت Kit Loffstadt قصصًا خيالية للمشجعين تستكشف عوالمًا بديلة لأبطال “Star Wars” وأشرار “Buffy the Vampire Slayer” ، حيث تشارك قصصها مجانًا على الإنترنت.

ولكن في مايو ، توقفت السيدة لوفشتات عن نشر إبداعاتها بعد أن علمت أن شركة بيانات قد نسخت قصصها وأدخلتها في تقنية الذكاء الاصطناعي الكامنة وراء ChatGPT ، روبوت الدردشة الفيروسي. مذعورة ، أخفت كتاباتها خلف حساب مغلق.

ساعدت السيدة لوفشتات أيضًا في تنظيم عمل تمرد الشهر الماضي ضد أنظمة الذكاء الاصطناعي. جنبا إلى جنب مع العشرات من كتاب الخيال المعجبين الآخرين ، نشرت فيض من القصص غير الموقرة على الإنترنت لتطغى على خدمات جمع البيانات التي تغذي عمل الكتاب في تكنولوجيا الذكاء الاصطناعي وتشويشها.

قالت السيدة لوفشتات ، ممثلة الصوت البالغة من العمر 42 عامًا من ساوث يوركشاير في بريطانيا: “يتعين على كل منا أن يفعل كل ما في وسعه لنظهر لهم أن ناتج إبداعنا لا يقتصر على حصاد الآلات كما يحلو لهم”.

إن كتّاب قصص المعجبين هم مجرد مجموعة واحدة تقوم الآن بثورات ضد أنظمة الذكاء الاصطناعي حيث استحوذت الحمى على التكنولوجيا في وادي السيليكون والعالم. في الأشهر الأخيرة ، اتخذت شركات وسائل التواصل الاجتماعي مثل Reddit و Twitter ، والمؤسسات الإخبارية بما في ذلك The New York Times و NBC News ، ومؤلفون مثل Paul Tremblay والممثلة Sarah Silverman ، موقفًا ضد قيام منظمة العفو الدولية بامتصاص بياناتهم دون إذن.

اتخذت احتجاجاتهم أشكالاً مختلفة. يقوم الكتاب والفنانون بتأمين ملفاتهم لحماية أعمالهم أو مقاطعة بعض مواقع الويب التي تنشر محتوى تم إنشاؤه بواسطة الذكاء الاصطناعي ، بينما تريد شركات مثل Reddit فرض رسوم على الوصول إلى بياناتها. تم رفع ما لا يقل عن 10 دعاوى قضائية هذا العام ضد شركات الذكاء الاصطناعي ، متهمة إياها بتدريب أنظمتها على العمل الإبداعي للفنانين دون موافقة. في الأسبوع الماضي ، رفعت السيدة سيلفرمان والمؤلفان كريستوفر جولدن وريتشارد كادري دعوى قضائية ضد شركة OpenAI ، الشركة المصنعة ChatGPT ، وآخرين بشأن استخدام الذكاء الاصطناعي لعملهم.

في قلب التمردات يوجد فهم جديد مفاده أن المعلومات عبر الإنترنت – القصص والأعمال الفنية والمقالات الإخبارية ومنشورات لوحة الرسائل والصور – قد يكون لها قيمة كبيرة غير مستغلة.

تم بناء الموجة الجديدة من الذكاء الاصطناعي – المعروفة باسم “الذكاء الاصطناعي التوليدي” للنصوص والصور والمحتويات الأخرى التي تنتجها – فوق أنظمة معقدة مثل النماذج اللغوية الكبيرة القادرة على إنتاج نثر شبيه بالبشر. يتم تدريب هذه النماذج على كنوز من جميع أنواع البيانات حتى يتمكنوا من الإجابة على أسئلة الناس وتقليد أساليب الكتابة أو إنتاج الكوميديا ​​والشعر.

أدى ذلك إلى قيام شركات التكنولوجيا بمطاردة المزيد من البيانات لتغذية أنظمة الذكاء الاصطناعي الخاصة بها. استخدمت Google و Meta و OpenAI بشكل أساسي المعلومات من جميع أنحاء الإنترنت ، بما في ذلك قواعد البيانات الكبيرة لقصص المعجبين ومجموعة من المقالات الإخبارية ومجموعات الكتب ، والتي كان الكثير منها متاحًا مجانًا على الإنترنت. في لغة صناعة التكنولوجيا ، كان هذا يُعرف باسم “تجريف” الإنترنت.

GPT-3 من OpenAI ، وهو نظام ذكاء اصطناعي تم إصداره في عام 2020 ، يمتد على 500 مليار “رمز مميز” ، كل منها يمثل أجزاء من الكلمات الموجودة في الغالب على الإنترنت. تمتد بعض نماذج الذكاء الاصطناعي على أكثر من تريليون توكن.

إن ممارسة تجريد الإنترنت قديمة وقد تم الكشف عنها إلى حد كبير من قبل الشركات والمنظمات غير الربحية التي قامت بذلك. لكن الشركات التي تمتلك البيانات لم تكن مفهومة جيدًا أو لم يُنظر إليها على أنها إشكالية بشكل خاص. تغير ذلك بعد ظهور ChatGPT لأول مرة في نوفمبر وتعلم الجمهور المزيد عن نماذج الذكاء الاصطناعي الأساسية التي تدعم روبوتات المحادثة.

قال براندون دودرستادت ، المؤسس والرئيس التنفيذي لشركة Nomic ، وهي شركة للذكاء الاصطناعي: “ما يحدث هنا هو إعادة تنظيم أساسية لقيمة البيانات”. “في السابق ، كانت الفكرة هي أنك تحصل على قيمة من البيانات من خلال جعلها مفتوحة للجميع وعرض الإعلانات. الآن ، الفكرة هي أنك تغلق بياناتك ، لأنه يمكنك استخراج المزيد من القيمة عند استخدامها كمدخل إلى الذكاء الاصطناعي الخاص بك “

قد يكون للاحتجاجات على البيانات تأثير ضئيل على المدى الطويل. عمالقة التكنولوجيا ذوي الجيوب العميقة مثل Google و Microsoft يجلسون بالفعل على جبال من المعلومات الخاصة ولديهم الموارد لترخيص المزيد. ولكن مع اقتراب عصر المحتوى السهل الكشف عنه ، قد لا تتمكن الشركات الناشئة الصغيرة في مجال الذكاء الاصطناعي والمنظمات غير الربحية التي كانت تأمل في التنافس مع الشركات الكبرى من الحصول على محتوى كافٍ لتدريب أنظمتها.

في بيان ، قال OpenAI إن ChatGPT تم تدريبه على “المحتوى المرخص والمحتوى المتاح للجمهور والمحتوى الذي أنشأه مدربون الذكاء الاصطناعي البشري”. وأضافت: “نحترم حقوق المبدعين والمؤلفين ونتطلع إلى مواصلة العمل معهم لحماية مصالحهم”.

وقالت جوجل في بيان إنها شاركت في محادثات حول كيفية إدارة الناشرين لمحتوياتهم في المستقبل. قالت الشركة: “نعتقد أن الجميع يستفيد من نظام محتوى حيوي”. لم تستجب مايكروسوفت لطلب التعليق.

اندلعت ثورات البيانات العام الماضي بعد أن أصبحت ChatGPT ظاهرة عالمية. في نوفمبر ، رفعت مجموعة من المبرمجين دعوى قضائية مقترحة ضد Microsoft و OpenAI ، بدعوى أن الشركات انتهكت حقوق النشر الخاصة بهم بعد استخدام التعليمات البرمجية الخاصة بهم لتدريب مساعد برمجة يعمل بالذكاء الاصطناعي.

في يناير / كانون الثاني ، رفعت شركة Getty Images ، التي توفر صورًا ومقاطع فيديو ، دعوى قضائية ضد Stability AI ، وهي شركة تعمل بالذكاء الاصطناعي تنتج صورًا من أوصاف نصية ، مدعية أن الشركة الناشئة قد استخدمت صورًا محمية بحقوق الطبع والنشر لتدريب أنظمتها.

ثم في يونيو ، رفعت شركة Clarkson ، وهي شركة محاماة في لوس أنجلوس ، دعوى قضائية جماعية مقترحة من 151 صفحة ضد OpenAI و Microsoft ، واصفة كيف قامت OpenAI بجمع البيانات من القاصرين وقالت إن تجريف الويب ينتهك قانون حقوق الطبع والنشر ويشكل “سرقة”. يوم الثلاثاء ، رفعت الشركة دعوى مماثلة ضد جوجل.

قال رايان كلاركسون ، “تمرد البيانات الذي نشهده في جميع أنحاء البلاد هو طريقة المجتمع للرد على هذه الفكرة القائلة بأن Big Tech يحق لها ببساطة أخذ أي وجميع المعلومات من أي مصدر على الإطلاق ، وجعلها خاصة بهم”. مؤسس كلاركسون.

قال إريك جولدمان ، الأستاذ في كلية الحقوق بجامعة سانتا كلارا ، إن حجج الدعوى كانت واسعة النطاق ومن غير المرجح أن تقبلها المحكمة. لكنه قال إن موجة التقاضي قد بدأت للتو ، مع ظهور “الموجة الثانية والثالثة” التي ستحدد مستقبل الذكاء الاصطناعي.

الشركات الكبرى تقاوم أيضًا كاشطات الذكاء الاصطناعي. في أبريل ، قالت Reddit إنها تريد فرض رسوم على الوصول إلى واجهة برمجة التطبيقات الخاصة بها ، أو API ، وهي الطريقة التي يمكن للأطراف الثالثة من خلالها تنزيل وتحليل قاعدة البيانات الواسعة للشبكة الاجتماعية للمحادثات الشخصية.

قال ستيف هوفمان ، الرئيس التنفيذي لشركة Reddit ، في ذلك الوقت إن شركته “لم تكن بحاجة إلى إعطاء كل هذه القيمة لبعض أكبر الشركات في العالم مجانًا”.

في نفس الشهر ، قال موقع Stack Overflow ، وهو موقع للأسئلة والأجوبة لمبرمجي الكمبيوتر ، إنه سيطلب أيضًا من شركات الذكاء الاصطناعي الدفع مقابل البيانات. يحتوي الموقع على ما يقرب من 60 مليون سؤال وإجابة. تم الإبلاغ عن تحركها في وقت سابق من قبل Wired.

تقاوم المؤسسات الإخبارية أيضًا أنظمة الذكاء الاصطناعي. في مذكرة داخلية حول استخدام الذكاء الاصطناعي التوليفي في يونيو ، قالت صحيفة The Times إنه يتعين على شركات الذكاء الاصطناعي “احترام ملكيتنا الفكرية”. وامتنع متحدث باسم التايمز عن الخوض في التفاصيل.

بالنسبة للفنانين والكتاب الفرديين ، فإن مقاومة أنظمة الذكاء الاصطناعي تعني إعادة التفكير في مكان النشر.

كان نيكولاس كول ، 35 عامًا ، رسامًا في فانكوفر ، كولومبيا البريطانية ، منزعجًا من الطريقة التي يمكن بها تكرار أسلوبه الفني المتميز بواسطة نظام الذكاء الاصطناعي ، واشتبه في أن التكنولوجيا قد ألغت عمله. يخطط لمواصلة نشر إبداعاته على Instagram و Twitter ومواقع التواصل الاجتماعي الأخرى لجذب العملاء ، لكنه توقف عن النشر على مواقع مثل ArtStation التي تنشر محتوى تم إنشاؤه بواسطة الذكاء الاصطناعي جنبًا إلى جنب مع المحتوى الذي ينشئه الإنسان.

قال السيد كول: “إنها مجرد سرقة متعمدة مني ومن فنانين آخرين”. “يضع حفرة من الرهبة الوجودية في بطني.”

في Archive of Our Own ، وهي قاعدة بيانات خيالية للمشجعين تضم أكثر من 11 مليون قصة ، ضغط الكتاب بشكل متزايد على الموقع لحظر تجريف البيانات والقصص التي تم إنشاؤها بواسطة الذكاء الاصطناعي.

في شهر مايو ، عندما شاركت بعض حسابات Twitter أمثلة على ChatGPT تحاكي أسلوب رواية المعجبين الشهيرة المنشورة على Archive of Our Own ، انتفض العشرات من الكتاب. لقد حظروا قصصهم وكتبوا محتوى تخريبيًا لتضليل كاشطات الذكاء الاصطناعي. كما دفعوا أيضًا Archive of Our Own القادة إلى التوقف عن السماح بالمحتوى الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي.

قالت بيتسي روزنبلات ، التي تقدم المشورة القانونية لأرشيفنا الخاص وهي أستاذة في كلية الحقوق بجامعة تولسا ، إن الموقع يتبع سياسة “الحد الأقصى من الشمولية” ولا يريد أن يكون في موقع تمييز القصص التي تمت كتابتها مع الذكاء الاصطناعي

بالنسبة للسيدة Loffstadt ، كاتبة قصص المعجبين ، جاءت المعركة ضد الذكاء الاصطناعي عندما كانت تكتب قصة عن “Horizon Zero Dawn” ، وهي لعبة فيديو حيث يحارب البشر الروبوتات التي تعمل بالذكاء الاصطناعي في عالم ما بعد المروع. قالت إن بعض الروبوتات كانت جيدة في اللعبة وبعضها الآخر كان سيئًا.

ولكن في العالم الحقيقي ، قالت ، “بفضل الغطرسة وجشع الشركات ، يتم تحريفهم للقيام بأشياء سيئة.”

Comments

No comments yet. Why don’t you start the discussion?

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *