آخر الأخبار

اتهامات جديدة.. هل استخدمت "OpenAI" كتب "O’Reilly" المدفوعة في تدريب نماذجها؟

شارك
شعار شركة OpenAI (المصدر: رويترز)

يواجه عملاق الذكاء الاصطناعي "OpenAI" مجددًا اتهامات باستغلال محتوى محمي بحقوق الطبع والنشر في تدريب نماذجه المتطورة.

فقد كشفت ورقة بحثية حديثة صادرة عن منظمة مراقبة الذكاء الاصطناعي أن "OpenAI" ربما اعتمدت على كتب مدفوعة من "O’Reilly Media" دون الحصول على ترخيص رسمي.

نماذج الذكاء الاصطناعي هي أنظمة تنبؤ متقدمة، تُدرّب على كميات هائلة من البيانات، مثل الكتب والأفلام والمحتوى الإلكتروني، لتتمكن من توليد نصوص ورسومات بناءً على أنماط محددة.

لكن استخدام بيانات غير مصرح بها يثير تساؤلات قانونية وأخلاقية حول ممارسات الشركات المطورة لهذه النماذج، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".

دراسة جديدة تكشف المستور

وفقًا للدراسة التي أجراها مشروع إفصاحات الذكاء الاصطناعي، وهي منظمة غير ربحية شارك في تأسيسها الناشر الشهير تيم أوريلي والخبير الاقتصادي إيلان شتراوس، فإن نموذج GPT-4o الخاص بشركة OpenAI أظهر قدرة غير عادية على التعرف على محتوى كتب O’Reilly المدفوعة مقارنةً بالإصدارات السابقة من نماذج الشركة.

وأشارت الورقة البحثية إلى أن شركة O’Reilly لم توقّع أي اتفاقية ترخيص مع OpenAI، مما يزيد من احتمالية استخدام هذه البيانات بشكل غير قانوني.

تقنية متطورة لكشف التجاوزات

استخدم الباحثون تقنية متخصصة تُعرف باسم "هجوم استدلال العضوية" (DE-COP) لكشف ما إذا كان GPT-4o قد دُرّب على نصوص محمية بحقوق الطبع والنشر.

وتبيّن أن هذا النموذج تعرّف على محتوى الكتب المدفوعة بمعدلات أعلى بكثير من نموذج GPT-3.5 Turbo، مما يشير إلى احتمال دمج هذه الكتب في بيانات التدريب.

ردود فعل وتحركات قانونية محتملة

في حين أن الدراسة لا تقدم دليلًا قاطعًا على انتهاك " OpenAI " لحقوق الملكية الفكرية، إلا أنها تثير شكوكًا قوية حول ممارساتها.

وتواجه الشركة بالفعل عدة دعاوى قضائية تتعلق باستخدام بيانات محمية بحقوق النشر في تطوير نماذجها، ما قد يؤدي إلى مزيد من التدقيق القانوني خلال الفترة المقبلة.

استراتيجية "OpenAI" في الحصول على البيانات

على الرغم من هذه الاتهامات، لا تُخفي "OpenAI" سعيها للحصول على بيانات تدريب عالية الجودة، إذ أبرمت بالفعل اتفاقيات مع ناشري أخبار وشبكات تواصل اجتماعي ومؤسسات إعلامية.

كما توفر الشركة آليات للإبلاغ عن المحتوى المحمي، لكنها لا تزال غير كافية لمنع المخاوف المتزايدة بشأن ممارساتها.

العربيّة المصدر: العربيّة
شارك

حمل تطبيق آخر خبر

آخر الأخبار