تبدو شركة أبل متأخرة في سباق الذكاء الاصطناعي مقارنةً بمنافسيها مثل "OpenAI" و"غوغل" و"ميتا"، إلا أن أبحاثها في هذا المجال تسير بخطى ثابتة خلف الكواليس.
يعمل باحثو "أبل" على تطوير أدوات ذكاء اصطناعي يمكن أن تحسّن جودة محررات الصور المعتمدة على الأوامر النصية.
قدّم فريق "أبل" مجموعة بيانات جديدة أطلق عليها اسم "Pico-Banana-400K"، تضم 400 ألف صورة تم تعديلها بناءً على أوامر نصية بهدف تحسين أداء نماذج الذكاء الاصطناعي الخاصة بتحرير الصور، بحسب تقرير نشره موقع "lifehacker" واطلعت عليه "العربية Business".
وتقول الشركة إن مجموعتها تتفوّق على قواعد البيانات السابقة من حيث جودة الصور وتنوعها، مشيرة إلى أن بعض المجموعات السابقة كانت تعتمد على صور مولّدة بالذكاء الاصطناعي أو تفتقر للتنوع الكافي، ما يحد من دقة النماذج التدريبية.
صُممت مجموعة بيانات "أبل" الجديدة للعمل مع نموذج تحرير الصور من "غوغل" نانو بانانا، حيث تتيح تنفيذ 35 نوعًا مختلفًا من التعديلات، وتستخدم نموذج Gemini 2.5 Pro لتقييم جودة النتائج وتحديد التعديلات التي تستحق البقاء ضمن قاعدة البيانات.
وتتضمّن المجموعة:
- 258 ألف عيّنة لتعديلات فردية (صورة أصلية وصورتها المعدّلة).
- 56 ألف زوج من التفضيلات لتمييز النتائج الناجحة من الفاشلة.
- 72 ألف تسلسل من التعديلات المتتابعة بين خطوتين إلى خمس خطوات.
أوضحت "أبل" أن التحرير العام وتغيير الأسلوب الفني هما الأسهل تحقيقًا بنسبة نجاح بلغت 93%، بينما كانت تعديلات النصوص هي الأصعب بنسبة نجاح 58% فقط.
ومن بين النتائج الأخرى:
- إضافة نص جديد: 67%.
- التكبير أو الزوم: 74%.
- إضافة مؤثرات كلاسيكية أو حبيبات الفيلم: 91%.
أعلنت "أبل" أن قاعدة بيانات Pico-Banana-400K ستكون متاحة مجانًا للباحثين والمطورين في مجال الذكاء الاصطناعي.
ويبدو أن هذه المبادرة تمثّل تغييرًا في فلسفة "أبل" نحو مزيد من الانفتاح العلمي والمساهمة في تطوير أدوات الذكاء الاصطناعي عالميًا، حتى وإن كان الطريق ما زال طويلًا قبل أن نرى مساعد "سيري" بقدرات ذكاء حقيقية.
المصدر:
العربيّة