تحدث شركة غوغل روبوتها للدردشة "Gemini" بنموذج ذكاء اصطناعي للصور جديد يمنح المستخدمين تحكمًا أدق في تعديل الصور، في خطوة تهدف إلى مواكبة أدوات إنشاء الصور الشهيرة من شركة "OpenAI" واستقطاب المستخدمين من "شات جي بي تي" المنافس.
وسيبدأ طرح التحديث، المُسمّى "Gemini 2.5 Flash Image"، اعتبارًا من يوم الثلاثاء لجميع مستخدمي تطبيق "Gemini"، بالإضافة إلى المطورين عبر واجهة برمجة تطبيقات جيميني، ومنصتي "Google AI Studio"، و"Vertex AI".
وصُمّم نموذج الصور الجديد في "Gemini" لإجراء تعديلات أكثر دقة على الصور، بناءً على طلبات المستخدمين باللغة الطبيعية، مع الحفاظ على تناسق الوجوه والحيوانات وغيرها من التفاصيل، وهو أمرٌ تُعاني منه معظم الأدوات المنافسة، بحسب تقرير لموقع "TechCrunch" المتخصص في أخبار التكنولوجيا، اطلعت عليه "العربية Business".
وعلى سبيل المثال، عند توجيه طلب إلى "شات جي بي تي" أو "غروك" -التابع لشركة "xAI"- لتغيير لون قميص شخص ما في صورة، قد تتضمن النتيجة وجهًا مشوهًا أو تعديلات غير مرغوب فيها في الخلفية.
لكن أداة "غوغل" الجديدة جذبت الانتباه بالفعل حتى قبل الكشف عنها رسميًا. ففي الأسابيع الأخيرة، أشاد مستخدمو مواقع التواصل الاجتماعي بمحرر صور مثير للإعجاب مدعوم بالذكاء الاصطناعي على منصة التقييم الجماعي لنماذج الذكاء الاصطناعي "LMArena".
وظهر النموذج للمستخدمين على المنصة بشكل مجهول تحت الاسم المستعار "Nano Banana".
وأكدت "غوغل"، يوم الثلاثاء، أن نموذج "Nano Banana" الذي أصبح رائجًا في الأيام القليلة الماضية هو نموذج "Gemini 2.5 Flash Image"، بحسب موقع أكسيوس.
وفي الوقت الحالي، يمكن لمستخدمي خدمة "Gemini" المجانية إجراء ما يصل إلى 100 تعديل للصور يوميًا، بينما يمكن للمستخدمين من أصحاب الاشتراكات المدفوعة إجراء عشرة أضعاف هذا العدد باستخدام نموذج الذكاء الاصطناعي الجديد.
وتحت الاسم المستعار "Nano Banana"، حقق النموذج أداءً تجاوز النماذج الأخرى على منصة "LMArena" في تصنيف تعديل الصور، وأحدث ضجة على مواقع التواصل الاجتماعي.