شهدت تقنيات توليد الصور بالذكاء الاصطناعي تطوراً ملحوظاً مع إطلاق نموذج Images 2.0 الجديد من " OpenAI"، والذي بات قادراً على إنتاج نصوص داخل الصور بدقة غير مسبوقة، في خطوة قد تُصعّب التمييز بين المحتوى المصنوع بشرياً ونظيره المُولد آلياً.

فحتى وقت قريب، كانت النماذج السابقة تعاني من أخطاء واضحة في كتابة الكلمات، حيث كانت تولد نصوصاً مشوهة أو غير مفهومة، خصوصاً في المهام البسيطة مثل تصميم قوائم الطعام.

أما الآن، فقد أصبح بإمكان النموذج الجديد إنشاء محتوى بصري متكامل — كقائمة طعام لمطعم — يبدو احترافياً وقابلاً للاستخدام الفعلي دون ملاحظة أخطاء تُذكر، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".

ويرجع هذا التحسن إلى تطور آليات توليد الصور، إذ كانت النماذج التقليدية تعتمد على ما يُعرف ب "نماذج الانتشار"، التي تعيد بناء الصورة انطلاقاً من الضوضاء، ما يجعل النصوص داخلها جزءاً هامشياً يصعب إتقانه.

في المقابل، بدأت الأبحاث تتجه نحو نماذج أكثر تقدماً مثل Autoregressive models، التي تعمل بطريقة أقرب إلى نماذج اللغة، ما يحسن دقة التفاصيل الدقيقة مثل النصوص.

ورغم أن "OpenAI" لم تكشف بشكل صريح عن البنية التقنية للنموذج الجديد، إلا أنها أكدت أن Images 2.0 يتمتع بقدرات تفكير متقدمة، تتيح له تنفيذ مهام معقدة مثل البحث، وإنشاء عدة صور من طلب واحد، ومراجعة النتائج قبل تقديمها.

كما أوضحت الشركة أن النموذج الجديد يقدم دعماً محسناً للنصوص غير اللاتينية، بما يشمل لغات مثل اليابانية والكورية والهندية والبنغالية، ما يعزز استخدامه في أسواق عالمية متعددة.

وبفضل هذه القدرات، أصبح بإمكان المستخدمين إنشاء مواد تسويقية عالية الجودة، أو رسوم كوميكس متعددة المشاهد، مع الحفاظ على دقة التفاصيل، مثل الأيقونات وعناصر واجهات المستخدم، وحتى النصوص الصغيرة — وهي من أبرز التحديات التي واجهت النماذج السابقة.

ورغم أن توليد هذا النوع من المحتوى قد يستغرق وقتاً أطول مقارنة بالردود النصية التقليدية، إلا أنه لا يزال يتم خلال دقائق معدودة، حتى في الحالات المعقدة.

ومن المقرر أن يتاح النموذج الجديد لجميع مستخدمي تشات جي بي تي و«Codex»، مع ميزات إضافية للمشتركين المدفوعين، إلى جانب إطلاق واجهة برمجية تحمل اسم «gpt-image-2»، والتي ستُسعّر وفق جودة ودقة الصور المنتجة.

هذا التطور يعكس تسارع المنافسة في مجال الذكاء الاصطناعي، ويضع معياراً جديداً لقدرات توليد الصور، خاصة في ما يتعلق بدمج النصوص بدقة داخل المحتوى البصري.

المصدر: العربيّة

الصفحة الرئيسية

نموذج جديد من "OpenAI" ينجح في كتابة النصوص داخل الصور

إقرأ أيضا

تسعير سلسلة HONOR 600 Pro يربك السوق

عندما تصبح الصور أكثر ذكاء.. هل يغير شات جي بي تي إيميجز 2 قواعد اللعبة؟

آخر الأخبار

مداهمات واسعة في ألمانيا ضد شبكة تهريب متسترة بتصاريح لاجئين سوريين

الحرس الثوري الإيراني يُعلن احتجاز سفينتين في مضيق هرمز