كشف باحثون صينيون عن تقنية جديدة قد تُحدث تحولًا جذريًا في عالم إنتاج الفيديو بالذكاء الاصطناعي، عبر تسريع عملية التوليد إلى مستويات غير مسبوقة، تقترب من الزمن الحقيقي.
وبحسب ورقة بحثية نُشرت مؤخرًا، تستطيع التقنية الجديدة التي تحمل اسم TurboDiffusion تسريع توليد فيديوهات الذكاء الاصطناعي بما يصل إلى 200 ضعف دون التأثير على جودة الصورة، ما يمهد لاستخدامات تجارية وتفاعلية واسعة النطاق.
ووفقًا للباحثين من جامعة تسينغهوا في بكين، وشركة Shengshu المطورة لنماذج الذكاء الاصطناعي، وبالتعاون مع جامعة كاليفورنيا - بيركلي، فقد نجحت التقنية في تقليص زمن إنشاء مقطع فيديو مدته خمس ثوانٍ وبدقة عادية من أكثر من ثلاث دقائق إلى 1.9 ثانية فقط، عند اختبارها على جهاز استهلاكي مزود ببطاقة Nvidia RTX 5090.
أما في حالة الفيديو عالي الدقة، فانخفض زمن التوليد على الجهاز نفسه من قرابة 80 دقيقة إلى 24 ثانية فقط، أي تسريع يقارب 200 مرة، بحسب أحد الاختبارات الواردة في الدراسة، بحسب تقرير نشره موقع "scmp" واطلعت عليه "العربية Business".
ويأتي هذا التطور في وقت لا تزال فيه منصات كبرى تعاني من بطء نسبي؛ إذ يستغرق إنشاء فيديو مدته خمس ثوانٍ على منصة Vidu التابعة لشركة Shengshu ما بين ثلاث إلى خمس دقائق، فيما أشارت "OpenAI" سابقًا إلى أن نموذجها الشهير سورا يحتاج عدة دقائق لإنتاج مقاطع قصيرة.
ويرى مراقبون أن TurboDiffusion يعكس التقدم السريع الذي حققه الباحثون الصينيون في مجال توليد الفيديو بالذكاء الاصطناعي، منذ أن كشفت "OpenAI" عن سورا في فبراير 2024، في سباق تقني يتسارع بشكل لافت.
ويقول محلل الصناعة كيون شو إن تسريع إنتاج الفيديو يمثل نقطة تحول مهمة، لأن نماذج توليد الفيديو لن تعود عائقًا في سلاسل الإنتاج الإبداعي والتجاري.
وعزا الباحثون هذا الإنجاز إلى ابتكارات في تدريب النماذج، أبرزها استخدام ما يُعرف بـالانتباه الخطي المتناثر، وهي تقنية تتيح للنموذج التركيز على الأجزاء الأكثر أهمية من البيانات بدل معالجتها بالكامل، ما يقلل زمن المعالجة وكلفة الحوسبة بشكل كبير.
وفي تعليق لها، قالت مؤسسة AI Native Foundation، وهي جهة معنية بتعزيز دمج الذكاء الاصطناعي بشكل عادل وشامل، إن TurboDiffusion تنقل الذكاء الاصطناعي من مرحلة القدرة على التوليد إلى مرحلة التوليد الفوري، ما يفتح الباب أمام تطبيقات آنية في مختلف القطاعات.
وأضافت المؤسسة أن التقنية ستُمكن الشركات من إنتاج الفيديو على نطاق تجاري بتكلفة أقل وسرعة أكبر، كما تمثل معيارًا مفتوح المصدر ومتقدمًا للباحثين والمطورين الراغبين في بناء تطبيقات تفاعلية وفورية.
يُذكر أن تقنية TurboDiffusion متاحة بالكامل كمشروع مفتوح المصدر عبر منصة GitHub، ما يعزز فرص انتشارها واعتمادها سريعًا داخل مجتمع الذكاء الاصطناعي العالمي.
المصدر:
العربيّة