آخر الأخبار

من الشاشة إلى الواقع.. تقنية تسمح لك بالدخول إلى الفيديو

شارك

في حال واجهت مشكلة في مشاهدة الفيديو، إضغط على رابط المصدر للمشاهدة على الموقع الرسمي

في عصر يتسارع فيه تطور الذكاء الاصطناعي وتقنيات معالجة الصور، تبرز شركة "فور دي في إيه آي" (4DV AI) الصينية بتقنية مبتكرة تحدث تحولا جذريًا في عالم المحتوى المرئي.

وتعد هذه التقنية المسماة "النثر الغاوسي الرباعي الأبعاد" (4D Gaussian Splatting) بإعادة تعريف مفهوم المشاهد الديناميكية عبر تحويل أي فيديو عادي ثنائي الأبعاد إلى مشهد رباعي الأبعاد غامر.

ويتيح هذا الأمر للمشاهد التجول في المشهد بزوايا متعددة كما لو كان جزءا منه، مما يفتح آفاقاً جديدة في مجالات الترفيه، والتعليم، وحتى الصحافة الرقمية.

وتعتمد هذه التقنية على محرك "بلاي كانفاس" (PlayCanvas) لتمثيل المشاهد الديناميكية بطريقة ثلاثية الأبعاد مع إضافة بعد الزمن لخلق تأثيرات حركية واقعية.

وفي هذا الموضوع، نغوص في أعماق هذه التقنية الواعدة، ونكتشف أهميتها، وآلية عملها، وكيفية توظيفها لإحياء المشاهد ببعد جديد.

عصر جديد للمحتوى المرئي الغامر

شهد المحتوى المرئي تحولات جذرية عبر العقود الماضية، بدءًا من الصور الثابتة، مرورًا بالفيديو الثنائي الأبعاد الذي أصبح جزءًا لا يتجزأ من حياتنا اليومية.

ومع ذلك، فإن هذه الأشكال التقليدية تفرض قيودًا على تفاعل المشاهد، حيث يظل المنظور ثابتًا وغير قابل للاستكشاف بحرية.

ويحد هذا القيد من قدرة الجمهور على الانغماس الكامل في المشهد، ويجعل التجربة أقرب إلى المشاهدة السلبية.

وفي ظل التطورات المتسارعة تتزايد الحاجة إلى تجارب أكثر انغماسًا وتفاعلية، تتجاوز مجرد المشاهدة السلبية وتسمح للمستخدمين بأن يصبحوا جزءًا من المحتوى نفسه.

وفي هذا السياق، تبرز تقنية "النثر الغاوسي الرباعي الأبعاد" كقفزة نوعية، واعدة بإعادة تعريف تجربة المحتوى المرئي من خلال تحويل المشاهد الديناميكية إلى عوالم غامرة قابلة للاستكشاف والتحكم.

ما هي تقنية "النثر الغاوسي الرباعي الأبعاد"؟

من أجل فهم تقنية "النثر الغاوسي الرباعي الأبعاد"، يجب أولًا استيعاب تقنية "النثر الغاوسي الثلاثي الأبعاد" (3D Gaussian Splatting).

إعلان

وتستخدم هذه التقنية لتمثيل المشاهد الثلاثية الأبعاد، حيث لا تبنى النماذج من الأشكال الهندسية التقليدية، مثل المثلثات، بل من ملايين "النقاط الغاوسية" (Gaussians blobs).

وتعد هذه النقاط في الأساس نقاط بيانات صغيرة، شبه شفافة، وذات شكل بيضاوي، تحمل معلومات عن الموضع واللون والشفافية.

وتجمع هذه النقاط وتعرض لإنشاء تمثيل واقعي للغاية للمشهد، مما يحسن بشكل كبير جودة التصور في النماذج ثلاثية الأبعاد وينتج سحابات نقطية أكثر اكتمالا وتفصيلا.

وتتخلص هذه التقنية من الشبكات المضلعة التقليدية، وتمتلك كل نقطة من هذه النقاط خصائص معينة لتحديد مكانها ولونها ومدى شفافيتها وحجمها وشكلها واتجاهها.

وعند دمج الملايين من هذه النقاط، تحصل على صورة أكثر تفصيلا لجسم ثلاثي الأبعاد توضح أيضًا كيف يبدو من أي زاوية معينة، وذلك بفضل كل هذه البيانات الإضافية.

وباستخدام هذه النقاط، يمكن تمثيل المشهد بشكل واقعي ودقيق. وتحاكي هذه التقنية طريقة عمل الكاميرا، حيث تدمج ألوان النقاط الموجودة في مسار الرؤية لإنشاء الصورة النهائية.

وقد أحدثت "النثر الغاوسي الثلاثي الأبعاد" ثورة في سرعة عرض المشاهد الثابتة، حيث مكنت من تحقيق عرض في الوقت الفعلي بجودة عالية، متجاوزة بذلك القيود التي كانت تواجهها تقنيات سابقة.

ويأتي الابتكار الحقيقي لتقنية "النثر الغاوسي الرباعي الأبعاد" في إضافة البعد الرابع، وهو الزمن.

وبينما تسمح "النثر الغاوسي الثلاثي الأبعاد" بالتنقل بحرية في مشهد ثلاثي الأبعاد ثابت، فإن "النثر الغاوسي الرباعي الأبعاد" تمكن من نمذجة وتجسيد المشاهد الديناميكية التي تتغير وتتطور بمرور الوقت.

ويعني هذا أن المشاهد الملتقطة لا تظل مجرد صور ثابتة في الفراغ، بل تصبح كيانات حية تتحرك وتتفاعل، ويمكن للمستخدم التنقل بحرية ليس فقط في المكان ولكن أيضًا عبر الزمن.

وتمثل القدرة على التحكم في منظور المشاهدة، وإعادة مشاهدة الأحداث من زوايا مختلفة في أي نقطة زمنية، جوهر ما يميز البعد الرابع في هذا السياق، مما يجعل الزمن بعدًا تفاعليًا جديدًا.

وتعد تقنية "النثر الغاوسي الرباعي الأبعاد" تطورًا لتقنية "النثر الغاوسي الثلاثي الأبعاد"، التي بدورها جاءت لتحسين أوجه القصور في تقنيات سابقة، مثل "حقول الإشعاع العصبوني" (NeRFs).

وقدمت "حقول الإشعاع العصبوني" جودة إعادة بناء عالية للمشاهد الثلاثية الأبعاد، إلا أنها كانت تعاني من بطء في العرض بسبب اعتمادها على العرض الحجمي المعقد.

وتركز "النثر الغاوسي الرباعي الأبعاد" على نمذجة الحركة المعقدة والعرض في الوقت الفعلي، مما يجعلها ملائمة للمشاهد الديناميكية مقارنة بتقنية "حقول الإشعاع العصبوني" التي تركز على إعادة البناء الثلاثي الأبعاد للمشاهد الثابتة.

من البكسلات إلى الواقع الديناميكي

تنقل تقنية "النثر الغاوسي الرباعي الأبعاد" الفكرة إلى مستوى جديد من خلال إضافة البعد الرابع، وهو الزمن.

وتحلل هذه التقنية الفيديو الثنائي الأبعاد المدخل، حيث تفك الخوارزمية تشفير الفيديو إطارًا تلو الآخر لاستخراج بيانات العمق والحركة.

ويجري توليد الملايين من "النقاط الغاوسية" بناءً على البيانات المجمعة، وتمثل كل نقطة جزءًا من المشهد، وتتضمن بيانات عن لونها، وشكلها، وموضعها، بالإضافة إلى كيفية تغير هذه البيانات بمرور الزمن.

إعلان

وتعيد التقنية بناء المشهد في صورة مشهد رباعي الأبعاد، حيث يضاف عنصر الزمن لإنشاء تأثيرات حركية طبيعية.

وتستخدم الشبكات العصبونية المتقدمة لتقدير خريطة العمق وحركة العناصر في المشهد وربط البيانات الزمانية والمكانية للنقاط، مما يسمح بتوقع وتوليد إطارات جديدة من زوايا مختلفة وفي أزمنة مختلفة.

ويستخدم محرك "بلاي كانفاس"، المعروف بدعمه للرسوميات في المتصفحات دون الحاجة إلى إضافات، لعرض المشهد النهائي بطريقة سلسة وقابلة للتكيف مع مختلف الأجهزة.

ومن الجوانب المهمة الأخرى استخدام الصوت المكاني. وبينما يتنقل المشاهد عبر بيئة الفيديو، يستجيب الصوت لموضع الكاميرا الجديد، مما يضيف بعدًا صوتيًا واقعيًا يزيد من انغماس المستخدم في المشهد.

مصدر الصورة مع استمرار تطور هذه التقنيات قد تصبح المشاهد الرباعية الأبعاد جزءا أساسيا من كيفية استهلاكنا للمحتوى الرقمي (غيتي)

من الفيديو الثنائي الأبعاد إلى الرباعي الأبعاد

تسمح هذه التقنية للمستخدم بالتنقل داخل المشهد وتغيير زاوية العرض في الزمن الحقيقي، كما تتكيف الأصوات المحيطة بما يتناسب مع موقعه الجديد في البيئة الافتراضية.

وتكمن أهميتها في قدرتها على إعادة تصور محتوى الفيديو الديناميكي والتقليدي، حيث أصبح بإمكان صناع المحتوى تجاوز حدود التصوير الثنائي وفتح آفاق جديدة للسرد المرئي.

وفي صناعة السينما، على سبيل المثال، بات بإمكان المخرجين إعادة تنسيق اللقطات بعد انتهاء التصوير والسماح للمشاهدين باستكشاف المشهد من أي زاوية يختارونها.

وفي المجال الرياضي أيضًا، تسمح هذه التقنية للمحللين والجماهير بإعادة مشاهدة اللحظات الحاسمة من أي جهة للحصول على رؤية أوضح للمجريات.

كما تسمح بتحويل التقارير الإخبارية إلى مشاهد تفاعلية تتيح للمشاهدين رؤية الأحداث من زوايا متعددة.

ومن خلال هذه التقنية، يمكن محاكاة مشاهد معقدة للتدريب التفاعلي وتحليل حركة الأجسام المعقدة بزوايا متعددة.

وأصبح بالإمكان إنشاء بيئات ألعاب ديناميكية واقعية من لقطات حقيقية دون الحاجة إلى تصوير متخصص بكاميرات 360 درجة. بالإضافة إلى تقديم جولات افتراضية غامرة لمواقع سياحية أو عقارات من لقطات فيديو.

ختامًا، تمثل تقنية "النثر الغاوسي الرباعي الأبعاد" قفزة نوعية في معالجة الفيديو الرقمي من أجل تقديم تجارب بصرية غامرة لم تكن ممكنة من قبل. وبفضل اعتمادها على محرك "بلاي كانفاس"، تصبح هذه التقنية قابلة للاستخدام على نطاق واسع دون الحاجة إلى أجهزة متخصصة.

ومع استمرار تطور هذه التقنيات، قد تصبح المشاهد الرباعية الأبعاد جزءا أساسيا من كيفية استهلاكنا للمحتوى الرقمي، سواء في الإعلام أو الترفيه أو المجالات المهنية، مما يعيد تعريف مفهوم المشاهدة التفاعلية بشكل كامل.

الجزيرة المصدر: الجزيرة
شارك


حمل تطبيق آخر خبر

إقرأ أيضا