أعلنت شركة غوغل رسميا قبل أيام عن إطلاق "ليريا 3 برو" (Lyria 3 Pro)، وهو النموذج الأكثر تقدما في عائلة "ليريا" لتوليد الموسيقى. ويأتي هذا الإصدار ليعالج الفجوة بين "المقاطع التجريبية" و"الإنتاج الموسيقي المتكامل"، واضعا معايير جديدة للجودة والبناء الهيكلي للمحتوى الصوتي، حسب ما تقول غوغل.
ووفقا لما نشرته مدونة غوغل بلوغ، فإن التطور الأبرز في نسخة البرو هو القدرة على توليد مقاطع موسيقى تصل مدتها إلى 3 دقائق، مقارنة بـ 30 ثانية فقط في نسخة "ليريا 3" العادية التي صدرت في فبراير/شباط الماضي.
وهذا التمديد الزمني ليس مجرد "تكرار"، بل هو بناء موسيقي متطور يفهم الفوارق الجوهرية بين أجزاء الأغنية من المقدمات (Intros)، والمقاطع (Verses)، واللوازم (Choruses)، والجسور (Bridges)، مما يمنح المقطوعة تدفقا طبيعيا يشبه الإنتاج البشري.
يعمل النموذج بمعايير أستوديو احترافية، حيث ينتج صوتا بنظام "48 كيلوهرتز ستيريو" (48kHz Stereo). وتؤكد الوثائق التقنية لجيميني إيه بي آي (Gemini API) أن النموذج يدعم مدخلات متعددة الوسائط (Multimodal)، إذ يمكن للمستخدم:
تقول غوغل إن ليريا لم يعد مجرد تجربة معزولة، بل تم دمجه في صلب أدوات الإنتاج اليومي، ففي تطبيق جيميناي هو متاح الآن لمشتركي إيه آي بلس، وبرو وألترا مع حدود استخدام تصل إلى 50 مقطعا يوميا لمشتركي ألترا.
وفي غوغل فيدز (Google Vids)، يمكن لصناع المحتوى توليد موسيقى خلفية مخصصة داخل منصة الفيديو الجديدة التابعة لوركسبيس (Workspace).
أما في فيرتكس إيه آي وغوغل إيه آي ستوديو (Vertex AI & Google AI Studio)، فهو متاح للمطورين لبناء تطبيقات تعتمد على الموسيقى التوليدية.
وفي خطوة تهدف لضبط الملكية الفكرية، أكدت غوغل ديب مايند (Google DeepMind) أن جميع المقاطع المولدة عبر ليريا 3 برو تتضمن علامة مائية رقمية غير مسموعة تسمى سينث آي دي (SynthID).
وهذه التقنية تظل ثابتة حتى بعد ضغط الملف أو تعديله، مما يتيح التحقق من أصل المحتوى عبر أدوات غوغل المتخصصة، كما تلتزم غوغل حسب قولها بفلترة المخرجات لمنع "محاكاة أصوات الفنانين الحقيقيين" بشكل مباشر.
لم يقتصر اختبار ليريا 3 برو على المهندسين، بل شارك في تطويره موسيقيون حائزون على جوائز "غرامي" مثل المنتج يونغ سبيلبرغ ودي جيه فرانسوا كيه، الذين استخدموا النموذج في العصف الذهني وتوزيع الموسيقى التصويرية للأفلام القصيرة، مما يعزز من مكانة الأداة كـ"مساعد إبداعي" وليس بديلا عن الفنان.
لتحويل أفكارك الموسيقية إلى واقع ملموس، تتبع غوغل نهجا يعتمد على "البساطة في الواجهة والتعقيد في المعالجة"، إليك الخطوات العملية للبدء:
1. الوصول إلى الأداة
يمكن للمستخدمين المشتركين في باقات (إيه آي بلس أو برو أو ألترا) الوصول إلى النموذج عبر منصة جيميناي أو من خلال أداة غوغل فيدز. وللمطورين، يمكن البدء عبر غوغل إيه آي ستوديو (Google AI Studio) واختيار نموذج lyria-3-pro-preview.
2. هندسة الأمر الموسيقي (Prompt Engineering)
لا تكتف بكلمات عامة، فكلما زادت التفاصيل، زادت دقة النتيجة. ولذلك اتبع المعادلة التالية: [النوع الموسيقي] + [الحالة المزاجية] + [الآلات الأساسية] + [الإيقاع/السرعة].
وهذا الأمر مثال على ذلك: "موسيقى جاز هادئة (Lo-fi Jazz)، توحي بالتركيز، مع التركيز على بيانو منفرد وصوت مطر خفيف في الخلفية، إيقاع بطيء 80 بي بي إم."
3. تحديد الهيكل (Structure Control)
ميزة البرو الكبرى هي التحكم في مسار الأغنية، حيث يمكنك توجيه النموذج لإنتاج أجزاء محددة:
4. إضافة الكلمات والأداء الصوتي
إذا كنت ترغب في أغنية بصوت بشري، فعليك كتابة كلمات الأغنية في الخانة المخصصة (يدعم العربية والإنجليزية بطلاقة). من ثم حدد نوع الصوت مثلا: صوت نسائي ناعم، أو صوت رجالي عميق، بعد ذلك سيقوم ليريا 3 برو بتلحين الكلمات وتوزيعها آليا لتتناسب مع الإيقاع المختار.
5. المعاينة والتعديل (Refining)
بعد توليد المقطع الذي يستغرق عادة أقل من دقيقة لمدة 3 دقائق، يمكنك طلب تعديلات فورية، مثل: اجعل صوت الطبول أقوى في المنتصف، أو أضف لمسة من موسيقى السينث (Synth) في النهاية، أو ارفع جودة التردد إلى الحد الأقصى للنشر.
6. التصدير والحماية
بمجرد رضاك عن النتيجة، يمكنك تحميل الملف بصيغة "دبليو إيه في" (WAV) عالية الجودة أو "إم بي 3" (MP3). وتذكر أن الملف سيحتوي تلقائيا على علامة سينث آي دي المائية، مما يضمن لك إثبات ملكية المحتوى كإنتاج مدعوم بالذكاء الاصطناعي ويحميك من دعاوى الانتحال المباشر.
للانتقال من مجرد "مقطع عشوائي" إلى "مقطوعة احترافية"، ينصح خبراء الصوتيات عند التعامل مع ليريا 3 برو باتباع الآتي:
1. قاعدة الـ (BPM) والدقة الإيقاعية
لا تترك الإيقاع للصدفة، حدد سرعة المقطوعة باستخدام ضربات الإيقاع في الدقيقة (بي بي إم). مثلا: للموسيقى الهادئة استخدم (70-90 بي بي إم)، وللموسيقى الحماسية أو الرياضية استخدم (120-140 بي بي إم). هذا يضمن تناسق الآلات مع الحالة المزاجية المطلوبة.
2. "الطبقات الصوتية" (Layering)
بدلا من قول "أريد موسيقى روك"، جرب وصف الطبقات، "أريد طبقة أساسية من الدرامز القوي، مع طبقة غيتار كهربائي مشوه (Distorted Guitar)، وخلفية من الكيبورد الساكن (Atmospheric Pads)". تعدد الطبقات في الوصف يمنح النموذج عمقا في التوزيع.
3. استخدام "الكلمات الدلالية" للصوتيات (Audio Keywords)
استخدم مصطلحات تقنية لرفع الجودة، مثل:
4. هندسة السكوت (The Power of Silence)
الموسيقى العظيمة هي التي تتنفس، حيث يمكن للمستخدم توجيه النموذج لإضافة وقفات درامية بالقول: "أضف وقفة إيقاعية (Beat Drop) قبل اللازمة الأخيرة"، أو "اجعل النهاية تتلاشى تدريجيا (Slow Fade out)".
5. تجنب "التلوث الصوتي"
لا تطلب عددا هائلا من الآلات المتناقضة في أمر واحد، مثلا لا تطلب أورج شرقي مع غيتار فلامنكو وطبلة أفريقية، فقد يؤدي ذلك إلى تداخل الترددات، فقط ركز على "ثيمة" موحدة لضمان صفاء التوزيع.
6. استغلال "الذكاء العابر للغات"
بما أن ليريا 3 برو يدعم العربية، جرب دمج مقامات معينة في الوصف، مثل طلب أغنية بوب بلمسة من مقام الحجاز، وستفاجأ بمدى قدرة النموذج على دمج الهوية الثقافية في قوالب عالمية.
وبحسب المراقبين، فإن إطلاق ليريا 3 برو ليس مجرد إضافة تقنية إلى ترسانة غوغل الرقمية، بل هو إعلان عن نضوج عصر "الإبداع الخوارزمي الموجه"، فبينما كان الذكاء الاصطناعي في السابق يكتفي بمحاكاة الألحان، أصبح اليوم قادرا على فهم الهيكل الموسيقي، والالتزام بمعايير الجودة الاحترافية، وحتى حماية الملكية الفكرية عبر تقنيات مثل سينث آي دي.
هذا التحول يضع الصناع والمبدعين أمام واقع جديد، فالأداة لم تعد هي العائق، بل الخيال والقدرة على توجيه الآلة هي المعيار الجديد للتميز.
وبينما تتسارع الخطى نحو سيادة رقمية كاملة في الإنتاج الصوتي، يبقى السؤال الجوهري، هل ستظل الموسيقى تعبيرا عن روح المبدع، أم ستتحول إلى هندسة دقيقة للأوامر والبيانات؟ والإجابة تكمن في قدرة المبدع البشري على استخدام هذه الأدوات كجناح للإبداع، لا كبديل عن الإحساس.
المصدر:
الجزيرة
مصدر الصورة
مصدر الصورة