الكشف عن أداة Google Lumiere Multimodal AI لإنشاء الفيديو؛ يمكن إنشاء مقاطع فيديو مدتها 5 ثوانٍ من النصوص والصور

الكشف عن أداة Google Lumiere Multimodal AI لإنشاء الفيديو؛  يمكن إنشاء مقاطع فيديو مدتها 5 ثوانٍ من النصوص والصور


كشفت شركة جوجل النقاب عن أحدث نماذجها للذكاء الاصطناعي، Lumiere، الأسبوع الماضي. نموذج الذكاء الاصطناعي الجديد عبارة عن أداة لإنشاء فيديو متعدد الوسائط يمكنها إنشاء مقاطع فيديو مدتها 5 ثوانٍ. وهو يدعم كلاً من إنشاء النص إلى الفيديو والصورة إلى الفيديو وينضم إلى نماذج الذكاء الاصطناعي الحالية مثل Runway Gen-2 وPika 1.0. وفقًا لشركة Google، يستخدم Lumiere بنية Space-Time U-Net (STUNet) التي تبتكر كيفية حدوث الحركة في فيديو الذكاء الاصطناعي، مما يجعلها تبدو واقعية. المنصة ليست مفتوحة للجمهور حتى الآن.

في ورقة ما قبل الطباعة المصاحبة، أوضح فريق البحث الذي يقف خلف Lumiere أن الابتكار الرئيسي في الحركة يأتي من إنشاء الفيديو في عملية واحدة بدلاً من تجميع الإطارات الثابتة معًا. ونتيجة لذلك، يتم إنشاء الجوانب المكانية (الأشياء الموجودة في الفيديو) والجوانب الزمنية (كيفية تحرك الأشياء في الفيديو) في وقت واحد. بالنسبة للشخص العادي، يؤدي هذا إلى إدراك الحركات كما تحدث في الطبيعة. لتحقيق ذلك، يقوم Lumiere بإنشاء عدد أكبر من 80 إطارًا بدلاً من 25 إطارًا في Stable Diffusion.

“من خلال نشر كل من العينات المكانية والأهم من ذلك الزمانية لأسفل وأعلى والاستفادة من نموذج نشر النص إلى الصورة المدرب مسبقًا، يتعلم نموذجنا إنشاء فيديو بمعدل إطار كامل ومنخفض الدقة مباشرة عن طريق معالجته وأضافت الصحيفة: “في مقاييس زمانية متعددة”.

على الرغم من أنه لا يمكن اختبار Google Lumiere في الوقت الحالي، إلا أن موقع الويب نشط ويمكن للمتحمسين التحقق من مقاطع الفيديو المختلفة التي تم إنشاؤها باستخدام نموذج الذكاء الاصطناعي بالإضافة إلى المطالبة النصية وإدخال الصور المستخدمة لإنشاء المخرجات. يمكنه أيضًا إنشاء مقاطع فيديو بأنماط مختلفة، ورسومات سينمائية تتيح للمستخدمين تحريك جزء معين من الفيديو، والرسم حيث يتم استخدام فيديو أو صورة مقنعة ويكملها الذكاء الاصطناعي بناءً على المطالبة.

تتنافس أحدث أدوات إنشاء الفيديو المستندة إلى الذكاء الاصطناعي من Google مع نماذج الذكاء الاصطناعي الحالية مثل Runway Gen-2، الذي تم إطلاقه في مارس 2023، وPika Lab’s Pika 1.0، وكلاهما في متناول الجمهور. بينما يستطيع Pika إنشاء مقاطع فيديو مدتها 3 ثوانٍ (والتي يمكن زيادتها لمدة 4 ثوانٍ أخرى)، يمكن لـ Runway إنشاء مقاطع فيديو تصل مدتها إلى 4 ثوانٍ. كلا النموذجين متعددي الوسائط ويسمحان بتحرير الفيديو أيضًا.


قد يتم إنشاء الروابط التابعة تلقائيًا – راجع بيان الأخلاقيات الخاص بنا للحصول على التفاصيل.

تعليقات

للحصول على أحدث الأخبار والمراجعات التقنية، تابع Gadgets 360 على Xوالفيسبوك والواتس اب والخيوط وأخبار جوجل. للحصول على أحدث مقاطع الفيديو حول الأدوات والتكنولوجيا، اشترك في قناتنا على YouTube. إذا كنت تريد معرفة كل شيء عن أهم الشخصيات المؤثرة، فاتبع تطبيق Who’sThat360 الداخلي لدينا على Instagram وYouTube.

سيتم إطلاق أجهزة Apple MacBook Air وiPad Pro وiPad Air الجديدة بحلول نهاية شهر مارس، وجاري الإنتاج: مارك جورمان



تعليقات

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *