جوجل تكشف أدوات جديدة لإنشاء الصور والفيديو والموسيقى

صورة مصممة بنموذج Imagen 3 لإنشاء الصور بالذكاء الاصطناعي من جوجل - Google - Google
صورة مصممة بنموذج Imagen 3 لإنشاء الصور بالذكاء الاصطناعي من جوجل - Google - Google
القاهرة-محمد عادل

أزاحت جوجل الستار عن مجموعة من الأدوات الجديدة لإنتاج المحتوى باستخدام الذكاء الاصطناعي، وفي مقدمتها نموذجها الأول لإنتاج مقاطع الفيديو باستخدام الأوامر النصية Veo، إلى جانب الجيل الجديد من منصتها لإنتاج الصور Imagen.

ويأتي هذا الإعلان من جوجل عن أدواتها الذكية الجديدة، بعد إطلاق OpenAI نموذجها لإنتاج الفيديوهات Sora العام الماضي.

وكشفت الشركة خلال مؤتمرها السنوي للمطورين I/O 2024، عن نموذجها الجديد Veo الذي يمكنه إنتاج مقاطع فيديو تتخطى حاجز الدقيقة الواحدة، وبجودة عرض 1080p.

ونجحت جوجل من خلال نموذجها الجديد في تقديم مستوى مميز، من الدقة في إدراك تفاصيل المشاهد التي يتخيلها المستخدم من خلال الوصف اللغوي الطبيعي للبشر.

وتمكّن Veo من فهم الأوصاف السينمائية للمشاهد، وزوايا التصوير بدقة، لتخرج مقاطع الفيديو وكأنها مصورة بشكل احترافي.

وأشارت جوجل إلى أن نموذجها الجديد نتاج سنوات طويلة من البحث، والتطوير على مستوى نماذج الذكاء الاصطناعي المتخصصة في تحليل الفيديوهات، وفهم محتواها، والعناصر الدقيقة بداخلها، وحركتها، وإدراك قوانين الفيزياء مع حركة الأشياء.

وتتيح الشركة الآن إمكانية استخدام قدرات نموذجها الجديد Veo، لعدد محدود من صناع المحتوى عبر منصتها VideoFX، كما وعدت بتفعيل العديد من مزاياه في منصتها للفيديوهات القصيرة Youtube Shorts.

ويعتبر Veo رداً مباشراً من جوجل على نموذجي Sora، وVIDU، لإنشاء مقاطع الفيديو عبر الأوامر النصية.

Imagen 3 لإنشاء الصور

كما قدمت جوجل الجيل الجديد من عائلة Imagen لإنشاء الصور بالذكاء الاصطناعي، وهو نموذج Imagen 3 الذي يصل بتحديثات كبيرة على مستوى دقة تحليل النصوص، وتصميم الصور بناء على إدراك معناها ووصفها الدقيق.

وأشارت الشركة إلى أن النموذج الجديد أصبح أكثر قدرة على فهم المغزى وراء الأوامر النصية، مع زيادة قدرته على إضافة تفاصيل دقيقة إلى تصميم الصور بناء على الأوامر النصية الطويلة، ما يزيد من دقة ودرجة حقيقية اللقطات المصممة، وجعْلها أكثر واقعية.

صورة مصممة بواسطة نموذج جوجل الجديد Imagen 3 لتصميم الصور بالذكاء الاصطناعي
صورة مصممة بواسطة نموذج جوجل الجديد Imagen 3 لتصميم الصور بالذكاء الاصطناعي - Google

ووصفت الشركة Imagen 3 بأنه أفضل إصدار على الإطلاق في تصميم الصور التي تتضمن نصوصاً بداخلها، حيث تخرج النصوص مصممة كجزء طبيعي من التصميمات، وتظهر بصورة أكثر طبيعية.

صور تتضمن نصوص واضحة مصممة بواسطة نموذج جوجل الذكي Imagen 3 الجديد
صور تتضمن نصوص واضحة مصممة بواسطة نموذج جوجل الذكي Imagen 3 الجديد - Google

وسيتوفر النموذج الجديد لمجموعة محدودة من صناع المحتوى عبر منصة ImageFX، وسيصل قريباً إلى منصة Vertex AI.

موسيقى AI

وأعلنت جوجل كذلك عن تعاون يوتيوب مع عدد من الفنانيين لاستخدام أدوات ذكاء اصطناعي مطورة من جانب الشركة، تتمثل في الحزمة الذكية لإنشاء الموسيقى Music AI Sandbox.

وتسهل الأدوات الذكية على الفنانين إنشاء المقاطع الموسيقية، باستخدام الأوامر النصية والتعديل عليها، ما يتيح مساحة واسعة من الابتكار والتطوير في إنشاء الموسيقى، وقد يغير هذا طريقة الإنتاج الموسيقي بشكل كامل في المستقبل.

وبالفعل، بدأ 3 فنانين، وهم جاستن ترانتر، وويكلف جين، ومارك ريبايليت في نشر مقاطع لتجاربهم الموسيقية الأولية باستخدام أدوات Music AI Sandbox عبر قنواتهم الرسمية على يوتيوب.

تصنيفات

قصص قد تهمك