متا به تازگی از ابزار هوش مصنوعی خود به نام Movie Gen پرده برداری کرده است که برای تولید ویدئوهای مبتنی بر هوش مصنوعی طراحی شده است. این شرکت چند نمونه خیره کننده از این ابزار را به نمایش گذاشته، اما هنوز زمانی برای عرضه رسمی آن تعیین نکرده است.
در حالی که رقابت در حوزه تولید ویدئوهای هوش مصنوعی روز به روز بیشتر می شود، سرعت توسعه این فناوری به اندازه کافی سریع نیست. به عنوان مثال، ابزار Sora از OpenAI که هفت ماه پیش معرفی شد، همچنان بدون تاریخ عرضه رسمی باقی مانده است.
شرکت های نوپای فعال در این حوزه نیز دست به کار شده اند و مدل های جذابی را ارائه کرده اند، اما هنوز معلوم نیست کدامیک از این شرکت ها در بازار نوظهور ویدئوهای هوش مصنوعی موفق تر عمل خواهند کرد. یکی از چالش های اصلی این است که مدل های هوش مصنوعی برای تولید ویدئو هنوز به محصولاتی عملی و پرسرعت تبدیل نشده اند. کاربران باید مدت زمان زیادی منتظر بمانند تا ویدئوهای دلخواهشان تولید شود، مشکلی که حتی «کریس کاکس»، مدیر محصول متا نیز به آن اذعان کرده است.
قابلیت های Movie Gen
کاکس در پلتفرم Threads توضیح میدهد: “ما هنوز آماده نیستیم تا این ابزار را بهعنوان محصول نهایی عرضه کنیم — هزینه تولید همچنان بالاست و زمان زیادی میبرد — اما نتایجی که تاکنون به دست آمده بسیار چشمگیر بودهاند.” با وجود این، او بر این باور است که Movie Gen در سطح صنعت پیشتاز است. این ابزار میتواند با وارد کردن درخواست متنی یا با استفاده از تصاویر ثابت و ویدئوهای متحرک، ویدئوهای جدیدی ایجاد کند. همچنین، این مدل قابلیت تطبیق صداهای تولیدشده توسط هوش مصنوعی با ویدئوها را دارد و میتواند ویدئوها را در نسبتهای مختلف تصویر تولید کند.
یکی از ویدئوهایی که متا در صفحه Movie Gen خود به نمایش گذاشته، مربوط به دوندهای در یک بیابان است. این ویدئو با تغییرات جالبی همراه شده است؛ در یک نسخه، پومپومهای آبی به دستان دونده اضافه شدهاند، در نسخهای دیگر، او در میان کاکتوسها میدود و در نسخه سوم لباس ورزشیاش با لباسی به شکل دایناسور جایگزین شده است.
در مورد دادههای آموزشی، متا همانند سایر شرکتهای فعال در زمینه هوش مصنوعی اطلاعات دقیقی ارائه نکرده است. این شرکت تنها اعلام کرده که دادههای مورد استفاده برای آموزش Movie Gen ترکیبی از دادههای عمومی و دادههای دارای مجوز هستند. در ماه ژوئیه، استارتاپ هوش مصنوعی Runway برای توسعه مدل Gen-3، صدها ویدئوی یوتیوب را جمعآوری کرد.
گمان میرود که متا با استفاده از دادههای تولیدشده توسط کاربران شبکههای اجتماعی خود برای آموزش این مدل، نسبت به رقبا مزیتی به دست آورده باشد.