یک تیم پژوهشی در مرکز تحقیقات گوگل با نام “Lumiere”، یک ابزار هوش مصنوعی جدید را توسعه داده است. این ابزار به عنوان نسل بعدی ابزارهای تولید ویدیو بر اساس متن شناخته میشود. گوگل ادعا کرده است که Lumiere قادر است ویدیوهایی با حرکات منسجم، روان و واقعیتر را ایجاد کند. در حالی که بسیاری از مدلهای فعلی هوش مصنوعی در تولید ویدیو مشکلاتی دارند و حتی اگر بتوانند حرکات را به خوبی نمایش دهند، دیگر جنبهها ممکن است دچار اختلال شوند.
گوگل با استفاده از رویکرد متفاوتی در ابزار Lumiere، که به نام “برادران لومیر”، به عنوان افراد مخترع سینما شناخته میشوند، این مشکل را برطرف کرده است. به جای قراردادن فریمهای جداگانه کنار هم، Lumiere کل ویدیو را در یک فرآیند ایجاد میکند و میتواند مکان قرارگیری اشیا و حرکت آنها را همزمان مدیریت کند. هوش مصنوعی Lumiere هنوز یک پروژه تحقیقاتی است، بنابراین امکان استفاده عمومی از آن وجود ندارد. گوگل در حال حاضر یک ویدیو کوتاه از قابلیتهای این ابزار را منتشر کرده است.
مدل هوش مصنوعی گوگل براساس معماری فضا-زمان ساخته شده است، به این معنا که Lumiere میتواند تمام جنبههای حرکت و مکان را در نظر بگیرد و در فرآیند تولید ویدیو، موقعیت سوژهها و حرکت اشیا را مورد بررسی قرار دهد. این ابزار هنوز برای عموم منتشر نشده است، اما علاقهمندان میتوانند با مراجعه به صفحه GitHub آن، چند ویدیو آزمایشی را مشاهده کنند.