در این مطلب از مجله فناوری و تکنولوژی استار بورس نسل جدید تولیدکننده ویدیو از متن مبتنی بر هوش مصنوعی Google Research را قرار دادیم .
نسل جدید تولیدکننده ویدیو از متن مبتنی بر هوش مصنوعی Google Research
یک تیم از محققان هوش مصنوعی در گوگل ریسرچ به نام لومیر، نسل جدید تولید ویدیو از متن را توسعه دادهاند. این تیم مقالهای را در پایگاه پیشچاپ arXiv منتشر کرده است و تلاشهای خود را در این زمینه شرح داده است.
در چند سال اخیر، برنامههای کاربردی هوش مصنوعی به طور گستردهای در جامعه کاربران مورد استفاده قرار گرفتهاند. به عنوان مثال، مدلهای زبانی بزرگ (LLM) مانند ChatGPT با مرورگرها ادغام شدهاند و این امکان را به کاربران میدهند تا متون خود را با روشهای نوین تولید کنند.
اخیرا، ابزارهای تبدیل متن به تصویر به کاربران اجازه دادهاند تا تصاویر واقعی را ایجاد کنند و ابزارهای تبدیل متن به ویدیو هم این امکان را به کاربران دادهاند که با استفاده از چند کلمه، کلیپهای ویدیویی کوتاه بسازند.
اکنون تیم گوگل با معرفی یک تولیدکننده ویدیو از متن به نام لومیر، این حوزه را به ابعاد جدیدی رسانده است.
گوگل برای این مولد جدید، به عنوان یک فناوری پیشرو در زمینه فضا و زمان U-Net، توضیح میدهد که برای ایجاد ویدیوهای متحرک در یک مدل طراحی شده است.
ویدیوی تبلیغاتی نشان میدهد که گوگل ویژگیهای جدیدی اضافه کرده است، از جمله اجازه دادن به کاربران برای ویرایش ویدیوهای موجود با برجسته کردن بخشی از آن و اعمال دستورالعملهایی مانند “تغییر رنگ لباس به قرمز”.
این مولد همچنین انواع مختلفی از نتایج را تولید میکند، از جمله سبکسازی که سوژه را با سبکهای مختلف نمایش میدهد و امکان برجسته کردن و تحریک بخشهای مختلف یک تصویر ثابت.
گوگل تصریح نکرده است که آیا قصد دارد “لومیر” را به عموم عرضه کند یا نه، اما احتمالاً به دلیل مشکلات قانونی احتمالی که ممکن است ناشی از ایجاد ویدیوهایی که حقوق نشر را نقض میکنند، ایجاد شود.