Инженеры компании Meta разработали новую систему под названием Make-A-Video.

Как сообщает Naked Sience, пользователь системы может ввести текстовое описание того, что он хотел бы увидеть, а Make-A-Video с помощью искусственного интеллекта генерирует короткий ролик, соответствующий тексту. Отмечается, что на начальном этапе видеоролики получаются не очень хорошего качества, с размытым изображением и искаженной анимацией. Между тем подчеркивается, что новая система — это значительный шаг вперед в области создания видеизображений с помощью искусственного интеллекта.

Пока что Make-A-Video создает ролики из 16 кадров с разрешением 64 на 64 пикселя, которые затем увеличиваются в размере с помощью отдельной модели искусственного интеллекта до 768 на 768.

meta_teddy_square_gif.gif 

Пример видео, сгенерированный новой моделью преобразования текста на основе искусственного интеллекта Make-A-Video. Текст для создания ролика гласил: "плюшевый мишка рисует свой портрет" / ©Meta*

"Создатели системы отмечают, что Make-A-Video обучается на парах изображений и подписей, а также на немаркированных видеоматериалах. Учебный контент получается из двух наборов данных (WebVid-10M и HD-VILA-100M), которые вместе содержат миллионы видеороликов, охватывающих сотни тысяч часов отснятого материала. Сюда входят стоковые видеоматериалы", — говорится в сообщении

Пока нет информации, станет ли Make-A-Video общедоступным средством создания контента.

***

Читайте нас в Viber и Telegram