Топ-14 нейросетей для генерации видео из фото: как сделать видео по фото товара для Ozon, Wb

Рынок уходит от статики. Если ещё пару лет назад хватало одной симпатичной инфографики, сегодня в выдаче всё чаще мелькает видеообложка для маркетплейса: товар крутится, подсвечиваются выгоды, показывается использование.

Что это даёт:

по кейсам маркетплейсов и агентств видеообложки почти всегда дают рост CTR относительно статики;
в конкурентных нишах (одежда, бьюти, электроника) рост CTR по видеообложкам часто двузначный;
видео помогает выделиться там, где все уже умеют делать «красивые слайды».

И самое важное: чтобы сгенерировать видео из фото, уже не нужен продакшен. Сейчас можно:

собрать карточку в сервисе типа Fabula AI;
и тут же, на основе этой же картинки, сгенерировать видео по фото → получить готовую видеообложку для Ozon, WB или Яндекс.Маркета.

Раньше «поиграть с ИИ» означало просто оживить фото или сделать лёгкую анимацию фото ради эффекта. Сейчас задача прагматичная: выжать максимум CTR и конверсии с карточки.

Содержание:

Как видеообложка влияет на CTR

Требования к видеообложкам WB, Ozon и Яндекс.Маркет

Лучшая нейросеть для генерации видео из фото

Лучшие модели для видеогенерации: Veo, Sora 2, Kling и др.

Топ сервисов для генерации видео из фото

Сервисы говорящих аватаров: D-ID, HeyGen, Synthesia

Российские сервисы для генерации видео

Сравнение: модели и сервисы для генерации видео из фото

Пошаговый чек-лист: создать видео по фото

Как видеообложка влияет на CTR

Когда мы говорим «видео для маркетплейсов», важен не только факт наличия ролика, но и то, как он сделан:

понятен ли товар и его ключевые выгоды;
читается ли бренд;
не ломается ли геометрия (ручки, крышки, упаковка).

По наблюдениям агентств и продавцов видео для карточки товара:

сильнее цепляет взгляд в выдаче: движение выигрывает против сотен статичных миниатюр.
лучше показывает объём: размер, фактуру, применение товара.
помогает быстрее считать ценность: покупатель видит не только «красивую картинку», а живой сценарий использования.

Когда конкуренты упираются только в графику, генерация видеообложек становится уже не «игрушкой», а конкретным инструментом роста CTR.

Требования к видеообложкам WB, Ozon и Яндекс.Маркет

Чтобы не делать видео «вслепую», соберём базовые требования площадок.

Параметры видеообложки:

Параметр	Ozon	Wildberries	Яндекс.Маркет
Формат файла	MP4, MOV	MP4, MOV	MP4, MOV
Разрешение видео	от 1080 до 1920 px	от 720 до 1920 px	от 1080 до 1920 px
Размер файла	≤ 20 МБ	≤ 50 МБ	≤ 100 МБ
Длительность	от 8 до 30 секунд	до 3 минут	до 20 минут
Соотношение сторон	вертикальное 3:4	вертикальное 3:4	явно не пишут, но можно — 3:4

Для нас критично:

вертикальное 3:4 — не 9:16, не квадрат;
хотя бы 8 секунд под Ozon (WB/Маркет проще по длительности);
HD или FullHD (1080p) — особенно если целимся в Ozon/Маркет;
разумный размер файла (20–50 МБ почти любые нейросети выдержат, если не просить у них минутное 4K).

Дальше будем смотреть на модели и сервисы через эту призму.

Лучшая нейросеть для генерации видео из фото

Fabula AI

Fabula AI — это сервис для создания инфографики для карточек товаров на маркетплейсах, внутри которого:

вы собираете инфографику под Ozon/WB/Я.Маркет;
и сразу же анимируете её в видеообложку.

Что происходит под капотом:

в Fabula AI встроен Kling 2.5 Turbo — одна из самых сильных моделей «оживления» картинок;
Fabula сама анализирует картинку и с помощью языковой модели придумывает промт для создания видео;
вам не нужно разбираться, как правильно просить нейросеть: достаточно отправить картинку, дальше сервис сделает всё сам.

Почему это удобно именно для маркетплейсов:

выходное видео заранее подогнано под требования Ozon, WB и Я.Маркет:
- вертикальное 3:4;
- длительность от 8 секунд (под Ozon);
- HD/FullHD разрешение;
- формат MP4, адекватный размер файла;
вам не нужно отдельно думать про формат видео для ВБ, формат видео для Озон — Fabula занимается этим в фоне.

Плюс важная деталь для российских селлеров:

Fabula можно оплачивать из России — без плясок с иностранными картами и блокировками.

По сути это решение «одним окном»:

Вы собираете инфографику для карточки товара (шаблоны, шрифты, сетки уже заточены под маркетплейсы).
Одной кнопкой превращаете её в видеообложку для маркетплейса — без промт-инженерии, монтажа и ручной подгонки форматов.

Примеры видеообложек:
Терка

Видео

Лежанка для котов

Видео

Наушники

Видео

Мужской парфюм

Видео

Итог:
Если вам не хочется разбираться в Kling, форматах и текстах для нейросетей, Fabula AI закрывает всё разом: карточка, видеообложка, соответствие требованиям маркетплейсов и удобная оплата из России.

Сгенерировать видео по фото в Fabula AI

Соберите инфографику под Ozon, WB или Я.Маркет — сервис сам сделает из неё видеообложку нужного формата и длительности.

Сделать видеообложку

Передовые модели для видеогенерации

Veo 3.1 (Google DeepMind)

Что умеет:

форматы: 16:9 и 9:16 нативно;
длительность: ~8 секунд за одну генерацию, длиннее — только склеиванием сцен;
качество: 720p или 1080p при 24 fps, очень реалистичный свет, движения и физика;
режим работы: умеет и видео по тексту, и «оживление» загруженного кадра;
доступ: через Google AI, доступ ограничен по странам.

Минусы:

Потребуется VPN и подключение к региону США
Иностранная карта
Свежий Google аккаунт, который ранее не использовался

Пример видео:

Итог:
Качество — космос, но это история про платформы и крупные команды. Как «зашёл сам, нажал пару кнопок и сделал видеообложку для маркетплейса» — пока нет.

Sora 2 / Sora 2 Pro (OpenAI)

Sora (часто называют Sora 1)

Первая версия модели и веб-редактор видео

Параметры: до ~20 секунд, до 1080p, разные соотношения сторон (9:16, 16:9, 1:1). Но нет 3:4.
Доступ: Для России потребуется VPN и подписка ChatGPT Plus/Pro.
Оплата: отдельной цены у модели нет — она входит в подписку ChatGPT Plus/Pro.

Пример видео модели Sora:

Sora 2

Новая флагманская модель видео+аудио: более реалистичная физика, лучшее следование инструкциям, синхронный звук/речь.

Каналы:
- Приложение Sora (iOS + Android) — TikTok-подобное соц-приложение.
- Веб (sora.com) — более продвинутый редактор.
- Sora Video API (model sora-2) для разработчиков.
Где работает сейчас:
- Официально только в: США, Канада, Япония, Корея, Вьетнам, Таиланд, Тайвань
- В ЕС (в т.ч. Нидерланды), России Sora 2 пока недоступен официально.

Sora 2 Pro

Sora 2 Pro — максимум качества, сложные сцены, больше вычислений, рендер дольше.

Где работает сейчас:
- Sora Video API (sora-2-pro) с повышенной ценой.
- Постепенно включается для ChatGPT Pro и некоторых пользователей Sora 2 (например, режимы High quality).

Итог:
Sora — очень мощная штука, которая умеет и говорить по-русски, и понимать русские описания. Но доступ нестабилен, формата 3:4 нет (нужно кадрировать), и это всё ещё не тот инструмент, куда селлер просто заходит и стабильно делает себе видеообложки.

Kling 2.5 Turbo (Kuaishou)

Что умеет:

форматы: 16:9, 9:16, 1:1, 4:3 и 3:4 — для нас это критично;
длительность: 5 или 10 секунд за генерацию, сцены можно соединять в более длинное видео;
разрешение: до 1080p при 24 fps;
режим работы: сильный упор на «оживление» загруженного фото, хорошо держит лица и объекты;
доступ: веб-сайт Kling AI, нет бесплатного доступа.

Пример видео:

Итог:
Kling — один из самых интересных кандидатов для видеообложек: есть 3:4, хорошая стабильность, нормальное качество. Минусы — английский/китайский интерфейс и слабый звук, но для «немых» видеообложек это не критично. В чистом виде модель не супер-удобна для массового селлера, зато отлично работает как двигатель внутри готового сервиса — именно так Kling встроен в Fabula AI.

Seedance 1.0 (ByteDance)

Что умеет:

форматы: 16:9, 9:16, 1:1, 4:3, 3:4, 21:9;
длительность: 5–10 секунд на сцену, до ~12 секунд за один запрос; можно собирать мульти-сюжетные ролики;
разрешение: до FullHD;
режим работы: одна модель и для видео по тексту, и для видео по загруженному фото; акцент на кинематографичных сюжетах и плавном движении;
доступ: через партнёров или корпоративный API.

Пример видео:

Итог:
Seedance идеально подходит под видеообложки по возможностям, но сфокусирован на студиях и платформах. Для одиночного продавца это скорее двигатель внутри чужого сервиса, чем инструмент «в пару кликов».

Промежуточный вывод

Напрямую Veo, Sora, Seedance и «голый» Kling — это скорее про платформы и крупные стеки. Селлеру удобнее, когда такие модели уже упакованы в готовый сервис, где:

есть русский интерфейс;
не надо думать о форматах Ozon/WB/Маркет;
можно платить из России.

Топ сервисов для генерации видео из фото

Если смотреть на задачу глазами селлера, первым номером в этом списке будет Fabula AI: внутри уже встроен Kling 2.5 Turbo, форматы и длительность подогнаны под требования маркетплейсов, а оплату можно провести из России. Ниже — массовые международные сервисы, которые можно использовать как альтернативу или «песочницу» для экспериментов.

Runway Gen-2 (RunwayML)

Что умеет:

форматы: из коробки 16:9, но есть поддержка 9:16, 1:1, 4:3 и 3:4 через настройки и кадрирование;
длительность: базовый клип 4 секунды, с функцией Extend можно нарастить до ~15–18 секунд;
разрешение: стандартно 1280×720, на платных планах есть более высокие варианты и апскейл вплоть до 4K;
режим работы: умеет генерировать видео и по тексту, и по загруженному кадру (image-to-video) — второй вариант даёт больше контроля;
доступ: обычный SaaS-сервис, есть бесплатные кредиты и платные тарифы.

Минусы: английский интерфейс, промты лучше писать по-английски, бесплатная версия с водяным знаком.

Итог:
Runway — один из самых жизнеспособных вариантов «в лоб»: привычная регистрация, понятный веб-интерфейс, нормальное качество. Можно сделать короткий ролик из фото товара и растянуть его дозированно до 8–12 секунд.

Genmo AI

Что умеет:

работает в браузере, позволяет сгенерировать видео онлайн по фото или тексту;
поддерживает разные форматы: 16:9, 1:1, 3:4, 2:3, 4:3 и другие;
в бесплатной версии делает ролики до ~6 секунд;
выдаёт разрешение на уровне 480–720p;
щедрый бесплатный лимит — примерно до сотни коротких роликов в день, платный тариф расширяет пределы.

Плюсы:

много бесплатных попыток;
можно руками настраивать «камеру» и характер движения;
удобно сгенерировать видео из фото бесплатно, чтобы понять, как может «ожить» карточка.

Минусы:

нет стабильного FullHD;
интерфейс и модель ориентированы на английский;
пост-монтажа почти нет, всё придётся дорабатывать отдельно.

Итог:
Genmo хорошо подходит как песочница: протестировать идеи, стили, сценарии анимации. Под строгие требования Ozon/WB по длине и качеству — слабоват как финальный инструмент.

Pika Labs

Что умеет:

позволяет сгенерировать видео по фото или по тексту;
поддерживает форматы 16:9, 9:16, 1:1, 5:2, 4:5, 4:3;
в бесплатной версии делает ролики примерно по 3 секунды, на платном тарифе — до ~10 секунд;
выдаёт 720p с водяным знаком бесплатно и до 1080p без логотипа на платном;
есть настройки движения, частоты кадров и даже генерации звука.

Плюсы:

для своих размеров клипы выглядят довольно эффектно;
можно оживлять загруженные фото и играться с движением.

Минусы:

в бесплатной версии слишком короткие ролики для видеообложки;
нормальная длина только на платном плане;
нужен VPN и терпимость к англоязычному интерфейсу.

Итог:
На платном тарифе Pika можно использовать для видеообложек: сгенерировали 9:16 или 4:3, в монтажке обрезали под 3:4 — и получили 8–10 секунд. Главное — быть готовым к VPN и небольшому количеству ручной работы.

Сервисы говорящих аватаров: D-ID, HeyGen, Synthesia

Эти сервисы не столько анимируют фото товара, сколько делают виртуального ведущего, который говорит на камеру. Полезно, когда нужно быстро собрать обучающее или приветственное видео.

D-ID Creative Reality Studio

Что умеет:

делает реалистичных говорящих аватаров по фото;
поддерживает форматы 16:9, 1:1 и 9:16;
длительность до 15 минут;
разрешение до 1080p;
поддерживает десятки языков, включая русский.

Итог:
Отлично подходит, чтобы записать обращение, инструкцию, презентацию. Для видеообложки конкретного товара — слаб: это «говорящая голова» на фоне, а не анимация самой карточки.

HeyGen

Что умеет:

большой выбор готовых аватаров и голосов;
поддержка 16:9 и 9:16;
ролики до десятков минут;
разрешение от 720p до 4K.

Итог:
Классный инструмент для маркетинговых и обучающих видео с диктором. Для «немой» динамичной видеообложки товара — не то, что нужно.

Synthesia

Что умеет:

делает ролики с виртуальными ведущими для обучения и презентаций;
поддерживает 16:9, 9:16, 1:1 и другие форматы;
длительность до 10 минут на ролик (на стартовом плане);
выдаёт 1080p.

Итог:
Идеален для корпоративных обучающих видео. Как инструмент для видеообложки для маркетплейса с крутящимся товаром — совсем не про это.

Российские сервисы для генерации видео

Kandinsky 3.1 (FusionBrain)

Что умеет:

делает как картинки, так и короткие видео по тексту и по загруженному изображению;
поддерживает форматы 16:9, 9:16 и 1:1;
умеет создать видео по фото нейросеть с русскими промтами;
ролики получаются длиной до ~10 секунд, на практике чаще 3–5 секунд;
работает бесплатно через Сбер ID, без VPN.

Плюсы:

полностью русскоязычный интерфейс;
можно детально прописывать, как должна двигаться сцена;
отлично подходит, чтобы создать видео по фото нейросеть бесплатно и быстро показать идею команде.

Минусы:

генерация нестабильна, иногда приходится несколько раз перегенерировать;
разрешение и качество ниже, чем у топ-сервисов;
чаще получается просто «слегка подвижная картинка», а не полноценная сцена.

Итог:
Kandinsky — отличный способ прототипировать идею «живой карточки» без вложений. Но под боевые видеообложки Ozon/Маркет/Я.Маркет его качества обычно недостаточно.

Шедеврум (Yandex)

Что умеет:

оживляет фото в фиксированном формате 4:3;
делает очень короткие анимации по 2–3 секунды;
работает только из мобильного приложения;
доступен бесплатно по Яндекс ID.

Плюсы:

максимально простой вход: зашёл, загрузил фото, получил «живую» картинку;
внутри есть что-то вроде «соцсети» с чужими примерами, можно вдохновляться.

Минусы:

только смартфон;
фиксированный формат и невысокое разрешение;
ролики слишком короткие и простые.

Итог:
«Шедеврум» — отличный инструмент «поиграться» и оживить фото, но не рабочий вариант под требования маркетплейсов к видеообложкам.

NeuroSphere (оживление фото)

Что умеет:

умеет оживить фото, особенно портреты и старые фотографии;
по умолчанию делает вертикальные ролики 9:16, формат можно менять;
длительность около 5 секунд;
улучшает, восстанавливает и анимирует лица;
даёт несколько бесплатных токенов, дальше — оплата.

Плюсы:

объединяет улучшение и анимацию фото в одном месте;
хорошо добавляет мимику и движение к фронтальным портретам.

Минусы:

строгие лимиты бесплатных генераций;
иногда заметная «странная» мимика;
больше заточен под лица, чем под предметку.

Итог:
NeuroSphere можно попробовать для карточек, где человек держит товар, но как основной рабочий инструмент под товарную фотку он слаб.

Сравнение: модели и сервисы для генерации видео из фото

Модель / сервис	Что по длительности и качеству	Минусы / ограничения	Стоимость
Fabula AI (Kling 2.5 внутри)	8+ секунд, HD/FullHD, 3:4, MP4, авто-промт	Платный сервис, завязан на экосистему Fabula	от 2990₽/мес
Veo	~8 с, HD/FullHD	Дорогой, сложный доступ	от 20$/мес
Sora	Короткие ролики, HD	Бета, нет массового доступа	от 20$/мес
Kling	5–10 с, до FullHD, есть 3:4	В чистом виде неудобен без обвязки	от 7$/мес
Seedance 1.0	Короткие сцены, FullHD	Доступ через API	от 0,47$/генерация
Runway Gen-2	4 с + Extend до 10–15 с, HD+	Подписка, англ. интерфейс	от 12$/мес
Genmo AI	До ~6 с, 480–720p	Слабо под строгие требования маркетплейсов	от 10$/мес
Pika Labs	3–10 с, 720p–1080p	Нужен VPN, мало секунд бесплатно	от 24$/мес
Kandinsky 3.1	Несколько секунд, умеренное качество	Недостаточно стабилен под боевые видеообложки	0₽/мес
Шедеврум	2–3 с, фикс. формат	Низкое разрешение, очень коротко	0₽/мес
NeuroSphere	~5 с, вертикаль 9:16	Больше про портреты, чем про товар	от 890₽/мес
D-ID / HeyGen / Synthesia	До 10–30 мин, 1080p–4K	Не решают задачу предметной анимации	в зависимости от модели

Пошаговый чек-лист: создать видео по фото

Вариант 1. Через Fabula AI (путь «хочу результат без боли»)

Соберите инфографику в Fabula AI:
- выберите шаблон под нужный маркетплейс;
- расставьте выгоды, иконки, подписи;
- убедитесь, что товар читается.
Отправьте картинку в генерацию видеообложки:
- Fabula анализирует изображение;
- формирует промт под встроенный Kling 2.5 Turbo;
- запускает нейросеть для генерации видео из фото.
Получите готовую видеообложку:
- вертикальное 3:4;
- длительность и размер файла соответствуют требованиям;
- остаётся только загрузить видео в карточку на Ozon/WB/Я.Маркете.
Оплатите привычным способом:
- Fabula AI можно оплачивать из РФ, без танцев с иностранными картами.

Проверить, как видеообложка влияет на CTR

Возьмите любую свою карточку, сделайте к ней видео в Fabula AI и посмотрите, как изменится кликабельность и конверсия в заказ.

Протестировать на своём товаре

Вариант 2. Через отдельные сервисы (Runway, Kling как сервис и др.)

Подготовьте фото товара.
Зайдите в выбранный сервис (Runway / Pika / Genmo / «голый» Kling).
Напишите промт, подберите формат (9:16 или 3:4), длину ролика.
Перегенерируйте до приемлемого результата.
Скадрируйте под 3:4, проверьте размер файла и длительность.
Загрузите в карточку.

Оба пути рабочие, просто во втором вы берёте на себя всю «грязную» работу по промтам, форматам и монтажу.

FAQ

1. Можно ли оживить фото бесплатно и использовать это как видеообложку?

Можно воспользоваться режимами «оживить фото», «нейросеть оживить фото» или «оживить фото нейросеть бесплатно» в сервисах вроде «Шедеврум», Kandinsky, NeuroSphere. Но:

ролики обычно получаются 2–5 секунд;

разрешение невысокое;

анимация больше про лицо, чем про товар.

Для боевой карточки лучше использовать решения вроде Fabula AI (Kling внутри) или Runway, где изначально можно сгенерировать видео по фото в нужном формате.

2. Что лучше для карточки: анимация фото или полноценное видео из фото?

Лёгкая анимация фото и «ИИ анимация фото» — это когда чуть двигается фон, свет, мелкие детали. Это лучше, чем чистая статика, но:

мало показывает товар «в объёме»;

часто выглядит как эффект ради эффекта.

Полноценное видео из фото (облет камеры вокруг товара, смена ракурсов) работает лучше на CTR и доверие. Поэтому логика такая:
анимировать фото — промежуточный этап,
создать видео по фото нейросетью — финальный формат под маркетплейс.

3. Какая нейросеть для генерации видео из фото бесплатно подойдёт для старта?

Чтобы «пощупать» без бюджета:

Kandinsky 3.1 — позволяет создать видео по фото нейросеть бесплатно и писать промты по-русски;

Genmo AI — даёт много попыток и разные форматы, удобно проверять сценарии движения;

Шедеврум — быстро «оживляет» фото и вдохновляет примерами других.

Когда видите, что идея работает, логично перейти к более серьёзному решению — например, Fabula AI, где всё завязано на требования маркетплейсов.

4. Когда достаточно «нейросеть оживить фото», а когда нужно полноценное видео?

Если задача — эмоция (старое фото, семейный альбом, соцсети), хватает режима «нейросеть оживить фото»: лицо моргнуло, повернулось, улыбнулось.

Если цель — продажи на маркетплейсе:

нужен внятный показ товара;

нужно соблюсти формат видео для ВБ и формат видео для Озон;

нужно удержать внимание 8–15 секунд и донести выгоды.

Здесь выигрывает полноценная нейросеть для генерации видео по фото вроде Kling (через Fabula AI) или Runway, а не просто анимация лица.

5. Можно ли сгенерировать видео по фото бесплатно и сразу залить на Ozon/WB?

Технически — да, если сервис выдаёт нужное разрешение, длительность и формат. Практически:

бесплатные сервисы ограничены по длине и качеству;

часто ставят водяные знаки;

формат приходится подгонять вручную.

Рабочая стратегия:

На тестах — сгенерировать видео из фото бесплатно (Kandinsky, Genmo, «Шедеврум»), понять, заходит ли вообще идея живой карточки.

Для боевого варианта — использовать решение типа Fabula AI (с Kling внутри), где вы одновременно делаете инфографику и генерацию видеообложек под требования маркетплейсов.

New

Содержание:

Как видеообложка влияет на CTR

Требования к видеообложкам WB, Ozon и Яндекс.Маркет

Лучшая нейросеть для генерации видео из фото

Fabula AI

Сгенерировать видео по фото в Fabula AI

Передовые модели для видеогенерации

Veo 3.1 (Google DeepMind)

Sora 2 / Sora 2 Pro (OpenAI)

Sora (часто называют Sora 1)

Sora 2

Sora 2 Pro

Kling 2.5 Turbo (Kuaishou)

Seedance 1.0 (ByteDance)

Промежуточный вывод

Топ сервисов для генерации видео из фото

Runway Gen-2 (RunwayML)

Genmo AI

Pika Labs

Сервисы говорящих аватаров: D-ID, HeyGen, Synthesia

D-ID Creative Reality Studio

HeyGen

Synthesia

Российские сервисы для генерации видео

Kandinsky 3.1 (FusionBrain)

Шедеврум (Yandex)

NeuroSphere (оживление фото)

Сравнение: модели и сервисы для генерации видео из фото

Пошаговый чек-лист: создать видео по фото

Вариант 1. Через Fabula AI (путь «хочу результат без боли»)

Проверить, как видеообложка влияет на CTR

Вариант 2. Через отдельные сервисы (Runway, Kling как сервис и др.)

FAQ

1. Можно ли оживить фото бесплатно и использовать это как видеообложку?

2. Что лучше для карточки: анимация фото или полноценное видео из фото?

3. Какая нейросеть для генерации видео из фото бесплатно подойдёт для старта?

4. Когда достаточно «нейросеть оживить фото», а когда нужно полноценное видео?

5. Можно ли сгенерировать видео по фото бесплатно и сразу залить на Ozon/WB?