Рынок уходит от статики. Если ещё пару лет назад хватало одной симпатичной инфографики, сегодня в выдаче всё чаще мелькает видеообложка для маркетплейса: товар крутится, подсвечиваются выгоды, показывается использование.
Что это даёт:
- по кейсам маркетплейсов и агентств видеообложки почти всегда дают рост CTR относительно статики;
- в конкурентных нишах (одежда, бьюти, электроника) рост CTR по видеообложкам часто двузначный;
- видео помогает выделиться там, где все уже умеют делать «красивые слайды».
И самое важное: чтобы сгенерировать видео из фото, уже не нужен продакшен. Сейчас можно:
- собрать карточку в сервисе типа Fabula AI;
- и тут же, на основе этой же картинки, сгенерировать видео по фото → получить готовую видеообложку для Ozon, WB или Яндекс.Маркета.
Раньше «поиграть с ИИ» означало просто оживить фото или сделать лёгкую анимацию фото ради эффекта. Сейчас задача прагматичная: выжать максимум CTR и конверсии с карточки.
Содержание:
- Как видеообложка влияет на CTR
- Требования к видеообложкам WB, Ozon и Яндекс.Маркет
- Лучшая нейросеть для генерации видео из фото
- Лучшие модели для видеогенерации: Veo, Sora 2, Kling и др.
- Топ сервисов для генерации видео из фото
- Сервисы говорящих аватаров: D-ID, HeyGen, Synthesia
- Российские сервисы для генерации видео
- Сравнение: модели и сервисы для генерации видео из фото
- Пошаговый чек-лист: создать видео по фото
Как видеообложка влияет на CTR
Когда мы говорим «видео для маркетплейсов», важен не только факт наличия ролика, но и то, как он сделан:
- понятен ли товар и его ключевые выгоды;
- читается ли бренд;
- не ломается ли геометрия (ручки, крышки, упаковка).
По наблюдениям агентств и продавцов видео для карточки товара:
- сильнее цепляет взгляд в выдаче: движение выигрывает против сотен статичных миниатюр.
- лучше показывает объём: размер, фактуру, применение товара.
- помогает быстрее считать ценность: покупатель видит не только «красивую картинку», а живой сценарий использования.
Когда конкуренты упираются только в графику, генерация видеообложек становится уже не «игрушкой», а конкретным инструментом роста CTR.
Требования к видеообложкам WB, Ozon и Яндекс.Маркет
Чтобы не делать видео «вслепую», соберём базовые требования площадок.
Параметры видеообложки:
| Параметр | Ozon | Wildberries | Яндекс.Маркет |
|---|---|---|---|
| Формат файла | MP4, MOV | MP4, MOV | MP4, MOV |
| Разрешение видео | от 1080 до 1920 px | от 720 до 1920 px | от 1080 до 1920 px |
| Размер файла | ≤ 20 МБ | ≤ 50 МБ | ≤ 100 МБ |
| Длительность | от 8 до 30 секунд | до 3 минут | до 20 минут |
| Соотношение сторон | вертикальное 3:4 | вертикальное 3:4 | явно не пишут, но можно — 3:4 |
Для нас критично:
- вертикальное 3:4 — не 9:16, не квадрат;
- хотя бы 8 секунд под Ozon (WB/Маркет проще по длительности);
- HD или FullHD (1080p) — особенно если целимся в Ozon/Маркет;
- разумный размер файла (20–50 МБ почти любые нейросети выдержат, если не просить у них минутное 4K).
Дальше будем смотреть на модели и сервисы через эту призму.
Лучшая нейросеть для генерации видео из фото
Fabula AI
Fabula AI — это сервис для создания инфографики для карточек товаров на маркетплейсах, внутри которого:
- вы собираете инфографику под Ozon/WB/Я.Маркет;
- и сразу же анимируете её в видеообложку.
Что происходит под капотом:
- в Fabula AI встроен Kling 2.5 Turbo — одна из самых сильных моделей «оживления» картинок;
- Fabula сама анализирует картинку и с помощью языковой модели придумывает промт для создания видео;
- вам не нужно разбираться, как правильно просить нейросеть: достаточно отправить картинку, дальше сервис сделает всё сам.
Почему это удобно именно для маркетплейсов:
- выходное видео заранее подогнано под требования Ozon, WB и Я.Маркет:
- вертикальное 3:4;
- длительность от 8 секунд (под Ozon);
- HD/FullHD разрешение;
- формат MP4, адекватный размер файла;
- вам не нужно отдельно думать про формат видео для ВБ, формат видео для Озон — Fabula занимается этим в фоне.
Плюс важная деталь для российских селлеров:
- Fabula можно оплачивать из России — без плясок с иностранными картами и блокировками.
По сути это решение «одним окном»:
- Вы собираете инфографику для карточки товара (шаблоны, шрифты, сетки уже заточены под маркетплейсы).
- Одной кнопкой превращаете её в видеообложку для маркетплейса — без промт-инженерии, монтажа и ручной подгонки форматов.
Примеры видеообложек:
Терка

Лежанка для котов

Наушники

Мужской парфюм

Итог:
Если вам не хочется разбираться в Kling, форматах и текстах для нейросетей, Fabula AI закрывает всё разом: карточка, видеообложка, соответствие требованиям маркетплейсов и удобная оплата из России.
Сгенерировать видео по фото в Fabula AI
Соберите инфографику под Ozon, WB или Я.Маркет — сервис сам сделает из неё видеообложку нужного формата и длительности.
Передовые модели для видеогенерации
Veo 3.1 (Google DeepMind)
Что умеет:
- форматы: 16:9 и 9:16 нативно;
- длительность: ~8 секунд за одну генерацию, длиннее — только склеиванием сцен;
- качество: 720p или 1080p при 24 fps, очень реалистичный свет, движения и физика;
- режим работы: умеет и видео по тексту, и «оживление» загруженного кадра;
- доступ: через Google AI, доступ ограничен по странам.
Минусы:
- Потребуется VPN и подключение к региону США
- Иностранная карта
- Свежий Google аккаунт, который ранее не использовался
Пример видео:

Итог:
Качество — космос, но это история про платформы и крупные команды. Как «зашёл сам, нажал пару кнопок и сделал видеообложку для маркетплейса» — пока нет.
Sora 2 / Sora 2 Pro (OpenAI)
Sora (часто называют Sora 1)
Первая версия модели и веб-редактор видео
- Параметры: до ~20 секунд, до 1080p, разные соотношения сторон (9:16, 16:9, 1:1). Но нет 3:4.
- Доступ: Для России потребуется VPN и подписка ChatGPT Plus/Pro.
- Оплата: отдельной цены у модели нет — она входит в подписку ChatGPT Plus/Pro.
Пример видео модели Sora:

Sora 2
Новая флагманская модель видео+аудио: более реалистичная физика, лучшее следование инструкциям, синхронный звук/речь.
- Каналы:
- Приложение Sora (iOS + Android) — TikTok-подобное соц-приложение.
- Веб (sora.com) — более продвинутый редактор.
- Sora Video API (model sora-2) для разработчиков.
- Где работает сейчас:
- Официально только в: США, Канада, Япония, Корея, Вьетнам, Таиланд, Тайвань
- В ЕС (в т.ч. Нидерланды), России Sora 2 пока недоступен официально.
Sora 2 Pro
Sora 2 Pro — максимум качества, сложные сцены, больше вычислений, рендер дольше.
- Где работает сейчас:
- Sora Video API (sora-2-pro) с повышенной ценой.
- Постепенно включается для ChatGPT Pro и некоторых пользователей Sora 2 (например, режимы High quality).
Итог:
Sora — очень мощная штука, которая умеет и говорить по-русски, и понимать русские описания. Но доступ нестабилен, формата 3:4 нет (нужно кадрировать), и это всё ещё не тот инструмент, куда селлер просто заходит и стабильно делает себе видеообложки.
Kling 2.5 Turbo (Kuaishou)
Что умеет:
- форматы: 16:9, 9:16, 1:1, 4:3 и 3:4 — для нас это критично;
- длительность: 5 или 10 секунд за генерацию, сцены можно соединять в более длинное видео;
- разрешение: до 1080p при 24 fps;
- режим работы: сильный упор на «оживление» загруженного фото, хорошо держит лица и объекты;
- доступ: веб-сайт Kling AI, нет бесплатного доступа.
Пример видео:

Итог:
Kling — один из самых интересных кандидатов для видеообложек: есть 3:4, хорошая стабильность, нормальное качество. Минусы — английский/китайский интерфейс и слабый звук, но для «немых» видеообложек это не критично. В чистом виде модель не супер-удобна для массового селлера, зато отлично работает как двигатель внутри готового сервиса — именно так Kling встроен в Fabula AI.
Seedance 1.0 (ByteDance)
Что умеет:
- форматы: 16:9, 9:16, 1:1, 4:3, 3:4, 21:9;
- длительность: 5–10 секунд на сцену, до ~12 секунд за один запрос; можно собирать мульти-сюжетные ролики;
- разрешение: до FullHD;
- режим работы: одна модель и для видео по тексту, и для видео по загруженному фото; акцент на кинематографичных сюжетах и плавном движении;
- доступ: через партнёров или корпоративный API.
Пример видео:

Итог:
Seedance идеально подходит под видеообложки по возможностям, но сфокусирован на студиях и платформах. Для одиночного продавца это скорее двигатель внутри чужого сервиса, чем инструмент «в пару кликов».
Промежуточный вывод
Напрямую Veo, Sora, Seedance и «голый» Kling — это скорее про платформы и крупные стеки. Селлеру удобнее, когда такие модели уже упакованы в готовый сервис, где:
- есть русский интерфейс;
- не надо думать о форматах Ozon/WB/Маркет;
- можно платить из России.
Топ сервисов для генерации видео из фото
Если смотреть на задачу глазами селлера, первым номером в этом списке будет Fabula AI: внутри уже встроен Kling 2.5 Turbo, форматы и длительность подогнаны под требования маркетплейсов, а оплату можно провести из России. Ниже — массовые международные сервисы, которые можно использовать как альтернативу или «песочницу» для экспериментов.
Runway Gen-2 (RunwayML)
Что умеет:
- форматы: из коробки 16:9, но есть поддержка 9:16, 1:1, 4:3 и 3:4 через настройки и кадрирование;
- длительность: базовый клип 4 секунды, с функцией Extend можно нарастить до ~15–18 секунд;
- разрешение: стандартно 1280×720, на платных планах есть более высокие варианты и апскейл вплоть до 4K;
- режим работы: умеет генерировать видео и по тексту, и по загруженному кадру (image-to-video) — второй вариант даёт больше контроля;
- доступ: обычный SaaS-сервис, есть бесплатные кредиты и платные тарифы.
Минусы: английский интерфейс, промты лучше писать по-английски, бесплатная версия с водяным знаком.
Итог:
Runway — один из самых жизнеспособных вариантов «в лоб»: привычная регистрация, понятный веб-интерфейс, нормальное качество. Можно сделать короткий ролик из фото товара и растянуть его дозированно до 8–12 секунд.
Genmo AI
Что умеет:
- работает в браузере, позволяет сгенерировать видео онлайн по фото или тексту;
- поддерживает разные форматы: 16:9, 1:1, 3:4, 2:3, 4:3 и другие;
- в бесплатной версии делает ролики до ~6 секунд;
- выдаёт разрешение на уровне 480–720p;
- щедрый бесплатный лимит — примерно до сотни коротких роликов в день, платный тариф расширяет пределы.
Плюсы:
- много бесплатных попыток;
- можно руками настраивать «камеру» и характер движения;
- удобно сгенерировать видео из фото бесплатно, чтобы понять, как может «ожить» карточка.
Минусы:
- нет стабильного FullHD;
- интерфейс и модель ориентированы на английский;
- пост-монтажа почти нет, всё придётся дорабатывать отдельно.
Итог:
Genmo хорошо подходит как песочница: протестировать идеи, стили, сценарии анимации. Под строгие требования Ozon/WB по длине и качеству — слабоват как финальный инструмент.
Pika Labs
Что умеет:
- позволяет сгенерировать видео по фото или по тексту;
- поддерживает форматы 16:9, 9:16, 1:1, 5:2, 4:5, 4:3;
- в бесплатной версии делает ролики примерно по 3 секунды, на платном тарифе — до ~10 секунд;
- выдаёт 720p с водяным знаком бесплатно и до 1080p без логотипа на платном;
- есть настройки движения, частоты кадров и даже генерации звука.
Плюсы:
- для своих размеров клипы выглядят довольно эффектно;
- можно оживлять загруженные фото и играться с движением.
Минусы:
- в бесплатной версии слишком короткие ролики для видеообложки;
- нормальная длина только на платном плане;
- нужен VPN и терпимость к англоязычному интерфейсу.
Итог:
На платном тарифе Pika можно использовать для видеообложек: сгенерировали 9:16 или 4:3, в монтажке обрезали под 3:4 — и получили 8–10 секунд. Главное — быть готовым к VPN и небольшому количеству ручной работы.
Сервисы говорящих аватаров: D-ID, HeyGen, Synthesia
Эти сервисы не столько анимируют фото товара, сколько делают виртуального ведущего, который говорит на камеру. Полезно, когда нужно быстро собрать обучающее или приветственное видео.
D-ID Creative Reality Studio
Что умеет:
- делает реалистичных говорящих аватаров по фото;
- поддерживает форматы 16:9, 1:1 и 9:16;
- длительность до 15 минут;
- разрешение до 1080p;
- поддерживает десятки языков, включая русский.
Итог:
Отлично подходит, чтобы записать обращение, инструкцию, презентацию. Для видеообложки конкретного товара — слаб: это «говорящая голова» на фоне, а не анимация самой карточки.
HeyGen
Что умеет:
- большой выбор готовых аватаров и голосов;
- поддержка 16:9 и 9:16;
- ролики до десятков минут;
- разрешение от 720p до 4K.
Итог:
Классный инструмент для маркетинговых и обучающих видео с диктором. Для «немой» динамичной видеообложки товара — не то, что нужно.
Synthesia
Что умеет:
- делает ролики с виртуальными ведущими для обучения и презентаций;
- поддерживает 16:9, 9:16, 1:1 и другие форматы;
- длительность до 10 минут на ролик (на стартовом плане);
- выдаёт 1080p.
Итог:
Идеален для корпоративных обучающих видео. Как инструмент для видеообложки для маркетплейса с крутящимся товаром — совсем не про это.
Российские сервисы для генерации видео
Kandinsky 3.1 (FusionBrain)
Что умеет:
- делает как картинки, так и короткие видео по тексту и по загруженному изображению;
- поддерживает форматы 16:9, 9:16 и 1:1;
- умеет создать видео по фото нейросеть с русскими промтами;
- ролики получаются длиной до ~10 секунд, на практике чаще 3–5 секунд;
- работает бесплатно через Сбер ID, без VPN.
Плюсы:
- полностью русскоязычный интерфейс;
- можно детально прописывать, как должна двигаться сцена;
- отлично подходит, чтобы создать видео по фото нейросеть бесплатно и быстро показать идею команде.
Минусы:
- генерация нестабильна, иногда приходится несколько раз перегенерировать;
- разрешение и качество ниже, чем у топ-сервисов;
- чаще получается просто «слегка подвижная картинка», а не полноценная сцена.
Итог:
Kandinsky — отличный способ прототипировать идею «живой карточки» без вложений. Но под боевые видеообложки Ozon/Маркет/Я.Маркет его качества обычно недостаточно.
Шедеврум (Yandex)
Что умеет:
- оживляет фото в фиксированном формате 4:3;
- делает очень короткие анимации по 2–3 секунды;
- работает только из мобильного приложения;
- доступен бесплатно по Яндекс ID.
Плюсы:
- максимально простой вход: зашёл, загрузил фото, получил «живую» картинку;
- внутри есть что-то вроде «соцсети» с чужими примерами, можно вдохновляться.
Минусы:
- только смартфон;
- фиксированный формат и невысокое разрешение;
- ролики слишком короткие и простые.
Итог:
«Шедеврум» — отличный инструмент «поиграться» и оживить фото, но не рабочий вариант под требования маркетплейсов к видеообложкам.
NeuroSphere (оживление фото)
Что умеет:
- умеет оживить фото, особенно портреты и старые фотографии;
- по умолчанию делает вертикальные ролики 9:16, формат можно менять;
- длительность около 5 секунд;
- улучшает, восстанавливает и анимирует лица;
- даёт несколько бесплатных токенов, дальше — оплата.
Плюсы:
- объединяет улучшение и анимацию фото в одном месте;
- хорошо добавляет мимику и движение к фронтальным портретам.
Минусы:
- строгие лимиты бесплатных генераций;
- иногда заметная «странная» мимика;
- больше заточен под лица, чем под предметку.
Итог:
NeuroSphere можно попробовать для карточек, где человек держит товар, но как основной рабочий инструмент под товарную фотку он слаб.
Сравнение: модели и сервисы для генерации видео из фото
| Модель / сервис | Что по длительности и качеству | Минусы / ограничения | Стоимость |
|---|---|---|---|
| Fabula AI (Kling 2.5 внутри) | 8+ секунд, HD/FullHD, 3:4, MP4, авто-промт | Платный сервис, завязан на экосистему Fabula | от 2990₽/мес |
| Veo | ~8 с, HD/FullHD | Дорогой, сложный доступ | от 20$/мес |
| Sora | Короткие ролики, HD | Бета, нет массового доступа | от 20$/мес |
| Kling | 5–10 с, до FullHD, есть 3:4 | В чистом виде неудобен без обвязки | от 7$/мес |
| Seedance 1.0 | Короткие сцены, FullHD | Доступ через API | от 0,47$/генерация |
| Runway Gen-2 | 4 с + Extend до 10–15 с, HD+ | Подписка, англ. интерфейс | от 12$/мес |
| Genmo AI | До ~6 с, 480–720p | Слабо под строгие требования маркетплейсов | от 10$/мес |
| Pika Labs | 3–10 с, 720p–1080p | Нужен VPN, мало секунд бесплатно | от 24$/мес |
| Kandinsky 3.1 | Несколько секунд, умеренное качество | Недостаточно стабилен под боевые видеообложки | 0₽/мес |
| Шедеврум | 2–3 с, фикс. формат | Низкое разрешение, очень коротко | 0₽/мес |
| NeuroSphere | ~5 с, вертикаль 9:16 | Больше про портреты, чем про товар | от 890₽/мес |
| D-ID / HeyGen / Synthesia | До 10–30 мин, 1080p–4K | Не решают задачу предметной анимации | в зависимости от модели |
Пошаговый чек-лист: создать видео по фото
Вариант 1. Через Fabula AI (путь «хочу результат без боли»)
- Соберите инфографику в Fabula AI:
- выберите шаблон под нужный маркетплейс;
- расставьте выгоды, иконки, подписи;
- убедитесь, что товар читается.
- Отправьте картинку в генерацию видеообложки:
- Fabula анализирует изображение;
- формирует промт под встроенный Kling 2.5 Turbo;
- запускает нейросеть для генерации видео из фото.
- Получите готовую видеообложку:
- вертикальное 3:4;
- длительность и размер файла соответствуют требованиям;
- остаётся только загрузить видео в карточку на Ozon/WB/Я.Маркете.
- Оплатите привычным способом:
- Fabula AI можно оплачивать из РФ, без танцев с иностранными картами.
Проверить, как видеообложка влияет на CTR
Возьмите любую свою карточку, сделайте к ней видео в Fabula AI и посмотрите, как изменится кликабельность и конверсия в заказ.
Вариант 2. Через отдельные сервисы (Runway, Kling как сервис и др.)
- Подготовьте фото товара.
- Зайдите в выбранный сервис (Runway / Pika / Genmo / «голый» Kling).
- Напишите промт, подберите формат (9:16 или 3:4), длину ролика.
- Перегенерируйте до приемлемого результата.
- Скадрируйте под 3:4, проверьте размер файла и длительность.
- Загрузите в карточку.
Оба пути рабочие, просто во втором вы берёте на себя всю «грязную» работу по промтам, форматам и монтажу.
FAQ
1. Можно ли оживить фото бесплатно и использовать это как видеообложку?
Можно воспользоваться режимами «оживить фото», «нейросеть оживить фото» или «оживить фото нейросеть бесплатно» в сервисах вроде «Шедеврум», Kandinsky, NeuroSphere. Но:
- ролики обычно получаются 2–5 секунд;
- разрешение невысокое;
- анимация больше про лицо, чем про товар.
Для боевой карточки лучше использовать решения вроде Fabula AI (Kling внутри) или Runway, где изначально можно сгенерировать видео по фото в нужном формате.
2. Что лучше для карточки: анимация фото или полноценное видео из фото?
Лёгкая анимация фото и «ИИ анимация фото» — это когда чуть двигается фон, свет, мелкие детали. Это лучше, чем чистая статика, но:
- мало показывает товар «в объёме»;
- часто выглядит как эффект ради эффекта.
Полноценное видео из фото (облет камеры вокруг товара, смена ракурсов) работает лучше на CTR и доверие. Поэтому логика такая:
анимировать фото — промежуточный этап,
создать видео по фото нейросетью — финальный формат под маркетплейс.3. Какая нейросеть для генерации видео из фото бесплатно подойдёт для старта?
Чтобы «пощупать» без бюджета:
- Kandinsky 3.1 — позволяет создать видео по фото нейросеть бесплатно и писать промты по-русски;
- Genmo AI — даёт много попыток и разные форматы, удобно проверять сценарии движения;
- Шедеврум — быстро «оживляет» фото и вдохновляет примерами других.
Когда видите, что идея работает, логично перейти к более серьёзному решению — например, Fabula AI, где всё завязано на требования маркетплейсов.
4. Когда достаточно «нейросеть оживить фото», а когда нужно полноценное видео?
Если задача — эмоция (старое фото, семейный альбом, соцсети), хватает режима «нейросеть оживить фото»: лицо моргнуло, повернулось, улыбнулось.
Если цель — продажи на маркетплейсе:
- нужен внятный показ товара;
- нужно соблюсти формат видео для ВБ и формат видео для Озон;
- нужно удержать внимание 8–15 секунд и донести выгоды.
Здесь выигрывает полноценная нейросеть для генерации видео по фото вроде Kling (через Fabula AI) или Runway, а не просто анимация лица.
5. Можно ли сгенерировать видео по фото бесплатно и сразу залить на Ozon/WB?
Технически — да, если сервис выдаёт нужное разрешение, длительность и формат. Практически:
- бесплатные сервисы ограничены по длине и качеству;
- часто ставят водяные знаки;
- формат приходится подгонять вручную.
Рабочая стратегия:
- На тестах — сгенерировать видео из фото бесплатно (Kandinsky, Genmo, «Шедеврум»), понять, заходит ли вообще идея живой карточки.
- Для боевого варианта — использовать решение типа Fabula AI (с Kling внутри), где вы одновременно делаете инфографику и генерацию видеообложек под требования маркетплейсов.
