Купить крипто Рынки Спот ФьючерсыGOLD Сбережения Центр событий

Еще

Осенью я давал интервью для документального фильма Высшей школы экономики "После промпта". В сам фильм попал небольшой фрагмент, и я долго думал что делать с осОсенью я давал интервью для документального фильма Высшей школы экономики "После промпта". В сам фильм попал небольшой фрагмент, и я долго думал что делать с ос

Кейс: НейроДудь

Источник: ProBlockChain

2026/01/19 16:46

5м. чтение

Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

Осенью я давал интервью для документального фильма Высшей школы экономики "После промпта". В сам фильм попал небольшой фрагмент, и я долго думал что делать с остальным материалом. Так появился НейроДудь.

ВК версия

Если не считать монтажа самого интервью, работа над роликом заняла около трёх дней. Расскажу о ключевых этапах.

Визуал

Вначале нужно было сделать самого Дудя. Я сразу отказался от реалистичного варианта. Во-первых, это перебор, во-вторых, эффект зловещей долины был бы гораздо сильнее.

И это оказалось сложнее, чем я планировал. Потому что надо было решать сразу три задачи:

Дизайн локации должен хорошо монтироваться с основной сценой
Нужно было придумать дизайн самого робота
Робот должен быть похож на Дудя

Первые варианты выглядели как-то так:

Т-1000 был бы доволен

Для генерации я использовал Nano Banana Pro. Попробовал разные нейросетки, но остановился на ней, так как детали нужно было дорабатывать итерациями. На работу с деталями способен и ChatGPT, но результат получался хуже.

Однако, я использовал ChatGPT, чтобы дорабатывать промт для Nano Banana. Без этого у меня получался то лысый краш-тестер:

То наш с Дудём внебрачный сын с голым животом и коленками:

Который в какой-то момент решил ещё и раздеться:

Чем-то неуловимо похож на лысого из Бразерс

Спустя сутки мучений появился вариант, который меня более-менее устроил:

Осталось доработать окружение, цветокоррекцию и добавить привычную одежду:

Ещё я пытался сделать ему фирменные скрещенные ноги, но после нескольких часов попыток, решил, что лучшее - враг хорошего, и такой Дудь нам не нужен:

Нейросеть решила, что для этой позы нужно поменять и стул

Следующим бастином было лицо. Мне не нравился текущий дизайн и я пустился в эксперименты:

Весь спектр эмоций Дудя

Вот этот вариант мне нравился фирменной ухмылкой:

Кейс: НейроДудь

Но почему я от него отказался вы поймёте, когда дойдём до анимации. В конечном итоге, в финальный ролик попала доработанная версия одного из первых вариантов:

Кейс: НейроДудь

Достаточно похож, достаточно отличается, выглядит как следователь на допросе. В общем, то что нужно, чтобы пугать детей.

Синтез голоса

Этот этап был одновременно сложным и простым.

Простым, потому что Elevenlabs позволяет быстро и достаточно точно синтезировать голос. Но чтобы получился хороший результат, нужно собрать хороший референс - исходник реальной речи говорящего, и вот в этом была сложность.

Мне пришлось отсмотреть 4-часовое интервью Дудя и вырезать все моменты, где говорит он. Причём нужны были моменты, где он что-то спрашивает, у него тогда появляются характерные интонации.

И боже, как я устал. Классно его слушать фоном, когда чем-то занимаешься, но когда ты вынужден прям смотреть и искать моменты именно с Юрой, и смотреть прям на Юру - это отдельный вид пытки.

*звуки страданий

Вам наверняка интересно, сколько минут говорит сам Дудь в своих интервью. И вот вам бессмысленный факт, о котором никто не просил. Юра говорит примерно 40 минут в интервью, которое длится 4 часа. Не благодарите.

Анимация

И вот мы подошли к самому интересному. Чтобы сделать анимацию с липсинком, есть два подхода: простой и сложный.

Сложный выглядит так: вы берёте Runway и выбираете там режим "Act-Two". Дальше нужно снять себя на камеру в нужном ракурсе, сделать вид, что вы Юра Дудь, который задаёт вопросы. Дальше в Premiere подставить вместо своего голоса, голос Дудя, так чтобы он совпадал с губами. И скормить это видео Runway вместе с референсной картинкой, которую мы подготовили на предыдущем шаге.

Тогда генерация была бы классной, НейроДудь активно бы двигался, а его губы хорошо попадали в текст. Но я понял, что так заморачиваться не готов. Сразу было понятно, что этот ролик на грани корректности.

Сомнительная история, с точки зрения авторских прав, да и сам Ютуб легко бы мог его снести по просьбе Юры. (Юра, пожалуйста не кидай страйк). Прикольный эксперимент, но на постоянной основе точно так делать не стоит.

Поэтому я решил пойти по простому пути. Для этого есть сервис HeyGen. Он позволяет загрузить картинку и речь, чтобы получить видео, где нейросеть очень старается сделать липсинк. И даже пробует немного шевелить персонажа. В большинстве говорящих ИИ-картинках вы видите результат работы именно этого сервиса.

Но с ним тоже пришлось помучаться. Помните улыбающегося Дудя? Вот причина, по которой я отказался от этого дизайна:

В процессе анимации это стал кто угодно, но только не Дудь. Нейросеть воспринимает улыбку, как базовые черты лица и из-за этого анимация становится странной. К тому же по голосу слышно, что человек не улыбается.

Но и с более строгим дизайном пришлось намучаться. Чаще всего проблема была в том, что нейросеть слишком сильно растягивала рот на акцентных моментах. Да и липсинк пока далёк от идеала.

Один раз НейроДудь даже впал в экзистенциальный кризис:

Чуть проще было генерить вставки с реакциями Дудя. Делал я их с помощью нейросетей "Kling O1" и "Seedance 1.5" на платформе Кrea. Например тут пытался воссоздать фирменный возмущённый взгляд в камеру:

В конечном итоге, НейроДудь получился хоть и криповым, но всё равно достаточно залипательным.

Кроме Дудя я сделал круглого робота, который влетает в кадр со мной. Он нужен, чтобы чуть удержать внимание зрителя вначале ролика, пока они привыкают к говорящему.

Визуал робота генерировал в Reve - это мой основной инструмент для создания отдельных объектов. Анимацию делал с помощью "Seedance 1.5" на платформе Кrea. В сцену добавил с помощью After Effects.

Оформление

Интервью Дудя сложно представить, без его фирменной отбивки. Только нужно было поменять музыку, чтобы ютуб автоматически не жаловался на авторские права.

Новый логотип сгенерировал с помощью той же Nano Banana, а ремикс на джингл в Stable Audio - это такая Suno курильщика. Пробовал вначале Suno, но сходу не получилось, а Stable сделал с первой попытки то, что нужно. Но за чем-то сложнее туда ходить точно не надо.

Итог

1. Это было весело.
2. Вся работа заняла примерно 3 дня
3. Если прикинуть общую подписку на сервисы и покупку токенов, то получится в районе $150

После интервью для Вышки я сел писать большую серию статей, где детальнее рассказал свой взгляд на будущее, а этот ролик стал классным дополнением.

Судя по коментам на ютубе, людям тоже зашло.

ВК версия

Спасибо, что прочитали, накидайте вопросов в комментариях

Источник

Не пропустите U-Фест с 200 000$

Получите mystery box, 12% APR и подарки на 200$!

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Новости 24/7 в прямом эфире

Еще

Памятник создателю биткоина Сатоши Накамото открыт в Эль-Зонте, Сальвадор, подчёркивая культурное значение биткоина.

Автор: Vivek Sen08:44

Сегодня через Ормузский пролив не прошёл ни один нефтяной танкер, что ознаменовало его первую в истории полную блокировку.

Автор: Rockerfeller04:32

OpenClaw интегрируется с Solana и агентскими кошельками, демонстрируя потенциальное сотрудничество внутри экосистемы и технологическую синергию.

Автор: fxnction04:16

Выкуп и сжигание токенов $HYPE на сумму $1,1M, удалено около 26 500 токенов из обращения, что влияет на динамику предложения.

Автор: ryandcrypto03:59

TVL AAVE снизился на 25% после эксплойта KelpDAO.

Автор: TylerD 🧙‍♂️01:13

Быстрое чтение

Еще

Цены на криптовалюту

Биткоин

BTC

$74,477.26

$74,477.26$74,477.26

-1.80%

Эфириум

ETH

$2,287.99

$2,287.99$2,287.99

-1.84%

Солана

SOL

$84.38

$84.38$84.38

-2.31%

Рипл

XRP

$1.4099

$1.4099$1.4099

-1.46%

USDCoin

USDC

$0.9995

$0.9995$0.9995

+0.01%

Генезис USD1: 0% + 12% APR

Новые пользователи: Стейкайте и получите до 600% APR

Кейс: НейроДудь

Визуал

Синтез голоса

Анимация

Оформление

Итог

Вам также может быть интересно

XRP на Solana под угрозой? Новое предупреждение вызывает опасения по поводу безопасности

США захватили иранское грузовое судно, поскольку Тегеран отклонил второй раунд мирных переговоров

Цена Биткоина резко падает: BTC опускается ниже критического уровня поддержки $74 000

Популярные новости

Цена Solana (SOL) снизилась, но сеть опережает конкурентов — вот почему

WOJAK вырос на 187% за 24 часа: анализ возрождения мем-коина

AlphaPepe признан лучшим криптопресейлом на фоне переговоров о листинге на Binance, опережая Solana и Cardano с потенциалом x100

Asteroid Shiba вырос на 20,5%, объем торгов приближается к рыночной капитализации на уровне $116 млн в день

Экзистенциальные вопросы OpenAI: Стратегические приобретения раскрывают более глубокие бизнес-проблемы и проблемы общественного восприятия

Новости 24/7 в прямом эфире

Быстрое чтение

Прогноз цены BEEG на 2026 год: насколько высоко может подняться синий кит в этом году?

BEEG Снижение на 98% по сравнению с ATH - умная ловушка для покупки или стоимости? 2026 Глубокое погружение

Вы пропустили БИГ? Есть ли еще время войти в 2026 году?

BEEG в 2026 году: скрытая 10-кратная возможность или ралли уже исчезает?

BEEG Blue Whale (BEEG) Review 2026: рациональная система принятия решений перед покупкой

Цены на криптовалюту