Хороший звук в видео: общие принципы и конкретные рекомендации

Хороший звук в видео: общие принципы и конкретные рекомендации

Хороший звук с минимальными затратами – трудная задача, которая потребует много времени, желания, внимания к деталям и банальной усидчивости. Но результат всегда себя оправдывает.
В этой статье мы расскажем о том, как с низким бюджетом и в доступных всем условиях сделать звук, который как минимум не будет раздражать зрителя, а как максимум – улучшит впечатление от просмотра. Попутно постараемся развеять миф о необходимости дорогого оборудования и сложного реквизита для записи голоса и Foley, отточенных до совершенства навыков шумового оформителя и дорогого пост-продакшна в условиях, когда нет задачи получить быстрый результат и есть возможность самостоятельно окунуться в процесс. Со временем описанные в статье моменты войдут в привычку, а набор инструментов начнет сам собой пополняться и решение этой задачи перестанет быть таким трудным, как если начинать с нуля.
Качественный звук в визуальном произведении уже не воспринимается как диковинка и что-то необычное, присущее только проектам с большим бюджетом. Даже от простого любительского ролика сегодняшняя аудитория требует внятного и качественного звучания, без которого впечатление от просмотра может резко испортится: о степени влияния звука на картинку уже было сказано достаточно и с этим трудно не согласиться. Возникает вопрос: как же улучшить звук в видео, если речь идет о любительской записи? О снятом на простое оборудование дне рождения, детском утреннике или короткометражном фильме для дипломной работы в институте, где вливание денег не предполагается, но на создание хорошего звука есть время и желание.
Из чего складывается впечатление о звуке
Углубляясь в историю аудиовизуальных произведений, можно вспомнить массу примеров отличного звука в кино 60-80-х годов, когда характеристики оборудования были далеки от сегодняшних и никаких серьезных по нынешним меркам обработок нельзя было и представить. Микрофоны шумели, физические носители информации деградировали от малейшего воздействия, а артефакты записи нельзя было почистить в iZotope RX. Тем не менее, существуют такие примеры, как Стэнли Кубрик и шумовое оформление фильмов его производства и множество других, не менее креативных и талантливых по своему звучанию, продуктов тех лет.
Глядя на такие примеры, становится очевидно, что звук – не такая уж эфемерная, неощутимая и невероятно сложная материя, какой её пытаются преподнести некоторые источники. Достаточно соблюсти простые рекомендации и подойти к делу креативно, чтобы получить хороший результат.
Вот чеклист, которого следует придерживаться при оценке звука в видео:
Реверберация
Когда в обычном необработанном помещении появляется звук, он неизбежно отражается от стен и других поверхностей, образуя набор ранних и поздних отражений. Многократно отраженные звуковые волны пересекаются между собой, складываются в разной фазе и смешиваются с первоначальным источником.

Так появляется то, что мы привыкли называть реверберацией или эхо
Вот три звуковых фрагмента с разным характером и степенью реверберации, которые подходят для одних случаев и совершенно недопустимы для других:

Первый фрагмент – классический пример плохой записи голоса для видео. Такой звук может раздражать зрителя, потому что речь трудно разобрать из-за эхо. Нужно избегать подобного звучания, а если проблема обнаружилась уже после записи – пытаться справиться с ней на этапе пост-продакшна.
Второй фрагмент – полное отсутствие объема. Это приятно слушается в подкастах и аудиокнигах, но странно звучит, когда в кадре находится большая комната с бетонными стенами, а речь сухая и находится близко. Часто дикторский голосупаковывают именно в такой объем, точнее, в его отсутствие. Обусловлено это не художественной задачей, а самой что ни на есть технической: сухой звук лучше воспроизводится на плохих акустических системах, таких как динамики телефона, телевизора или радио.
Третий фрагмент – имитация объема жилой комнаты, сделанная на пост-продакшне. Такой вариант хорошо подойдет в ситуации, когда в кадре говорит человек, но родная реверберации комнаты звучит плохо и слишком сильно портит звук, перекрывает собой речь. Чтобы реализовать такой способ, нужно иметь сухую запись голоса, снятую петличным микрофоном, либо переозвучить человека его же голосом в более подходящих акустических условиях с последующим lip sync.

Реверберацию не нужно воспринимать как абсолютное зло и стремиться убрать её полностью. Часто иметь некоторый объем в звуке полезно, например, когда нужно передать атмосферу большого зала с керамическими стенами, открытого пространства, маленькой жилой комнатушки или решить другую художественную задачу. Правильная реверберация способна усилить ощущение присутствия и создать более реалистичную звуковую картину.
О том, как убрать реверберацию из голоса или заменить её на другую, в следующих разделах этой статьи.
Фоновый шум/эмбиент/атмосфера
Даже абсолютно пустая и тихая комната имеет свой звук, который из-за особенностей психоакустики не удается услышать на локации, но легко заметить в получившейся аудиозаписи.
Часто можно наблюдать, как в видеороликах и даже некоторых фильмах с хорошей картинкой и серьезной подготовкой по другим фронтам упускается этот важный момент – сохранение шумового окружения. Вот два примера разного подхода к записи атмосфер:

Легко понять, какой из двух фрагментов звучит приятнее и реалистичнее. Конечно, далеко не во всех случаях требуется приблизить визуальный продукт к реальности, но сделать так, чтобы картинка не конфликтовала со звуком – задача базовая и необходимая. Если в кадре находится оживленный лес, в котором кроны деревьев качаются от ветра и в них изредка проскакиваются птицы, хочется слышать именно это, а не один только голос диктора и напрочь заглушенное окружение.

Почти всегда записать качественный эмбиенс на той же площадке, где происходит действие, не получается. В таком случае лучше подмешать его уже после записи и выполнить базовое сведение с голосом. Атмосферу для подмешивания можно записать заранее, до того, как на площадке начались какие-либо действия, или же найти подходящую в специальных библиотеках, использовать похожую из собственной коллекции.
Детали
Шумовая озвучка видео, она же foley-оформление, строится на обыгрывании каждой детали кадра, которая хотя бы в теории может звучать, и построении правильного звукового полотна из них.
Малозаметные звуки шуршащей одежды, дыхания, слегка поскрипывающего кресла, тихих шагов по песку – это те элементы, без которых при просмотре возникает ощущение незаконченности или «чего-то здесь не хватает». Это распространенная проблема всех любительских и/или низкобюджетных продуктов, в которых создателям просто лень записать отдельно звуки объектов из кадра и подмешать их после записи/найти похожие фактуры в библиотеках. Безусловно, не всегда причиной такого подхода выступает лень, в редких случаях свои условия диктует время и иные обстоятельства, но в большей части ситуаций возможность дополнительно поработать над звуком все-таки есть.
Важно проследить, чтобы помимо голоса были слышны и другие объекты кадра:
Атмосфера: ветер, колыхание листвы, отдаленный шум проезжающих автомобилей
Крупные объекты, которые издают звук: электромеханические установки/животные и т.д.
Шаги, дыхание, малозаметные призвуки по типу скрипящей кожи на ботинках
Шуршание одежды
Важно помнить, что количество звуков, которые человек может воспринимать одновременно, ограничено. Не нужно стремиться озвучить каждую деталь кадра, иначе звук перестанет быть разборчивым: это компромисс между художественной задачей и навыками сведения фонограмм, у новичков далеко не всегда получается сделать так, чтобы три и более источника не конфликтовали между собой по громкости и тональному балансу.
Большим плюсом будет динамически меняющиеся звуки окружения. Например, если действующее лицо сменило локацию с закрытого помещения на открытое, то его голос должен звучать в другом объеме. Желательно, чтобы изменение характера звучания происходило плавно, без резкого контраста. Это трудно реализовать средствами монтажной программы, но получаемый результат стоит потраченных усилий.
Особенно ярко динамический звук влияет на просмотр анимационных роликов. Обратите внимание, как меняется панорамирование объектов:

Техническое совершенство
Шумящий тракт записи, электрические наводки, трение об петличку, задувание мембраны и прочие артефакты недопустимы. С большей частью дефектов записи способен справиться iZotope RX и его менее популярные аналоги, но все-же до применения цифровых коррекций лучше не доводить, а если это невозможно, свести её к минимуму.
Хоть подобные несовершенства трудно пропустить мимо ушей, в сеть попадают записи и с более серьезными проблемами, чем задувание мембраны и легкий шум на фоне. Следующий раздел расскажет о том, как предупредить возможные артефакты до того, как они попадут в запись.
Как подготовиться к записи звука
Перед тем, как приступать к обработке и сборке материала в единую картину, его нужно правильно записать. Этот этап лишь на первый взгляд кажется простым и очевидным: «голос записать, делов-то!» В самом же деле, именно тут совершается большая часть ошибок, которая тянется через весь производственный цикл и мешает его дальнейшим этапам.
Плохо записанный или напротив слишком яркий и навязчивый эмбиент, чирикающие на фоне птицы, громыхающий дизельный генератор, скрипящее на интервью кресло и другие огрехи способны забраковать всю аудиодорожку и обременить создателей контента дополнительным этапом работы со звуком, которого можно было избежать: переписывание с нуля, либо попытки исправить проблему цифровым методом, что может испортить материал еще сильнее.
Итоговый звук зависит не столько от уровня оборудования и его характеристик, сколько от умения с ним работать и продуктивно использовать имеющиеся возможности. При должном навыке не будет проблемой записать весь звук для ролика, включая фоли, интершум, и атмосферы с голосом на одну петличку, подключенную в ZOOM H1.
Подбор и расположение микрофонов
Это обширная тема и описать её в рамках одной статьи, а уж тем более одного её раздела, не получится. Мы обязательно раскроем тему расположения микрофонов для разных задач в следующих статьях блога, а здесь рассмотрим самые распространенные в контексте шумового оформления видео ситуации: запись голоса и интершума на локации.
Вопрос выбора оборудования не является первостепенным, так как речь идет о любительском видео. Принцип простой: используем все, что умеет писать звук. Это может быть многоканальный портативный рекордер уровня Zoom H6, микрофонный вход видеокамеры, или даже обычный смартфон с подключенными в него через переходник петличками. Из всего доступного нужно выбрать наиболее адекватные варианты, которые либо уже есть в наличии, либо не слишком сильно ударят по бюджету. Более подробно о железе и правильном взаимодействии с ним мы рассказали в этой статье.
Запись голоса
Первый момент, который должен беспокоить перед началом записи, это выбор локации и работа с ней. Наличие в аудиодорожке посторонних шумов по типу чирикающих птичек, скрипящего кресла или работающего на фоне генератора способно её забраковать. То же самое можно сказать о слишком сильной реверберации.
Если это комната или любое другое закрытое помещение, в нем не должно быть излишней реверберации и посторонних звуков. Важно понимать, что записывающее оборудование способно «слышать» более тихие звуки, чем человек, и обязательно запишет в дорожку все малозначимые, как посчитал оператор, фоновые шумы проезжающих за окном автомобилей и шумящего в соседней комнате кота. Исправить это пост-обработкой можно, но глубокая коррекция часто приводит к ухудшению материала.
В условиях комнаты бороться реверберацией лучше всего через использование петличного микрофона, расположенного в районе груди говорящего:

Запись диалогов и интервью
Задача усложняется, когда в кадре находится два и более человека. В таком случае есть три варианта их записи:
Отдельная петличка у каждого спикера и запись в отдельные каналы рекордера
Отдельная петличка у каждого спикера и запись через сумматор в один канал
Общий микрофон в зоне разговора
Первый вариант наиболее предпочтителен, но требует внушительного набора оборудования. На каждый микрофон требуется отдельный канал рекордера — это не будет проблемой, когда микрофона всего два, можно использовать переходник-разветвитель с jack 3.5 на x2 TRS-разъема и писать сигнал в два независимых канала той же камеры или смартфона. Но если микрофона три и более — тут без многокананального интерфейса не обойтись, если на выходе должен быть сигнал с разных источников на отдельных дорожках. Такой способ даст самый предсказуемый и контролируемый результат: каждый канал можно мониторить в реальном времени и в случае надобности отключить, чтобы переместить микрофон или вовсе поменять его на другой.
Самый доступный многоканальный рекордер любительского уровня — это Zoom H4n и его аналог Tascam DR-40. Это популярные решения, позволяющие писать сигнал на 4 независимых канала.
Второй вариант — это вариация первого с некоторыми ухищрениями. Можно записывать неограниченное число микрофонов в один общий канал, используя пассивный сумматор сигнала. Чаще всего это самодельная конструкция наподобие всем известного аттенюатора, которую можно легко собрать из доступных радиодеталей. Принцип простой: соединить вместе все сигнальные контакты и сделать общую землю. Существуют и готовые реализации, но найти их трудно:

Преимущество такого варианта в том, что звук все так же снимается в непосредственной близости к спикерам, но для его записи используется всего один канал. Можно сделать две группу по n-микрофонов, одна из которых будет записываться в левый канал, а другая в правый. Недостаток в том, что группу не получится разъединить — это монолитный материал, с которым мало что получится сделать в плане цифровой обработки. Можно заранее договориться о том, чтобы спикеры делали секундную паузу перед началом своей речи и не перебивали друг друга, и получить на одном канале сигнал с разных микрофонов, который еще и легко отделить от остальных банальным вырезанием.
Третий вариант самый проигрышный из перечисленных. Он может дать хороший звук, но этот звук будет трудно обрабатывать после записи и сама концепция накладывает ограничения на операторскую работу и композицию кадра: спикеров придется располагать рядом друг с другом, что не всегда смотрится хорошо.
Ближе или дальше спикеры от микрофона — это компромисс между хорошим звуком, наличием в нем реверберации, и красивым кадром. Придется построить некий баланс и сделать упор на что-то одно. При всех своих ограничениях, это лучше, чем писать диалог на встроенный микрофон камеры.
Запись атмосферы
Если съемка происходит в какой-то уникальной локации, звук окружения которой нельзя найти в библиотеках, лучше записать его на площадке. Конечно, свои ограничения здесь накладывает имеющийся парк оборудования и навык записи интершума, но лучше иметь живой плохо записанный живой эмбиент, чем хороший библиотечный, который не будет подходить к картинке и создавать с ней симбиоз.
Живую атмосферу локации лучше всего писать до того, как на ней начнутся какие-либо действия: подготовка оператора, запуск топливных генераторов, беготня ассистентов и так далее. Для записи желательно подобрать время, в которое локация не засорена посторонними шумами и звучит так, как должна звучать в идеале.
Даже если записанный интершум окажется плохим по качеству, само по себе его наличие может спасти в некоторых ситуациях: таких, как заполнение пауз в вырезанных репликах и маскировка артефактов. Кроме того, самостоятельно записанная атмосфера всегда может быть смешана с библиотечной, что позволит создать кастомный звуковой фон с нужными в конкретный момент характеристиками.
Запись Foley
Шумовое оформление любительского видео не предполагает долгих экспериментов с звуковыми фактурами, подбора foley-реквизита, и кропотливой пост-обработки. Достаточно просто записать звук объектов в кадре после того, как будет закончена видеосъемка, и подмешать его к итоговой дорожке.
Даже самых простых фоли-эффектов, записанных прямо на площадке на любой доступный рекордер, хватит для усиления эффекта присутствия. Для этого подойдет тот же микрофон, на который была записана речь: если есть возможность воспользоваться узконаправленным микрофоном типа «пушка», лучше взять его, если нет, подойдет кардиоидная петличка или любой другой из имеющихся.
Нужно определить, какие объекты кадра могут издавать звук:

Это может быть поворот ключа в замочной скважине или открывание/закрывания двери. Всё, над чем совершаются какие-либо действия, должно звучать. Принцип не ограничивается крупными и излишне явными объектами, звук которых и так слышен на дорожке с камеры: записать отдельно можно и трение одежды во время хождения, скрип кожаной обуви, усиленное дыхание во время напряженных сцен, автомобильный трафик за окном и прочие мелочи — именно они делают звуковую картину по-настоящему насыщенной и убедительной.
Процесс записи выглядит так:

Эти иллюстрации наглядно показывают основной принцип записи фоли: просто берем вещь из кадра и записываем её звук отдельно, после чего подмешиваем к итоговой звуковой дорожке. Для любительского видео такой подход удобен и выгоден по нескольким причинам:
Доступность реквизита: пишем то, что было в кадре
Не нужно искать сторонние фактуры для записи и учиться с ними работать
Подмешать отдельно записанные фрагменты к итоговой дорожке можно в любом монтажном софте
Требует меньше усилий и делается быстрее, чем работа с библиотеками/саундпаками
Foley и Field-recording — это объемное и по-настоящему бескрайнее поле для экспериментов, в котором всегда найдется место для креатива и необычных способов звукоизвлечения: для передачи нужного настроения можно попробовать записать не ту же самую одежду или обувь, которая была на человеке в кадре, а более жесткую/мягкую ткань разной структуры или тяжелую/легкую обувь с каблуками или без, сделанную из разного материала. При желании можно слегка окунуться в пост-обработку фоли: смешать разные фактуры между собой, получить несуществующий в реальности, но подходящий под художественную задачу, звук одежды, обуви, или даже голоса.
Как можно обработать записанный материал
Большая часть изменений, которая происходит со звуком, происходит с ним после записи. Аудиодорожка никогда не используется в исходном виде.
Чистка
В сырой записи речи, которая только-только была скинута на компьютер с рекордера, всегда есть артефакты: малозаметный шум, щелчки, взрывные и шипящие согласные, громкое дыхание в паузах и так называемые «слюни» от смыкания и размыкания губ при произношении. Подобные артефакты будут присутствовать в записи в любом случае, независимо от того, насколько хорошим было оборудование и с какой ответственностью отнесся к процессу его оператор. Это естественные для нашего речевого аппарата особенности произношения, которые мы не замечаем в реальности. Записывающее оборудование имеет куда более чуткий слух. А на последующей обработке, например, компрессии, все неочищенные артефакты обязательно станут громче и будут раздражать слушателя.
Первое, что имеет смысл сделать с записью речи или диалога, это обработка в iZotope RX. Это многофункциональный продукт от компании iZotope, который позволяет реставрировать звук с высоким качеством на выходе — удалять шум разного происхождения, щелчки, звуки дыхания, взрывные согласные и другие артефакты так, чтобы от обработки не ухудшилось качество полезного сигнала, в нашем случае голоса. Этот программный комплекс можно смело назвать индустриальным стандартом, так как используется он повсеместно.
Для продуктивной и по-настоящему качественной чистки придется изучить продукт, но чтобы по-быстрому удалить из аудиоматериала самые явные и заметные на слух артефакты, достаточно применить к нему набор готовых модулей:

Top