Дмитрий
СИМАНЕНКОВ
Дмитрий ПОПОВ
Музыкальное
Оборудование
март 1998
Моно,
стерео, квадро,
бинауральная
запись, процессоры
трехмерного
звука и, наконец,
многоканальный
объемный звук.
Проблема
разработки
систем многоканального
воспроизведения
звука возникла
потому, что
качество звучания,
реализуемое
монофоническими
(одноканальными)
системами
перестало
удовлетворять
взыскательных
слушателей.
Поэтому в конце
50-х годов начали
распространяться
стереофонические
(двухканальные)
системы воспроизведения
звука. Сегодня
формат стерео
является основным
стандартом
звуковоспроизведения,
однако и он не
свободен от
недостатков.
Хотя стереофонические
системы и создают
эффект пространственного
звучания за
счет синтеза
панорамы мнимых
источников
звука (МИЗ) между
двумя громкоговорителями,
стерео панорама
получается
плоской и
ограниченной
углом между
направлениями
на громкоговорители.
Такое звучание
в значительной
степени лишено
естественности
реального
звукового
пространства,
в котором человек
способен воспринимать
источники звука
практически
со всех направлений
как в горизонтальной,
так и в вертикальной
плоскостях,
и оценивать,
хотя порой и
с ошибками,
расстояние
до них.
Квадрофония
Следующим
шагом в развитии
многоканальных
систем звуковоспроизведения
было квадрофоническое
(четырехканальное)
звуковоспроизведение.
В начале 70-х было
разработано
несколько
конкурирующих
и несовместимых
друг с другом
квадрофонических
систем, например,
дискретная
(то есть с четырьмя
независимыми
каналами
воспроизведения)
система JVC CD-4 или
матричные
системы CBS SQ и
Sansui QS, в которых
четырехканальный
звук определенным
образом кодировался
в два канала
для записи, а
при воспроизведении
декодировался
в четыре канала.
Однако кодирование-декодирование
не проходило
бесследно и
качество
восстановленного
четырехканального
сигнала уступало
качеству сигналов
в дискретной
системе CD-4. Что
же касается
CD-4, то эта система
была неэкономична
(поскольку
требовала
четырехканальных
устройств
воспроизведения)
и отличалась
очень плохой
совместимостью
с основным
носителем того
времени - грампластинкой.
Мнения экспертов
о звуковых
возможностях
системы CD-4 разделились,
однако большинство
слушателей
отмечало отсутствие
круговой панорамы,
а многие эксперты
ощущали себя
зажатыми между
передней и
задней звуковыми
картинами.
Объясняется
это тем, что
человеческий
слуховой аппарат
способен довольно
легко создавать
фантомные
образы (или
воспринимать
мнимые источники)
для звуков,
находящихся
спереди. То
есть, если звук
с одинаковой
громкостью
воспроизводится
левой и правой
передними
акустическими
системами, то
мы воспринимаем
его как находящийся
точно в центре
между ними.
Однако способность
большинства
людей создавать
фантомные
образы снижается,
если источники
звука находятся
сзади, и практически
пропадает, если
они находятся
сбоку. Это можно
легко проверить,
если повернуться
боком к акустическим
системам, при
прослушивании
записи с насыщенной
информацией
в центре панорамы.
В
результате,
по причинам
несовместимости
с основными
носителями,
отсутствия
пользовательской
базы, разнообразия
и несовместимости
систем кодирования
(или неэкономичности
в случае дискретных
систем), а также
недостаточного
привлечения
творческих
сил (широко
известны, пожалуй,
только работы,
которые проводил
Alan Parsons, как с собственной
музыкой, так
и с творчеством
Pink Floyd) квадрофонические
системы не
получили широкого
распространения
и через пару
лет действия
по их продвижению
на рынок прекратились.
Наушники
Головные
стереотелефоны
также не позволяют
получить естественное
звучание
воспроизводимой
фонограммы.
Дело в том, что
возникающее
при этом впечатление
бесконечной
ширины стереобазы
и четкая локализация
звукового
изображения
внутри головы
слушателя не
могут удовлетворить
требовательных
меломанов. Для
устранения
этого эффекта
применяются
специальные
обработчики
сигналов, получившие
название
биофонических
процессоров.
Принцип их
действия состоит
в подмешивании
сигналов левого
канала в правый
канал, и наоборот.
Таким образом,
на выходе каждого
канала формируется
сигнал, состоящий
из ослабленного
и скорректированного
сигнала своего
канала, и задержанного
(и соответствующим
образом скорректированного)
сигнала другого
канала. Подобными
устройствами,
выполненными
в виде приставок
или встроенными,
в настоящее
время оснащены
многие музыкальные
центры. Интересно,
что такие устройства
могут быть
реализованы
и чисто программными
методами с
использованием
цифровой обработки
сигналов в
реальном времени
(например, существует
бесплатный
подключаемый
модуль NoPhones
в формате VST для
Windows).
Бинауральная
запись
Наиболее
совершенный
метод имитации
реального
трехмерного
звукового поля
- бинауральная
передача звука.
Бинауральный
метод состоит
в том, что звуковая
информация
воспринимается
микрофонами,
размещенными
в ушных раковинах
человека или
"искусственной
головы" - модели,
имитирующей
слуховое восприятие
человека. В
идеале такая
система позволяет
создать полную
иллюзию естественного
звучания. Она
как бы переносит
слушателя из
помещения
прослушивания
в помещение,
где ведется
запись. Однако,
полноценно
прослушивать
бинауральную
запись можно
только с помощью
стереотелефонов
и при условии,
что размеры
и строение
использовавшейся
для записи
искусственной
головы во многом
схожи с вашей
головой. Читатели
могут прослушать
бинауральные
звуковые файлы,
скачав их через
Интернет с
сервера Binaural Source
(www.binaural.com).
В
свое время,
микрофоны для
бинауральной
записи выпускали
фирмы Sennheiser (MKE 2002) и
Neumann (KU 81i по кличке
Fritz). Сейчас известна
только модель
Neumann KU 100 Dummy Head.
При
воспроизведении
бинаурального
сигнала через
акустические
системы, из-за
попадания
сигнала правого
канала в левое
ухо слушателя
и наоборот,
возникают
перекрестные
искажения, в
конечном счете
сводящие на
нет все преимущества
бинаурального
звуковоспроизведения.
Указанные
недостатки
в значительной
мере удается
устранить с
помощью специального
устройства
обработки
звуковых сигналов,
позволяющего
получить бинауральный
эффект при
прослушивании
бинауральной
записи через
акустические
системы. Такие
устройства
получили название
трансауральных
процессоров.
Принцип действия
таких устройств
основан на
подмешивание
определенным
образом сфазированных
сигналов левого
канала к правому
и наоборот, с
целью компенсации
перекрестных
помех. Трансауральный
эффект подобен
бинауральному
и отличается
от него только
способом
воспроизведения
бинауральной
записи. И хотя
площадь, где
он отчетливо
проявляется,
невелика, зато,
находясь в ее
пределах, слушатель
может иметь
представление
о расстоянии
до источников
звука и их взаимном
расположении
в пространстве
на момент записи.
Другое интересное
свойство
трансаурального
процессора
- это возможность
расширения
с его помощью
стереобазы
обычных стереофонических
записей. Реализованные
аппаратно,
трансауральные
процессоры
являются частью
снятых с производства
устройств
Lexicon CP 1 и CP 3, а также
выпускаемого
сейчас аудио-видео
процессора
Lexicon DC 1.
Процессоры
трехмерного
звука Еще
одним способом
улучшения
пространственного
звучания является
применение
так называемых
процессоров
трехмерного
звука (3-D Audio). Они
предназначены
для расширения
звуковой панорамы
за границы
физического
расположения
акустических
систем (в идеальном
случае до сферы),
некоторые из
подобных устройств
также предлагают
точное расположение
отдельных
звуков в пространстве.
Эти процессоры
пытаются имитировать
реальную звуковую
картину посредством
изменения
амплитуды,
времени и тембра
звука (см. статью
"Реализация
пространства").
Существует
два подхода
к процессорам
трехмерного
звука. В первом
случае предлагается
создавать объем
во время записи,
так чтобы результат
можно было
услышать на
любой стереофонической
системе. Этот
подход реализован
в технологиях
QSound, B.A.S.E. и Roland RSS. Во втором
случае предлагается
осуществлять
обработку на
стадии воспроизведения,
то есть встраивать
процессоры
непосредственно
в потребительскую
аппаратуру.
Естественно,
что в этом случае
при производстве
записи нет
никакой возможности
воздействовать
на трехмерность
результата.
Подобный подход
применяется
в технологиях
Hughes SRS и Carver Sonic Holography. Впрочем,
эти подходы
не являются
взаимоисключающими:
некоторые
звукоинженеры
используют
систему SRS непосредственно
в процессе
создания записи,
системы обработки
нередко применяются
на стадии
воспроизведения,
а некоторые
технологии
изначально
предназначены
для обоих вариантов
применения.
В
любом случае,
эффект, производимый
при помощи
процессоров
трехмерного
звука, сильно
зависит от
положения
слушателя и
чаще всего
несовместим
с моно. Последнее
не означает,
что трехмерность
не проявляется
при прослушивании
в моно (что и
так понятно),
а означает, что
при прослушивании
в моно происходит
изменение
(искажение)
тембра звука.
На
самом деле,
употребление
термина "трехмерный"
неправильно,
поскольку
практически
ни одна из технологий
не обеспечивает
расположение
звука по высоте.
То есть, даже
в лучшем случае
мы имеем не
сферу, а круг
- плоскую фигуру,
описываемую
двумя измерениями,
чаще же всего
реальное поле,
в котором можно
получить устойчивые
результаты,
составляет
полукруг, находящийся
перед слушателем.
Познакомимся
вкратце с основными
технологиями.
Технология
Qsound создана на
основе субъективных
критериев
оценки направления
звука, выработанных
в результате
более чем
полумиллиона
тестов. Действует
посредством
изменения
амплитуды
сигнала на
определенных
частотах, а
также посредством
фазовых и временных
сдвигов. Позволяет
размещать звук
в пределах
полукруга
(180°) перед слушателем.
Технология
воплощена в
аппаратном
устройстве
QSystem, имеющем восемь
входов и позволяющем
производить
статическое
размещение
или динамическое
перемещения
отдельных
звуков. Технологию
QSound применялась
при записи
таких исполнителей,
как Madonna, Sting, INXS, Julian Lennon, Roger
Waters, также она
использовалась
в некоторых
телевизионных
фильмах, например,
в сериале "Секретные
материалы"
(X-Files). Технология
QSound используется
в процессоре
UltraQ, созданном
для потребительского
рынка, и в некоторых
звуковых платах
производства
Creative Labs. Кроме того,
существуют
подключаемые
модули в формате
DirectX и Sound Forge для Windows, в
формате TDM, SD II и
AudioSuite для MacOS (см. здесь).
Технология
Roland RSS (Roland Sound Space) действует
посредством
изменения
амплитуды,
времени и тембра
звука. При этом
используется
комбинация
двух техник:
бинауральной
и трансауральной
(для прослушивания
бинаурального
сигнала через
акустические
системы). Система
способна производить
бинауральный
сигнал из стерео
или моно записи.
Устройство
RSS, стоимостью
около 20000$, имеет
четыре входа,
управляется
по MIDI, обеспечивает
расположение
звуков в полной
сфере. Менее
дорогой вариант
представлен
в виде процессора
RSS 10. Технология
RSS также присутствует
в некоторых
процессорах
фирмы Roland, в частности
SDE 330, SRV 330 и SDX 330.
Технология
Ambisonics появилась
в 1970 году в результате
британских
академических
исследований.
Она предназначена
прежде всего
не для имитации
пространства,
а для записи
с сохранением
реальной звуковой
картины, и лучше
всего это получается
при использовании
многоэлементного
микрофона
SoundField
SPS 422.
Запись можно
производить
и на два канала,
однако при
использовании
многоканальной
записи возможна
имитация круговой
(три канала) и
сферической
(четыре канала)
панорамы. Существует
матричная
система UHJ, позволяющая
кодирование
сделанной по
технологии
Ambisonics многоканальной
записи в два
канала. Результат
кодирования
совместим со
стерео и моно.
Закодированный
системой сигнал
может воспроизводиться
как с декодированием,
так и без него.
При воспроизведении
без декодера
лишь слегка
расширяется
звуковое поле,
если же используется
декодер, то
эффект выражен
гораздо ярче.
Наряду с двухканальным,
возможно и
многоканальное
воспроизведение
записей, сделанных
по технологии
Ambisonics. При использовании
четырех каналов
воспроизведения
(то есть четырех
независимых
акустических
систем) можно
получить круговую
панораму. Для
сферической
панорамы необходимо
шесть каналов,
возможно
использование
и большего
количества
акустических
систем. Наряду
с записью по
технологии
Ambisonics, существует
также система
микширования
уже записанного
многоканального
материала,
имеющая восемь
входов. Еще при
помощи этой
технологии
возможна обработка
готового стерео
материала,
подобные процессоры
используются
в потребительском
оборудовании.
Выпущено более
шестисот CD (в
основном с
классической
музыкой), записанных
по технологии
Ambisonics.
Технология
SRS была разработана
фирмой Hughes, но
сейчас ее дальнейшим
развитием
занимается
фирма SRS Labs. Технология
позволяет
производить
расширение
стереобазы
и преобразование
моно в стерео.
Наряду с отдельными
аппаратными
устройствами,
системы SRS применяются
в телевизорах
и другой потребительской
технике, а также
в компьютерных
продуктах
(звуковых платах,
например). Лицензии
на применение
SRS проданы многим
ведущим производителям
бытовой и
компьютерной
техники.
Технология
Spatializer может применяться
как для кодирования
при записи, так
и для обработки
звука при
воспроизведении.
Получаемый
эффект простирается
от расширения
стереобазы
до точного
позиционирования
в пределах
круга. Для работы
в крупных студиях
предназначены
устройства
PRO Spatializer (16 входов,
расширяется
до 24) и Spatializer 8 (восемь
входов) с MIDI управлением,
а также цифровое
устройство
со стерео входом
Digital Spatializer. Для малобюджетных
студий предлагается
процессор со
стерео входом
Spatializer Retro. Производится
также недорогое
устройство
HTMS 2510, предназначенное
для обработки
звука при
воспроизведении
и ориентированное
на потребительский
рынок. Технология
Spatializer применяется
в продуктах
некоторых
других фирм.
Еще существуют
подключаемые
модули в форматах
AudioSuite и TDM для MacOS, в формате
DirectX для Windows (см. здесь).
Spatializer применялся
в работах многих
известных
музыкантов
и продюсеров,
а также в нескольких
фильмах и
телевизионных
передачах.
Технология
фирмы CRE (Crystal River
Engineering) воплощена
как в аппаратных,
так и в программных
продуктах.
Первое устройство
- Convolvotron, было разработано
совместно с
NASA для использования
в тренировочных
имитаторах
полетов и других
системах виртуальной
реальности.
Существуют
также автономная
система Acoustetron II,
компьютерные
платы Beachtron и Alphatron,
подключаемый
модуль Protron
в формате TDM для
MacOS.
Это
не все существующие
технологии
трехмерного
звука, однако
самые известные
из них.
Многоканальные
форматы
Некоторые
фирмы уже довольно
давно заявляют,
что стерео -
отживший формат
и пытаться
получить с его
помощью трехмерную
картину технически
интересно, но
является пустой
тратой времени.
Взамен эти
фирмы предлагают
развивать
многоканальные
форматы воспроизведения
звука.
Одним
из несомненных
преимуществ
данного подхода
является меньшая
зависимость
производимого
эффекта от
расположения
слушателя, что
очень важно
для кинотеатров,
например, поскольку
невозможно
усадить всех
зрителей в
центр. Недаром
впервые коммерческое
применение
многоканального
звука произошло
в кино: вышедший
в 1940 году диснеевский
мультфильм
"Fantasia" сопровождался
трехканальным
дискретным
звуком. Этот
формат получил
название Fantasound,
однако больше
с тех пор нигде
не применялся.
В 50-х в кино
использовались
другие дискретные
форматы (четырехканальный
CinemaScope и шестиканальный
Todd-AO), однако самым
распространенным
на сегодняшний
день форматом
многоканального
объемного звука
в кино является
Dolby Stereo. Из кинотеатров
подобные системы
постепенно
перекочевали
в "домашние
театры".
Применяющийся
в кино четырехканальный
формат Dolby Stereo
является матричным
форматом, то
есть звук,
предназначенный
для каждого
из четырех
каналов, кодируется
и записывается
на два канала,
а при воспроизведении
декодируется
вновь в четыре
канала: левый,
центральный,
правый и задний
(обычно направляется
на две тыловые
акустические
системы одновременно).
Впервые формат
Dolby Stereo был применен
в фильме "Звездные
Войны" (Star Wars) в 1975
году. С 1976 по 1979 годы
процесс кодирования
основывался
на модифицированной
технологии
Sansui QS, разработанной
в свое время
для квадро.
Из-за применявшейся
технологии
кодирования
разделение
между каналами
было не больше
8 дБ. В 1979 году фирма
Dolby изменила
технологию
кодирования,
доведя разделение
между каналами
до 15 дБ, однако
частотный
диапазон заднего
канала так и
остался ограниченным
(от 100 Гц до 7 кГц).
На настоящий
момент в мире
насчитывается
около 40 тысяч
кинотеатров,
оборудованных
для воспроизведения
звука в формате
Dolby Stereo.
Домашний
вариант Dolby Stereo
называется
Dolby Pro-Logic. Это также
матричный
четырехканальный
формат, использующий
такой же принцип
кодирования
и, следовательно,
имеющий все
те же недостатки,
что и Dolby Stereo. Кодирование
и мониторинг
может производиться
посредством
аппаратных
устройств
(кодер Dolby SEU-4 и декодер
SDU-4) или подключаемых
модулей для
Pro Tools (см. здесь).
Кроме того,
декодеры встраиваются
в потребительскую
аппаратуру,
а также продаются
отдельно. На
сегодняшний
день около 30
миллионов
пользователей
в мире имеют
декодеры Dolby
Pro-Logic в том или ином
исполнении,
плюс ежегодно
продается пять
миллионов
декодеров.
Совместимость
с форматом
Dolby Stereo обеспечивает
широчайший
выбор готовой
продукции,
сегодня известно
около 7800 записей
со звуком в
формате Dolby Pro-Logic,
вышедших на
аудио кассетах,
видео кассетах,
лазерных дисках,
CD, CD-ROM и DVD дисках.
Существуют
также видео
игры, радио и
телевизионные
программы
(например, сериалы
Beverly Hills 90210, Melrose Place и The Simpsons). Кроме
того, в последнее
время начали
появляться
компьютерные
платы с декодером
Dolby Pro-Logic (miroMEDIA Surround).
В
отличии от
аналоговых
систем Dolby Stereo и Dolby
Pro-Logic Dolby Digital является
цифровой системой
кодирования
и записи многоканального
объемного звука
(раньше она,
кстати, называлась
Dolby Surround AC-3). К тому же,
Dolby Digital имеет не
четыре, а шесть
отдельных
каналов - пять
каналов с полным
диапазоном
и низкочастотный
канал, то есть
система соответствует
формату 5.1 (см.
далее). Кодер
Dolby Digital принимает
цифровые данные
с частотой
дискретизации
32, 44,1 или 48 кГц и
разрядностью
16, 18 или 20 бит. В
будущем разрядность
может быть
увеличена до
24 бит. Хотя в
системе Dolby Digital
используется
сжатие данных
с потерями (от
9:1 до 16:1), качество
в результате
получается
лучше, чем у
аналоговых
систем Dolby. Формат
Dolby Digital используется
в кино, выпущено
около 120 фильмов
и около 11000 кинотеатров
по всему миру
способны
воспроизводить
звуковое
сопровождение
в этом формате.
Все чаще появляется
домашняя аппаратура
со встроенными
декодерами
Dolby Digital, выходят
лазерные диски
и DVD диски со звуком
в этом формате.
Формат Dolby Digital является
частью спецификации
видео DVD, телевидения
высокой четкости
(HDTV) в США и Японии,
некоторых
систем кабельного
телевидения.
Хотя спецификации
для аудио DVD будут
приняты не
раньше мая
месяца этого
года, предложения
по спецификациям
включают формат
Dolby Digital.
При
обсуждении
многоканального
объемного звука
встречается
иногда упоминание
о LucasFilm THX, однако
необходимо
понимать, что
это не формат
кодирования,
а попытка
стандартизации
и сертификации
аппаратуры
(декодеров,
усилителей,
акустических
систем) для
воспроизведения
многоканального
объемного
звука. Существуют
спецификации
THX 4.0 для четырехканального
звука и THX 5.1 для
шестиканального.
Поскольку
тыловой канал
систем Dolby Stereo и Dolby
Pro-Logic имеет ограниченный
частотный
диапазон, эти
системы не
очень подходят
для равноправного
воспроизведения
музыки всеми
имеющимися
акустическими
системами.
Поэтому фирма
RSP Technologies некоторое
время назад
произвела
собственную
матричную
систему под
названием
Circle Surround, которая
является адаптацией
систем Dolby специально
для музыки,
поскольку имеет
тыловой канал
c полным диапазоном
частот. Современная
версия системы,
Circle Surround 5.2.5, может также
работать в
шестиканальном
режиме с раздельными
тыловыми каналами
и каналом субвуфера.
Система включает
кодер и декодер,
дополнительно
можно приобрести
контроллер
с четырьмя
джойстиками
и шестиканальный
усилитель
мощности. Фирма
RSP заявляет, что
звук, закодированный
посредством
системы Circle Surround (в
четырехканальном
режиме), полностью
совместим с
декодерами
Dolby Pro-Logic. Кроме того,
декодер Circle Surround
может синтезировать
объемный звук
из обычного
стерео. Выпущены
декодеры HTD 1 для
"домашнего
театра" и CSA 12 для
автомобильных
аудио систем.
Несколько
десятков CD
закодированы
системой Circle
Surround.
Цифровой
формат DTS (Digital
Theatre Systems) изначально
был предназначен
для кино. На
сегодняшний
день около 100
кинофильмов
вышли со звуковым
сопровождением
в этом формате
(первым был
"Парк Юрского
периода" (Jurassic
Park) в 1993 году) и около
12000 кинотеатров
по всему миру
оборудованы
для его воспроизведения.
В отличии от
других форматов
многоканального
звука для кино,
звук DTS записывается
не на кинопленку,
а на CD-ROM, откуда
потом и воспроизводится.
На кинопленку
же при этом
записывается
синхросигнал.
DTS использует
шесть каналов
(он соответствует
формату 5.1), но
может быть
декодирован
и в восемь каналов
(7.1), с дополнительными
левым центральным
и правым центральным
каналами, что
имеет важное
значение при
больших размерах
экрана. В DTS применяется
20-разрядный
звук с частотами
дискретизации
44,1 или 48 кГц, а также
используется
сжатие данных
с потерями (от
3:1 до 4:1, что гораздо
меньше, чем у
Dolby Digital и, по крайней
мере теоретически,
обеспечивает
лучшее качество
звука). Спецификация
DTS предусматривает
и сжатие данных
без потерь.
Последнее время
DTS активно проникает
в сферу домашних
систем и сегодня
в мире насчитывается
около 10000 декодеров.
Наряду с лазерными
и DVD видео дисками,
имеющими звуковое
сопровождение
в формате DTS,
выпускаются
также аудио
компакт-диски.
Возможно
воспроизведение
CD, лазерных или
DVD дисков на обычных
проигрывателях
при наличии
цифрового
выхода для
соединения
с декодером.
В формате DTS
выпущено больше
всего аудио
дисков.
Цифровой
формат SDDS (Sony Dynamic
Digital Sound) предназначен
исключительно
для кино и в
виде аудио
продукции пока
не встречается.
Звук SDDS может
быть декодирован
в четыре, шесть
(5.1) или восемь
(7.1) каналов, в
последнем
случае с дополнительными
левым центральным
и правым центральным
каналами. В
формате SDDS используется
звук с частотой
дискретизации
44,1 кГц и применяется
сжатие данных
с потерями
(примерно 5:1). Это
самый новый
многоканальный
формат для
кино, однако
в мире уже
используется
около 4300 декодеров.
Существует
несколько
разных спецификаций
видео DVD, например,
спецификация
для США и Японии
(NTSC-DVD) и спецификация
для Европы
(PAL-DVD). В спецификации
NTSC-DVD стандартом
многоканального
звука является
Dolby Digital. В спецификации
PAL-DVD изначально
было решено
сделать стандартом
формат многоканального
объемного звука
ISO-MPEG2 (не путать
с двухканальным
форматом MPEG1 Layer
2). Этот формат
может быть
шестиканальным
(5.1) или восьмиканальным
(7.1) и использует
сжатие данных
с потерями.
Однако планы
изменились,
и в данный момент
для PAL-DVD стандартом
выбран формат
Dolby Digital, а ISO-MPEG2 упоминается
в спецификации
как возможная
альтернатива.
Насколько мне
известно, кроме
DVD этот формат
нигде не упоминается
и декодеров
пока не существует.
Пять
к одному за 5.1
Как,
возможно, вам
уже стало ясно
из предыдущего
текста, сочетание
цифр 5.1 не означает
какой-то определенный
способ кодирования
многоканального
звука, а просто
указывает
количество
каналов (как
стерео или
квадро). Формат
объемного звука
5.1 означает, что
используется
пять каналов
с полным частотным
диапазоном
(левый передний,
центральный,
правый передний,
левый задний
и правый задний),
а также один
низкочастотный
канал (с диапазоном
от 3 до 120 Гц), подключаемый
к субвуферу.
Формат 5.1 представляется
наиболее
перспективным,
поскольку
поддерживается
основными
разработчиками
и производителями,
а также является
частью спецификаций
наиболее
перспективных
технологий.
Почему
же можно предполагать,
что формат 5.1
не постигнет
участь квадрофонии?
Прежде всего,
мы имеем немало
носителей,
способных
содержать звук
в данном формате
(CD, лазерные диски),
и самым перспективным
среди них является
DVD. Затем, пользовательская
база пока не
столь велика
(особенно в
нашей стране),
но она уже есть
в лице 30 миллионов
владельцев
"домашних
театров". Систем
кодирования
для 5.1 также
несколько, но,
во-первых, поскольку
мы имеем дело
с цифровым
сигналом, то
нет ничего
сложного в
создании декодера,
способного
работать со
звуком, закодированным
различными
системами, а,
во-вторых, Dolby
Digital вполне может
стать основным
стандартом.
Что касается
привлечения
артистов, то
фирмы Dolby и Digital Theatre
Corporation вкладывают
немалые силы
и средства в
пропаганду
своих форматов,
а также расширение
ассортимента
совместимых
записей. Во
всяком случае,
многие представители
технического
персонала
(звукоинженеры)
уже сегодня
с энтузиазмом
восприняли
новые возможности.
Вообще,
в распространении
многоканального
объемного звука
по разным причинам
заинтересованы
очень многие.
Производители
бытовой аудио
техники радуются
перспективам
продать пользователям
новые системы
(особенно потирают
руки производители
акустики). В
США, например,
на рынке потребительского
аудио и видео
оборудования
в прошедшем
году не снизился
объем продаж
только у систем
домашнего
театра. Фирмы
звукозаписи
рады снова
продать меломанам
старые записи,
теперь уже в
новом, многоканальном
формате. Производители
профессиональной
аудиотехники
готовятся
предложить
покупателям
новые микшеры,
усилители,
процессоры
эффектов (и в
этой области
производители
акустических
систем особенно
предвкушают).
Крупные студии,
в последнее
время подвергшиеся
жесточайшей
конкуренции
со стороны
малобюджетных
и персональных
студий, рассматривают
появление
многоканального
звука как возможность
увеличения
работы, пока
недоступной
более мелким
студиям. Однако
в конечном
итоге все будет
зависеть от
потребителя:
если, несмотря
на сильнейший
рекламный
прессинг, он
не примет
многоканальный
объемный звук,
то все мечты
производителей
останутся лишь
мечтами.
Зачем
вообще нужен
объемный звук
потребителю?
Если слова о
"восстановлении
естественности
пространственного
звучания" вас
не впечатлили,
то скажем по-другому:
применение
объемного звука
позволяет
значительно
усилить эмоциональное
воздействие
музыки на слушателя.
А это уже не
может игнорировать
никто: ни исполнитель,
ни звукорежиссер,
ни фирма звукозаписи,
ни сам слушатель
(если, конечно,
он приобретает
записи для
получения
эмоционального
воздействия,
а не пополнения
коллекции).
Интересно
также, что
прослушивание
музыки в многоканальном
объемном формате
меньше приводит
к усталости
по сравнению
со стерео форматом.
Это в первую
очередь отмечают
звукоинженеры,
которым приходится
заниматься
подобным
прослушиванием
в течении многих
часов.
Определенную
тревогу вызывает
использующееся
во всех цифровых
форматах сжатие
данных с потерями,
не приведет
ли это к ухудшению
звучания? Конечно,
потери - это
всегда плохо,
не это не однозначно
хуже линейного
(без сжатия)
звука, если
используется
более высокая
разрядность
и/или частота
дискретизации,
поскольку
алгоритмы
сжатия аудио
данных имеют
психоакустическую
оптимизацию,
то есть происходят
максимально
незаметно для
слушателя. В
результате,
следует еще
разобраться,
что лучше:
16-разрядный
звук с частотой
дискретизации
44,1 кГц без сжатия
или 20-разрядный
звук с частотой
дискретизации
96 кГц со сжатием.
Надо
отметить, что
все упоминания
о звуке на DVD
касались формата
видео DVD дисков.
На момент написания
этой статьи
формат аудио
DVD еще не принят,
известны только
предложения
рабочей группы:
двухканальный
звук с разрядностью
до 24 бит и частотой
до 192 кГц, пятиканальный
звук без сжатия
данных, звук
формата 5.1 со
сжатием данных
(система кодирования
может быть
Dolby Digital, MPEG или DTS).
Что
нужно для работы
Предположим,
что вы заинтересовались
многоканальным
объемным звуком
или даже получили
заказ на проведение
работы в этом
формате. Какое
новое оборудование
вам понадобится?
Прежде всего
микшер. Приспособленность
микшера для
сведения в
формате многоканального
объемного звука
определяется
не способностью
иметь на выходе
несколько
каналов (это
легко получить
на большинстве
моделей при
помощи подгрупп),
а наличием
специальных
средств панорамирования
звука. Представьте
себе: при работе
в стерео для
размещения
звука в определенном
месте вы пользуетесь
регулятором
панорамы, который
устанавливает,
какое количество
звука подается
в каждый канал
и, тем самым,
определяет
его воображаемое
положение между
двумя акустическими
системами. При
работе с объемным
звуком вам надо
каким-то образом
установить
какое количество
звука подается
в каждый из
пяти основных
каналов (это
не беря в расчет
канал субвуфера).
Даже если вам
удастся это
сделать, то
необходимое
в процессе
сведения изменение
положения звука
потребует
повышенных
усилий по перемещению
нескольких
регуляторов,
а также немалого
напряжения
головного
мозга. А динамическое
панорамирование,
то есть перемещение
звука в пространстве,
будет практически
возможно только
на микшерах
с автоматизацией.
В идеале, микшер
для многоканального
объемного звука
должен иметь
возможность
установки
панорамы при
помощи джойстика.
Еще
не так давно
для работы с
многоканальным
объемным звуком
требовалось
наличие микшера
класса Neve, Euphonix или
SSL. Сегодня возможности
сведения в
формате многоканального
объемного звука
имеют не только
супердорогие
микшеры, но и
некоторые
модели средней
стоимости,
например производства
фирм Otari, RSP и D&R, а
также относительно
недорогие
Mackie
Digital 8 Bus,
Yamaha
02 R
со второй версией
операционной
системы и даже
Yamaha
03 D.
Однако, вместо
покупки нового
микшера, можно
также приобрести
систему Otari PicMix,
которое позволяет
добавить объемное
панорамирование
и мониторинг
ко многим моделям
микшеров. В
крайнем случае,
несмотря на
то, что было
сказано в предыдущем
абзаце, можно
сделать сведение
для многоканального
объемного звука
и на обычных
восьмиподгруппных
микшерах (посредством
направления
звука на два
канала микшера
и назначения
каналов на
разные пары
подгрупп), только
оно потребует
больше времени
и хитрости.
Практическим
стандартом
для записи
многоканального
мастера стали
цифровые
восьмиканальные
магнитофоны
Tascam DA 88, хотя в принципе
для этого подойдет
любое устройство,
способное
записать необходимое
количество
каналов. Если
материал будет
кодироваться
в формат DTS (напомню,
что он содержит
шесть каналов
20-разрядного
звука), то часто
используется
устройство
Prism MR 2024 T, позволяющее
записать шесть
20-разрядных
каналов на
восемь каналов
DA 88. Впрочем, появление
20-разрядных
многоканальных
записывающих
устройств,
прежде всего
магнитофонов
фирмы Alesis (см. здесь),
может изменить
ситуацию в этой
области. Что
касается порядка
каналов, то
фактическим
стандартом
для большинства
систем 5.1 является
следующий
порядок (начиная
с первой дорожки):
левый передний,
центральный,
правый передний,
левый задний,
правый задний
и низкочастотный
каналы. Однако
для DTS используется
другой порядок:
левый передний,
правый передний,
левый задний,
правый задний,
центральный,
низкочастотный.
Несомненно
необходимо
наличие соответствующей
мониторной
системы. Вам
понадобится
пять широкополосных
акустических
систем (лучше,
если они будут
абсолютно
одинаковыми,
но если это
невозможно,
тыловые системы
могут отличаться
от фронтальных),
а также субвуфер.
Правда, при
этом возникают
определенные
проблемы, поскольку
у большинства
владельцев
домашних театров,
рассчитанных
на Dolby Pro-Logic, тыловые
акустические
системы слабее
(по мощности)
фронтальных
и другого типа,
а центральная
акустическая
система часто
отличается
от крайних
передних, поскольку
располагается
горизонтально
над телевизором
или проекционным
экраном. В
результате,
если вы будете
равноправно
использовать
все пять основных
каналов, то
впечатление
слушателя с
подобной системой
может сильно
отличаться
от задуманного
вами. Тем не
менее, большинство
специалистов
по сведению
многоканального
объемного звука
рекомендуют
не закладываться
н
Источник: https://sites.google.com/site/xmasguy/Home/stati-1 |