| Часть 9 Слуховые пороги, часть 2 Ирина Алдошина
Ограниченные возможности слуховой системы определяются не только наличием абсолютных порогов слышимости, о которых было сказано в первой части статьи о слуховых порогах, но и ограниченной разрешающей способностью слуха.
Под разрешающей способностью слуха подразумеваются минимальные изменения звукового давления, частоты, временных интервалов (и соответствующих им громкости, высоты, длительности), которые могут быть замечены слухом. Разрешающую способность называют еще дифференциальным порогом восприятия (в англоязычной литературе JND just noticeable difference).
Современные компьютерные технологии открыли возможность вносить очень тонкие изменения в параметры звука, однако использование этих изменений должно опираться на знание разрешающей способности слуховой системы, иначе они останутся незамеченными (если только не ставится задача вносить какие-то специальные изменения, например, удалять короткие щелчки при реставрации и др.). Поэтому изучению дифференциальных порогов уделяется очень большое внимание и за последнее время получен ряд интересных результатов.
Амплитудные дифференциальные слуховые пороги
Вопрос о минимальных изменениях амплитуды давления, которые улавливаются нашим слухом, был исследован рядом авторов (Олсон, Цвиккер, Редерер и др.).
Постановка экспериментов по определению слышимых амплитудных различий сигналов у разных авторов различалась, однако полученные результаты позволили получить очень близкие значения JND.
Первая группа экспериментов использовала два синусоидальных сигнала одинаковой частоты, но разного уровня. Например, у входа в ушной канал подавался сигнал с частотой 1000 Гц с уровнем звукового давления 40 дБ, и второй сигнал той же частоты с изменяющимся уровнем. При поочередном прослушивании пары таких сигналов слушатель отмечал, какой из сигналов звучит громче. Естественно, что если разница в уровнях между сигналами достаточно большая (например, 40 и 60 дБ), то все 100% слушателей отметят эту разницу, но если разница в уровнях будет уменьшаться, то замечать разницу между сигналами будет все меньшее количество слушателей.
Разница в уровнях, которую замечает 75% слушателей, принимается за дифференциальный слуховой порог по уровню звукового давления (по амплитуде). Эти измерения, повторенные для разных частот и разных уровней звукового сигнала, позволили получить характеристики зависимости дифференциальных порогов слышимости JND от частоты и общей интенсивности звукового сигнала (рис.1). Как видно из рисунка, эти пороги (т.е. едва замечаемая разница в уровне громкости) зависят от частоты сигнала: наименьшие значения получаются на средних частотах(500…4000 Гц), на низких и высоких частотах они возрастают. Например, при общем уровне 60 дБ JND для частоты 1000 Гц составляет 0,8 дБ, а для частоты 200 Гц 1,3 дБ. Кроме того, они сильно зависят от общего уровня сигнала чем громче сигнал, тем меньшую разницу между сигналами можно услышать. JND на частоте 1000 Гц при общем уровне 40 дБ составляет1,25 дБ, при уровне 80 дБ 0,6 дБ.
При другой постановке экспериментов использовался амплитудно-модулированный синусоидальный сигнал (пример такого сигнала показан на рис.2). Амплитудная модуляция сигнала достаточно широко используется в музыке (тремоло и амплитудное вибрато), она воспринимается на слух как небольшое изменение громкости сигнала.
Предварительно был исследован вопрос о влиянии частоты модулирующего тона на заметность изменения амплитуды несущего сигнала. Наибольшая чувствительность слуха отмечена при частотах модуляции около 4 Гц, в связи с чем дальнейшие измерения производились при этой частоте.
Опыты сводились к определению уровня звукового давления, при котором становились заметными колебания громкости, обусловленные модуляцией. Результаты представлены на рис.3 в виде семейства кривых, которые можно назвать кривыми равной заметности амплитудной модуляции звука. Они почти повторяют рисунок кривой порога слышимости. Цифры, которыми обозначены кривые, выражают соответствующую каждой кривой глубину амплитудной модуляции в процентах. Из этих результатов также следует, что чем громче сигнал, тем меньшее изменение амплитуды модулирующего сигнала можно заметить. Например, при общем уровне сигнала около 90 дБ можно заметить изменение амплитуды всего 1,5%.При уровне сигнала 30…40 дБ, чтобы услышать изменение громкости, нужно менять амплитуду модулирующего сигнала приблизительно на 10% (это нужно иметь в виду при создании электронных композиций с введением эффектов модуляции).
На основе этих кривых можно получить зависимость амплитудной разрешающей способности слуха от частоты при постоянной громкости. На рис. 4 приведены такие кривые для уровней громкости 40, 60 и 80 фон (фон единица громкости, равная уровню звукового давления в дБ на частоте 1000 Гц, например,40 фон = 40 дБ на 1000 Гц). По оси ординат отложено пороговое изменение звукового давления в процентах к уровню основного тона. Например, изменение р/р100%=3% при уровне 80 фон,т.е. 80 дБ (что соответствует значению р=0,2 Па), дает величину р = 0,06 Па.
Амплитудная разрешающая способность слуха также сильно зависит от уровня громкости звука. Например, при частоте 1000 Гц для громких звуков (с уровнем громкости 80 фон) заметно изменение давления на 3%, в то время как колебания давления тихих звуков (40 фон) становятся заметными лишь при изменении на 10%. С уменьшением громкости звука резче становится и частотная зависимость порога чувствительности слуха от изменения громкости. Таким образом, для чистых тонов с уровнем звукового давления, обычно используемым в музыке, замечаемая разница составляет от 0,5 дБ до 1 дБ в области средних частот.
Следует отметить, что для сложных музыкальных сигналов дифференциальные пороги существенно зависят от вида музыкальных программ (эстрадных, классических и др.), от опыта слушателя, свойств помещения и др.
Многочисленные эксперименты по определению чувствительности слуха к изменениям уровня звукового давления (т.е. неравномерности АЧХ) при воспроизведении через акустическую аппаратуру (громкоговорители, микрофоны и др.) показали, что пороговая величина воспринимаемых неравномерностей составляет в среднем 2 дБ, причем чувствительность слуха к пикам на АЧХ выше, чем к провалам. Кроме того, она зависит от ширины (добротности пика/провала) и его частотного расположения в области средних частот чувствительность максимальная.
Учитывая, что динамический диапазон слуховой системы около 120 дБ, то при такой тонкой чувствительности слуха к изменению уровней можно применять гораздо больше градаций по громкости (современные звуковые технологии позволяют это сделать), чем это используется в классической музыке, где указывается только шесть градаций от fff до ррр, что позволило бы существенно расширить таким образом средства музыкальной выразительности. (Классическая динамическая шкала предусматривает восемь динамических указаний: ppp-pp-p-mp-mf-f-ff-fff. В произведениях композиторов-романтиков Берлиоза, Вагнера, Чайковского встречаются и такие экстремальные обозначения, как pppp и ffff, однако эти ремарки носят больше эмоциональный, чем реальный акустический смысл. Подробнее об этом см. 3/1999, стр. 30-31 - прим. ред.)
Частотные дифференциальные слуховые пороги
Частотная разрешающая способность слуха может быть определена путем прямых экспериментов: слушателю предъявляются два синусоидальных сигнала одинаковой интенсивности, и его просят менять частоту сигнала относительного опорного, пока он не услышит разницу по высоте. Эксперименты, выполненные для разных частот и разных уровней интенсивностей, позволили построить зависимости JND (дифференциальных порогов) от частоты.
Частотная разрешающая способность может быть также оценена по минимальным изменениям частоты, замечаемым слухом при частотной модуляции. Область повышенной чувствительности наблюдается при частотах модуляции около 4%.
На рис.5 приведена зависимость от частоты дифференциальных частотных порогов f ( f/f 100%) для разных уровней громкости. Анализ кривых показывает, что пороги слышимости колебаний высоты тона зависят от частоты и интенсивности сигнала. В области частот до 1000 Гц при общем уровне звука 80 дБ f примерно составляет 3 Гц (в некоторых работах получены результаты до 1 Гц). Затем пороги начинают расти на 4000 Гц примерно до 10 Гц, выше определение различий по высоте резко уменьшается. Следует отметить, что слух замечает различие по высоте двух тонов при 3 Гц, но при этом при разнице частот до 15 Гц в суммарном звуке отчетливо слышны биения.
Как уже было отмечено в первой статье этого цикла (см. 6/1999), всего слуховая система различает 620 градаций высоты тона (140 градаций в диапазоне до 500 Гц и 480 градаций в диапазоне от500 Гц до 16 кГц), что открывает большие возможности для развития микротоновой и спектральной музыки.
Временное различение звука
Способность слуховой системы различать тонкие временные различия в структуре сигнала является в настоящее время основным предметом многочисленных исследований. Причина этого заключается в том, что слуховой аппарат является принципиально нелинейной системой (как при больших, так и при малых уровнях сигнала), поэтому способность воспринимать различия параметров сигнала в частотной области не связана однозначно с восприятием временной структуры сигнала (механизм преобразования звука в слуховом аппарате не определяется преобразованием Фурье).
Именно этим можно объяснить тот факт, что акустические преобразователи (громкоговорители, микрофоны, акустические системы и др.), даже имеющие частотные искажения на уровне порогов слышимости, не обеспечивают качества звучания, идентичного с живым звуком (что, вообще говоря, и является главным критерием для аппаратуры Hi-Fi).
По-видимому, какие-то различия во временной структуре сигнала, которые до настоящего времени еще четко не определены, являются значимыми для слуховой системы, и именно по ним она определяет живое звучание или отличает одну акустическую систему от другой. Способность различать тонкую, быстро изменяющуюся временную структуру звукового сигнала подтверждается удивительно точным анализом и распознаванием речи, когда в непрерывном временном потоке распознается специфическая структура различных фонем.
Исследования разрешающей способности слуховой системы во временной области проводятся в нескольких направлениях:
Прежде всего, необходимо было выяснить, каково минимальное время, в течение которого ухо способно различать два сигнала. Это время можно измерить, предложив обследуемому различить два сигнала, одинаковые во всех отношениях, за исключением времени поступления. Это означает, что наибольшая чувствительность к временному различению является оценкой наикратчайшего периода времени, в котором слух способен интегрировать энергию звука. Можно оценивать этот период времени как низший предел шкалы временной интеграции.
В экспериментах по исследованию остроты слуха использовались щелчки или тональные импульсы. Оказалось, что характер задачи, поставленной перед обследуемым, крайне важен при измерении временных различий с помощью разных методов получают несколько различающиеся значения величин.
Допустим, что слушателю в быстрой последовательности подают два сигнала (высокий и низкий). Он способен ответить, поступает один или два следующих друг за другом сигнала, обнаружив разницу между началом сигналов в 2 мс. Эта величина не сильно зависит от частоты (временное различение даже обостряется для частот выше 1000 Гц), а также от интенсивности звука.
С другой стороны, ему необходимо время в 20 мс, чтобы определить, какой из сигналов поступает первым. Если необходимо оценить смысловое значение звука (речи, например), то это время увеличивается еще до 35 мс. Как уже было отмечено в первой статье, для определения высоты тона также требуется определенное время: для низких частот ~60 мс, для высоких~15 мс.
Достаточно обученные слушатели способны идентифицировать быстрый ряд трехтональных раздражений, действующий в течение очень короткого периода 2…7 мс. При этом установлено, что на остроту временного слухового различения существенно влияют следующие факторы:
число стимулов в ряду, каждый из которых должен быть обнаружен;
способ подачи последовательных стимулов (раздельно или слитно);
тип задачи, которую должен выполнить слушатель;
степень его тренированности.
Следующей задачей было исследование дифференциальной чувствительности при воздействии звука с разницей в длительности dT.
Обследуемому предлагали два сигнала, один сигнал имел длительность Тмс, а другой несколько большую длительность (Т+dT)мс. Интервалы поступали в случайном порядке, а обследуемый должен был указывать на интервал с большей длительностью сигнала. Наименьшую разницу, правильно определяемую в 75% случаев, принимали за JND (дифференциальный порог) для длительности dT.
Основной вывод заключается в том, что dT начинает уменьшаться по мере уменьшения общей длительности воздействия сигнала (т.е. чем короче сигналы, тем меньшее различие по времени между ними слух может заметить).
Как можно видеть на рис. 6, dT уменьшается от 50 мс при длительности сигнала 960 мс, приблизительно до 0,5 мс при длительности сигнала меньше 0,5 мс. Дифференциальная чувствительность, dT/T (которая называется дробью Вебера) не представляет собой константу, а изменяется по мере изменения длительности так, что она равна d T/T= 1 при Т= 0,5…1 мс, приблизительно 0,3 при Т=10 мc и 0,1 при Т=50…500 мс (Т длительность звукового сигнала). Результаты почти не зависят от ширины полосы и интенсивности звука.
Следующей важной проблемой было исследование чувствительности слуха к изменению времени установления (атаки) или спада сигнала. Время установления и спада звука является характерной особенностью различных музыкальных инструментов. Известно, что, меняя время атаки или спада сигнала, можно существенно изменить его тембр. У большинства музыкальных инструментов время атаки или спада лежит в пределах 5…360 мс.
Исследования дифференциальных порогов слуха для времени установления мс были выполнены для различных типов сигналов, и результаты, полученные для сигналов типа тональных посылок (прямоугольный импульс с синусоидальным заполнением) позволили установить, что дифференциальный порог для времени установления (как и для времени спада) для частот ниже 1000 Гц оказывается равным =1мс, для частот 1…10 кГц =0,5мс. Таким образом, изменения времени атаки и спада звукового сигнала, меньшие этих пределов, оказываются незаметными для слуха. Для реальных музыкальных сигналов эти пороги могут несколько отличаться в большую сторону за счет маскировки соседними звуками.
Разумеется, главной задачей современных исследований является установление слуховой чувствительности к тонкой временной структуре сигнала, в связи с чем особое внимание было уделено исследованиям дифференциальной слуховой чувствительности к фазовым искажениям. Изменения фазовых соотношений между спектральными составляющими сигнала существенно меняют его временную структуру. Однако на протяжении долгого времени, со времен Гельмгольца, считалось, что слух не чувствителен к фазовым соотношениям. Исследования последних лет показали, что это не соответствует действительности: изменения фазовых соотношений влияют на изменение тембра, четкость определения высоты музыкального сигнала и др.
В 80-е годы эти исследования привели к тому, что многие фирмы-производители Hi-Fi техники начали создавать аппаратуру с линейно-фазовыми характеристиками (в которых сигнал практически не претерпевал фазовых искажений), однако исследования Блауерта показали, что слух наиболее чувствителен к скорости изменения фазы, т.е. к групповому времени задержки (ГВЗ): гр=-d ( )/ .
В этих же исследованиях были установлены дифференциальные слуховые пороги для искажений ГВЗ (рис.7), которые для частоты 2000 Гц имеют минимальное значение ~1 мс. Эти данные используются в настоящее время при проектировании высококачественной акустической аппаратуры искажения ГВЗ в них должны быть ниже установленных порогов.
Разумеется, полученные результаты не исчерпывают сложной проблемы установления порогов слуховой чувствительности к изменению временной структуры сигнала, и исследования в этом направлении продолжаются.
В заключение хотелось бы сказать о слуховой чувствительности к нелинейным искажениям, под которыми понимается появление в спектре звукового сигнала дополнительных спектральных составляющих. Это может явиться результатом компьютерной обработки или прохождения сигнала через электроакустический тракт.
Пороги слуховой чувствительности существенно зависят от характера нелинейности: при появлении низших (второй, третьей) гармоник пороги слуха для тональных сигналов составляют 0,1%, для фортепианной музыки 1…2%, для эстрадной музыки до 7%. Чувствительность слуха зависит от порядка гармоник: заметность гармонических искажений третьего порядка вдвое выше, чем искажений второго порядка, заметность искажений от пятого порядка и выше в 6…10 раз выше, чем второго. Именно этим объясняется странное явление, что в акустических системах, имеющих в основном нелинейные искажения изших порядков, пороговые значения составляют 1…2%, в то же время в транзисторных усилителях и цифровой аппаратуре, где возникают нелинейные искажения высоких порядков, уровни нелинейных искажений должны составлять сотые и тысячные процента, чтобы они были незаметны для слуховой системы.
Как уже было отмечено выше, современные компьютерные технологии открывают очень широкие возможности при обработке звука, однако при всех видах обработки следует учитывать возможности слуховой системы, для чего и необходимы данные как по абсолютным, так и по дифференциальным слуховым порогам.
|
|