Кодирование в частотных поддиапазонах
Разделение сигнала на частотные поддиапазоны позволяет использовать оптимальные для различных частот алгоритмы. В низкочастотных сигналах преобладают малые приращения, а в высокочастотных – большие. Точность в полосе высокой чувствительности слуха должна быть выше, чем в полосах, где чувствительность слуха ниже. MPEG-аудио, Dolby AC, Sony MiniDisk (ATRAC).
mp3 - формат сжатия с потерей качества
Кодеки mp-3:
- Fraunhofer-IIS Формат МР3 был создан исследователями Института Фраунгофера (Германия) в начале прошлого десятилетия. Срок действия патентов на технологию истек в 2010 году, теперь формат MP3 любой производитель сможет бесплатно. Наилучшее качество до 128 кбит/с
- Кодеры Xing Technologies – высокая скорость при минимальном качестве.
- Кодеры на основе стандартаISO/IEC 11172-3 (LAME-codec) создают наилучшие по качеству MP3 файлы для битрейтов 128 – 320 кбит/с.
битрейт - величина потока информации. Качество зависит не только от битрейта, но и от кодека.
Constant Bit Rate - постоянный битрейт (битрейт кратен 16)
Average Bit Rate - то есть усредненный битрейт (подгоняет под заданный)
Variable Bit Rate - то есть изменяющийся битрейт или переменный битрейт (максимальное качество)
Mp-3 Pro – наивысшее качество, но плееры, не поддерживающие формат, воспроизводят их без ВЧ.
wma - лицензируемый формат файла с более высокими характеристиками, чем mp3, но нестойкий к ошибкам (последние версии без потери качества)
aac - Advanced Audio Coding — патентованный формат аудиофайла с увеличенным размером «окна» в 2048 пунктов, частотами дискретизации до 96 кГц и до 48 каналов (.aac, .mp4, .m4a, .m4b, .m4p, .m4r)
VQF - Vector Quantization — векторное квантование, Япония (на 30-35 % компактнее MP3при равном качестве за счет загрузки процессора)
ogg - контейнер для различного типа медиа. Открытый бесплатный стандарт. В контейнере Ogg можно хранить звук и видео в различных форматах (таких как MPEG-4, Dirac, MP3 и другие), но обычно Ogg используется со следующими:
- Speex— для сжатия речевого сигнала на низких битрейтах (~8—32 кбит/канал);
- Vorbis — для сжатия звука на средних и высоких битрейтах (~16—500 кбит/канал).
- FLAC — мультиплатформенный кодек сжатия без потерь для обработки звуковых архивов и других аудиоданных высокого качества воспроизведения.
Компрессия речи
Моделирование звуков на основе анализа параметров и пауз позволяет сохранить хорошее качество при сжатии 100:1 и выше. На основе алгоритмов компрессии были разработаны алгоритмы модификации голоса. Speex см. выше.
Опорные точки
При сжатии звука используется накопление информации. Для возможности использования в потоковом аудио необходимо периодически создавать опорные точки.
Дата добавления: 2017-01-16; просмотров: 1210;