Какой максимальный битрейт аудио люди могут различить?

Некоторые аудио битрейты достигают 256 кбит / с. Но я слушаю очень чистую музыку со скоростью 92 кбит / с. У меня возникло подозрение, что за пределами определенного битрейта x кбит / с среднее человеческое ухо вообще не может различить. Что такое х?

Хотя вопрос не является специфичным для Ubuntu, он возник из-за вопроса открытого формата ogg, который я разделил.

Преимущества mp3 для ogg

2 ответа

Решение

Скорость передачи сама по себе не различима, потому что это не измерение аудиоинформации, которую мы слышим. Размер информации после кодера удаляет то, что он считает неслышимым (и, следовательно, "одноразовым" без потерь или с минимальными потерями).

Хорошие кодеры имеют хорошие психоакустические алгоритмы, то есть они мудро выбирают, как удалять высокие частоты и частоты, амплитуда которых слишком мала, чтобы их можно было воспринимать, а затем упаковывают "прерывистую" волну в заданный битрейт. Чем выше битрейт, тем меньше кодер должен отрываться от исходного звука, но насколько различимые удаленные части больше связаны с решениями, принятыми алгоритмом (его психоакустической моделью), чем с фактическим битрейтом. Для достижения того же уровня воспринимаемого качества бедным кодировщикам (таким как древний Син) потребуется более высокий битрейт, чем хороший (например, современный хром). Поскольку с учетом тех же самых битов, он выбрал плохо, что кодировать и что отбрасывать.

Поэтому не думайте о битрейте MP3 так же, как о битрейте CD. На компакт-диске аналоговая звуковая волна просто кодируется цифровым способом, ничего не удаляется. Таким образом, чем больше битов, тем точнее будет ваша звуковая волна. Таким образом, вы можете иметь отображение 1-1 от битрейта до предполагаемой точности. Это невозможно с кодировкой MP3 (или OGG) или любой кодировкой с потерями, основанной на психоакустических моделях.

Кроме того, "различимый" субъективен: человеческий слух и высокочастотная чувствительность ухудшаются с возрастом... поэтому вы можете наслаждаться 96kpbs сейчас, но 10 (или 20) лет назадвам, безусловно, "понадобится" больше. Разные люди по-разному различают высокие частоты (или небольшие амплитуды), поэтому для них данный кодер может быть лучше другого, даже с более низкой скоростью передачи битов. Кроме того, оборудование и окружающая среда играют ключевую роль: слушать музыку в автомобиле на дороге не так, как в тихой комнате с высококачественными наушниками.

Есть и другие факторы... особенно VBR... что означает, что битрейт постоянно меняется... до 320 для частей песни, требующих более сложного кодирования, и до 96, где ничего не нужно удалять. Таким образом, файл VBR со средним значением 128 кбит / с обычно имеетгораздо более высокое качество, чем файл с постоянной скоростью передачи данных (CBR) 160 (или даже 192).

Тем не менее,VBR128 кбит / с идеально подходит для меня, даже используя наушники хорошего качества. Для CBR 192 достаточно для прозрачности (то есть я не могу отличить от оригинального CD-аудио без потерь). Мне 33 года, а не меломан, поэтому ваш пробег может отличаться.

Аналогия:

Хорошая аналогия пришла ко мне сейчас... она может помочь понять, почему невозможно ответить на вопрос "вышеx кбит / с, человеческое ухо не различает":

Думайте об аудио как о доме и его мебели. Вы переезжаете в другой дом. Ваш движущийся грузовик - ваш битрейт: чем он больше, тем больше мебели вы сможете упаковать в свой новый дом. Но так как это поездка в один конец, а грузовик не достаточно большой, чтобы вместить все,что-то всегда останется позади, и поэтому будет потеряно.

Сможете ли вы распознать, что что-то было потеряно? Согласны ли вы с тем, что от того, что было выбрано позади, зависит столько (или больше), сколько от того, насколько большим был грузовик, даже если действительно большой грузовик действительно поможет?

Согласны ли вы с тем, что невозможно измерить, насколько большим должен быть грузовик, чтобы он был "неразличим", если только грузовик не достаточно большой, чтобы вместить всю вашу мебель? (это будет кодирование без потерь, как FLAC. И это примерно в 5 раз больше, чем самый большой MP3).

Заключительные слова:

Некоторые могут сказать, что объективное измерение порогов слышимости человека возможно. Правда, вы можете измерить человеческое ухо на предмет того, насколько высокая частота неслышна, или на сколько дБ данный звук может быть ниже "доминирующего", так как он будет неразличим. Но вы не можете напрямую перевести это в битрейты, потому что сколько битов требуется для кодирования (или отбрасывания), это зависит от того, сколько их присутствует в данной песне.

Форум Hydrogenaudio провел несколько тестов ABX по этому вопросу. Большинство людей не могут однозначно определить разницу между несжатым исходным материалом и сжатыми файлами в диапазоне VBR ~160 кбит / с, но некоторую музыку действительно трудно сжимать точно, и некоторые люди могут услышать разницу с кодировкой с потерями даже при 320 кбит / с. музыка Ответ: это зависит.

Вы имеете в виду, что 192 кбит / с очень, очень ясно? 92 кбит / с - это немного низкая скорость передачи данных, и я легко могу различить разницу. Если вы не слушаете в шумной обстановке, где качество не имеет большого значения (например, прослушивание портативного устройства в шине), я бы не стал использовать VBR со скоростью ниже 128 кбит / с со стереозвуком. Вы жертвуете качеством, чтобы сэкономить немного места, и компромисс, на мой взгляд, не стоит этого.

Вы можете снизить скорость передачи данных до 80 кбит / с и поддерживать приемлемое качество для монофонической музыки и речи.

Другие вопросы по тегам