Конференция работает на сервере ETegro Technologies.

Radeon.ru

Конференция Radeon.ru

Страница 1 из 1 [ Сообщений: 36 ]  Версия для печати [+]
Показать сообщения за  Поле сортировки  
Попалась статья о практических плюсах хранения данных в hi-res PCM.
Это перевод второй (из четырех) частей развернутой статьи Кристофера «Монти» Монтгомери (создателя Ogg Free Software и Vorbis).

Цифровой аудиоформат 24/192, и почему в нем нет смысла

Среди 554 попыток, испытуемые выбирали «правильно» в 49.8% случаев. Другими словами, они пытались угадать. Ни один слушатель в течение всего теста не смог опознать, которая из записей была в формате 16/44.1, а какая была звуком высокой четкости [15].

Описаны моменты, связанные с ультразвуком и его влиянием на звуковые тракты. Описан принцип ABX, описаны нюансы сравнительных тестирований. Возможно, кому-то это наступит на больную мозоль. Частей этого материала всего 4.
Очень много совершенно очевидных (лично для меня) утверждений, но наверное, кто-то захочет лучше понять или поспорить.

Предлагаю обсудить эту интересную тему.
Интересный материал :)
Нет, ну сам формат имеет право на существование. Как говориться — если звёзды зажигают, значит это кому ни будь нужно. Другое дело, что аудиофилы явно не свойственное ему приписывают, да и злой аудиофильский бог играет с ними злую шутку. Как говориться — бывают в жизни злые шутки, сказал петух слезая с утки.


Последний раз редактировалось msivano 11:53 01.03.2017, всего редактировалось 1 раз.
NEW
Ну в статье речь идёт, судя по всему, за довольно качественный тракт (ЦАПы). А что, если ЦАП старый или дешёвый. Такие ЦАПы могут плохо переваривать 44.1/16, а при более высоком разрешении могут выдавать более высокие характеристики. Тут нужно либо передискретизацию качественную использовать, либо контент в более высоком разрешении.
Т.е. может в статье и дело говорят, но почему они тогда не все карты раскрывают?
DigiMakc
Вообще-то у всех ЦАП, умеющих работать в 24/192, лучшая точность и лучшие характеристики как раз в режиме 16/44.
Обратных примеров не встречал. И у старых, и у новых.

PCM1792A
Частоты — 44.1 / 96 / 192 kHz
THD+N — 0.0004 / 0.0008 / 0.0015 (%)
Разделение каналов ухудшается аналогично.

PCM1798 (mono mode)
THD+N — 0.0005 / 0.001 / 0.0015 (%)

PCM1793 (достаточно старый цап)
THD+N — 0.001 / 0.0015 / 0.003 (%)

AK4490
THD+N = -112 / -109 / -106 (dB)

AK4497
THD+N = -116 / -113 / -110 (dB)


Более высокая частота дискретизации позволяет упростить фильтр. Упростить аналоговую часть за счет цифровой.
Собственно, картинка на эту тему приведена во 2 части этой статьи


Это дополнительное пространство между 20 кГц и частотой Найквиста, по существу, просто амортизатор для аналогового фильтра.

Изображение

На рисунке выше представлены диаграммы из видео «Цифровое мультимедиа. Пособие для начинающих гиков», иллюстрирующие ширину переходной полосы для ЦАП или АЦП при частоте 48 кГц (слева) и 96 кГц (справа).

Оттуда же.

Это означает, что сигналы с низкой частотой дискретизации (44.1 кГц или 48 кГц) могут обладать такой же точностью воспроизведения, гладкостью АЧХ и низким уровнем наложений, как сигналы с частотой дискретизации 192 кГц или выше, но при этом не будет проявляться ни один из их недостатков (ультразвуковые волны, вызывающие интермодуляционные искажения, увеличенный размер файлов). Почти все современные ЦАП и АЦП производят избыточную дискретизацию на очень высоких скоростях, и мало кто об этом знает, потому что это происходит автоматически внутри устройства.

Вообще-то у всех ЦАП, умеющих работать в 24/192, лучшая точность и лучшие характеристики как раз в режиме 16/44.
Обратных примеров не встречал. И у старых, и у новых.
Creative SB Live

Телефон, например, тоже. Дома если тесты HTC HD7 сохранились, то покажу. На сколько помню, в 44.1 было хуже, чем в 48.
DigiMakc
Кстати, Макс, вот тут в комментариях встретил то, о чем мы с тобой не очень давно говорили (про форму сигнала и восстановление составляющих в ультразвуковой области). Автор комментария описывает тот же самый механизм другими словами.

https://geektimes.ru/company/audiomania ... nt_8265774

Форму периодическую сигнала дают обертоны — они имеют частоту кратно выше, чем основной тон. Если частота прямоугольного сигнала 20 кГц, то он разлагается в бесконечный ряд фурье как sin(20 кГц) + sin(40 кГц)/2 + sin(60 кГц) / 3…
И все, кроме основного тона в 20 кГц, лежит выше требуемой частоты. Поэтому, что все, что выше 20 кГц невозможно передать при частоте дискретизации 44100, поэтому о прямоугольнике тут речи идти не может. На выходе, соответственно, тоже будет синусоида — ультразвук в 40 кГц человек не услышит.

Справедливости ради можно заметить про интермоды в слышимой области на нелинейной аппаратуре,
к примеру, разностный звуковой тон 1 кГц между ультразвуковыми тонами 25 и 26 кГц, но его уровень будет очевидно невысоким,
а собственно музыкальная полезность этой избыточной информации будет равна нулю, а если еще точнее, эта избыточность будет вредна.
То есть конечно разница в виде тона 1 кГц здесь будет появляться, и кто-то будет утверждать, что вот же оно, слышимое отличие (и даже улучшение), вот только в исходном музыкальном материале этого тона не было.

Это примерно как по похрустыванию виниловой пластинки слушатели в тестах определяли, что это винил,
и на этом основании заявляли, что слышали разницу в звуке (непременно положительную).

Лично мне виниловое похрустывание (в случае, если оно еле слышное) совсем не мешает и даже вызывает легкую приятную ностальгию,
но улучшением именно музыкальной составляющей его не считаю :)

-- Добавлено спустя 4 мин 33 с --
DigiMakc
Да, Creative SB Live! знаменит своей историей про некачественную передискретизацию и проблемной работой в режиме 44.1.
Помню, эта история заставила многих обращать внимание на наличие в устройствах нативного 44.1 с отдельным кварцем в качестве плюса.
И на то, что передискретизация (при некачественной реализации или нехватке ресурсов на это) может сделать звук хуже.

На телефонах скорее всего наблюдается тот же самый ресемплинг с минимальными затратами ресурсов на него.
С появлением спецификации AC97 частота 44.1 стала в дешевых устройствах внесистемной, а штатной стала 48 и кратные частоты 96, 192.
44.1, как атавизм, поддерживается из-за совместимости множества старых устройств с CD, который разрабатывали во времена жесткой экономии ресурсов.
Плюс еще это было одной из мер защиты от цифрового копирования на DAT кассеты (на бытовых магнитофонах DAT с основной частотой 48, поддерживающих запись в 44.1, была доступна запись только первой копии, последующая перезапись уже с нее запрещалась в битовой маске). А потом появился CD-R и уничтожил все эти усилия.
NEW
Да понял я про прямоугольник и частоты 20+ КГц .

Тем не менее, такая проблема есть. Просто народ не заморачивается. Сейчас на моём Samsung S4 разница если и есть, то незначительная совсем.
1 КГц Samsung S4:
44,1 КГц, мп3 320
Изображение

48 КГц, мп3 320
Изображение
DigiMakc
Скорее всего там единственный кварц для 48 кГц с кратным пересчетом в 96-192, если такие есть,
и программный пересчет (ресемплинг) в 44.1 выливается в грязь на графике в неродном режиме.

Сейчас просто мощности-скорости такие, что народ не заморачивается даже текстовым набором в мессенджерах, общаются сразу в видеорежиме,
а что касается ресемплинга, то сделали как-нибудь, численные значения достаточные и ладно (-90 дБ), над более точными алгоритмами передискретизации (как в плагинах к Foobar) никто не напрягается. Программные ресурсы никто не экономит, на избыточно мощных устройствах и индийский код прокатит, батарейку тоже никто не экономит, экономия не в моде, все равно экран больше жрет. А вот лишний кварц туда впаивать точно никто не будет, это влияет на себестоимость устройства.

над более точными алгоритмами передискретизации (как в плагинах к Foobar) никто не напрягается

тем паче, что дай бог, услышит это один из ста. да и то не факт.
Друзья, вы забываете, что всё (со всеми его ±) появляется в _своё время и со своими тогдашне-врЕменными ограничениями. Вы гляньте в историю: когда, для чего и почему появился формат 16/44...
Чисто _инструментально намного проще осуществить ограничение спектра до 20 кГц при 48 кГц, чем при 44 кГц. Математику ведь никакими маркетинговыми хитростями не объедешь :D
Отсюда, дорогой DigiMakc, и гораздо более приличный твой нижний график.
-----
В своё время мы, со товарищи по связному НИИ, очень глубоко погрузились в эту проблему расфильтровки спектров. :oops: Эх, чего только мы не изобретали... :shuffle:
U-Nick
В большинстве случаев без внутреннего оверсемплинга сейчас чипов не осталось, поэтому для аналоговой фильтрации сейчас условия много комфортнее, чем у самых ранних чипов.
Тема высосана из пальца, CD качества за глаза, есть мнения что и оно избыточно. Улитко однако :lol:
Автор статьи — разработчик форматов хранения файлов (первый пост поправил, добавил уточнения).

jonmell
Там отслеживается одна мысль, что более широкие рамки новых форматов (при всей их избыточности) позволяют вольготнее обращаться с собственно музыкальным материалом, то есть проще с ошибками. Действительно качественные записи, достойные всех этих рамок, создать куда сложнее. Да и те (с приличной техникой записи) стали попадаться только в последние годы, среди старых можно и не искать.

x[x]x

тем паче, что дай бог, услышит это один из ста. да и то не факт.

Думаю, один из ста — это очень оптимистичная позиция. В отношении точности передискретизации это скорее соревнования на математическом уровне и далеко за порогами субъективного обнаружения. Собственно, если разницу невозможно заметить при быстром переключении, то её можно и не искать.

Совсем на днях у меня был спор, где человек описывал, что надо дескать неделю одно послушать, неделю другое... я ему ответил, что через неделю он забудет, что слушал еще вчера. А уж для лобовых сравнений счет кратковременной слуховой памяти идет вообще на секунды, дальше самовнушение.
NEW
+ к этому слух человека как раз больше рассчитан на выявление мгновенных изменений. чисто эволюционно )
x[x]x
С т.з. выживания в дикой природе очень многое у человека легко объясняется.
Цивилизованная часть эволюции homo как вида очень короткая, базовая часть намного длиннее.
HTC HD7 тест 44,1/16 против 48/24
Изображениеhttp://savepic.net/8982478.gif Изображениеhttp://savepic.net/8986574.gif
DigiMakc
А раздельными скринами нельзя поместить? У меня такой длины не отображается.
NEW
Отредактировал сообщение. Выложил ссылки на картинки. Их можно открыть в браузере и кликнуть на реальный размер, либо сохранить и просмотреть просмотрщиком.
DigiMakc
Спасибо, посмотрел.
А в цап интересующей меня категории, где выжимают максимум, в 44 обычно картина по искажениям лучше, чем в 192.

в 44 обычно картина по искажениям лучше, чем в 192

к примеру, у моего древнего интерфейса, который сейчас в данной ценовой категории и сменить не на что, картина похожая — в 192 чуть хуже.
http://www.ixbt.com/proaudio/emu-tracker-pre.shtml
x[x]x
А в 16 бит нет замеров?

нет замеров?

не нашёл.
а у меня нет двух коротких джек-джеков (
x[x]x
А зачем два? Вход-выход, один шнур.

Вход-выход, один шнур

есть только 6 метров инструментального шнура, 6 метров для теста многовато )
да и зачем моно... всякое взимопроникновение каналов как мерять?

тем более в идеале нужны 2 коротких стереоджек-канон(папа), ибо там баланс.
x[x]x
Взаимопроникновение не самый важный из показателей.

не самый важный из показателей

а какой важный? мне пофиг, если честно, оно всегда хорошо играет... я не аудиофил, я обычный «глухой» музыкант.
x[x]x
Взаимопроникновение каналов обычно вполне достаточное даже при слабых показателях, тем более на современной музыке с динамическим диапазоном в десяток от силы децибел.
Вот для магнитофонов, особенно кассетных (с дорожками с порядком 1-2 и 3-4 назад) эти имело существенное значение.
А у катушечных магнитофонов еще и дорожки шли через строку — 1-3 и 2-4 в обратном направлении, там на высоких скоростях можно было и обратную запись поймать :)
А когда его меряют у аппаратуры в топологии дуал-моно — вообще теряет смысл.

Даже соотношение сигнал-шум в последнее время тоже зачастую декоративный показатель (когда речь идет о цифрах за 100-110 дБ), да его можно нагнать и искусственно, на тех же мютах.
Куда интересны показатели, снятые не только при 0 дБ, как для тех же лент приводилась АЧХ для сигнала -20 дБ.


я не аудиофил, я обычный «глухой» музыкант.

Музыканты самые страшные люди по отношению к технике ))
Был как-то случай, у незнакомого клиента вижу на столе стопки дисков в пыли на столе и как попало.
Спрашиваю — наверное, музыкант? Он — :eek: — а как догадались? :gigi:

самые страшные люди по отношению к технике

да-да, расскажите мне.


стопки дисков в пыли на столе и как попало

если человек неряха, то всё равно, музыкант он или нет.
нет тут причинно-следственной связи.
Доброго всем.
Можно я вставлю свои пять копеек ?))
24/44.1 считаю самым оптимальным,всё что выше 44.1 уже слушать не возможно,нет целостности картины.всё как то разбросанно.
x[x]x
Просто наблюдение такое из общения с незнакомыми людьми.
Музыканты всегда брали диск за плоскость, а не за ребра.

DeViL-Team
Про 44.1. Возможно, причиной был перевод с CD, от исходников, из-за неудачного ресемплинга.
Я больше на вопрос выбора форматов хранения и пресет обращаю внимание.

Музыканты всегда брали диск за плоскость, а не за ребра.

все мои знакомые музыканты берут диски исключительно за рёбра... так что ))
NEW
Возможно у "аппарата" товарища DeViL-Team выставлено 44,1 КГц, вот и слышит он непонятки на контенте 48-192 КГц.
x[x]x
Значит, мне не такие музыканты попадались )

Взаимопроникновение каналов обычно вполне достаточное даже при слабых показателях, тем более на современной музыке с динамическим диапазоном в десяток от силы децибел.
Вот для магнитофонов, особенно кассетных (с дорожками с порядком 1-2 и 3-4 назад) эти имело существенное значение.

:yes: В некоторых схемах даже использовали доп-цепи (иногда с ручным включением) для некоторой взаимокомпенсации лево-право сигналов. Они часто именовались "расширители стереобазы".
Я такое одному другу сделал — и он был сильно доволен.
U-Nick
Ну там все просто — две RC-цепочки с коллектора на базы перекрестно (сигнал в противофазе на вход второго стереоканала, с каждого из каналов).
У меня в переносном стереомагнитофоне с двухполосной акустикой такой расширитель с завода стоял. Усиливалась стерео-составляющая.
Но это ерунда. Да, база раздвигалась сильно, но это был такой эрзац по звуку, что даже тогда я его выключал.

Интереснее было добавить объем другим способом, типа псевдоквадро.
Ставишь две небольшие колонки (широкополосники) по бокам, на них последовательно пускаешь по проводу сигнал через LC или просто C от плюсов на основных стереоколонках, которые стояли впереди, как обычно. То есть выводишь на них только разностный сигнал из стерео. Электрически обе, естественно, в противофазе друг к другу. Это работало намного лучше и подключалось сразу без разборки аппаратуры. И никакого Dolby не надо, все доступно на коленке. Там появлялось окружение звуком и объем.
Заодно и суммарная АЧХ выравнивалась, а не портилась, как в первом случае, если кому хотелось не точность, а объем.
То есть цепь такая, последовательно, + первой колонки -- C или LC или RC -- шп колонка -- шп колонка -- + второй колонки.
C — десятки мкФ (неполярные или встречно включенные полярные с двойной емкостью), R — единицы Ом или небольшая катушка L.
Новая тема    Ответить  [ Сообщений: 36 ] 


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  

Удалить cookies конференции

Пишите нам | Radeon.ru