Най-честите заблуди по темата за цифрово аудио

Забележка. за по-добро разбиране на текста по-долу бих силно препоръчвам да се научат основите на цифров звук.

S: Колкото по-висока скорост на предаване, толкова по-добре на пистата







R: Това не винаги е така. Да започнем нека ви напомня, че това битрейт (битрейт, а не bitraid). В действителност, това равнище на данни в килобита втори по време на възпроизвеждане. . Това е, ако вземем размера на писта в килобита и разделете на срока за секунди, ние ще го получи скорост на предаване - т.нар .. базирано на файлове битрейт (FBR), тя обикновено не е много различна от скоростта на предаване на аудио поток (причината за разликите е наличието в метаданните на писта - етикети "пришити" изображения, и т.н. ...).

Сега вземат пример: битрейт некомпресирано РСМ аудио записани на стандартен аудио CD, се изчислява, както следва: 2 (канали) * 16 (бита за проба) * 44100 (проби в секунда) = 1411200 (бита / сек) = 1411.2 кбит / сек , Сега вземете sozhmom и проследяване на всеки без загуби кодек ( «без загуби» - .. «Lossless", т.е. такава, която не води до загуба на всички данни), например кодек FLAC. В резултат на това ние се битрейт по-ниска, отколкото на оригинала, но качеството ще остане същата - че вие ​​и първото опровержение е.

Ето нещо, което трябва да се добави. Скоростта на предаване на изхода с компресия без загуба може да се окаже много по-различен (но обикновено е по-малко от некомпресирано аудио) - това зависи от сложността на компресиран сигнал, а по-скоро от излишъка на данни. По този начин, по-прости сигнали ще бъдат компресирани по-добри (т.е. има по-малък размер на файла със същата продължителност => по-ниска скорост на предаване ..), и по-сложни - е по-лошо. Ето защо класическата музика в без загуби е по-малка честота, отколкото, да речем, една скала. Но трябва да се подчертае, че скоростта на предаване във всеки случай не е показател за качеството на аудио материал.

Сега нека да поговорим за компресия със загуби (загуби). Първото нещо, което трябва да се разбере, че има много различни енкодери и формати, а дори и в рамките на едно и също качество формат кодиране за различни енкодери може да бъде различен (например QuickTime AAC кодиране е много по-качествено остарели FAAC), да не говорим за превъзходството на модерни формати (OGG Vorbis, AAC , Opus) на MP3. Казано по-просто, на два еднакви песни, кодирани от различни енкодери с единна ставка по малко, някои ще звучат по-добре, но някои - по-лошо.

В допълнение, има такова нещо като apkonvert. Т.е.. Можете да вземете пистата в MP3 формат с битрейт от 96 Kbit / сек и да го конвертирате в MP3 320 Kbit / сек. Не само това, качеството не се подобри (в действителност губи по време на предишния кодиране на 96 Kbit / сек данни не се връщат), тя е още по-лошо. Заслужава да се отбележи, че на всеки етап от загуби кодиране (с всяка скорост на предаване и всеки енкодер) определена част от изкривяването подадено в аудиото.

S: DVD-Audio звучи по-добре от Audio CD (24-битов срещу 16, 96 кХц срещу 44.1, и т.н. ...)

R: По принцип, това е съвсем логично, а дори и частично вярно, но единствените хора са склонни да се гледа само цифрите и много рядко се мисли за въздействието на даден параметър.

Така че, помислете за малко, за да започнете. Този параметър е отговорен за нищо друго, освен за динамичния диапазон, т.е. за разликата между най-тихите и най-силните звуци (в db). В цифрово аудио максималното ниво - е 0 dBFS, а минималната - ограничено ниво на шума, т.е., в действителност на динамичния обхват на модула е равно на нивото на шума ... За 16-битов аудио динамичен диапазон се изчислява като 20 * дневник (2 ^ 16). 96.33 (БД). Така динамичния обхват на симфонична оркестър - 75db (обикновено около 40-50 db).

Сега си представете, реалните условия. Нивото на шума в стаята - около 40 децибела (не забравяйте, че db - относителна стойност в този случай се приема като 0db праг на чуваемост.), с максимален обем на музиката достига до 110 db (за да се избегне дискомфорт) - получава разлика от 70 db. Така се оказва, че на динамичния обхват на над 70 db в този случай просто безполезни. Д. С обхват над или силни звуци ще достигнат праг на болка или тихи звуци, се усвояват от околния шум. Достигнат нивото на шума в околната среда най-малко 15 db е много трудно (тъй като на това ниво е обемът на човешкия дъх и други шумове, причинени от човешка грешка), в резултат на поредица от 95 db за слушане на музика е напълно достатъчна.

Но има едно "но". Ако се генерира чист тон с честота например 1 кХц и на ниво от -60 dBFS 16-битова дълбочина на квантуване, а след това да го слушате и в сравнение със същия сигнал, но се генерира под формата на 24-битов, ще чуете разликата. Причината се крие в нарушаване на формата на сигнала и появата на фалшиви хармоници. Но за да се избегне това неприятно въздействие, за щастие, има технологии трептене и формирането на шума.

R: За да се разбере защо това не е така, необходимо е да се разбере какво софтуерния плейър. В действителност, това декодиращи процесори (по желание) изход щепсел (на един от интерфейсите: ASIO, DirectSound, WASAPI т.н ..), и разбира се на GUI (графичен потребителски интерфейс). . Т. декодер до 99,9% от работата на стандартния алгоритъм, а съединителят за изход - това е само част от потока от програма, която предава на звуковата карта чрез един от интерфейсите, причината за разликите могат да бъдат само на процесори. Факт е обаче, че процесори обикновено са изключени по подразбиране (или би трябвало да бъде изключен, това е нещо добро за играча - .. За да може да предава звук към "оригиналната" форма). В резултат на това е предмет на сравнението тук може да бъде само за обработка и показване на възможности, които, между другото, се нуждаят от много често изобщо. Но дори и ако такава необходимост е - след това го е сравнение на процесори, а не играчите.

Тук бих искал да спомена една статия за това как да конфигурирате аудио изхода на компютъра си, а може би разочарова потребителите, които се възхищават на "огромни" промени в звука, след като е описано в него настройка - в 95% от случаите това самовнушение (с изключение, разбира се, в случаите, когато в хода на нейната настройка е изключен за известно "uluchshayzer" или друг манипулатор, развалят цялата картина). За съжаление, да се възползват от всички тези устройства с по ReplayGain, resemplerami и ограничители - нещастен. Заключение: ако искате наистина висококачествен звук - купи Hi-Fi високоговорители и професионална звукова карта.

S: Различни версии на водача звучат различни

R: В долната част на това твърдение е банална непознаване на принципите на звуковата карта. Driver - .. Това е софтуер, което се нуждаете за ефективно взаимодействие на устройството с операционната система и обикновено осигурява графичен потребителски интерфейс за възможности за управление на устройството, параметрите му, и така драйвера на звуковата карта предвижда признаване на звуковата карта като аудио устройство, Windows поддържаните отчети OS формати карти, позволява предаване на некомпресиран PCM (обикновено) потока на картата, както и осигурява достъп до настройки. Освен това, в случай на меки обработка (CPU означава), водачът може да съдържа различни DSP (процесори). Защото, първо, ефектите са изключени по време на обработката и, ако водачът не дава точна предаване на PCM заложено на карта, тя се счита за грубо грешка, критичен бъг. И това се случва много рядко. От друга страна, различията между водачите могат да се актуализират алгоритми (resemplerov, ефекти), въпреки че това се случва твърде рядко. В допълнение, ефектът от лечението и всеки шофьор все пак трябва да деактивирате / байпас за постигане на най-високо качество.







По този начин, актуализации на драйвери са насочени главно към подобряване на стабилността и премахване на грешки, свързани с обработката. Нито едното, нито другото в този случай, на качеството на играта не е засегната, тъй като в 999 случая от 1000 звук водача не е засегната.

S: Лицензиран Audio CD звук по-добре, отколкото техните колеги

R: Когато копиране е възникнала грешка (фатално) четене / запис на устройството и оптичното устройство, в който ще се възпроизвежда на диск копие, няма проблеми с неговото четене, такова изявление е лъжа и лесно опровергани.

S: стерео режим кодиране дава по-добро качество, отколкото на Съвместния Stereo

R: Това е подвеждащо засягащи основно LAME MP3, като всички съвременни енкодери (AAC, Vorbis, Musepack) да използва само съвместно стерео режим (и тя е около казва нещо)

За да започнете, трябва да се отбележи, че Съвместното стерео режим се използва успешно в компресия без загуби. Същността му се състои в това, че един сигнал, преди да бъде кодиран се разлага на сумата от ляво и от дясно канал (Mid) и тяхната разлика (Side), а след това там е отделен кодирането на тези сигнали. В срока (за една и съща информация в дясната и лявата канал) се получава, като спестяване на двойно данни. И тъй като повечето от информацията за музика в дясното и лявото канали са доста сходни, този метод е много ефективен и може значително да повиши степента на сгъстяване.

В загуби принцип е един и същ. Но тук, в постоянните фрагменти качествени битрейт с подобна информация в двата канала ще се увеличи (в рамките на ограничението - да се удвои), а за режим VBR в такива места, просто ще се понижат скоростта на предаване (не забравяме, че основната задача на режима на VBR - поддържа стабилно предварително определено качество кодиране, с помощта на възможно най-ниска скорост на предаване). Тъй като по време на загуба кодиране на приоритета (при разпределяне бита) дава на броя канали, за да се избегне влошаването на стерео образа, използва динамично превключване между Съвместното стерео (Mid / Side) и конвенционален (ляво / дясно) въз основа на стерео рамки. Между другото, причината за грешката е несъвършена превключване алгоритъм в по-старите версии на куци, и режима на достъпност Принудително Съвместния, където няма автоматично превключване. В последните версии на LAME Съвместния режим е активирана по подразбиране и не се препоръчва да го промените.

S: По-широкият обхват, по-добре на записа (около спектрограмите, auCDtect и честотен диапазон)

R: ". Линията на спектрограмата" По наше време във форума, но за съжаление много често мярка за качеството на писта Очевидно е, че поради простотата на метода. Но, както показва практиката, реалността е много по-сложно.

И тук е нещо тук. Спектрограмата визуално показва силата на разпространението на сигнала честота, но не може да даде пълна картина на звукозаписа, присъствието в него на изкривяване и компресия артефакти. . Това е в действителност всичко, което може да се определи от спектрограма - честотен обхват (и отчасти - спектър плътност в областта на HF). Д., В най-добрия, като анализира спектрограмата може да идентифицира apkonvert. Сравнявайки спектрограмите писти, получени чрез кодиране на различни енкодери, оригиналът - абсурдно. Да, вие ще бъдете в състояние да идентифицират различията в спектъра, но за да се определи дали те ще бъдат (и колко) да се възприема от човешкото ухо - на практика е невъзможно. Не трябва да забравяме, че със загуби кодиране задача - да се гарантира, резултатът е неразличима за човешкото ухо от оригинала (не на окото).

Същото важи и за оценката на качеството на кодиране чрез анализ на записите от програмата за излизане auCDtect (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect - това е само една черупка за по рода Aucdtect конзола програма). auCDtect алгоритъм също всъщност анализира честотния диапазон и само позволява да се определи (с определена вероятност), дали на някой от етапите на кодиране се прилага за MPEG компресия. Алгоритъмът е наострен от MP3, защото е лесно да "измама" с Vorbis кодек, AAC и Musepack, така че дори и ако програмата се казва "100% CDDA" - това не означава, че кодираното аудио 100% от оригинала.

И, връщайки се незабавно на спектъра. Популярно и желанието на някои "ентусиасти" в каквото и да било забраните нискочестотен (ЛФ) филтър в Lame енкодер. Тук, на лицето на липса на разбиране на принципите на кодиране и психоакустика. На първо място, енкодер отрязъци, висока честота на една единствена цел - да запазите данните и да ги използва за кодиране на повечето от звуков честотен обхват. Разширен честотен диапазон може фатално да повлияе върху цялостната качество на звука и да доведе до звукови артефакти кодиране. Освен това, отрязани при 20 кХц - по принцип е напълно неоправдано, тъй като честотите над човек просто не чуват.

S: Налице е един вид "магия" предварително зададено еквалайзер, който може значително да подобри звука

R: Това не е съвсем така, от една страна, защото всяка отделна конфигурация (слушалки, високоговорители, звукова карта) има свои параметри (по-специално, неговата амплитуда честота характеристика). И тъй като всяка конфигурация, трябва да има свой собствен, уникален подход. Просто казано, съществува тази предварително зададена еквалайзер, но тя е различна за различните конфигурации. Същността на това е да се коригира честотната характеристика на пътя, а именно - в "изравняване" на нежелани спадове и пикове.

Също така, сред хората, далеч от пряката работа със звука на много популярен създаване графичен еквалайзер "тик", който всъщност представлява увеличението на компонентите LF и HF, но в същото време води до намаляване на звука вокална и инструменти спектър на звука, който се намира в средния диапазон ,

S: Преди конвертиране в друг формат на музика трябва да бъде "декомпресиране" да WAV

R: Просто имайте предвид, че при косвените данни WAV PCM (PCM) в контейнера за WAVE (файл с разширение * .wav). Тези данни представляват нищо повече от поредица от битове (нули и единици) в групи от по 16, 24 или 32 (в зависимост от дължината на думата), всеки от които представлява амплитудата на двоичен код, съответстващ на това проба (например 16 бита, в десетичен представителство тази стойност -32 768 до 32 768).

Така че, факт е, че който и да е звуков процесор - дали филтър или енкодер - обикновено работи само с тези стойности, т.е. само с некомпресирани данни. Това означава, че, за да се превърне звука на, да речем, FLAC да APE, просто трябва първо да декодира FLAC до PCM, а след това се кодира PCM да APE. Това е как да се преопаковат файловете от пощенски до RAR, трябва първо да разопаковате ZIP.

Въпреки това, ако използвате конвертор, или просто напреднали конзолни програмисти, междинно конвертиране на PCM се извършва в движение, дори и без да записвате WAV временен файл. Това е, което подвежда хората - изглежда, че форматите се превръщат директно в един от друг, но в действителност в такава програма е задължен да има входен формат декодер, изпълнява pomezhutochnoe преобразуване на PCM.

По този начин, ръчно преобразуване на WAV не ви дава абсолютно нищо, но си губим времето.

? 200 "200px ':' '+ (this.scrollHeight + 5) +' пиксела ');"> Ако се генерира чист тон с честота например 1 кХц и ниво - 60 dBFS с 16-битова дълбочина на квантуване, а след това да я слушат и в сравнение със същия сигнал, но генерира в 24-битов форма, ще чуете разликата.


И ако често ги управлява (различия), за да чуят от обема, който обикновено слушат музика?

Всичко е точно обратното. WASAPI и двете дават ASIO битов поток, съчетани, така че не е точно ефекта на биберон-залъгалка. А resemplery на някои карти са напълно в състояние да помогне да се избегне лошо качество повторно взимане на проби. И все пак има дълбока изрезка в някои MP3 - има ограничител спестява много добре.
MP3 и др аз не използват със загуби (просто не искат да се занимават с възможните странични ефекти, като например рязането и мястото на депозит в размер на без загуби Нямам нищо против).
Всъщност, може би греша. Най-вероятно WASAPI аз наистина не го чуете навреме. И на творчески продукти (Audigy 2 ZS в моя случай) е доста съмнителна повторно взимане на проби на картата, ако се вярва на "слухове". Така че това е опция.

Тъй като не е тъжно, като се радва на всички тези устройства с по ReplayGain, resemplerami и ограничители - нещастен.
Е, от resemplerov и ограничители, разбира се, не, но това е начина, по който е невъзможно да се обясни банална "плацебо" подобряване на звука от движещ се с wasapi изключително за хардуер ASIO на. Говорейки зло меломани превръща "сцена се е превърнал по-широко и по-дълбоко." Четливост страни (особено в "подплатени" рекорд), не е, че по някакъв начин коренно се подобрили, но все пак се подобрили. Не, дори и най-първото нещо, което забелязах след преминаване ASIO - са се подобрили значително в случай на поддържане.

? 200 "200px": '' + (this.scrollHeight + 5) + 'пиксела'); "> Е, от resemplerov и ограничители на не разбира, но това е начина, по който е невъзможно да се обясни банална е" плацебо "подобряване на звука да се преместят в wasapi изключително за хардуер ASIO на.

Всичко е точно обратното. WASAPI и двете дават ASIO битов поток, съчетани, така че не е точно ефекта на биберон-залъгалка. А resemplery на някои карти са напълно в състояние да помогне да се избегне лошо качество повторно взимане на проби. И все пак има дълбока изрезка в някои MP3 - има ограничител спестява много добре.

DBT вас "в ръка".