Cele mai frecvente concepții greșite pe tema audio digitale

anterior ◈ următoarea

Notă. pentru o mai bună înțelegere a textului de mai jos este extrem de aș recomanda să învețe elementele de bază ale audio digitale.

S: Cu cât bitrate, cu atât mai bine pista

R: Acest lucru nu este întotdeauna cazul. Pentru a începe să-ți reamintesc că acest bitrate-ul (bitrate, mai degrabă decât bitraid). De fapt, această rată de date în kilobiți o secundă în timpul redării. . Asta este, dacă luăm dimensiunea pista în kilobiți și împărțire de durata în secunde, vom obține mușcat rata - așa-numitul .. Rată de biți pe bază de fișier (FBR), nu este de obicei prea diferit de rata de biți a fluxului audio (motivul diferențelor este prezența în metadatele de cale - tag-uri „cusute“ imagini, etc ...).

Ne luăm acum un exemplu: bitrate audio PCM necomprimat înregistrat pe un CD audio standard se calculează după cum urmează: 2 (canale) * 16 (biți pe eșantion) * 44100 (eșantioane pe secundă) = 1411200 (biți / sec) = 1411.2 kbit / s . Acum, ia sozhmom și urmări orice codec fără pierderi ( «Lossless» - .. «Lossless“, adică una care nu duce la pierderea de date), de exemplu codec FLAC. Ca rezultat, vom obține o rată de biți mai mică decât originalul, dar calitatea va rămâne aceeași - că tu și prima respingere.

Iată ceva ce ar trebui să fie adăugate. Rata de biți la ieșire cu compresie fără pierderi se pot dovedi foarte diferite (dar de obicei este mai mică decât audio necomprimat) - depinde de complexitatea semnalului comprimat, ci mai degrabă din redundanța datelor. Astfel, un semnal mai simplu va fi comprimat mai bine (de exemplu, au o dimensiune de fișier mai mic, cu aceeași durată => rată mică de eșantionare ..), Și mai complexă - este mai rău. Acesta este motivul pentru care muzica clasică are o rată fără pierderi de biți mai mică decât, să zicem, o piatră. Dar trebuie subliniat aici faptul că rata de biți, în orice caz, nu un indicator al calității materialului audio.

Acum, hai sa vorbim despre compresie lossy (lossy). Primul lucru pe care trebuie să înțeleagă că există multe codificatoare diferite și formate, și chiar și în aceeași calitate de codificare format pentru diferite codificatoare pot fi diferite (de exemplu, QuickTime codificare AAC este mult mai calitativ învechit FAAC), să nu mai vorbim de superioritatea formatelor moderne (OGG Vorbis, AAC , Opus) pe MP3. Pur și simplu pune, cele două piese identice, codificate de diferite codificatoare cu o rată unică de biți, unele va suna mai bine, dar unele - mai rău.

În plus, există un astfel de lucru ca apkonvert. Adică. Puteți lua melodia în format MP3 cu o rată de biți de 96 kbit / s și converti la MP3 320 kbit / s. Nu numai că, calitatea nu se îmbunătățește (de fapt, a pierdut în timpul codificării anterioare la 96 kbit / s de date nu a returnat), este chiar mai rău. Merită să subliniem că în fiecare etapă de codificare lossy (cu orice rată de biți și orice codificator) anumită porțiune a distorsiunea introdusă în audio.

S: DVD-Audio sună mai bine decât CD audio (24 biți vs 16, 96 kHz vs 44,1, etc ...)

R: În principiu, este destul de logic, și chiar și parțial adevărat, dar singurii oameni tind să se uite doar la numerele și foarte rar se gândească la impactul unui parametru.

Deci, ia în considerare bitul pentru a începe. Acest parametru este responsabil pentru nimic altceva decât pentru intervalul dinamic, adică, pentru diferența dintre cele mai liniștite și sunetele joase (în dB). În audio digital nivelul maxim - este de 0 dBfs, iar cea minimă - nivelul de zgomot limitat, adică, de fapt, intervalul dinamic al modulului este egal cu nivelul de zgomot ... Pentru 16-bit gamă audio dinamică se calculează ca 20 log * (2 ^ 16). 96.33 (dB). Astfel, intervalul dinamic al unei orchestre simfonice - 75 dB (în general, aproximativ 40-50 dB).

Acum, imaginați-vă condițiile reale. Nivelul de zgomot în camera - aproximativ 40 dB (nu uitați că dB - valoare relativă, în acest caz, se consideră 0 dB prag de audibilitate.), Volumul maxim al muzicii atinge 110 dB (pentru a evita disconfortul) - se obține o diferență de 70 dB. Astfel, se pare că intervalul dinamic de peste 70 dB, în acest caz, pur și simplu inutil. E. Cu o gamă de mai sus sau zgomote puternice va ajunge la un prag de durere sau sunete linistite sunt absorbite de zgomotul din jur. Atinge nivelul de zgomot ambiental cu cel puțin 15 dB este foarte dificil (deoarece la acest nivel este volumul respirației umane și alte zgomote cauzate de erori umane), rezultând într-un interval de 95 dB pentru a asculta muzică este complet suficient.

Dar există un „dar“. Dacă genera un ton pur, cu o frecvență de exemplu 1 kHz și un nivel de adâncime cuantizare -60 dBfs 16 biți, și apoi să-l asculta și în comparație cu același semnal, dar este generat în formă de 24 de biți, auzi diferența. Motivul constă în deformarea formei de undă și apariția armonicilor false. Dar, pentru a elimina acest efect neplăcut, din fericire, există tehnologii dithering și a zgomotului de formare.

R: Pentru a înțelege de ce acest lucru nu este așa, este necesar să se înțeleagă ce player-ul de software. De fapt, acest procesoare decodoare dop (opțional) de ieșire (pe una dintre interfețele: ASIO, DirectSound, WASAPI etc ..), Și, desigur, GUI (interfață grafică de utilizator). . T. decodor la 99,9% din modul de funcționare a algoritmului standard, precum și fișa de ieșire - este doar o parte a fluxului de program care transmite placa de sunet printr-una dintre interfețele, motivul pentru care diferențele pot fi doar procesoare. Dar faptul este că procesoarele sunt de obicei dezactivate în mod implicit (sau ar trebui să fie oprit, că este un lucru bun pentru player - .. Pentru a putea transmite sunetul la forma „originală“). Ca urmare, obiectul comparației aici nu poate fi decât de prelucrare și afișare capabilități, care, de altfel, au nevoie de foarte multe ori la toate. Dar, chiar dacă o astfel de necesitate este - atunci este o comparație între procesoare și nu jucătorii.

Aici, aș dori să menționez un articol despre cum se configurează ieșirea audio de pe computer, și, probabil, dezamăgesc utilizatorii care admiră modificările „uriașe“ în sunetul după descris în aceasta setare - în 95% din cazuri, această auto-sugestie (cu excepția, desigur, în cazurile în care, în cursul său setare a fost dezactivată pentru unele „uluchshayzer“ sau alt handler, rasfatul întreaga imagine). Din păcate, beneficiază de toate aceste dispozitive cu pentru ReplayGain, resemplerami și limitatoare - mizerabil. Concluzie: dacă doriți cu adevărat un sunet de înaltă calitate - cumpere un boxe Hi-Fi și placa de sunet profesional.

S: Diferite versiuni ale conducătorului auto diferite de sunet

R: În partea de jos a acestei declarații este ignoranța banală a principiilor placa de sunet. Driver - .. Acesta este software-ul de care aveți nevoie pentru interacțiunea eficientă a dispozitivului cu sistemul de operare, și de obicei oferă o interfață grafică de utilizator pentru capacitățile de gestionare a dispozitivului, parametrii săi, și așa mai departe driverul plăcii de sunet oferă o recunoaștere a plăcii de sunet ca un dispozitiv audio, Windows, rapoarte Sisteme de operare suportate formate de carduri, permite transmiterea de PCM necomprimat (de obicei), fluxul de pe card, precum și oferă acces la setările. Mai mult, în cazul unui prelucrare moale (înseamnă CPU), conducătorul auto poate cuprinde diferite DSP (procesoare). Pentru că, în primul rând, efectele sunt oprite în timpul prelucrării și, în cazul în care conducătorul auto nu asigură transmisia exactă a PCM în joc, acesta este considerat a fi o greșeală gravă, un bug critic. Și acest lucru se întâmplă foarte rar. Pe de altă parte, diferențele dintre conducătorii auto pot fi actualizate algoritmi (resemplerov, efecte), cu toate că se întâmplă prea rar. În plus, efectele tratamentului și fiecare șofer ar trebui să dezactiveze în continuare / by-pass pentru a obține cea mai bună calitate.

Astfel, actualizările de driver vizează în principal îmbunătățirea stabilității și a elimina erorile asociate cu procesarea. Nici una, nici alta, în acest caz, calitatea jocului nu este afectată, deoarece în 999 de cazuri din 1000 driver de sunet nu este afectată.

S: Licentiat sunet CD audio mai bine decât omologii lor

R: Când copiați are eroare (fatală) dispozitiv de citire / scriere și unitatea optică în care discul-copie va fi reproduse, fără probleme cu lectura lui, o astfel de afirmație este falsă și ușor demolată.

S: Mod de codare stereo oferă o calitate mai bună decât stereo comună

R: Aceasta este înșelătoare se referă în principal LAME MP3, ca toate codificările moderne (AAC, Vorbis, Musepack) utilizează modul stereo numai mixt (și este vorba de a spune ceva)

Pentru început, este demn de menționat faptul că modul stereo mixt este utilizat cu succes în compresie fără pierderi. Esența ei constă în faptul că un semnal înainte de a fi codificat este descompus în suma dreapta și canal (Mid) stânga, și diferența lor (Side), iar apoi există codificarea separată a acestor semnale. În limita (pentru aceleași informații în dreapta și canalul din stânga) este obținut prin salvarea datelor dublu. Și, din moment ce majoritatea informațiilor de muzică din dreapta și din stânga canale sunt destul de asemănătoare, această metodă este foarte eficientă și poate crește în mod semnificativ rata de compresie.

În principiu, lossy este același. Dar aici, în constante fragmente de calitate bitrate-ul cu informații similare în cele două canale vor crește (în limita - a dubla), precum și pentru modul VBR în astfel de locații vor scădea pur și simplu rata de biți (nu uitați că sarcina principală a modurilor VBR - menține stabil predeterminat calitate de codificare, utilizând cea mai mică rată de biți posibil). Deoarece în timpul priorității de codificare lossy (atunci când alocarea de biți) dată cantitatea de canale pentru a evita deteriorarea imaginii stereo, utilizează comutarea dinamică între Stereo mixt (Mid / Side) și convențional (stânga / dreapta), pe baza cadrelor stereo. Apropo, cauza erorii a fost algoritmul de comutare imperfect în versiunile mai vechi ale șchiopi și modul de disponibilitate forțată în comun, în cazul în care nu există nici o auto-comutare. În versiunile recente ale modului comune LAME este activată în mod implicit și nu este recomandat să-l schimbe.

S: Lărgirea gamei, cu atât mai bine înregistrarea (aproximativ Spectrograme, auCDtect și interval de frecvență)

R: „Linia de pe spectograma“ În timpul nostru pe forumuri, din păcate, măsura foarte comună a calității de cale Evident, din cauza simplitatea metodei. Dar, după cum arată practica, realitatea este mult mai complicată.

Și aici e chestia aici. Spectrograma demonstrează vizual puterea distribuției de frecvență a semnalului, dar nu poate oferi o imagine completă a înregistrării sunetului, prezența în ea de distorsiune și de compresie artefacte. . Aceasta este, de fapt, tot ce poate fi determinată din spectrograma - un interval de frecvență (și parțial - spectru de densitate în zona HF). E., cel mai bun caz, prin analiza spectrograma poate identifica apkonvert. Comparând piesele Spectrograme obținute prin codare diferite codificatoare, original - absurd. Da, va fi capabil să identifice diferențele în spectrul, dar pentru a determina dacă acestea vor fi (și cât de mult) să fie percepută de urechea umană - este practic imposibil. Nu trebuie să uităm că sarcina de codificare lossy - pentru a se asigura rezultatul este imposibil de distins cu urechea umană din original (nu a ochiului).

Același lucru este valabil și pentru evaluarea calității de codare prin analiza melodiile de pe programul de ieșire auCDtect (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect - aceasta este doar o coajă pentru unul de un fel de program de consolă Aucdtect). auCDtect algoritm, de asemenea, de fapt, analizează gama de frecvențe și numai permite determinarea (cu o anumită probabilitate) dacă oricare dintre etapele de codare aplicate la compresie MPEG. Algoritmul este ascuțită de MP3, pentru că este ușor să „trișeze“ cu Vorbis codec, AAC și Musepack, astfel încât, chiar dacă programul spune „100% CDDA“ - aceasta nu înseamnă că audio codat 100% din original.

Și, revenind imediat la spectrele. Popularã, de asemenea, dorința unor „entuziaști“, în orice fel de dezactivare filtru trece jos (LF) în LAME codificator. Aici, pe fața lipsei de înțelegere a principiilor de codificare și psihoacusticii. În primul rând, codorul trunchiază frecvență mare pentru un singur scop - pentru a salva datele și să le utilizeze pentru a codifica cea mai mare gama de frecvențe audibil. gamă de frecvență extinsă poate afecta în mod fatal calitatea generală a sunetului și poate conduce la artefacte audibile de codificare. Mai mult decât atât, taie la 20 kHz - în general, este complet nejustificată, deoarece frecvențele de mai sus o persoană care pur și simplu nu se aude.

S: Există un fel de „magic“ egalizator prestabilit, care poate îmbunătăți foarte mult sunetul

R: Acest lucru nu este destul de atât, în primul rând, pentru că fiecare configurație unică (căști, difuzoare, o placă de sunet) are propriile sale parametri (în particular, caracteristica amplitudine-frecvență). Și pentru că fiecare configurație trebuie să aibă propria abordare, unica. Pur și simplu pune, există acest egalizator prestabilit, dar este diferit pentru diferite configurații. Esența este de a ajusta frecvența de răspuns calea - și anume, în „nivelarea“ golurilor nedorite și piroane.

De asemenea, printre persoanele îndepărtate de activitatea directă cu sunetul unui foarte popular setare egalizator grafic „capusa“, care reprezintă de fapt creșterea în componentele LF și HF, dar în același timp, duce la scăderea spectrului de frecvențe vocale și instrumente de sunet de sunet, care se află în raza medie .

S: Înainte de a converti în alt format de muzica ar trebui să fie „decomprima“ să WAV

R: Doar act de faptul că în conformitate cu datele implicite PCM WAV (PCM) în container WAVE (fișier cu extensia * .wav). Aceste date nu reprezintă nimic mai mult decât o serie de biți (unu și zero) în grupuri de 16, 24 sau 32 (în funcție de lungimea cuvântului), fiecare dintre acestea reprezentând amplitudinea codului binar corespunzător un eșantion (de exemplu, 16 de biți, în reprezentare zecimală această valoare -32768-32,768).

Deci, este faptul că orice procesor de sunet - dacă un filtru sau codificator - de obicei, funcționează numai cu aceste valori, adică numai cu date necomprimate. Acest lucru înseamnă că, în scopul de a transforma sunetul, să zicem, FLAC la APE, pur și simplu trebuie să decodeze mai întâi FLAC PCM, și apoi PCM codifica la APE. Acesta este modul de a re-împacheta fișierele din ZIP la RAR, trebuie despachetarea ZIP.

Cu toate acestea, dacă utilizați convertorul, sau pur și simplu codere avansate consola, de conversie intermediară la PCM are loc pe zbor, chiar și fără a înregistra un fișier WAV temporar. Aceasta este ceea ce induce în eroare oamenii - se pare că formatele sunt convertite direct într-unul pe altul, dar, de fapt, într-un astfel de program este obligat să aibă un format de intrare decodor, efectuează conversia pomezhutochnoe la PCM.

Astfel, conversia manuală a WAV nu vă oferă absolut nimic, dar pierdem timpul.

? 200 „200px“: „“ + (this.scrollHeight + 5) + „px“); „> Dacă genera un ton pur, cu o frecvență de exemplu 1 kHz și nivelul - 60 dBfs cu adâncime cuantizare de 16 biți, și apoi să-l asculta și comparativ cu același semnal, dar generat în formă de 24 de biți, veți auzi diferența.

Și dacă de multe ori le-a reușit (diferențe) pentru a auzi pe volum, pe care, de obicei, asculta muzica?

Totul este exact opusul. WASAPI și ambele da bit stream ASIO potrivire, deci nu este tocmai efectul suzeta. Un resemplery pe unele hărți sunt pe deplin capabile de a ajuta la evitarea resampling de slabă calitate. Și totuși, există o tăiere adânc în unele MP3 - nu există limitator economisește foarte bine.
MP3 și altele nu folosesc lossy (pur și simplu nu doresc să deranjez cu posibilele efecte secundare, cum ar fi tăiere, precum și locul de depunere a lossless nu mă deranjează).
De fapt, poate că am greșit. Cel mai probabil, WASAPI eu nu prea asculta ceva la timp. Și pe produsele Creative (Audigy 2 ZS, în cazul meu) este reeșantionare destul de discutabil de pe card, dacă considerați că „zvonuri“. Așa că aceasta este o opțiune.

Deoarece nu este trist, beneficiaza de toate aceste dispozitive cu pentru ReplayGain, resemplerami și limitatoare - mizerabil.
Ei bine, de la resemplerov și limitatoare, desigur, nu, dar asta e modul în care este imposibil de a explica banal „placebo“ îmbunătățirea sunetului de la deplasarea cu wasapi exclusiv la ASIO hardware-ul. Vorbind audiofil răul se transformă „scena a devenit mai largă și mai profundă.“ partidele lizibilitate (mai ales în „căptușit“ înregistrare) nu este îmbunătățită, care într-un fel în mod fundamental, dar încă îmbunătățit. Nu, chiar primul lucru pe care am observat după trecerea ASIO - s-au îmbunătățit semnificativ în cazul susține.

? 200 '200px': '' + (this.scrollHeight + 5) + 'px'); "> Ei bine, de la resemplerov si limitatoare, de nu, desigur, dar asta e modul în care este imposibil de a explica banal" placebo „îmbunătățire a sunetului de la trecerea la wasapi exclusiv la ASIO hardware-ul.

DBT te „în mână“.

anterior ◈ următoarea

Cele mai frecvente concepții greșite pe tema audio digitale

Meniu

Tag-uri articol