A CD-SACD-DVD-Audio formátumok technikai megközelítésben

Bevezetés

Már egy ideje érdekelt, hogy valójában mennyire is jók az olyan új, nagy felbontású formátumok, mint a Super Audio CD és a DVD-Audio. Már voltam néhány bemutatón, de nem igazán lettem meggyőzve, ami persze a formátumokon kívül álló okok miatt is elképzelhető. A különböző fórumokat olvasva úgy látszott, hogy a legtöbb audiofil az SACD-t jobbnak ítéli, mint a DVD-Audio-t. Én is ezt gondoltam egészen addig, amíg el nem olvastam, hogy mit is írt Ing. Öhman a Svéd Audio-Technikai Szövetség folyóiratában (a Szövetség egy nonprofit szervezet, ami az audioval és a hangreprodukálással kapcsolatos problémákkal és tudományokkal foglalkozik). Ezt olvastam:

„Kész tragédia, hogy a Sony/Philips SACD-jét még mindig valódi ellenfélnek tekintik a DVD-Audioval szemben, pedig a legmagasabb oktávban még a CD-nél is kisebb a felbontása. A DVD-A a teljes felvételi sávban nyújt jóval nagyobb dinamikát, mint a CD, de az SACD esetén ez igencsak kérdéses. Az SACD a magasfrekvenciás visszaadásban eléggé átlagos, akár egy jó CD-lejátszó egy egybites DAC-al is versenyben van vele, egy multi-bites konverter pedig egyértelműen sokkal jobb. A DVD-A viszont a teljes frekvenciasávban 250-szer jobb – elméletben – mint a CD-rendszer! Persze manapság nem könnyű megvalósítani egy ilyen nagyon nagy felbontású rendszert, de a jövőben? Ha a lehetőség fennáll, akkor a felvételi és a visszajátszási technológia fel fog nőni a feladathoz. Ma a DVD-A megvalósítások nagyjából 16-szor jobbak, mint a CD-rendszer és a frekvenciatartomány 100 kHz-ig tart, ellentétben a CD 22050 Hz-ével.”

Na ekkor már kíváncsi lettem. Ez pont az ellenkezője annak, amit én gondoltam. Megkérdeztem magát Öhmant.

Niklas Ladberg: Hogyan jutott erre a konklúzióra?

Ing. Öhman: A DSD (az SACD esetén használt kódolási rendszer) sokkal jobb, mint a CD az alacsonyabb frekvenciákon. A probléma a magasabb frekvenciáknál jelentkezik. Az ultrahangok tartományában a zaj több, mint 100 dB-el magasabb (-40 dB a maximális kivezérlés alatt szűk sávú analízist használva), mint a DVD-A esetében (-144 dB a maximális kivezérlés alatt, széles sávú zaj). Úgy is fogalmazhatnánk, hogy az SACD-ről jövő zaj több, mint 20 milliószor nagyobb, mint a DVD-A-ról mérve. De még fontosabb, hogy tudjuk, ez az ultrahangú zaj, ami az SACD-ről jön, elegendő ahhoz, hogy a magassugárzókat annyira fölmelegítse, ami már befolyásolja a reprodukált hangot is. Továbbá az ultrahangok hatással lehetnek a hallható hangokra is, különösen nagy hangnyomáson. A CD-vel való összevetés nehezebb, mert annak egyébként eléggé limitált az átviteli képessége. Jel-zaj viszony ott 22,05 kHz fölött nem mérhető, de egyébként a zajszint ugyanolyan jó lehet, mint DVD-A esetén – mindig használható aluláteresztő szűrő. És ekkor a CD-játszóból nem jön ki ultrahang. Az SACD-vel kapcsolatos probléma elméleti számításokkal, méréssel és meghallgatásos tesztekkel is kimutatható. Én már mindhárommal foglalkoztam és mindegyik pont ugyanabba az irányba mutat: az SACD-nek nincs nagyobb felbontása 10 kHz fölött, mint a CD-nek. A néhány évvel ezelőtti becsléseinket most már az általunk és mások által elvégzett mérések és a meghallgatások is igazolták. Már sok tanulmány készült, például a Stereophile által, akik számos SACD lejátszót teszteltek és igazolták a föltevéseinket.

NL: Mit írt a Stereophile az SACD korlátairól?

: Hát a publikált tesztekben nem sokat. A Stereophile egy hirdetés-orientált újság és óvatosak, hogy ne mondjanak véletlenül sem semmi negatívumot, viszont publikálták a méréseiket, amiket gyakran maga a ravasz főszerkesztő, John Atkinsson végzett el. Megjegyzései nagyon tanulságosak! Bár nagyon óvatos, egy hasonlóan ravasz olvasó kiolvashatja Atkinson véleményét a szövegből. A Stereophile kiterjedt szubjektív meghallgatásos tesztet is végzett a létező nagy felbontású formátumok között és az SACD ott még a 16 bites, 176,4 kHz-es PCM-nél is gyengébb volt. De persze senkinek nem kell túlságosan figyelembe vennie, hogy hányszor írják ezt vagy azt. Ami a lényeg, hogy ezek a dolgok valóban megvannak függetlenül attól, hány ember hisz bennük. Az igazság szavazással való eldöntése ritkán jó módszer. Csak azt mutatja meg, hogy mit hisznek az emberek. Néhány ember hite persze az igazat tartalmazhatja, de a helyes információkat és a megfelelő meghallgatásos teszteket nagyon gyakran eltorzítják a tévképzetek, előre kialakított vélemények és a média háttérzaja. Ez különösen ebben az esetben igaz, mivel a DVD-A és az SACD sosem lett összehasonlítva azonos körülmények között.

NL: Olvastam egy technikai dokumentációt az SACD-ről. A Sony ezt állítja:

„A CD-re szánt PCM felvételekre használt A/D-konverterek túlnyomó többsége 1 bites konverterrel dolgozik magas mintavételezési frekvencián.”

Hát akkor nem jobb, ha megtartjuk a jelet ebben a formában (DSD – SACD), mint hogy átkonvertáljuk PCM-é (CD/DVD-A)?

: Igen, ez igaz, de lényeges ez? A CD-rendszer gyengébbnek tűnik, ha egybites konverterrel használjuk. A probléma nem a konverzió az egy bitről PCM-re, hanem maga az egy bites átalakító maga! Ráadásul a CD-lejátszókban használt egybites konverterek általában magasabb mintavételezéssel dolgoznak, mint a DSD, ami csak 64-szer nagyobb, mint a CD mintavételezése (a DSD 2,8 MHz-es mintavételezéssel dolgozik). Ez a nagyon alacsony érték azért lett elfogadva, mert a kódolás egyáltalán nem hatékony, a tárhely pedig véges. Betömörítve persze némileg jobb a helyzet, de a PCM-el összehasonlítva még mindig gyenge. A CD-lejátszókban használt egybites konverterek általában 11 és 50 MHz közötti mntavételezést használnak. A legjobb egybites konverter szerintem a JVC PEM-DD-je, ami sokkal jobb, mint a DSD. Ezt persze fenntartásokkal kell fogadni, persze lehetnek még a PEM-DD-nél is jobb egybites konverterek. De jelenleg szerintem ez áll legközelebb a valódi multibites konverterekhez felbontásban.

NL: Eleinte azt hittem, az SACD a DSD technikát használja végig a felvétel és a mastering során, de ez nem így van:

„Nagy meglepetés volt az AES-en, hogy a Sony megerősítette: az SACD-kben használt DSD-technika multibites PCM-et használ a felvétel és a mastering során és csak a fogyasztói lejátszókban van egybites technika. Jim Johnston az AT&T-nél azt is megkockáztatta, hogy ugyanaz a mikroprocesszor képes különböző kimenetein DSD és DVD-A adatfolyamokat produkálni.”

Nyilvánvaló tehát, hogy PCM-et használnak még az SACD felvételéhez és masteringjéhez is. Így aztán a konvertálás hiányának előnye egyből eltűnik.

: Számos dokumentum bizonyítja ezt. A Sony/Philips még hivatalosan is azt javasolja, hogy PCM-et használjanak az anyag szerkesztése során. Szerintem ez bölcs gondolat, mert a PCM esetén minden módosítás egyszerű és hatékony és ha elég nagy a felbontás, akkor nem rontja a minőséget. Így csak a DSD-problémák maradnak! Ezért viszont a DVD-A tisztább és előrelátóbb rendszer. Nincs konvertálás a különböző formátumok között és 100 kHz-ig megvan a 144 dB-es felbontás. Lehetne jobb? Persze mindig lehet jobbat kitalálni, de a DVD-A elég jó. Tulajdonképpen a CD-rendszernek kellett volna ilyennek lenni már a kezdetektől!

NL: Visszatérve a Sony technikai dokumentációjához:

„Lejátszási téren a legtöbb CD-lejátszó egybites D/A konvertert használ, hogy a digitális jelből analógot csináljon.”

Ez így van? A legtöbb CD-lejátszó nem multibites konvertert használ?

: Bár rengeteg nagyszerű multibites CD-lejátszó létezik, manapság sajnos a legtöbb már egybites konvertert használ. Ez bizonyára pénzkérdés. Egy ún. 24 bites egybites konverter (ami belsőleg egybites módon dolgozik, de 24 bites bemenete van) körülbelül 2-4 dollárba kerül, ami már tartalmazza a 2 csatornát és a digitális szűrőt. Egy valódi 24 bites konverter 96 kHz-es mintavételezési frekvenciával és 8-szoros túlmintavételezéssel körülbeül 10-15 dollárba kerül csatornánként – a digitális szűrő nélkül. Két csatornával és digitális szűrővel már körülbeül 40 dollár. A multibites tehát tízszer drágább, mint az egybites. A legtöbb gyártónak innentől kezdve egyértelmű a döntés… Különösen, mert a HiFi-magazinok és üzletek sosem állnak ki, hogy elmondják a különbséget.

NL: Újra a Sonytól:

„Bár a bitszám csak 1/16-a a CD-nél használtnak, a mintavételezési frekvencia 64-szer nagyobb. A DSD több, mint 4-szer több információt tárol, mint a CD.”

4-szer több információ csak nem lehet rossz? Vagy a bitek száma sokkal fontosabb?

: A bitek száma sokkal fontosabb. Tulajdonképpen elméletben a DSD-rendszer kevésbé „sűrű”, mint a CD-rendszer. Még akkor is, ha az adat tömörített (mint az SACD-n), akkor sem annyival jobb. Amikor a Sony azt állítja, hogy a DSD 4-szer annyi adatot tárol, ez valójában azt jelenti, hogy 4-szer akkora hely van az SACD-n, mint a CD-n. De mivel a DSD-kódolás annyival kevésbé hatékony, a valódi információ jelentősen kevesebb. A felbontás/információ megduplázódik, ha megduplázzuk a mintavételezési frekvenciát (persze a helyzet valamivel bonyolultabb, de a példa szempontjából ez is megfelel). De ha PCM esetén meg akarjuk duplázni a felbontást, csak egy további bitet kell hozzáadnunk. Ha 1 bitről 16 bitre növeljük (15 bitet hozzáadva, ami nagyjából 15-szörösére növeli a tárigényt), a felbontás 65536-szorosára nő (egy lépésről 65536 lépésre). [Ez nem így van, egy bit kétféle állapotot tárolhat, tehát a felbontás 32768-szorosára nő, de persze a magyarázat ettől még megállja a helyét – a ford.]

És van még egy másik alapvető különbség: a felbontás mintavételezési frekvenciával való növelése frekvenciafüggő lesz. Egy egybites rendszernek nagy felbontása van alacsony frekvenciákon (ahol az információ elméletileg alacsony) és kis felbontása magasabb frekvenciákon (ahol az információ viszont elméletileg magasabb). Nagy mértékű zajformálással meg lehet növelni a felbontást „egészen magas frekvenciákig” azon az áron, hogy nagyon magas frekvencián alacsonyabb lesz, de ez csak a statikus, nem tranziens jelekre érvényes. A tranziens jeleknek nagyon rossz a felbontása az egybites rendszerekben. Ha a jel nem elég hosszan marad meg, akkor a hiba nem minimalizálható az egybites rendszer zajformálásával.

Ezért lehet olyanokat olvasni a Burr-Brown dokumentációiban (a cég egybites és multibites konvertereket is gyárt), hogy „a hullámforma szintetizáló alkalmazások esetén, amelyek nagyon alacsony torzítást és zajszintet igényelnek”, multibites konvertert ajánlanak. Ők ezt nem véletlenül írták le. Egy egybites konverter (mint a DSD rendszer) képtelen reprodukálni megfelelő precizitással a rövid idejű impulzusokat. Mert az pillanatról pillanatra változik. Az egyébként azonos rögzített jelek mindegyike más és más formát fog ölteni. Még mindig vitatkoznak ennek a tulajdonságnak az észlelhetőségén és azon, hogy ha hallható, mennyire zavaró. Az jó minőségű reprodukció nem fontos mindenki számára. Ha a zene visszaadása valamennyire megváltozik, néhány embernek ez csekély probléma, másoknak sokkal komolyabb. Az viszont nem vita tárgya, hogy az egybites rendszerek alacsonyabb felbontása csak precízebb visszaadás esetén probléma. De amikor nagyon nagy precizitásra és stabilitásra van szükség, amikor fontos, hogy a generált hullámforma pont olyan, amilyennek lennie kell, akkor csak a multibites konverterek használhatóak, mert csak ezek tudják ezt megcsinálni. Személyes véleményem és tapasztalatom, hogy a hangvisszaadás nagyon magas precizitást követel és a reprodukció sérül az egybites és a DSD rendszerek gyengeségei miatt. Még inkább mindig a régi 13 bites Denon PCM-alapú rendszereket preferálnám a 70-es évekből. Nem volt valami szuper nagy felbontású rendszer, de stabil és megbízható volt! Van sok ezzel készített felvételem (újra kiadták őket CD-n) és még mindig mesésen szólnak!

NL: A Sony dokumentációjából:

„Általában a kvantálási zaj szintje a PCM esetében egyenletes, a bitek számától függően. Delta Sigma moduláció esetén a zajszint a zajformálástól függ. Mivel a DSD magas mintavételi frekvenciát használ, a kvantálási zaj magasabb frekvenciákba tolódik. Ez a hallható zajt az emberek hallásának tartományában lecsökkenti.”

Ez így van?

: Igen, az első része igaz, de talán nem kellene a hallást annyira lebecsülni, mint a Sony teszi – máskülönben olyan rendszereket csinálunk, mint az SACD! Természetesen alaphangokat csak 20 kHz-ig hallunk, de ez nem jelenti azt, hogy akkor már bármilyen zaj jöhet efölött. Az ultraszonikus felharmonikusok hallható eredményt produkálnak nagyobb hangnyomáson. Persze lehet azon vitatkozni, hogy mennyire halljuk meg az SACD által generált ultraszonikus zajt. Ez 100 kHz fölött egyébként már nagyobb szintű, mint a hasznos magas hangok a hallható tartományban, legalábbis amikor akusztikus zenét hallgatunk. Azon is lehet vitatkozni, hogy a DSD mennyire „magas” mintavételi frekvenciával dolgozik. Ezen kívül pedig: zajformálás nélkül ez a dolog egyáltalán nem működne és ez még rosszabb. Így csak egy kicsit gyengébb, mint a CD a legmagasabb tartományban. De vajon miért is kell bevezetni egy olyan új szuper nagyfelbontású formátumot, ami „egy kcsit gyengébb, mint a CD”? Természetesen vannak előnyei még a CD-vel is összehasonlítva, de az SACD/DSD hátrányaira semmi szükség nem lett volna. Nem kellene egy új rendszernek minden tekintetben jobbnak lenni, mint a CD?

100 kHz fölött a zajszint -40 dB a maximum jelszint alatt (és így még egy oszcilloszkópon is látható!). A zaj így ebben a frekvenciatartományban sokkal magasabb, mint bármilyen zenei jel. Na ezt hasonlítsuk a DVD-A-hoz, ahol a zajszint -144 dB az egész átviteli tartományban, még az ultraszonikus hangok terén is. Valójában ezek az értékek persze nem érhetőek el a kereskedelemben kapható DVD-audio lejátszóknál, de a jövőbeli lehetőség megvan. Ma a legjobb DVD-A lejátszók jel-zaj viszonya 120 dB körül van (0-100 kHz). Kis sávú analízissel ez az érték még magasabb is lehet. Ez persze messze van a 144 dB-től, de még mindig egész jónak számít.

Kicsit kínos viszont, hogy még mindig nincsenek jó DVD-A felvételek. Mindegyiknek gyenge minősége van. Ez pedig az átlagembereknek nem ad lehetőséget, hogy objektív véleményt alkossanak a rendszerek közötti különbségről. Az Opus3-tól például Jan-Erik Persson felvételei SACD-n sokkal jobbak, mint bármi, ami eddig DVD-Audio-n megjelent. Amikor általánosságban nézzük, a tároló média és rendszer közötti vita sokkal kevésbé lényeges, mint a hangmérnök képességei – egy jó felvétel még kazettán is sokkal jobb, mint egy rossz felvétel DVD-Audio-n. De minden vitának megvan a helye és az ideje. Ez például nem lényeges akkor, amikor egy új tároló médiumról vitázunk. Itt a médium (SACD a DVD-A-val szemben) a kérdés és ezt nagyon könnyen el lehet vinni más irányba, amikor szóbakerülnek a különböző rendszerek és felvételek. A jobb felvétel mindig nyer. A zene persze még fontosabb, mint a felvétel, de az már nagyon szubjektív – itt nics miről vitázni. Az én zenei ízlésem például szánalmas, legalábbis néhány ember szerint!

NL: Folytatom a kiadványból:

„A vízjelezés bevezetésének nagy visszhangja volt a 109. AES konferencián Los Angelesben (jelenleg még csak profi szinten, de a jövőben fogyasztói szinten is). Nagy és egyre növekvő számú profi szakember hangsúlyozta már azt a tényt, hogy a jelenlegi vízjeles megoldásnak rossz hatása van a hangminőségre az új nagy felbontású formátumok esetén. De a vízjeles reklámcégek elég erősen erőltetik ezeket a módszereket, viszont jól ismert audio cégek csoportja (például a Chesky) és mérnökök (a GRP-től Tony Faulkner) nagyon kiábrándultak amiatt, amilyen hatással ez a hangminőségre van. Az első teszteket az USA-ban és Angliában végezték DVD-Audio-val és a romlás ténye jól kimutatható volt (bár nem volt eléggé pártatlan a teszt, mert nagyon gyenge minőségű felvételeket használtak).”

Az SACD vízjele is rontja a hangminőséget?

: Nos ez attól függ, hogy milyen vízjelet használnak! Az ún. „pszichoakusztikai vízjel” mindegyike rontja a hangminőséget, de eltérő mértékben és ez független a tároló rendszertől. Bármelyikkel használható, de nem világos, hogy melyik milyen mértékben alkalmazza. Amennyire én tudom, az eddig megjelent SACD lemezek még nem tartalmazzák. Az viszont biztos, hogy rengeteg CD-felvétel tartalmazza. De a vízjel csak egy probléma. Ez nem változtat a felvételi és a tároló rendszeren. Vagy használják vagy nem. Viszont a DSD-rendszerek alapvető problémát nem lehet kikerülni!

Csak hogy elkerüljük a félreértéseket, emlékeztetni szeretnék, hogy az SACD-nek 5-10 kHz alatt nagyobb a felbontása, mint a CD-nek. A szempontokat, mi szerint a CD vagy az SACD jobb, aszerint lehet meghatározni, hogy statikus vagy dinamikus jelet veszünk-e alapul. 100-600 Hz környékén és az alatt az SACD elméletileg még a DVD-Audio-nál is jobb, de valójában ez lényegtelen. Mert itt már olyan kis különbségekről van szó, ami jóval a hallásküszöb alatt van, úgyhogy ezektől el lehet tekinteni. Egy lejátszó pedig különben is lehet, hogy rossz az alacsony frekvenciák visszaadásában, de ez nem az SACD vagy a DVD-A rendszer hibája. A gyakorlatban a DVD-A minden frekvencián jobb az SACD-től; tisztább a hangja, alacsonyabb a zajszintje és teljesen stabil, mentes a zajformáló algoritmusok hatásaitól.

NL: Mennyire közel vannak az elméleti lehetőségekhez napjaink lejátszói?

: Nos, a ma kapható lejátszókat elnézve a felbontás körülbelül 15-30-szor kisebb, mint a DVD-Audio-ban rejlő lehetőségek. Ez azt jelenti, hogy 8-16-szor jobb, mint a CD. Ez nagy előrelépés, de még több lehetséges. De ezek a „hányszoros” összehasonlítások csak technikai specifikációk alapján lehetségesek. Ha a legrosszabb esetet akarjuk megnézni, akkor vegyük a logaritmusát és szorozzuk meg 20-al, hogy megkapjuk az értékeket dB-ben. A „15-ször jobb” 23,5 dB-el kisebb zajszintet jelent. De ha ezeket az értékeket használni is akarjuk, akkor felmerül a kérdés, hogy mit jelent, amikor egy zavarjel x dB-el a zenei jel alatt van? Ha a zavar a hallásküszöb alatt van, akkor természetesen semmi különbséget nem fogunk hallani. És a különböző hibákat különbözőképpen is halljuk.

Néhányat könnyebb észrevenni, néhányat nehezebb. Néhány hibajelenséget jobban elviselünk még akkor is, ha erőteljesebben jelen vannak. De ki mondta, hogy könnyű megbízható véleményt alkotni? Viszont a technikai képességek hangra való hatását nagyon figyelmesen kell megvizsgálni. Az én tapasztalatom szerint a több bitből származó minőségi előrelépés csak nagy dinamikát tartalmazó zenei anyagon jelenik meg. A rendkívül kompresszált rádióhangnak például egy 11 bites felvétel is jól megfelel. És hogy az emberek hogyan reagálnak az ultraszonikus hangokra, az is egyéntől függ. A legérzékenyebb hallgatók jobban elviselik a zenét, ha egyáltalán nincs ultraszonikus tartománya és ilyen magas felharmonikusai, mintha az be lenne szennyezve ultraszonikus zajjal. Talán nem mindenkit érdekel a jól reprodukált ultraszonikus tartomány (DVD-A), de amikor megfelelő képességű rendszert használunk, nincs rá bizonyíték, hogy a hangmérnök képes lesz az ultraszonikus tartományt „szennyezetlenül” megtartani.

Amikor a CD, DVD-A és az SACD összehasonlításáról van szó, a dolog valamivel egyszerűbb, mert ezek optimális megvalósításakor minden hibájuk zaj formájában jelentkezik. De minden frekvencián egyenként kell megvizsgálni, mert ezen formátumok zajkaraktere különbözőképpen jelenik meg.

NL: Köszönöm, hogy válaszolt a kérdéseimre!

: Remélem, sikerült tisztázni a kérdéses dolgokat.

Niklas Ladberg

Forrás: http://sound.westhost.com/cd-sacd-dvda.htm

Fordította: Sipos Róbert (egyes kifejezések fordításában fapaci segített)