Priestorový zvuk
Zvuk je pozdĺžne mechanické vlnenie v látkovom prostredí schopné vyvolávať v uchu sluchový vnem. Frekvencia zvuku sa nachádza v rozpätí od 20 Hz – 20 kHz. Mimo týchto hraníc človek zvuk nevníma. Zvuk s frekvenciou nižšou než 20 Hz nazývame infrazvuk. Zvuk s frekvenciou vyššou ako 20 kHz nazývame ultrazvuk.
Priestorový zvuk je koncept rozširujúci zvuk z nulového alebo jedného rozmeru (mono/ stereo) do druhého alebo tretieho rozmeru. Uvedený koncept je najčastejšie využívaný pre verejné zvukové prostredie.
Formáty záznamu priestorového zvuku:
a) DVD- Audio – jedná sa o digitálny formát určený na ukladanie vysoko kvalitného zvukového záznamu neobsahujúceho video. Jednotlivé dáta sú uložené vo formáte .war
b) SACD – zvukový nosič ponúkajúci frekvenčný rozsah do 100 kHz. Jeho výhodou je reprodukcia priestorového zvuku.
c) Dolby digital (AC-3) – je fexibilný zvukový formát podporujúci 6 nezávislých kanálov s frekvenciou f = 48 kHz. V označení 1 hovoríme o ľavom prednom, centrálnom, pravom prednom, ľavom zadnom a pravom zadnom reproduktore, a o subwooferi pre reprodukciu hlbokých tónov.
Kóder AC-3 prevádza zvuk vo formáte PCM na bitový tok. Najskôr sú bankami filtrov prevedené PCM vzorky na bloky frekvenčných koeficientov. Každý z týchto koeficientov je reprezentovaný mantisou a exponentom. Skupina exponentov je kódovaná spektrálnou obálkou, ktorá redukuje spektrum tohto úseku na základe psychoakustických princípov. Spektrálna obálka je tiež dôležitou súčasťou funkcie bitovej alokácie, pretože udáva na koľko bitov má byť kódovaná mantisa. Spektrálna obálka a kvantizované mantisy šiestich audio blokov (1536 audio vzoriek) je formátovaných do jedného rámca AC-3. Bitový tok AC-3 je sekvencia rámcov AC-3.
Dekódovanie je opačným procesom. Dekodér synchronizuje zakódovaný bitový tok, kontrolujechyby a deformátovatuje rôzne typy dát – zakódovanú spektrálnu obálkou a kvantizovanú mantisu, ktoré následne funkcia bitovej alokácie dekóduje. Zo spektrálnej obálky sú vytvorené exponenty, ktoré sú spoločne s mantisami transformované späť do časovej oblasti, tak sú vytvorené PCM vzorky.
Štandard AcC-3 povoľuje maximálny kódovaný bit-rate (dátový tok) do 640 Kbit/s. Z uvedenej hodnoty bol vytvorený oficiálny štandard, pričom Blu-ray prehrávače, Sony Playstation 3 a Microsoft Xbox herná konzola dokážu vysielať až 640 kbit/s. Zvuk je vedený na SPDIF výstup a prenášaný do receivera (AV prijímača) alebo domáceho kina SPDIF koaxiálnym káblom.
Verzie:
- Dolby Digital 2.0– obsahuje 2 zvukové kanály a môže byť mono alebo stereo.
- Dolby Digital 2.0 Surround– na rozdiel od analógoo zaznamenáného zvuku obsahuje informáciu že sa jedná o Dolby Surroud
- Dolby Digital Surroun EX – DD Surround EX poskytuje spätnú kompatibilitu s 5.1 DD verziou a nesie aj šiesty, zadný centrálny kanál aby sa zdokonalili lokalizačné efekty. Extra kanál je matrixovo kódovaný do samostatného ľavého a pravého kanálu z prvotnej 5.1 zmesi. Výsledok môže byť prehraný bez straty informácií na štandarde 5.1 alebo na systémoch 6.1 a 7.1 vybavených Surround EX dekódovacím čipom a prídavnými reproduktormi.
- Dolby Digital 4.0–obsahujíe 4 samostatné kanály (ľavý, stredný, pravý, zadný).
- Dolby Digital 5.0–obsahuje 5 samostatných kanálov(predný ľavý, stredný, predný pravý, zadný ľavý a zadný pravý) bez basového LFE kanálu.
- Dolby Digital 5.1– najčastejšia verzia obsahujúca 5 hlavných plnorozsahových kanálov (predný ľavý, stredný, predný pravý, zadný ľavý a zadný pravý) a jeden LFE kanál.
- Dolby Digital 5.1 EX –Dolby Digital EX je podobný formátu Pro-Logic ktorý využíva technológiu Matrix pre pridanie centrálneho a osobitného zadného kanálu pre lepšie priestorové ozvučenie. EX pridáva pôvodnému Dolby Digital rozšírenie o štandard 5.1 kanálov. Popri klasických 5.1 kanáloch obsahuje zadný stredný kanál ktorý je maticovo zakódovaný v zadnom ľavom a zadnom pravom kanáli. Uvedený formát nebol navrhnutý ako ”čistý“ 6.1 alebo 7.1 výstupový kodek, pretože jeho schopnosť podpory samostatného šiesteho kanála je v porovnaní s konkurenčným DTS-ES veľmi malá.
- Dolby Digital Plus – vylepšený kódovací systém ponúkajúci vyššie dátové toky. Podporuje viac zvukových kanálov (13.1), redukujúce kompresné artefakty, vylepšené kódovacie techniky a spätnú kompatibilitu existujúcim AC- hardvérom
- Dolby Digital Live Dolby Digital Live (DDL) – je tzv. real-time kódovacia technológia (kódovanie v reálnom čase) určená pre interaktívne média. Má schopnosť konvertovať akýkoľvekaudio signál na PC alebo hernej konzole do 5.1 kanálového formátu Dolby Digital a transportuje ho cez S/PDIF kábel. Podobnú technológiu ponúka aj konkurencia pod názvom DTS Connect. DDL je dostupný na základných doskách s kodekmi ako sú Realtek ALC882D, ALC888DD a ALC888H a je tiež podporovaný všetkými zvukovými kartami Creative X-Fi. Dôležitou výhodou tejto technológie je to, že umožňuje využitie digitálneho multikanálového zvuku s komerčnou zvukovou kartou.
- Dolby TrueHD – je vyspelý bezstratový audio kodek založený Meridian Lossless Packing. Podpora zvedeného kodeku je garantovaná u hardvéru formátu HD DVD a voliteľná u Blu-ray Disc, TrueHD podporuje 24 bitové audio kanály pri frekvencii 96 kHz pri prenosovej rýchlosti 18 Mbit/s. Maximálny počet pri takomto priepustnom pásme je 14. (HD DVD a Blu-ray Disc využívajú iba 8 z celkového možného počtu poskytnutých kanálov)Kanálové konfigurácie
- Mono (iba center)
- 2-channel stereo (Ľavý + Pravý), optionally carrying matrixed Dolby Surround
- 3-channel stereo (Ľavý, Center, Pravý) 2-channel stereo s mono surround (Ľavý, Pravý, Surround)
- 3-channel stereo s mono surround (Ľavý, Center, Pravý, Surround)
- 4-channel quadrophonic (Ľavý, Pravý, Ľavý Surround, Pravý Surround)
- 5-channel surround (Ľavý, Center, Pravý, Ľavý Surround, Pravý Surround)
Všetky tieto konfigurácie môžu v prípade potreby obsahovať extra kanál nízkofrekvenčných efektov – Low Frequency Effect (LFE). LFE je metóda zvukového záznamu využívajúca iba nízke frekvencie (20 – 120Hz) a takýto záznam je spravidla interpretovaný zariadením zvaným subwoofer. Posledné dve konfigurácie so stereo surround ozvučením môžu voliteľne používať Dolby Digital EX matrix kódovanie pre pridanie osobitného zadného kanálu (Rear chanel).
Viacero Dolby Digital dekodérov je vybavených funkciou podmixovania. Viackanálový formát je upravený pre menej kanálový formát, napr. stereo. Uvedené upravenie umožňuje prehratie priestorového zvuku cez dostupné ozvučenie. Číslo ‚1‘ v 5.1, 7.1 atď. označuje o formáte pre LFE kanál, ktorý je taktiež diskrétny kanál. Elektrotechnická fakulta, Žilinská univerzita v Žiline 28 4.8 Využitia Dolby Digital – Dolby Digital SR-D kino nahrávky sú synchronizovane zaznamenávané na 35 mm páse využívajúcom sekvenčné dátové bloky umiestnené medzi každou performačnou medzerou. CCD snímač v projektore vyberá naskenované obrazy tejto časti a procesor ich následne zlaďuje s AC-3 dátovým tokom. Tieto dáta sú potom konečne dekódované do 5.1 kanálového zdroja.
d) DTS – jedná sa o digitálny viackanálový formát priestorového ozvučenia so stratovou kompresiou. Jeho využitie spočíva v ozvučení filmov v kinách, diskoch DVD – video. Medzi domácimi a technickými variantami sa vyskytujú menšie technické rozdiely.
Varianty:
- DTS 5.1– jedná sa o základnú najrozšírenejšiu variantu, s 5.1 kanálmi (5 hlavných plnorozsahových kanálov a nízkofrekvenčný LFE kanál), zhodných s obdobnou konfiguráciou formátu Dolby Digital.
- DTS-ES Matrix 6.1– obsahuje navyše jeden zadný centrálny kanál maticovo zakódovaný v ľavom zadnom a pravom zadnom kanáli. Pri tomto formáte signály SB kanálu podstupujú maticové kódovanie a vstupujú najprv do kanálov SL a SP. Pri reprodukcií sú dekódované do kanálov SL, SP a SB. Kvalita kódovania a samotného kódovača môže byť plne nahradená použitím veľmi presného digitálneho maticového dekodéru. Formát dátového toku je 100% kompatibilný s bežnými DTS signálmi, takže je možné dosiahnuť efektu formátu Matrix 6.1 i u 5.1 kanálových zdrojov signálu.
- DTS-ES Discrete 6.1– jeho zadný kanál je zakódovaný samostatne. Zadný centrálny kanál je možno prehrávať za pomoci jedného alebo viacerých reproduktorovdomáceho kina konfiguráie 7.1.
- DTS 96/24– ponúka kvalitu originálnej 96kHz/24bit master nahrávky. Jedná sa napr. o vysoko kvalitné obrazovo/hudobné DVD video zdroje s 96/24bit. Stereo PCM hudobnými stopami. Pretože je však objem týchto hudobných stôp extrémne veľký, nahrávky sú obmedzené iba na dva kanály a obraz musí byť kvôli kvalite obmedzený iba na statické obrázky. 96/24bit. 5.1 kanálový zvuk je možný s DVD audio zdrojmi ktoré vyžadujú k prehrávaniu v tejto kvalite DVD audio prehrávač. Bežné priestorové formáty používajú vzorkovacie frekvencie 48 alebo 44.1 kHz, takže maximálne prehrávacie frekvencie sú približne 20kHz. U DTS 96/24 je k dosiahnutiu širokého frekvenčného rozsahu (až cez 40 kHz) zvýšená vzorkovacia frekvencia na 96 kHz alebo 88.2 kHz. Ďalej má DTS 96/24 rozlíšenie 24 bitov s rovnakým frekvenčným pásmom a dynamickým rozsahom ako 96/24 bit PCM dáta.
- DTS NEO:6– funguje na podobnom princípe ako Dolby Pro Logic II. Zo stereo nahrávky dokáže vytvoriť 1 nebo 6.1 zvuk.
- DTS Neo:6 Cinema – Dekódovanie u 2 kanálových zdrojov je prevádzané s dôrazom na jednotlivé zložky zvuku, aby sa dosiahlo rovnakej atmosféry ako u 6.1 kanálových zdrojov. Tento režim je efektívny taktiež u zdrojov nahraných v bežných priestorových formátoch, pretože fázová zložka je priradená prevažne k centru a zložka protifáze k surround kanálom.
- DTS Neo:6 Music – je optimálny pre prehrávanie hudby. Signály predných kanálov FR a FL nie sú vedené. Efekt signálov vystupuje z centrálneho a surround kanálu čím je zaistená prirodzená šírka zvukového poľa.
- DTS-ES Extended Surround TM – Formát DTS-ES je kompatibilný s konvenčnými DTS. Vďaka nárastu priestorových signálov zlepšuje dojem celkového obklopenia a vyjadrenia priestoru. K bežným kanálom pribudol u DTS-ES aj kanál SB pre 6.1 kanálovú priestorovú reprodukciu. DTS-ES obsahuje dva formáty signálu s rôznymi metódami jeho zriadenia.
- DTS-ES Discrete 6.1 –Nakoľko kanály SL, SP a SB sú úplne nezávislé, hlavnou prednosťou tohto formátu je, že môže byť zvuk navrhnutý s úplnou voľnosťou a je možné docieliť pocitu voľného pohybu zvuku zadného akustického obrazu obklopujúceho poslucháča zo všetkých strán. Pri prehrávaní cez bežný DTS dekodér sú signály SB kanálu automaticky zmiešavané do SL a SP kanálov, takže nepríde k strate komponentov signálu
- DTS-HD High Resolution – je rozšírením pôvodného DTS audio formátu umožňuúci využitie 7.1 kanálovej konfigurácie zvuku so vzorkovacou frekvenciou 96 kHz a 24 bitovou hĺbkou.
- DTS-HD Master Audio – je známy ako DTS++ a DTS-HD, vie ľubovoľný zvukový záznam ,,podmixovať’’ do 5.1 kanálov alebo sterea. Kvalita záznamu ďaleko prevyšuje záznam u pôvodného DTS Digital Surround a dosahuje tak minimálne stratové hodnoty v kompresii (24-bit, 192 kHz).Iné konfigurácie:
- 2.0(stereo),
- 2.1(ľavý kanál, pravý kanál + LFE kanál)
- 3.0(3 hlavné kanály bez LFE)
- 3.1(3 hlavné kanály + LFE kanál)
- 4.0(ľavý kanál, pravý kanál, centrálny kanál, zadný kanál)
- 4.1(ľavý kanál, pravý kanál, centrálny kanál, zadní kanál + LFE)
- 5.0(predný ľavý kanál, centrálny kanál, predný pravý kanál, zadný ľavý kanál a zadný pravý kanál bez LFE)
e) DVD – je formát digitálneho optického dátového nosiča, ktorý môže obsahovať filmy vo vysokej obrazovej a zvukovej kvalite alebo rozličné iné údaje. Jedná sa o spôsob uloženia videozáznamu na DVD nosiči. Na kompresiu obrazu sa používa štandard MPEG-2. Na kódovanie zvukovej stopy sú používané formáty PCM, MPEG-2 audio, Dolby Digital (AC-3) alebo DTS. Na prehrávanie DVD Video médií je potrebná mechanika DVD obsahujúcu dekodér MPEG-2 (napr. prehrávač DVD alebo osobný počítač s mechanikou DVD a softvérovým prehrávačom DVD). DVD Video disky často obsahujú viacero zvukových kanálov sprevádzajúcich obrazový záznam. Maximálny počet stôp na jeden obrazový záznam je 8.
Vytvorenie priestorového dojmu
Stereofonia je špeciálny prípad amplitúdovaného polohovania dvoch reproduktorov umiestnených pred poslucháčom. Existuje niekoľko zákonov určujúcich azimut virtuálneho zdroja z reproduktorových zosilňovacích faktorov.
Bauer odvodil sínusový polohovací zákon pre situáciu, v ktorej je poslucháč umiestnený medzi reproduktormi symetricky.
sin ?? /sin ?0 = ?1 − ?2 /?1 + ?2
Bernfeld vylepšil polohovací zákon vylepšením modelu hlavy použiteľného pri sínusovom zákone. Tento zákon sa nazýva Tangensový zákon.
tan ?T / tan ?0 = ?1 − ?2 / ?1 + ?2 ,
Pri zaznamenávaní zvukov mikrofónom dochádza k strate priestorovej hodnoty zvuku. Priestorovú hodnotu zvuku je možné získať pri reprodukcií – lokalizácia zdroja zvuku je totožná s umiestnením reproduktora.
Pre dosiahnutie stereofonického vnemu sú potrebné dva reproduktory. Faktom je, že bez ďalších úprav, by bola dosiahnutá lokalizácia zdroja zvuku len na spojnici oboch reproduktorov. Pri zaznamenaní zvuku na dvoch rozličných miestach, vznikajú dva rozličné zoznamy ktorých súčet je reprodukovaný. Fázový posun nahrávok je označovaný ako efekt hrebeňového filtra. (V prípade, že je zdroj zvuku v jednej línií s mikrofónmi vzdialenými od seba 1m, tóny s vlnovou dĺžkou 1m budú reprodukované dvojnásobne vyšším signálom. Tóny s vlnovou dĺžkou 2m sa stretnú v opačnej fáze a budú vynulované. Dôsledkom opísaného javu bude silné skreslenie charakteristiky zaznamenaných zvukov.
VEKTOROVÉ BÁZOVÉ AMPLITÚDOVÉ POLOHOVANIE – polohovacia technika umožňujúca použitie neobmedzeného počtu reproduktorov, v dvojrozmernom alebo trojrozmernom priestore. Reproduktory musia byť umiestnené okolo poslucháča. Miestnosť nesmie vytvárať ozveny. Touto metódou možno vytvárať stacionárne a pohyblivé zdroje zvuku. Pri uvedenej metóde je dvojkanálová stereofónna konfigurácia preformulovaná ako dvojrozmerná vektorová báza.
AMBISONIA- systém vyvinutý M. Gerzonom, ktorý je založený na dekompozícií sférických harmonických funkcií zvukového pola. Hlavným rozdielom je separácia poštu kanálov. Typicky sa používa väčšie množstvo reproduktorov než prenosových kanálov. Medzi najbežnejšie usporiadanie reproduktorov patrí regulárna polygonia. Neregulárný rozptyl je taktiež bežne zaužívaný. Kódovanie ambisonickýh zvukových signálov je založené na predpoklade, že zdroj zvuku je dostatočne vzdialený, aby jeho príspevok bol aproximovateľný rovinnou vlnou.
Vlastnosti ambisonických komponentov sú nemenné s kmitočtom. Sférické harmonické funkcie bez vertikálnej informácie možno zjednodušiť na cilindrické harmonické funkcie popísané v kartézskom systéme súradníc.
Ambisonické dekódovanie je postup ktorý vhodnou lineárnou kombináciou pre každý reproduktor v systéme reprodukuje tlak s časticovou rýchlosťou v stredovej pozícií systému.
3 typy reproduktorových konfigurácií:
a) Regulárne polygóny
b) Neregulárne polygóny s protiľahlými pármi
c) Obecne neregulárne polygóny
Gerzon vypracoval meta – teóriu nazvanú smerová psychoakustika. Pri tejto metóde stačí bežná stereo sústava. Technológia je známa pod označením HRTF a využíva sa pri technológiach A3D, DrectSound 3D a Sensaura.
Medzi základné predpoklady smerovej psychoakustiky patria:
- Na nízkych kmitočtoch majú signály prichádzajúce do uší stabilný fázový rozdiel, ktorý je menší ako polovica vlnovej dĺžky
- Na vysokých kmitočtoch je so signálmi prichádzajúcimi do uší zaobchádzané ako s nekoherentnými z čoho vyplýva, že sluchová sústava je citlivá na zosilnenie vektoru energie
Psychoakustiká optimalizácia vychádza z teórie v ktorej Gerzon prehlásil, že človek používa rôzne mechanizmy pre sluchovú lokalizáciu. Okrem prípadov keď sú jednotlivé podnety v konflikte je celkový sluchový dojem daný väčšinou súhlasných podnetov. Vnímaný smer sa pohybuje v závislosti od veľkosti lokalizačného vektoru, keď poslucháč pohybuje hlavou. Medzi dva elementárne modely sa radia:
- Model akustickej časticovej rýchlosti
- Model prúdenia energie
Dekóder alebo reprodukčný systém obklopujúci zvuk je definovaný ako ambisonický, pokiaľ spĺňa nasledovné podmienky:
- Smer rýchlostného vektoru a vektoru energie musí byť do kmitočtu aspoň 4 kHz s tým, že sa reprodukovaný azimut výrazne nemení s kmitočtom
- Pri nízkych kmitočtoch je veľkosť rýchlostného vektoru blízko jednej pre všetky reprodukované azimuty
- Na stredných a vysokých kmitočtoch bola veľkosť vektoru energie maximalizovaná na čo najväčšie časti posluchového priestoru
SYSTÉM XY– použité sú dva kardioidné alebo osmičkové mikrofóny umiestnené v tesnej blízkosti, pričom vzájomné vychýlenie osí ich snímania je 90°. Jeden sníma pravú polovicu miestnosti, druhý ľavú (stred leží medzi osami mikrofónov). Vďaka veľmi blízkej polohe mikrofónov nenastáva problém s efektom hrebeňového filtra.
Nevýhodou je najmä skreslené podanie zvuku zo stredu – útlm kardioidných mikrofónov je závislý nielen od uhla, ale aj od frekvencie, preto majú zvuky zo stredu stlmené výšky (čo čiastočne simuluje útlm pri prirodzenom posluchu zvukov, spôsobený ľudskou hlavou). Ďalšou nevýhodou je zanikanie fázovej informácie, ktorá by vznikla pri prirodzenom posluchu vďaka vzájomnej vzdialenosti uší. Tieto nevýhody sú však mierne, preto je systém XY najčastejším druhom snímania.
SYSTÉM MS – Vychádza z predpokladu, že stereofonickú informáciu tvorí predovšetkým rozdiel medzi „ľavým“ a „pravým“ záznamom. Je použitý pár mikrofónov v tesnej blízkosti, pričom guľový ) sníma stred miestnosti, osmičkový je namierený na strany (osi sú kolmé na seba).
Výsledné dva kanály sa získajú ako súčet zvuku zo stredu a zvuku zo strán v pôvodnej fáze (ľavý kanál) alebo protifáze (pravý kanál), resp. naopak. Kladným bodom je úplná kompatibilita s mono reprodukciou (odlišné fázy sa vynulujú a ostane len stred) a verný záznam zvuku zo stredu miestnosti. Čím je však zdroj zvuku bližšie k stranám, tým znie neprirodzenejšie. Nakoľko odchýlky od stredu nie sú príliš veľké, možno meniť šírku stereofonického vnemu i dodatočne (zvýšením váhy z postranného mikrofónu).
SYSTÉM AB – Pri uvedenej technológií sú použité dva mikrofóny, ktoré sú od seba dostatočne vzdialené. Vzniká verný a silný stereofonický vnem a zreteľný efekt hrebeňového filtra. Používa sa pri zázname veľkých priestorov (koncerty, orchestry) na dodanie „celkového dojmu“, v kombinácii s ďalšími „bodovými“ mikrofónmi, ktoré zaznamenávajú jednotlivé hudobné nástroje.