ponedeljek, 6. julij 2015

S kolikšnimi izgubami pravzaprav deluje mp3 zapis



Da bi lahko poslušali svojo glasbo, bomo dobljeni surovi avdio zapis izvozili v mp3 datoteko. Takšna datoteka je najprimernejši medij za poslušanje glasbe na malem žepnem predvajalniku. Gre za majhno stereo datoteko s karakteristikami 48000 Hz pri 256 bitih - postavki, ki povesta koliko spomina bo porabil računalnik, da si datoteko zapomni.


Med ustvarjanjem mp3 datoteke bo algoritem za kodiranje upoarbil spretne tehnike za stiskanje, ki datoteko naredijo manjšo (kot naprimer to počne ZIP algoritem), pri tem pa bo morebiti del informacije tudi opustil (kot to počne JPEG algoritem). Zaradi te lastnosti kodiranja sodi  mp3 format med izgubne, za razliko od formatov for so FLAC, ki delujejo brez izgub.


Kolikšne so izgube mp3 formata v primerjavi z brezizgubnim FLAC formatom? In ali vplivajo na kvaliteto zapisa glasbe do tolikšne mere, da razlika postane slišna? To vprašanje je povezano z samo naravo kompresijskega algoritma. Ali je v primerjavi z drugimi podobnimi algoritmi bolj tipa izgubnega JPEG ali je podobnost bolj na strani brezizgubnega ZIP.

Vzorčenje (Sample rate)




Po tem, ko smo posnetek spustili na 48 kHz, pride do prve vidne razlike šele ko sliko povečamo. Zgornja slika je povečana do te mere, da na njej vidimo 1 milisekundo zvočnega zapisa. Še vedno pa obe krivulji, ki predstavljata zvok, skoraj povsem sovpadata. Če upoštevamo, da ima že zračni pritisk v sobi, kjer poslušamo glasbo, večji vpliv kot je razlika med tema dvema signaloma, potem lahko z gotovosto trdimo, da FLAC format tukaj ni nič drugačen kot mp3 format.

Bitna širina (Bit rate)


Pojem bitna širina se nanaša na število bitov oziroma na količino informacije, ki jo pretočimo v določenem času. Več bitov ko uporabimo, več prostora v računalniku bomo zasedli. Surovi avdio posnetek bo pravzaprav zasedel dokaj veliko prostora, zaradi česar se je pri shranjevanju avdio datotek uveljavila metoda shranjevanja stisnjenih datotek, ker na ta način zasedemo manj prostora na disku. Na tem mestu se začenja tudi debata o brezizgubnem v primerjavi s stisnjenim načinu shranjevanja podatkov.
Na tem mestu, da bi zagotovili optimalno mp3 datoteko, je naša dilema kolikšno bitno širino nameniti posnetku. Poglejmo kolika bitna širina je potrebna za našo količino informacije.
Naš surovi avdio posnetek, spuščen na 48000 semplov na sekundo, pri 32 bitni širini, krat 2 za dva stereo kanala, je enako
48000 semplov/s * 32 bit/sempl * 2 = 3.072 kb/s
Kar pomeni, da je sekunda naše surove glasbe natančno definirana z 3,072 biti. Na disku bi to bilo 0,38 mega bajtov. Toda posnetku, ki ga bomo stisnili v mp3 format, bomo namenili 256 kb/s, dvanajstkrat manj kot je zahtevano in upali, da ta širina zadostuje.


Preizkus


Sledeči poskus bo analiziral s kolikšnimi izgubami imamo opravka pri stiskanju podatkov v mp3 format. Eksperiment temelji na primerjavi dveh formatov.



Rezultati kažejo, da čeprav bi brezizgubni FLAC format teoretično potreboval 38 MB prostora na disku, dobimo v postopku v resnici 8,92 MB veliko datoteko. Predpostavljamo, da je proces znal brez igub dodatno skrčiti datoteko za 4,29 krat, imenujmo to faktor neškodljive dodatne kompresije.
Datoteka mp3, v nasprotju z FLAC datoteko, pa je bolj majhna, faktor njene stisnjenosti je nekje 3 krat večji od faktorja neškodljive dodatne kompresije. S to primerjavo si lahko predstavljamo, da so 3 od 4 semplov morali biti prilagojeni, njihova vrednost zaokrožena na bližjo decimalko, ko so bili podvrženi mp3 kompresiji.
Mimogrede, izgube o katerih govorimo, ki nastanejo zaradi stiskanja mp3 datotek, niso tako drastične kot se to sliši na prvi pogled. Noben sempl se ne izgubi in krivulja zaradi tega ne postaja stopničasta, zgubi se zgolj na preciznosti nekaterih semplov, ki niso več natančni na 24 decimalnih mest.

Zaključek


Za zaključek smo dobljene rezultate ocenili tudi na uho, in po slišanem sodeč lahko trdimo, da ko se nekdo odloča ali datoteke shranjevati na ta ali oni način, da ni bistvene razlike. Vse dokler je mp3 format velik 48000 Hz pri 256 b/s, je ta ločljivost zadovoljiva in posnetek zelo blizu originalu.

Ni komentarjev:

Objavite komentar