Kako Format zvoka MP3 zmanjšuje velikost podatkov?
1. Psihoakustični model: To je jedro stiskanja MP3. Temelji na tem, kako človeško uho dojema zveni. Endoder analizira zvočni signal in prepozna frekvence in zvoke, ki jih bodo verjetno prikrili z glasnejšimi zvoki ali so manj zaznani za naše sluh. Te zamaskirane frekvence so nato močno stisnjene ali v celoti zavržene. Na primer, tihi visokofrekvenčni zvok, ki se predvaja hkrati z glasnim nizkofrekvenčnim zvokom, je morda popolnoma neslišen, zato je odstranjen.
2. Frekvenčna transformacija: Zvočni signal se pretvori iz časovne domene (amplituda skozi čas) v frekvenčno domeno (amplituda različnih frekvenc). Običajno se to izvaja z uporabo spremenjene diskretne kozinusne transformacije (MDCT). Ta predstavitev omogoča lažjo identifikacijo in manipulacijo posameznih frekvenc.
3. Kvantizacija: Po frekvenčni analizi se kvantizirajo vrednosti amplitude vsake frekvenčne komponente. To pomeni, da so zaokroženi na omejeno število vrednosti. To uvaja nekaj izgube informacij, a ker so bile ugotovljene manj pomembne frekvence in potencialno odstranjene ali močno stisnjene, je slišni vpliv zmanjšal.
4. Huffman kodiranje: Končno se kvantizirani podatki kodirajo s kodo s spremenljivo dolžino, imenovano Huffmanovo kodiranje. To dodeli krajše kode pogostejšim podatkom in daljše kode manj pogoste podatke, kar vodi do nadaljnjega zmanjšanja podatkov.
V bistvu MP3 izkoristi nepopolnosti in omejitve človeškega sluha, da znatno zmanjša količino podatkov, potrebnih za zastopanje zvoka, hkrati pa si prizadeva za ohranjanje sprejemljive kakovosti zvoka. Stopnja stiskanja (in s tem zmanjšanja velikosti) je mogoče prilagoditi, kar ima za posledico različne velikosti datotek in različne ravni kakovosti zvoka. Večja stiskalna razmerja vodijo do manjših datotek, vendar potencialno bolj opazne artefakte ali izguba zvestobe.