Kodowanie transformatowe

Nowoczesne techniki kodowania wykorzystują analizę czasowo-częstotliwościową opartą na transformacjach - każdy blok próbek pierwotnego sygnału jest reprezentowany przez zestaw współczynników transformaty. Najczęściej wykorzystywane jest zmodyfikowane przekształcenie kosinusowe (MDCT) wykazujące właściwości podobne do DFT (współczynniki reprezentują składowe widmowe o różnych częstotliwościach). Dodatkowa przewaga MDCT nad DFT wynika z symetrii tego przekształcenia.

,

gdzie w(n) jest specjalną funkcją okna o kształcie półokresu sinusoidy lub podobnym.

Interesującą rozwiązaniem jest to, że MDCT reprezentuje 2N próbek sygnału x(n) używając tylko N współczynników Fk. W oderwaniu od kontekstu taka reprezentacja nie jest odwracalna, ponieważ brakująca część współczynników powoduje silne zniekształcenie aliasowe sygnału w dziedzinie czasu (jedna połowa bloku próbek jest odbita symetrycznie w czasie i nakłada się na drugą połowę). Składowe aliasowe są jednak obecne w 2 sąsiadujących blokach, ponieważ przekształcenie MDCT obliczane jest z 50% zakładką i mają przeciwne znaki. W trakcie rekonstrukcji sygnału w dekoderze, składowe aliasowe ulegają wzajemnej kompensacji w procesie sumowania zachodzących na siebie bloków próbek [11,12,13].

Współczesna technika kodowania dźwięku MPEG AAC (ang. Advanced Audio Coding) [14] operuje na sygnale podzielonym na zachodzące na siebie bloki złożone z 2N = 2048 lub 2N = 512 próbek. W zależności od chwilowych właściwości sygnału, reguła adaptacji może dokonać przełączenia trybu kodowania z bloku 2048 próbek na bloki 512 próbek. Długie bloki pozwalają na lepszą rozdzielczość częstotliwościową potrzebną do analizy stacjonarnych składników tonalnych dźwięku, podczas gdy krótkie bloki oferują lepszą rozdzielczość czasową, która jest niezbędna do ścisłego kontrolowania zniekształceń w dziedzinie czasu, w celu zapobieżenia dokuczliwemu zjawisku echa wyprzedzającego. Po stronie dekodera wykonywane jest odwrotne przekształcenie i z zestawu współczynników transformatowych rekonstruowany jest sygnał w dziedzinie czasu.