数字多媒体广播
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2 信源编码概论

2.2.1 信源编码的任务

广播系统由模拟信号向数字化信号过渡,首先是实现演播室的数字化,即节目的记录、存储、交换都是以数字的形式进行。但是,如果将演播室经过模/数转换的PCM(脉冲编码调制)信号直接进行传送,将会占用极大的信道宽度,频谱利用极不经济。例如,一套CD立体声节目,A/D转换的取样频率为44.1kHz,每取样值按16比特编码,则数据率为2×44.1×103 × 16=1411.2kb/s。

考虑到为了能够纠正传输差错,进行信道编码时人为加入一定的冗余,假设信道编码率R=1/2,则实际上在传输信道中传送的数据率为1411.2kb/s ×2,如果频谱利用率按(2b/s)/Hz计算,那么传送一套这样的立体声节目所需的射频带宽为

这个带宽相当于现行约7个模拟调频广播电台所占用的有效带宽。可以看出,这在实际上是不能被人们接受的。

如果经过数据压缩,将数据率降至原来的1/7左右,利用一个FM电台所占的射频带宽就可以传送一套CD质量的立体声节目。所以,数据压缩清除了广播电视节目传输数字化的最大障碍。

此外,如果不进行数据率压缩,与高的数据率直接相联系的是,通过线路(微波、电缆、光缆、卫星)传输时传输费用高,节目存储时需要大的存储器容量。

经过数据压缩后,就可以在现有通信干线上开通更多的并行业务,在带宽一定的信道上可同时安排多套节目。数据率压缩可以较快地传输各种信源,降低信道占用费。由于压缩降低了数据率,存储费和空间都可以大大减少,也可以降低发射机功率消耗。

由以上的讨论得出的结论是:必须应用相应的方法来降低数字音频信号的数据率,称之为数据压缩或码率压缩,或称为数字音频信号的信源编码。

信源编码的任务主要是解决数据存储、交换、传输的有效性问题。即通过对信源数据率的压缩,力求用最少的数码传递最大的信息量。

在进行信源编码时,既希望最大限度地降低码率,又希望尽可能不要对节目质量造成损伤,以便听众感觉不出数据压缩的节目与原版节目的差别。二者是相矛盾的,只能根据不同节目的特点和不同的需要折中选择合适的压缩程度。

2.2.2 信源编、解码系统

如图2-2-1所示是数字音频信号编码与解码系统原理。

图2-2-1 信源编码与解码系统原理图

图中只画出了一个声道。模拟音频信号经A/D转换(取样、量化、编码)后变为PCM(脉冲编码调制)数字音频信号。如果按照演播室标准,取样频率为48kHz,每取样值按16比特量化,那么每声道PCM信号的数据率就是768kb/s。经过信源编码,去除声音信号中的“冗余”部分和与听觉无关的“不相关”部分,经压缩的数据率每声道仅100kb/s左右。在解码端,通过相应的解码器,数据率又被恢复为每声道768kb/s,信号形式仍然为PCM数字音频信号,再经D/A转换,变为模拟音频信号。

2.2.3 数据压缩的可能性

1.声音信号中的“冗余”部分

统计分析表明,无论是语言信号还是音乐信号,都存在多种冗余度。编码时降低信号中的冗余度,在解码时完全可以重建。

信息的冗余度在时域和频域都存在。

时域信息冗余度主要表现在:幅度非均匀分布,即不同幅度的样值出现的概率不同,小幅度的样值比大幅度样值出现的概率高。尤其在语言和音乐信号的间隙,会有大量的低电平样值。

(1)样值间的相关:对音频信号波形分析表明,相邻样值间存在最大的相关性,取样频率越高,样值间的相关性越大。

(2)周期间的相关性。虽然音频信号占据很宽的频率范围(20Hz~20kHz),但无论是语言节目还是音乐节目,在特定的瞬间,某一声音通常只有少数的几个频率分量,此时,就如同某些振荡波形一样,在周期与周期之间存在一定的相关性。

频域信息冗余度主要表现在非均匀的长时间功率谱密度:在较长时间间隔内进行统计平均,得到的功率谱密度函数表明,功率谱呈现很大的不平坦性。这说明没有充分利用给定的频带,或者说存在固有的冗余度。功率谱的高频成分能量较低。

2.声音信号中的“不相关”部分

基于人耳听觉特性,人耳对信号幅度、频率和时间的分辨能力是有限的,凡是人耳感觉不到的成分,这种对人耳辨别声音信号的强度、音调、方位没有贡献的成分,称为无关部分或“不相关部分”。即凡是感觉不到的成分不编码、不传送。这种压缩数据率的可能性是充分利用了人耳听觉的心理声学特性(频谱掩蔽特性和时间掩蔽特性,后文详细讨论)。

2.2.4 数据压缩的分类

数据压缩通常分为可逆压缩和不可逆压缩两类。

1.可逆压缩

可逆压缩又称冗余度压缩,或无失真压缩。在这种压缩方法中,在编码时去除重复的数据,在解码时根据压缩后的数据,可以完整地恢复原来的数据,无信息的丢失。这种编码方法也称“低噪声编码”。但用低噪声编码不能实现恒定码率,因为信号的冗余是随时间变化的。此外,仅利用去除冗余进行源编码,不能实现特别有效的压缩。

冗余度压缩的一个简单例子是去除重复的数据。例如,当传送的数据在一段长时间内不变,则许多连续取样值将是重复的。在这种情况下,我们可以计算有变化的两个取样之间重复取样值的数目,编码器只需要传送取样值与该重复数目。

2.不可逆压缩

不可逆压缩又称“不相关”压缩。这种压缩的特点是,压缩时丢掉的信号中“不相关”部分,解码后不能如实地恢复原来的“不相关”部分。虽然经解码后数据率又与编码前相同,但其中各自的“不相关”部分并不相同。因此,这种压缩是不可逆的,也称为失真压缩或有损压缩。

可逆压缩与不可逆压缩可借助图2-2-2来理解。当图中比较器输出D=0时,称为“冗余”压缩(可逆);当D≠O时,称为“不相关压缩”(不可逆)。需要指出的是,图2-2-2并不是实际测试电路,这里没有考虑编码与解码处理所需的时延。

图2-2-2 可逆压缩与不可逆压缩

2.2.5 何谓与CD可比的质量

过去,声音广播最好质量的代表是调频立体声广播。随着激光唱片(CD)的出现,大家早已认识和熟悉CD质量意味着什么。

我们通常聆听的CD音乐都是没有经过数据率压缩的,即双声道立体声的数据率是1411.2kb/s。现在的问题是,经过数据率压缩之后,压缩到何种程度,主观聆听,感觉仍然有与CD可比的质量呢?

如果将压缩后的节目与原版CD节目对比试听,若听不出差别,就可认为数据压缩的节目有与CD可比的质量。

若原版CD节目(代号为A,数据率为1411.2kb/s),经压缩后的节目代号为B(如数据率为192kb/s),事先在告知是节目A的情况下聆听,获得一个原版的印象。然后,在不告知是A还是B的情况下聆听A和B,然后由听者判断哪个是A,哪个是B,如果分不清A和B,说明B有与原版CD可比的质量。