2.2 信源编码概论_数字多媒体广播-QQ阅读女生中文现言网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

2.2 信源编码概论

2.2.1 信源编码的任务

广播系统由模拟信号向数字化信号过渡，首先是实现演播室的数字化，即节目的记录、存储、交换都是以数字的形式进行。但是，如果将演播室经过模/数转换的PCM（脉冲编码调制）信号直接进行传送，将会占用极大的信道宽度，频谱利用极不经济。例如，一套CD立体声节目，A/D转换的取样频率为44.1kHz，每取样值按16比特编码，则数据率为2×44.1×103 × 16=1411.2kb/s。

考虑到为了能够纠正传输差错，进行信道编码时人为加入一定的冗余，假设信道编码率R=1/2，则实际上在传输信道中传送的数据率为1411.2kb/s ×2，如果频谱利用率按（2b/s）/Hz计算，那么传送一套这样的立体声节目所需的射频带宽为

这个带宽相当于现行约7个模拟调频广播电台所占用的有效带宽。可以看出，这在实际上是不能被人们接受的。

如果经过数据压缩，将数据率降至原来的1/7左右，利用一个FM电台所占的射频带宽就可以传送一套CD质量的立体声节目。所以，数据压缩清除了广播电视节目传输数字化的最大障碍。

此外，如果不进行数据率压缩，与高的数据率直接相联系的是，通过线路（微波、电缆、光缆、卫星）传输时传输费用高，节目存储时需要大的存储器容量。

经过数据压缩后，就可以在现有通信干线上开通更多的并行业务，在带宽一定的信道上可同时安排多套节目。数据率压缩可以较快地传输各种信源，降低信道占用费。由于压缩降低了数据率，存储费和空间都可以大大减少，也可以降低发射机功率消耗。

由以上的讨论得出的结论是：必须应用相应的方法来降低数字音频信号的数据率，称之为数据压缩或码率压缩，或称为数字音频信号的信源编码。

信源编码的任务主要是解决数据存储、交换、传输的有效性问题。即通过对信源数据率的压缩，力求用最少的数码传递最大的信息量。

在进行信源编码时，既希望最大限度地降低码率，又希望尽可能不要对节目质量造成损伤，以便听众感觉不出数据压缩的节目与原版节目的差别。二者是相矛盾的，只能根据不同节目的特点和不同的需要折中选择合适的压缩程度。

2.2.2 信源编、解码系统

如图2-2-1所示是数字音频信号编码与解码系统原理。

图2-2-1 信源编码与解码系统原理图

图中只画出了一个声道。模拟音频信号经A/D转换（取样、量化、编码）后变为PCM（脉冲编码调制）数字音频信号。如果按照演播室标准，取样频率为48kHz，每取样值按16比特量化，那么每声道PCM信号的数据率就是768kb/s。经过信源编码，去除声音信号中的“冗余”部分和与听觉无关的“不相关”部分，经压缩的数据率每声道仅100kb/s左右。在解码端，通过相应的解码器，数据率又被恢复为每声道768kb/s，信号形式仍然为PCM数字音频信号，再经D/A转换，变为模拟音频信号。

2.2.3 数据压缩的可能性

1.声音信号中的“冗余”部分

统计分析表明，无论是语言信号还是音乐信号，都存在多种冗余度。编码时降低信号中的冗余度，在解码时完全可以重建。

信息的冗余度在时域和频域都存在。

时域信息冗余度主要表现在：幅度非均匀分布，即不同幅度的样值出现的概率不同，小幅度的样值比大幅度样值出现的概率高。尤其在语言和音乐信号的间隙，会有大量的低电平样值。

（1）样值间的相关：对音频信号波形分析表明，相邻样值间存在最大的相关性，取样频率越高，样值间的相关性越大。

（2）周期间的相关性。虽然音频信号占据很宽的频率范围（20Hz～20kHz），但无论是语言节目还是音乐节目，在特定的瞬间，某一声音通常只有少数的几个频率分量，此时，就如同某些振荡波形一样，在周期与周期之间存在一定的相关性。

频域信息冗余度主要表现在非均匀的长时间功率谱密度：在较长时间间隔内进行统计平均，得到的功率谱密度函数表明，功率谱呈现很大的不平坦性。这说明没有充分利用给定的频带，或者说存在固有的冗余度。功率谱的高频成分能量较低。

2.声音信号中的“不相关”部分

基于人耳听觉特性，人耳对信号幅度、频率和时间的分辨能力是有限的，凡是人耳感觉不到的成分，这种对人耳辨别声音信号的强度、音调、方位没有贡献的成分，称为无关部分或“不相关部分”。即凡是感觉不到的成分不编码、不传送。这种压缩数据率的可能性是充分利用了人耳听觉的心理声学特性（频谱掩蔽特性和时间掩蔽特性，后文详细讨论）。

2.2.4 数据压缩的分类

数据压缩通常分为可逆压缩和不可逆压缩两类。

1.可逆压缩

可逆压缩又称冗余度压缩，或无失真压缩。在这种压缩方法中，在编码时去除重复的数据，在解码时根据压缩后的数据，可以完整地恢复原来的数据，无信息的丢失。这种编码方法也称“低噪声编码”。但用低噪声编码不能实现恒定码率，因为信号的冗余是随时间变化的。此外，仅利用去除冗余进行源编码，不能实现特别有效的压缩。

冗余度压缩的一个简单例子是去除重复的数据。例如，当传送的数据在一段长时间内不变，则许多连续取样值将是重复的。在这种情况下，我们可以计算有变化的两个取样之间重复取样值的数目，编码器只需要传送取样值与该重复数目。

2.不可逆压缩

不可逆压缩又称“不相关”压缩。这种压缩的特点是，压缩时丢掉的信号中“不相关”部分，解码后不能如实地恢复原来的“不相关”部分。虽然经解码后数据率又与编码前相同，但其中各自的“不相关”部分并不相同。因此，这种压缩是不可逆的，也称为失真压缩或有损压缩。

可逆压缩与不可逆压缩可借助图2-2-2来理解。当图中比较器输出D=0时，称为“冗余”压缩（可逆）；当D≠O时，称为“不相关压缩”（不可逆）。需要指出的是，图2-2-2并不是实际测试电路，这里没有考虑编码与解码处理所需的时延。

图2-2-2 可逆压缩与不可逆压缩

2.2.5 何谓与CD可比的质量

过去，声音广播最好质量的代表是调频立体声广播。随着激光唱片（CD）的出现，大家早已认识和熟悉CD质量意味着什么。

我们通常聆听的CD音乐都是没有经过数据率压缩的，即双声道立体声的数据率是1411.2kb/s。现在的问题是，经过数据率压缩之后，压缩到何种程度，主观聆听，感觉仍然有与CD可比的质量呢？

如果将压缩后的节目与原版CD节目对比试听，若听不出差别，就可认为数据压缩的节目有与CD可比的质量。

若原版CD节目（代号为A，数据率为1411.2kb/s），经压缩后的节目代号为B（如数据率为192kb/s），事先在告知是节目A的情况下聆听，获得一个原版的印象。然后，在不告知是A还是B的情况下聆听A和B，然后由听者判断哪个是A，哪个是B，如果分不清A和B，说明B有与原版CD可比的质量。