音频数据压缩编码.ppt

上传人：牧羊曲112

文档编号：6378936

上传时间：2023-10-22

格式：PPT

页数：12

大小：560.50KB

《音频数据压缩编码.ppt》由会员分享，可在线阅读，更多相关《音频数据压缩编码.ppt（12页珍藏版）》请在三一办公上搜索。

1、,1,多媒体通信,第5讲音频数据压缩编码,2,人耳结构图,3,人的听觉特性,人耳可听声音的频率范围：16Hz20KHz,人耳可听声音最灵敏的频率范围：2KHz5KHz,频域掩蔽效应：强信号会降低人耳对该信号频率附近其他弱信号的敏感度。,时域掩蔽效应：人耳在听一个强音之后，需要经过一个短暂的延时才能听到较弱的声音。,4,静音阈值与掩蔽阈值,5,SMR,信号屏蔽比（Signal-to-Mask Ratio）：掩蔽声的大小与掩蔽阈值之比值。,6,MPEG Audio压缩技术,数据压缩的主要依据：是人耳朵的听觉特性，使用“心理声学模型(psychoacoustic model)”去掉低于“听觉阈值电

2、平”的声音信号（听阀与频率、具体的人有关）利用“听觉掩蔽特性”，听觉阈值电平会随听到的不同频率的声音而发生变化。（例如，安静房间里的谈话和吵闹环境中的谈话）,7,MPEG Audio压缩技术,感知子带编码（MPEG-1 Audio采用）Dolby AC3（MPEG-2 Audio采用）,8,感知子带编码,分割子带对每个子带分别进行量化和编码将各子带的编码进行复合,9,感知子带编码,10,Dolby AC3,分析滤波器组把用PCM时间样本表示的声音信号变换成用频率系数块表示的声音信号。谱包络编码的功能是对“分析滤波器组”输出的指数进行编码。指数代表粗糙的信号频谱位分配使用“谱包络编码”输出的信息确定尾数编码所需要的位数尾数量化按照位分配信息对尾数进行量化。AC-3帧格式将输出的频谱包络组成AC-3帧。,11,Dolby AC3,12,心理声学模型,