第四节 声音信息的表示
(一)数字声音基础
1.波形声音的数字化
声音是一种物理信号,计算机要对它进行处理,其前提是必须用二进制数字的编码形式来表示声音。最常用的声音信号数字化方法是取样-量化法,它分成如下3个步骤:
(1)取样(Sampling)
(2)量化
(3)编码(Encoding)
2.PC机中的声音
PC机中的数字声音有两种不同的表示方法。一种称为“波形声音”,通过对实际声音的波形信号进行数字化(取样和量化)而获得,它可表示任何种类的声音。另一种是“合成声音”,它使用符号(参数)对声音进行描述,然后通过合成(Synthesize)的方法生成声音,合成语音(用声母、韵母或清音、浊音、基音频率等参数描述的语音)等。
PC机中使用最广泛的波形声音文件采用wav作为扩展名,称为波形文件格式(Wave FileˉFormat).wav文件格式能支持多种取样频率和样本精度,并支持压缩的声音数据。
(二)波形声音
1.数字语音的压缩编码
数字语音的数据压缩方法很多,从原理上可以分成3类:
(1)波形编码
(2)参数编码或模型编码
(3)混合编码
2.全频带声音的压缩编码
(1)MPEG-1Audio(ISO/IEC11172-3)
MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它规定了高质量数字声音的编码方法、存储表示和解码方法,得到了极其广泛的应用。它虽然是MPEG-1标准的一个组成部分,但完全可以独立应用。
(2)MPEG-2Audio(ISO/IEC13818-3)
MPEG-2Audio与MPEG-1Audio标准都使用相同类型的编/解码器,层1、层2和层3的结构也相同。
(3)MPEG-2AAC(ISO/IEC13818-7)
MPEG-2AAC(Advanced Audio Coding)是MPEG-2标准中一种新的先进的声音编码标准。AAC支持的取样频率可从8kHz到96kHz,AAC编码器的输入可以是单声道的、立体声的和多声道的声音。
(4)MPEG-4Audio(ISO/IEC14496-3)
MPEG-4Audio的编码对象既可以是自然音频信号(波形声音),也可以是合成的音频信号。
(三)合成声音
1.合成音乐与MIDI
MIDI(Musical Instrument Digital Interface)是乐器数字接口的缩写,它起源于数字式电子乐器,因为各种产品必须使用统一接口才能进行连接,因些必须规定一种数字乐器相互间的接口标准,特别是数字乐器与计算机的接口标准,这就是MIDI。
2.合成语音
语音合成目前主要指从文本到语音的合成(Text-to-Speech,简称TTS),也称为文语转换。
相关推荐:
北京 | 天津 | 上海 | 江苏 | 山东 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
广东 | 河北 | 湖南 | 广西 | 河南 |
海南 | 湖北 | 四川 | 重庆 | 云南 |
贵州 | 西藏 | 新疆 | 陕西 | 山西 |
宁夏 | 甘肃 | 青海 | 辽宁 | 吉林 |
黑龙江 | 内蒙古 |