Dzwebs.Net

撰写电脑技术杂文十余年

音频文件格式介绍之上篇

Admin | 2011-4-22 8:09:01 | 被阅次数 | 7017

温馨提示!

如果未能解决您的问题,请点击搜索;登陆可复制文章,点击登陆

  一、MIDI

  是乐器数字接口(Musical Instrument Digital Interface)的英文缩写,是数字音乐/电子合成乐器的统一国际标准。MIDI规范由美、日几家著名电子乐器厂商于1983年共同制定,目的是解决各种电子乐器间存在的兼容性问题。MIDI规范不仅定义了电脑音乐程序、音乐合成器及其它电子音乐设备交换音乐信号的方式,而且还规定了不同厂家的电子乐器与电脑连接的电缆和硬件及设备间数据传输的协议,可用于为不同乐器创建数字声音,能很容易地模拟钢琴、小提琴等传统乐器的声音。MIDI本身并不能发出声音,它是一个协议,只包含用于产生特定声音的指令,而这些指令则包括调用何种MIDI设备的音色、声音的强弱及持续的时间等。电脑把这些指令交由声卡去合成相应的声音(如依指令发出钢琴声或小提琴声等)。最初,因为不同MIDI设备的乐器音色排列方法不一,所以会造成同一MIDI文件在不同的设备上会出现完全不同的放音效果(比如一个钢琴音色的MIDI文件,在不同设备上播放时会变成小提琴或者小号的音色)。为避免出现这种混乱情况,GM(General MIDI,通用MIDI)标准被提出并得到了Windows操作系统的支持,得到了相当广泛的应用。它规定了前128种常用乐器音色的编排方式,例如1号是钢琴、66号是萨克斯管等等。GM标准还描述了成为GM兼容格式的硬件设备应具有的其它特征,如GM标准音源同时发音数不少于24,MIDI通道为16,第10通道为打击乐声部等等,它实际上是对MIDI规范的补充。 Roland公司提出的GS标准在兼容GM标准的基础上,对其进行了发展,增强了音乐的表现力——它提供比GM标准数量更多的打击乐器组和更多的特殊音效。GS标准具有广泛的软硬件适应性,包括声卡、音乐爱好者的娱乐乐器到专业音乐器材等。后来,Yamaha公司又提出了基于GM标准的XG标准。相对于保存真实采样数据的声音文件,MIDI文件显得更加紧凑,其文件的大小要比WAV文件小得多——一分钟的WAV文件约要占用10MB的硬盘空间,而一分钟的MIDI却只有区区的3.4KB。现在,MIDI已经成为电脑音乐的代名词。电脑播放MIDI文件时, 有两种方法合成声音: FM合成和波表合成。FM合成是通过多个频率的声音混合来模拟乐器的声音;波表合成是将乐器的声音样本存储在声卡波形表中,播放时从波形表中取出来产生声音。采用波表合成技术可以产生更逼真的声音。MIDI文件有几个变通的格式,其中CMF文件是随声卡一起使用的音乐文件,与MIDI文件非常相似,只是文件头略有差别;另一种MIDI文件是Windows使用的RIFF文件的一种子格式,称为RMID,扩展名为RMI。

  二、WAV

  由Microsoft公司开发的一种WAV声音文件格式,是如今电脑上最为常见的声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。Wave格式支持MSADPCM、CCITTALaw、CCITT μ Law和其它压缩算法,支持多种音频位数、采样频率和声道,但其缺点是文件体积较大(一分钟44kHZ、16bit Stereo的WAV文件约要占用10MB左右的硬盘空间),所以不适合长时间记录。

  三、MPEG

  (Moving Picture Experts Group,活动图像专家组)代表的是MPEG活动影音压缩标准,MPEG音频文件指的是MPEG标准中的声音部分,即MPEG音频层(MPEG Audio Layer)。MPEG音频文件根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio Layer 1/2/3),分别与MP1、MP2和MP3这三种声音文件相对应。MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4∶1和6∶1~8∶1,而MP3的压缩率则高达10∶1~12∶1,也就是说一分钟CD音质的音乐,未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。因此,目前Internet上的音乐格式以MP3最为常见。MP3为降低声音失真采取了名为“感官编码技术”的编码算法:编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的MP3文件,并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。虽然它是一种有损压缩,但是它的最大优势是以极小的声音失真换来了较高的压缩比。

  MP3问世不久,就凭着较高的压缩比(12:1)和较好的音质创造了一个全新的音乐领域。然而,MP3的开放性却最终不可避免地导致了版权之争。在这样的背景下,文件更小、音质更佳,同时还能有效保护版权的MP4就应运而生了。MP4与MP3之间其实并没有必然的联系。首先,MP3是一种音频压缩的国际技术标准,而MP4却是一个商标的名称。其次,它采用的音频压缩技术也迥然不同,MP4采用的是美国电话电报公司(AT&T)所研发的、以“知觉编码”为关键技术的a2b音乐压缩技术,可将压缩比成功地提高到15:1(最大可达到20:1)而不影响音乐的实际听感。同时,MP4在加密和授权方面也做了特别的设计。它有如下特点:(1)每首MP4乐曲就是一个扩展名为.exe的可执行文件,在Windows里直接双击就可以运行播放,十分方便。MP4的这个优点同时又是它的先天缺陷---容易感染电脑病毒!(2)更小的体积!更好的音质?相对先进的a2b音频压缩技术的采用,使MP4文件大小仅为MP3的3/4左右,从这个角度来看,MP4更适合在Internet上传播,而且据说音质也更胜一筹,但我怎么也没听出它比MP3的音质更为优越。(3)独特的数字水印。MP4乐曲采用了名为“Solana”技术的数字水印,可方便地追踪和发现盗版发行行为。而且,任何针对MP4的非法解压行为,都可能导致MP4原文件的损毁。(4)支持版权保护。MP4乐曲还内置了包括与作者、版权持有者相关的文字、图像等版权说明,既可声明版权,又表示了对作者和演唱者的尊重。(5)比较完善的功能。MP4可独立调节左右声道音量控制;内置波形/分频动态音频显示和音乐管理器,可支持多种彩色图像、网站链接及无限制的滚动显示文本

  三、WMA

  就是Windows Media Audio的缩写,是微软自己开发的Windows Midea Audio技术。它和Windows Midea Video一样,经历了几代改良后,变得非常出色。比起老掉牙的MP3压缩技术,WMA无论从技术性能(支持音频流)还是压缩率(比MP3高一倍)都远远把MP3抛在后面了。 据微软声称,用它来制作接近CD品质的音频文件,其体积仅相当于MP3的1/3。在48Kbps的传送速率下即可得到接近CD品质(Near-CD Quality)的音频数据流,在64Kbps的传送速率下可以得到与CD相同品质的音乐,而当连接速率超过96Kbps后则可以得到超过CD的品质。

  MPC(MusePaCk)原先又被称为MPEGPlus(.mp+),是由德国人Andree Buschmann开发的一种完全免费的高品质音频格式。在其问世之前,Lame MP3是公认音质最好的有损压缩方案,追求音质的人对它趋之若鹜。但现在这个桂冠无疑该让给MPC了,在中高码率下,MPC可以做到比MP3更好音质。在高码率下,MPC的高频要比MP3细腻不少,可以在节省大量空间的前提下获得最佳音质的音乐欣赏,是目前最适合用于音乐欣赏的有损编码。不仅仅是音质,MPC还有编码速度快的优点,经MPC现任负责人Frank Klemm改良后的1.14版编码器,比慢工出细活的LAME要快得多!其实如果你没有MP3随身听,只是在自己的电脑上制作、播放音乐,完全可以弃MP3而转投MPC,因为后者在编码速度和音质上的表现绝对会让你彻底忘记MP3的!

  四、ogg

  开放源代码的Ogg Vorbis,作为开放源...些变故之后,Ogg Vorbis终于在2002年7月释出了1.0版本。由于开放源码的东西向来都缺少枪手为其摇旗呐喊,所以国内并不是有很多的人了解Ogg Vorbis。Ogg Vorbis 是一种音频压缩格式,类似于MP3等现有的通过有损压缩算法进行音频压缩的音乐格式。但有一点不同的是,Ogg Vorbis格式是完全免费、开放源码且没有专利限制的。Vorbis 是这种音频压缩机制的名字,而Ogg则是一个计划的名字,该计划意图设计一个完全开放源码的多媒体系统。开放源代码能为用户在经济上带来收益,这一点很多人都知道了,但不能忘记的是Ogg Vorbis的技术也不是盖的。Ogg Vorbis文件的扩展名是.OGG。这种文件的设计格式是非常灵活的。它的最大特点是在文件格式已经固定下来后还能对音质进行明显的调节和新算法。现在创建的OGG文件可以在未来的任何播放器上播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。在压缩技术上,Ogg Vorbis的最主要特点是使用了VBR(可变比特率)和ABR(平均比特率)方式进行编码。与MP3的CBR(固定比特率)相比可以达到更好的音质。Ogg Vorbis其他技术特性还包括:支持类似于MP3的ID3信息,但比MP3要灵活而又完整得多,实际上可以填写随意多的信息。Vorbis还具有比特率缩放功能,可以不用重新编码便可调节文件的比特率。Vorbis文件可以被分成小块并以样本粒度(granularity,专业术语,指数据可以被分割的最小尺寸)进行编辑;Vorbis支持多通道(大于2)音频流并使用了独创性的处理技术;Vorbis文件可以以逻辑方式相连接等。

  接下篇…


该杂文来自: 基础知识杂文

上一篇:无压缩音频文件之采样频率、量化位数、声道和存储

下一篇:音频文件格式介绍之下篇

网站备案号:

网站备案号:滇ICP备11001339号-7

版权属性:

Copyright 2007-2021-forever Inc. all Rights Reserved.

联系方式:

Email:dzwebs@126.com QQ:83539231 访问统计