haihongyuan.com
海量文库 文档专家
全站搜索:
您现在的位置:首页 > 初中教育 > 初中语文初中语文

一:中考语文知识精讲试题分析和专。

发布时间:2014-02-14 10:50:44  

苍穹龙骑 http://www.cangqionglongqi.com

多媒体技术及应用

第2章 音频处理技术(一)
教学要求

西安交通大学 计算机教学实验中心 2007

问题的提出
?

?
?

?

?

什么是声音? 声音有哪些物理特征? 音乐1、2、歌曲1、2、3、MIDI1、2、 3、乐器伴唱…… 当我们看到“声音”这个字时,联想到 的是什么? ……

上一页

下一页

第2/77页

一.声音的基本特性
?

声音的表现形式有三类: ? 语音是指具有语言内涵和人类约定的 特殊媒体; ? 音乐是规范的符号化了的声音; ? 音响指其他自然声音,如动物的叫声、 机器的轰鸣声、风雨雷电声等。

上一页

下一页

第3/77页

声音
?
?

什么是声音?
声音是振动的波,是随时间连续变化的物理量。 声音依靠介质的振动进行传播。声源就是振动源。

?

声波 机械振动或气流扰动引起周围弹性媒质发 生波动而产生声波。 声源 产生声波的物体为声源(如人声带、乐器等)。
声场 声波所及的空间范围称为声场 。

? ? ?

声音 声波传到人耳,经过人类听觉系统的感知就 是声音。
上一页 下一页 第4/77页

声波的表示
?

?

声波可以用一条连续的曲线来表示,它在时间 和幅度上都是连续的,称为模拟音频信号。 在任一时刻t ,声波可以分解成一系列正弦波 的线性叠加:

? ? ? ?

An 是振幅,表示声音的强弱 ω是声波的基频,表示声音音调的高低 φn 是n次谐波的初相位 nω是ω的n次谐波分量,或称为泛音
上一页 下一页 第5/77页

音频信号的特征
?

声音的物理特性
?

频率、声压和声强、动态范围、频谱

?

声音的心理特性
?

音调、响度、音色、掩蔽效应、方位感、 空间感

?

声音的音质
?

频带宽度、信噪比、数据量
上一页 下一页 第6/77页

声音的物理特性
?

周期/频率/带宽 ? 两个相邻波之间的时间长度为周期T ,单位为秒;
?

每秒钟声源振动的次数称为频率f,单位Hz;

f=1/T
?

描述组成复合信号的频率范围,称为带宽。
振幅

t
周期
上一页 下一页 第7/77页

声音频带示意图
?

人类对声音的感觉是有限的,即只能在一个频带 范围内有效。 高于20kHz频率的声音人耳听不到。 有的音响产品工作频率上限为50kHz,调音台的 最高工作频率设计到100kHz。

? ?

?

上一页

下一页

第8/77页

声波的频率范围
?

在自然界中, 人耳接收的音域:20~20,000Hz 次声波(大象):< 20Hz 超声波(海豚):>20,000Hz

上一页

下一页

第9/77页

声源的频率范围
?

日常生活中的不同声源频率范围: 男 声: 100 ~ 9,000Hz 女 声: 150 ~10,000Hz 电话声: 200 ~ 3,400Hz 收音机AM调幅广播声: 50 ~ 7,000Hz 收音机FM调频广

播声: 20 ~15,000Hz 专业级音响放大器声: 10 ~40,000Hz

上一页

下一页

第10/77页

声压和声强
?

声压 P 声波在空气传播造成空气中的气压发生变 化而产生的压强(相当于在无声波下空气中的气 压上叠加一个变化的压强),被称为声压,记作 P。单位有帕斯卡(Pa)和微巴(μbar)。

?

声强 I 描述声音传播所需能量的强度(声波是由 能量来维持传播的。如扬声器纸盆的振动是由电 能转换而来)。单位时间内通过垂直于声波传播 方向的单位面积内的声波能量为声场中某点的声 强,记作I,单位为瓦/米2(W/m2)。
声强与声压最大值的平方成正比。
上一页 下一页 第11/77页

?

声压级&声强级
在声学中,量级定义为一个量与同类基准量之比 的以10为底对数。单位是dB。 ? 声压级Lp 为: Lp = 20lg P/P0 声压基准量为P0 = 2 × 10-4μbar,声压级为0~ 120dB。
?

?

声强级LI 为:

LI = 10lg I/I0 声强的基准量为I0 = 10-12W/m2 。
上一页 下一页 第12/77页


?

阈 值是指临界值。 可听阈 引起人耳刚能听到声音时的声压, 与年龄有关。中音频时约为0.0002微巴。 痛阈 使人耳膜感到疼痛的声压,超过 200微巴的声压,能使人耳膜产生疼痛。

?

?

上一页

下一页

第13/77页

分贝(dB)
?

自然现象:扬声器的功率增加一倍发出的声音, 人听到的声音强度并不是增加一倍。 在声学中用分贝来表示声压或声强的变化程度。 人听觉神经的刺激程度不与刺激量大小成正比, 而是按刺激量以10为底的对数增长 。 成对数关系变化。

?

?

?

上一页

下一页

第14/77页

动态范围
? ?

?

指声音最大声压级和最小声压级之间的差值。 每种声源的动态范围依据各自的特性有所不同。 ? 如女声的动态范围为25~50dB, ? 男声为30~50dB, ? 交响乐队的动态范围大于100dB。 动态范围不仅用来表示一个声源产生的最大声压 级与最小声压级之间的差值,录音设备或记录声 音的载体(磁带、光盘、硬盘)同样可用动态范围 表示能够处理信号电平的范围。

上一页

下一页

第15/77页

动态范围的相对强度
?

?

?

动态范围可以用信号的相对强度表示: 信号的动态范围 = 20×lg(信号最大强度/信号最小强度)(dB) 其中信号可以用电压或功率衡量。 因为是一种比例关系,故只要采用相同的度量单 位,其结果都是一致的。

上一页

下一页

第16/77页

频谱
?

?

? ?

?

物体在一定位置的附近作来回往复的运动,称 为简谐振动。 简谐振动会产生一个特定音调的纯音,听起来 感觉单薄。 乐器很少产生单一频率的纯音,而是复音。 复音的产生基于物体的复杂振动,可以分解为 许多不同振

幅和不同频率的简谐振动(即看成 简谐振动的叠加)。 简谐振动的振幅按频率排列的图形称为频谱。 频谱可一目了然地看出复杂振动的频率结构。
上一页 下一页 第17/77页

钢琴的复音频谱

?

钢琴(基频为253Hz)的复音频谱

上一页

下一页

第18/77页

声音的心理学特性
从声学心理角度分析,声音有三个 要素:音调、响度和音色。 它们与声波的频率、声压和频谱结 构对应。

?

?

上一页

下一页

第19/77页

音调
?

音调代表声音的高低,与频率有关。频率越高, 音调越高,反之亦然。 ? 人对声音频率的感觉表现为音调的高低,在音 乐中称为音高。音调与基频的对数(20×lg) 成线性关系,单位为美(mei)。基频越低, 给人的感觉越低沉。基频频率增加一倍,音乐 上称提高了一个八度。 ? 在编辑声音时,如果对声音的频率进行调整, 其音调也会随之而变;不同声源有自己特定的 音调,若改变了声源的音调,声音会发生质的 转变。
上一页 下一页 第20/77页

频率与音调的关系

上一页

下一页

第21/77页

响度
?

?

响度 也称音强,是人耳对声音强弱的感 觉程度。常说的“音量”也是指响度。 响度与声波的振幅成正比,振幅越大, 响度越大。 唱盘、CD激光盘等播放出来的声音响 度是一定的,但通过控制、调整播放设 备的音量,可以改变聆听时的响度。

?

上一页

下一页

第22/77页

等响度曲线
?

?

人的耳道会对某段频 率产生共鸣,使灵敏 度提高。因此人耳听 到声音的响度与声音 的频率有关。描述响 度、声压以及声源频 率之间的关系曲线称 为等响度曲线。 从曲线看出,当音量 开到使声压级为80 dB时,就可做到高、 低频声音丰满。
上一页 下一页

第23/77页

音色
?

?

?

?

音色是声音的特色,又称音品。通常说法是:声 音的音调和响度以外的音质差异叫做音色。 影响音色主要因素是复音。所谓“复音”是指不 同频率和不同振幅的混合声音,自然声中大部分 是复音。 在复音中,最低频率的声音是“基音”(声音的 基调),其他频率的声音称为“谐音”(也叫泛 音)。基音和谐音是构成声音音色的重要因素。 各种声源都具有自己独特的音色,例如每种乐器 的声音、每个人的声音等,人是根据音色来辨别 声源种类的。
上一页 下一页 第24/77页

音色(续)
?

高次谐波越丰富,音色就越有明亮感和穿 透力。此外,音色还与诸多其他因素有关, 如听音条件等。

?

音色是一个主观量,常用柔和、刺耳、饱 满等词描述。

上一页

下一页

第25/77页

掩蔽效应
?

?

?

?

?

称听不到的声音为被掩蔽声,而起

掩蔽作用的声 音为掩蔽声。 掩蔽效应的实质是掩蔽声的出现使人耳听觉的等 响度曲线的最小可听阈抬高。 掩蔽效应的一般规律是强音压低音、低频率声音 压高频率。 利用掩蔽效应可以用有用信号去掩蔽无用的声信 号,只需要把无用声音的声压级降低到掩蔽阈以 下即可。 在数字音频处理中,还可以利用掩蔽效应去掉人 耳听不到的那部分信号进行声音数据的压缩。
上一页 下一页 第26/77页

方位感
?

?

?

人凭借双耳在一定声学环境内能够对声源定位, 这种能力来自于声源发出的声波到达双耳间的强 度差、时间差等因素。 声源到达听者耳朵的声音有两个,一个声音直接 到达,而另一个由于人头部遮蔽,需绕过头部才 能到达。称前者为直达声,而后者为绕射声。 若有两个声源,增大其中一个声源的强度,由于 该声音源发出的直达声或绕射声的声压大于另一 个声源,双耳将会产生声压级差。使听者感受的 声源(声像)位置向强度较大的声源方向移,使 人感受到声音的立体感。
上一页 下一页 第27/77页

空间感
?

?

一个声源发出的声音同时向各个方向散开,其发 散的角度取决于声源所具有的指向性,发散的声 波有一小部分直接传给听者,而大部分会被空间 表面反射,然后到达听者。由于直接和经反射到 达听者的两个声音途径存在差别(取决于环境) 而带来时间差。当时间差超过一定数量时,听者 会听到先后到达的两个声音,从而产生回音。经 多次反射,造成余声。即使声源已停止发声,但 听者仍能听到声音存在。 回声与余音的感觉可使听者感受出房间体积大小、 房间高低及内表面结构上的差异,这便是空间感。
上一页 下一页 第28/77页

音频信号的质量指标
? ? ?

?

频带宽度 动态范围 信噪比 数据量

上一页

下一页

第29/77页

(1) 频带宽度
?

音频信号所包含的谐波分量越丰富,音色 越好。在广播通信和数字音响系统中,以 声音信号所包含的谐波分量的频率范围来 衡量声音的质量,即带宽。

不同质量的声音的频带对比示意图
上一页 下一页 第30/77页

动态范围
?

?

动态范围越大,说明音频信号强度的相 对变化范围越大,音响效果越好。 动态范围一般用dB为单位来计量。 ? FM(调频)广播的动态范围约60dB, ? AM(调幅)广播的动态范围约40dB。 ? CD-DA的动态范围约100dB, ? 数字电话约50dB。

上一页

下一页

第31/77页

信噪比
?

?

?

?

信噪比SNR(Signal Noise Ratio)是有用信 号与噪声之比的简称。 信噪比大,在一定程度上能够掩蔽噪声,从 而获得较好的声音效果。 信噪比不仅是声音设备的性能指标,在声音

的录制和播放时,也要注意环境噪声。录制 时应尽可能减小环境噪音。输出时应使音量 适当大,以减少环境噪音对听音的影响。 一般话筒和音箱的信噪比在75dB以上。声卡 的信噪比在85~95dB。
上一页 下一页 第32/77页

数据量
?

音质与数据采样频率和数据位数有关:
? ?

采样频率越低,位数越少,音质越差; 采样频率越高,位数越多,音质越好。

上一页

下一页

第33/77页

二、数字音频
?

声音的数字化 ? 数字化就是将连续信号变成离散信 号。 ? 对音频信号,首先在时间上离散, 取有限个时间点,称为采样。 ? 然后在幅度上离散,取有限个幅度 值,称为量化。 ? 再将得到的数据表示成计算机容易 识别的格式,称为编码。
上一页 下一页 第34/77页

PCM编码
?

PCM是把模拟信号转换成数字信号的编码方法, 它主要包括采样、量化和编码3个过程。
?

?

?

采样 按时间间隔测量,把时间连续的模拟信号转换成时 间离散、幅度连续的采样信号。如果采样时间间隔相等, 称为均匀采样; 量化是按“四舍五入”等方法将采样得到的数值限定在 几个有限的数值中,将采样信号转换成时间离散、幅度 离散的数字信号; 编码(coding)是将量化后的信号转换成一个二进制码 组输出。例如,量化得到的数据中只会出现两个数值51 和80,则只用一位二进制数表示即可,用0表示51,用 1表示80。这种编码方法称为自然编码。
上一页 下一页 第35/77页

模拟声音信号的采样和量化过程示意

模拟声音信号的波形

采样得到的离散时间信号

再量化得到的数字信号
第36/77页

上一页

下一页

例2.1
例2.1 设一个连续信号的波形可以表示为 :
?

?

设采样频率为21Hz,[-10,10]内的量化 间隔取为1,试计算出该信号0到1秒内的 量化数据。 在0-1秒内,取21个采样点。在1、1/20、 2/20、……19/20、1秒时刻采样,将采 样得到的数值取整,即得到量化数据。

上一页

下一页

第37/77页

表2-1 连续波形的数字化
序号 采样点 采样数据 量化值 0 0.00 1 0.05 2 0.10 3 0.15 4 0.20 5 0.25 …… …… 9 10 0.45 0.50 9.41421 -7.66754 1.30867 1.07930 -3.46729 8.93433 …… -1.63831 7.89216 9 -8 1 1 -3 9 …… -2 8 序号 11 12 13 14 15 16 …… 20 采样点 采样数据 0.55 0.60 0.65 0.70 0.75 0.80 …… 1.00 -9.37474 4.73547 -2.56445 0.40759 6.34915 -9.36672 …… 4.40090 量化值 -9 5 -3 0 6 -9 …… 4

上一页

下一页

第38/77页

举例
?

对于CD-DA,采样频率为44.1kHz,即每 秒取44,100个点。幅度的取值范围是限制 在216=65,536以内,量化间隔为1,即量 化幅度可以取65,536个不同的值,计算机 中用16位的存储空间就可以表示一个量化 后的数值。 动态范围为

20×lg(216)≈96dB

上一页

下一页

第39/77页

PCM编码原理
编码的过程: 采样。用一组脉冲采样时钟信号乘以输入的模 拟音频信号,得到离散时间信号。 量化。对采样后的信号幅值进行量化。量化过 程由量化器来完成。 编码。对经量化器变换后的信号再进行编码, 即把量化的信号电平转换成二进制码组,得到 离散的二进制数据序列x(n)。 数据处理。计算机对量化后的二进制数据可以 用文件的形式存储、编辑和处理,并可还原成 原始的模拟信号播放。
上一页 下一页 第40/77页

PCM编码示意图

上一页

下一页

第41/77页

均匀量化和非均匀量化
?

均匀量化 采用相等的量化间隔(“等分尺”) 对采样得到的信号作量化,也称为线性量化。

缺点: 增加的样本位数不 能得到充分的利用。

上一页

下一页

第42/77页

非均匀量化
?

?

非线性量化 思想是大的输入信号采用大的量化 间隔,小的输入信号采用小的量化间隔; 这样就可以在满足精度要求的情况下用较少的位 数来表示。声音数据还原时,采用相同的规则。

上一页

下一页

第43/77页

非均匀量化算法
? 非均匀量化采用两种算法(定义采 样输入信号幅度和量化输出数据之 间的对应关系): ?μ律(μ-Law)压扩 ?A律(A-Law)压扩

上一页

下一页

第44/77页

律压扩
?

μ律(μ-Law)压扩主要用在北美和日本等地 区的数字电话通信中,按下面的公式确定 量化输入和输出的关系。

上一页

下一页

第45/77页

A律(A-Law)
?

A律(A-Law)压扩主要用在欧洲和中国大陆等地 区的数字电话通信中,按下面的式子确定量化输 入和输出的关系 。

上一页

下一页

第46/77页

举例
?

?

对于采样频率为8kHz,样本精度为13位、14位 或者16位的输入信号,使用μ律压扩编码或者使 用A律压扩编码,经过PCM编码器之后每个样本 需8位二进制存储,输出的数据率为64 kb/s。 这个数据就是CCITT推荐的G.711标准:话音频 率脉冲编码调制。

上一页

下一页

第47/77页

数字音频的技术指标
?

?
? ? ?

采样频率 采样精度 声道数 音频数据传输率 编码算法与音频数据 压缩比

上一页

下一页

第48/77页

采样频率
?

采样频率是指一秒钟采样的次数。采样频率越高, 单位时间内采集的样本数越多,得到波形越接近 于原始波形,音质就越好。 ? 根据奈奎斯特(Harry Nyquist)采样理论:如 果采样频率高于输入信号最高频率的两倍,重 放时就能从采样信号序列无失真地重构原始信 号。 ? 例如,电话话音的信号频率约为3.4 kHz,若 采样频率选为8kHz,就能无失真地重放原始 声音。
上一页 下一页 第49/77页

采样的3个常用频率
?

?


别为: ? 11.025kHz——AM(调幅)广播 ? 22.05kHz ——FM(调频)广播 ? 44.1kHz ——CD高保真音质声音 现在声卡的采样频率一般为48kHz甚至 96kHz。

上一页

下一页

第50/77页

采样精度
? 采样精度用每个声音样本的位数表示,也叫样本精 度或量化位数,反映度量声音波形幅度的精度。
? 例如,每个声音样本用16位表示,则量化样本值在0~ 65535之间,它的精度是输入信号的1/65536。

? 采样精度决定了模拟信号数字化以后的动态范围。
? 若以8位量化,则其波形的幅值可分为28=256等份,等 效的动态范围为20×lg(256)=48dB。若以16位采样, 则可分为216=65536等份,等效动态范围为 20×lg(65536)=96dB。

? 采样精度影响到声音的质量
?

位数越多,声音的质量越高,而需要的存储空间也越多; 位数越少,声音的质量越低,需要的存储空间越少。
第51/77页

上一页

下一页

声道数
?
?

?

?

单声道(mono)信号一次产生一组声波数据。 双声道或立体声 (stereo) 一次产生两组声波数 据。 双声道在硬件中占两条线路,一条是左声道, 一条是右声道。 立体声不仅音质、音色好,而且能产生逼真的 空间感。但立体声数字化后所占空间比单声道 多一倍。

上一页

下一页

第52/77页

其他因素
?

除采样频率、采样精度、声道数影响声音质量 外,声音录制时环境噪声、声卡内部噪声以及 采样数据丢失等都会造成声音质量的下降。
实际收听时,音响(功率放大器、扬声器等) 的质量对音质的表现也起很大作用。

?

上一页

下一页

第53/77页

音频数据传输率
? ?

音频信号数字化后,产生大量数据 。 产生数据的速度或播放声音时需要传输数据的速 度影响声音的播放质量。数据传输率用每秒钟传 输的数据位数表示,记为bps(bit per second)。 未经压缩的数字音频数据传输率为: 数据传输率(bit/s) = 采样频率(Hz)×量化位数(bit)×声道数
第54/77页

?

上一页

下一页

声音质量和数字化指标
采样频率 样本精度 单道声/ 质量 (kHz) (bit) 立体声 数据率(kB/s) (未压缩) 频率范围
200~3 400 Hz 50~7 000Hz 20~15 000Hz 20~20 000 Hz 20~20 000 Hz

电话 * AM FM CD DAT

8 11.025 22.050 44.1 48

8 8 16 16 16

单道声 单道声 立体声 立体声 立体声

8 11.0 88.2 176.4 192.0

上一页

下一页

第55/77页

例2-2
例2.2 高保真立体声数字音频的量化位数为16,试计 算其数据传输率。 解:高保真立体声数字音频采样频率为44.1kHz,双 声道,其数据传输率为 : 数据传输率 = 44.1(kHz)×16(bit)×2(声道)=1411.2(kbps) ? 如果采用PCM编码,数字音频文件所占用的空间可 用如下的公式计算: 音频数据量(Byte)= 数据传输率×持续时间/8(bit/Byte)

?

其中数据量以字节(Byte)为单位;数据传输率以每秒比特 (bps)为单位;持续时间以秒(s)为单位。
上一页 下一页 第56/77页

例2-3
例2.3 计算1分钟未经压缩的高保真立体声数字声 音文件的大小。 ? 解:高保真立体声数字音频采样频率为44.1kHz, 16位量化,双声道,其数据传输率为: 数据传输率 = 44.1(kHz)×16(bit)×2(声道)=1411.2(kbps) ? 1分钟这样的声音文件的大小为 : 音频数据量 = 1411.2(kb/s)×60(s) /8(bit/Byte)=10584kB ? 未经压缩的4分钟的歌曲文件约42M数据,128M的 MP3播放器只能存放3首这样的歌曲。
上一页 下一页 第57/77页

编码算法与音频数据压缩比
?

?

?

未压缩的音频数据量非常大,因此在编码的时 候常采用压缩的方式。 实际上,编码的作用一是记录数字数据,二是 采用一定的算法来压缩数据以减少存储空间和 提高传输效率。 压缩编码的基本指标之一就是压缩比,一般为 数据压缩前后的数据量之比:

上一页

下一页

第58/77页

数据压缩说明
? 数字化指标不同反映在采用了不同数据压缩比。 ?如果PCM编码采用4bit量化对CD音质信号压缩, 其压缩比为4:1。这种情况下,用来记录幅值 的比特位越少,编码后数据量就越小,压缩比 越大。但压缩比越大,丢掉的信息就会越多, 信号还原后失真就越大。(对有损压缩) ? 压缩算法包括有损压缩和无损压缩: ?有损压缩解压后数据不能完全复原,要丢失一 部分信息。 ?无损压缩不丢失任何信息,能较好地复原原始 信号。
上一页 下一页 第59/77页

数字音频文件格式
?

数字声音文件格式是数字音 频在磁盘文件中的存放形式, 相同的数据可以有不同的文 件格式,而不同的数据也可 以有相同的文件格式。 ? WAVE 格式 ? MP3 格式 ? RA 格式

上一页

下一页

第60/77页

WAVE文件格式
?

?

?

WAVE文件是一种通用的音频数据文件,文件扩 展名为“.WAV”,Windows系统和一般的音频 卡都支持这种格式文件的生成、编辑和播放。 WAVE文件由三部分组成:文件头(标明是WAVE 文件、文件结构和数据的总字节数)、数字化 参数(如采样率、声道数、编码算法等),最后 是实际波形数据。CD激光唱盘中包含的就是 WAVE格式的波形数据。一般说来,声音质量与 其WAVE格式的文件大小成正比。 WAVE文件的特点是易于生成和编辑,但在保证 一定音质的前提下压缩比不够,不适合在网络 上播放。
上一页 下一页 第61/77页

MP3文件
?

?

?

?

MP3文件是采用MP3算法压缩生成的数字音频数据文件,以 “.MP3”为文件后缀。 MP3利用MPEG(Motion Picture Expert Group,运动图像 专家组)制定的MPEG-1 Audio layer 3的压缩标准,将音

频信息用10:1甚至12:1压缩率变成容量较小的数据文件。 MPEG-1压缩主要用于VCD数据的压缩,也用来压缩不包含图 像的纯音频数据,音频压缩算法包括MPEG Audio Layer1、 MPEG Audio Layer2等,而MPEG Audio Layer3有很高的压 缩比。 虽然MP3是一种利用了人类心理声学特性的有损压缩,人耳 基本不能分辨出失真,音质几乎达到了CD音质标准。按照 这种算法,10张CD-DA的内容可以压缩到l张CD-ROM中,而 且视听效果相当好。
上一页 第62/77页

下一页

RA文件
?

Real Audio是Real networks推出的一种音 乐压缩格式,它的压缩比可达到96:1,因 此在网上比较流行。 经过压缩的音乐文件可以在通过速率为 14.4kb/s的MODEM上网的计算机中流畅回放。 其最大特点是可以采用流媒体的方式实现 网上实时播放,即边下载边播放。

?

上一页

下一页

第63/77页

三、电子合成音乐
?

在多媒体系统中,除了用数字音频的方 式以外,还可以用合成的方式产生音乐。 音乐合成的方式根据一定的协议标准, 使用音乐符号来记录和解释乐谱,并组 合成相应的音乐信号,这就是 MIDI(Musical Instrument Digital Interface 乐器数字接口)。

?

上一页

下一页

第64/77页

电子合成音乐的有关概念
?

MIDI不是把音乐的波形进行数字化采样和编码, 而是将数字式电子乐器的弹奏过程以命令符号 的形式记录下来,如按了哪一个键、力度多大、 时间多长等。
当需要播放这首乐曲时,根据记录的乐谱指令, 通过音乐合成器生成音乐声波,经放大后由扬 声器播出。

?

?

上一页

下一页

第65/77页

电子音乐中的常用术语
?

?

?

电子合成器(musical synthesizer) 是由数字 信号处理器和其他集成电路芯片构成的电子设备, 用来产生并修改正弦波形,然后通过声音产生器 和扬声器发出特定的声音。 复调(polyphony)指合成器同时演奏若干音符 时发出的声音。如钢琴、吉他等乐器可以同时演 奏几种音符,而双簧管就不能。复调着重于同时 演奏的音符数,如钢琴的和弦音符。 多音色(timbre)指同时演奏几种不同乐器时发 出的声音。它着重同时演奏的乐器数。例如,具 有6音符复音的4种乐器合成器,可以同时演奏4 种不同声音的6个音符,如3个钢琴的合弦音符、 1个长笛、1个小提琴和1个萨克斯管的音符。
上一页 下一页 第66/77页

与MIDI有关的术语
(1)MIDI电子乐器
它是能产生特定声音的合成器,如电子键盘、吉他、萨克斯管等; 它们相互间的数据传送符合MIDI的通信约定。

(2)MIDI消息(message)或指令
MIDI软件通信协议,实际上是用数字指令描述的音乐乐谱,其中包 含音符、强度、定时及乐器的指派等。

(3)MIDI接口(interfa

ce)
MIDI硬件通信协议,可使电子乐器互连或与计算机硬件端口相连, 可发送和接收MIDI消息。

(4)MIDI通道(channel)
MIDI标准提供了16个通道,每种通道对应一种逻辑的合成器,即对 应一种乐器的合成。

(5)音序器(sequencer)
它指可用来记录、编辑和播放MIDI文件的计算机程序。
上一页 下一页 第67/77页

电脑合成音乐的制作原理
?

?

?

电脑合成音乐需要使用MIDI语言。MIDI语言利用 字节传送来告知相应的设备能够做什么和不能做 什么。MIDI字节通知乐器、声卡和其他MIDI设备 什么时候开始和什么时候结束演奏音符 。 MIDI自身并不产生和传送声音,只是传送产生声 音的控制符号。 使用MIDI语言的设备(MIDI设备)可以互联。典 型设备是合成器或者MIDI控制键盘,也可以是外 挂式音响效果单元、计算机、配备有MIDI接口的 吉他等。
第68/77页

上一页

下一页

MIDI音乐的产生过程

上一页

下一页

第69/77页

MIDI通道
?

当MIDI设备交流信息时,需要遵循一定的事件序 列。例如,两个MIDI设备在建立连接之后首先要 做的事情就是在使用相同的MIDI通道方面达成一 致。MIDI可以在16个这样的通道上进行操作,这 些通道用数字分别标记为0~15。只要两个MIDI 设备进行交流,就必须使用相同的通道。对电脑 合成音乐,每个逻辑通道可指定一种乐器,音乐 键盘可设置在这16个通道之中的任何一个,而 MIDI声源或者声音模块可被设置在指定的MIDI通 道上接收。

上一页

下一页

第70/77页

MIDI接口和计算机的连接
?

?

MIDI接口由三个端口组成:输入端口(In)、输出 端口(0ut)和直达端口(Thru) 。 直达端口对MIDI数据只是进行简单传输,来自直 达端口的数据仅仅是来自输入端口数据的拷贝, 在离开直达端口前数据不会发生任何的改变。

上一页

下一页

第71/77页

MIDI音乐合成器
?

?

MIDI指令送到合成器,由合成器(synthesizer) 产生相应的声音。同样的乐谱如选择不同的乐器 播放,会听到不同的音色 MIDI制造商协会(MIDI Manufacturers Association)制定了通用MIDI规格(General MIDI Mode),简称GM规格。通用MIDI标准同时定 义了GM音色库(一个音色库,也被称为音色映射, 支持128种乐器声音)和GM打击音色库(只包含打 击乐器发出的声音),另外还定义了其他一些与 音乐相关的性能,如每个GM设备应支持的声音数 量和MIDI消息种类。
上一页 下一页 第72/77页

不同类别MIDI设备的音色代码区间
程序号 1 ~8 9~16 17~24 25~32 33~40 41~48 49~56 57~64 乐器族 钢琴 半音打击乐器 风琴 吉他 贝司 琴弦 合唱 铜管乐器
上一页

程序号 65~72 73~80 81~88 89~96 97~104 105~112 113~120 121~128
下一页

乐器族 簧管乐器

笛 合成主音 合成衰减 合成效果 民间乐器 打击乐器 声音效果
第73/77页

MIDI合成的产生方式有两种:
?

FM(frequency modulation)合成和波表 (Wavetable)合成。
?

?

FM频率调制合成是通过硬件(称为发生器)产 生正弦信号,再经处理合成音乐。合成的方式 是将波形组合在一起。 这种方式在理论上有无限多组波形,即可以模 拟任何声音,而且可以任意修改音色。由此模 拟的乐器较高或较低频率的信号失真度很大, 音色真实度很差

上一页

下一页

第74/77页

波表
?

波表的原理是在ROM中以数字格式存储各种实 际乐器的声音采样,声音采样以声波的形式被 组织到能够对其进行单独处理的库中或者表内, 需要合成某种乐器的声音时,调用相应的实际 声音采样合成该乐器的乐音。 ROM存储器的容量越大,合成的效果越好。

?

上一页

下一页

第75/77页

MIDI文件
?

?

用乐谱指令代替声音数据 有效记录和重现各种乐器声音
?

MIDI声音仅适于重现打击乐或一些电子乐器的 声音 例如一个8位、22.05kHz的波形音频文件持续 2s就需超过40KB的容量,而一个MIDI文件播放 2分钟所需的空间不超过8KB。

?

占用存储空间极小
?

?

适合乐曲创作和远距离传输
上一页 下一页 第76/77页

数字音频处理

?

音频处理技术(二)

上一页

下一页

第77/77页

看到“声音”所联想到的
音质 音色 音调 音频

唱歌
讲话 数字化 编码 压缩 处理 格式
返回

波震动
大小 强弱

声音 Sound

节奏 泛音 (优美动听) 分贝 声压

文件

穿透力 采样 包含的信息 音域 男高音
上一页 下一页 第78/77页


网站首页网站地图 站长统计
All rights reserved Powered by 海文库
copyright ©right 2010-2011。
文档资料库内容来自网络,如有侵犯请联系客服。zhit326@126.com