南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第二章 媒体信息处理技术 2.1 音频处理技术

第二章媒体信息处理技术 21音频处理技术 2.1.1音频数字化处理 1.声音的基本描述 2.音频信号的数字化过程 3.数字音频的主要技术指标 2.1.2MIDI音乐合成 1.数字音乐生成方法 2.MIDI音频处理过程 2.1.3多媒体声音卡 2.1.4音频文件格式
第二章 媒体信息处理技术 2.1 音频处理技术 2.1.1 音频数字化处理 1.声音的基本描述 2.音频信号的数字化过程 3.数字音频的主要技术指标 2.1.2 MIDI音乐合成 1.数字音乐生成方法 2.MIDI音频处理过程 2.1.3 多媒体声音卡 2.1.4 音频文件格式

2.1音频处理技术 基本内容:音频数字化处理,MIDI音乐合成, 多媒体声音卡,音频文件格式 2.1.1音频数字化处理 1.声音的基本描述 ①波形声音:基于振动波(信号化)描述的声音; 可形成数字波形文件 ②语音:人的声道发出的声音一语义化描述的语言形式 ③音乐:通过乐谱规范表达的乐曲—符号化描述的声音; 可形成数字音乐文件
2.1 音频处理技术 基本内容:音频数字化处理,MIDI音乐合成, 多媒体声音卡,音频文件格式 2.1.1 音频数字化处理 1.声音的基本描述 ① 波形声音:基于振动波(信号化)描述的声音; 可形成数字波形文件 ② 语音:人的声道发出的声音 — 语义化描述的语言形式 ③ 音乐:通过乐谱规范表达的乐曲 — 符号化描述的声音; 可形成数字音乐文件

(1)声音的模拟信号表示方法 Sound= Bline+A×f(t) Bline ①基线B1ine:提供一个测量模拟信号的基准点 ②周期T:两个相邻信号的波峰(或波谷)之间的时间间隔, 用于表示信号的快慢即声音发生的频率f;f=1/T(Hz ③振幅A:波形峰点(或谷点)与基线之间的距离 用于表示信号的强弱即声音的响度
(1)声音的模拟信号表示方法 Sound = Bline + A×f(t) ① 基线Bline:提供一个测量模拟信号的基准点 ② 周期T:两个相邻信号的波峰(或波谷)之间的时间间隔, 用于表示信号的快慢即声音发生的频率f;f = 1/T(Hz) ③ 振幅A:波形峰点(或谷点)与基线之间的距离 用于表示信号的强弱即声音的响度

(2)声音的质量特性 SQuality =(Tone, Volume, TQuality ①音调(Tone):声音频度与音域宽窄程度,与频率f有关 音调可按频率分为: 次声(f20KHz) ②音量( Volume):声音响度亦或音强,与振幅A成正比 ③音质( Tone Quality):声音在听觉上的优美程度, 亦称音色; 是振幅与频率的优化组合(基音+谐音)
(2)声音的质量特性 SQuality = (Tone, Volume, TQuality) ① 音调(Tone):声音频度与音域宽窄程度,与频率f有关. 音调可按频率分为: ·次声(f 20KHz) ② 音量(Volume):声音响度亦或音强,与振幅A成正比. ③ 音质(Tone Quality):声音在听觉上的优美程度, 亦称音色; 是振幅与频率的优化组合(基音 + 谐音)

声音的质量通常以音频信号的带宽来衡量 音频( Audio):声音的同义词 频率范围为:20Hz~20KHz 人的声带一般为:50~500Hz 常见的音频带宽: ①电话音频: 200Hz3 4KHZ ②无线电广播调幅(AM)声:50Hz~7KHz ③无线电广播调频(FM)声:20Hz~15KHz ④高保真(HiFi)立体声:20Hz~20KH
声音的质量通常以音频信号的带宽来衡量 音频(Audio):声音的同义词 频率范围为:20Hz~20KHz 人的声带一般为:50~500 Hz 常见的音频带宽: ① 电话音频: 200Hz~3.4KHz ② 无线电广播调幅(AM)声:50Hz~7KHz ③ 无线电广播调频(FM)声:20Hz~15KHz ④ 高保真(HiFi)立体声: 20Hz~20KHz

2.音频信号的数字化过程 音频信号 放大/滤波 采样/保持 望化 编码 数字化声音 采样脉冲 ①放大:使信号幅度达到可采集与变换要求; 并滤除高频干扰和噪声 ②采样:模拟信号离散化 以固定的采样周期T对波形Xa(t)的幅值进行抽样 得到一个离散的序列X(n).采样值: X(n ) Xa (nt) ··●·· (离散点的个数), T=1/f,f为采样频率
2.音频信号的数字化过程 ① 放大:使信号幅度达到可采集与变换要求; 并滤除高频干扰和噪声 ② 采样:模拟信号离散化 以固定的采样周期T对波形Xa(t)的幅值进行抽样, 得到一个离散的序列X(n).采样值: X(n)= Xa(nT); N = 1,2,3,……(离散点的个数), T = 1/f,f为采样频率

③量化:离散信号数字化 把每个采样值(模拟量)转换成数字量, 并用n个二进制数表示;n越大,量化精度越高 量化值: xGm)=Q[X(n)];n=1,2,3,……, 量化误差:e()=xGmX();n=1,2,3,… 注意点:a.实现量化的过程称A/D变换 b.均匀量化后的信号称脉冲编码调制(PCM)信号 c.A/D变换一般是均匀量化;因而称PCM量化 ④编码:数字信号格式化 把每个量化值表示成二进制存储位形式的字长 8位字长≡8bit(1个Byte) 若要进行数据压缩编码时,需采用相关算法及数据格式表示
③ 量化:离散信号数字化 把每个采样值(模拟量)转换成数字量, 并用n个二进制数表示;n越大,量化精度越高 量化值: 量化误差: 注意点:a. 实现量化的过程称A/D变换 b. 均匀量化后的信号称脉冲编码调制(PCM)信号 c. A/D变换一般是均匀量化;因而称PCM量化 ④ 编码:数字信号格式化 把每个量化值表示成二进制存储位形式的字长 8位字长 ≡ 8bit (1个Byte) 若要进行数据压缩编码时,需采用相关算法及数据格式表示

3.数字音频的主要技术指标 (1)采样频率fc:单位时间间隔(采样周期)内所采集的样本数 fc越高,数字化后的信号质量就越高;但存储量也越大 (2)量化字长:用采样周期分割样本波形的振幅空间的等分数, 表示为采样值的二进制位数;因而称采样精度或样本字长 量化字长(位数)与采样值的精度成正比.关系: 4bit16级(n=16),8bit256级,16bit65536级 (3)声道数:一次采样所记录的声音波形个数 单声道一产生一个声音波形; 双声道一产生两个声音波形(立体声) 声道数增加,将使存储容量及开销成倍增加.计算公式: 存储量=(采样频率×量化字长×声道数)/8(Byte/s)
3.数字音频的主要技术指标 (1)采样频率fc:单位时间间隔(采样周期)内所采集的样本数 fc越高,数字化后的信号质量就越高;但存储量也越大 (2)量化字长:用采样周期分割样本波形的振幅空间的等分数, 表示为采样值的二进制位数;因而称采样精度或样本字长. 量化字长(位数)与采样值的精度成正比.关系: 4bit16级(n=16),8bit256级,16bit65536级. (3)声道数:一次采样所记录的声音波形个数 单声道 — 产生一个声音波形; 双声道 — 产生两个声音波形(立体声) 声道数增加,将使存储容量及开销成倍增加.计算公式: 存储量 =(采样频率×量化字长×声道数)/8 (Byte/s)

采样定理:若fc≡2 wimax( wimax为最大信号频率) 则可保证量化后的信号具有还原为模拟信号的能力 例:人耳听觉的上限频率为20KHz;则fc≡40KHz 釆样频率量化字长占用存储空间 音质等级 (KHz) (bit) (MB/ min) 说明 11025 066 C级(电话语音,AM 22.050 888 1.32 B级(磁带音乐,FM) 44.100 2.64 A级 11025 132 22.050 2.64 44.100 16 5.29 超级高保真(HiFi)
采样定理:若fc≧2fsmax (fsmax为最大信号频率), 则可保证量化后的信号具有还原为模拟信号的能力. 例:人耳听觉的上限频率为20KHz;则fc≧40KHz

2.1.2MIDI音乐合成 音乐设备数字接口MID的作用: 定义电子音乐设备连入计算机的电缆和端口标准 定义计算机与MIDI设备之间进行信息交换的一整套规则 包括电子乐器之间传送数据的通信协议 1988年,MID正式成为数字式音乐的一个国际标准 数字音乐的生成方法 波形声音数字化方法=→生成数字波形文件 MIDI方法(电子音乐合成方法)=→生成数字音乐文件 (乐谱的数字式描述一MD消息
2.1.2 MIDI音乐合成 音乐设备数字接口MIDI的作用: 定义电子音乐设备连入计算机的电缆和端口标准; 定义计算机与MIDI设备之间进行信息交换的一整套规则, 包括电子乐器之间传送数据的通信协议 1988年,MIDI正式成为数字式音乐的一个国际标准 1. 数字音乐的生成方法 ·波形声音数字化方法 生成数字波形文件 ·MIDI方法(电子音乐合成方法) 生成数字音乐文件 ( 乐谱的数字式描述 — MIDI消息 )
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第一章 多媒体技术概论 1.3 多媒体技术标准.ppt
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第一章 多媒体技术概论 1.1 多媒体技术的基本概念 1.2 多媒体技术的应用状况(万麟瑞).ppt
- 北京科技大学:《C语言程序设计》课程教学资源(PPT课件讲稿)第9章 结构体与共用体.ppt
- 北京科技大学:《C语言程序设计》课程教学资源(PPT课件讲稿)第8章 指针.ppt
- 北京科技大学:《C语言程序设计》课程教学资源(PPT课件讲稿)第7章 函数与预处理命令.ppt
- 北京科技大学:《C语言程序设计》课程教学资源(PPT课件讲稿)第6章 数组.ppt
- 北京科技大学:《C语言程序设计》课程教学资源(PPT课件讲稿)第5章 循环结构程序设计.ppt
- 北京科技大学:《C语言程序设计》课程教学资源(PPT课件讲稿)第4章 选择结构程序设计.ppt
- 北京科技大学:《C语言程序设计》课程教学资源(PPT课件讲稿)第3章 顺序结构程序设计.ppt
- 北京科技大学:《C语言程序设计》课程教学资源(PPT课件讲稿)第2章 C语言基础.ppt
- 北京科技大学:《C语言程序设计》课程教学资源(PPT课件讲稿)第1章 预备知识.ppt
- 北京科技大学:《C语言程序设计》课程教学资源(PPT课件讲稿)第10章 文件.ppt
- 西北大学信息科学与技术学院:《信息与编码》课程教学课件(PPT讲稿)第七章 保真度准则下的信源编码.ppt
- 西北大学信息科学与技术学院:《信息与编码》课程教学课件(PPT讲稿)第六章 波形信源和波形信道.ppt
- 西北大学信息科学与技术学院:《信息与编码》课程教学课件(PPT讲稿)第五章(5-3)循环码.ppt
- 西北大学信息科学与技术学院:《信息与编码》课程教学课件(PPT讲稿)第五章(5-5)纠错编码的基本思想.ppt
- 西北大学信息科学与技术学院:《信息与编码》课程教学课件(PPT讲稿)第五章 有噪信道编码.ppt
- 西北大学信息科学与技术学院:《信息与编码》课程教学课件(PPT讲稿)第三章 离散信道及其信道容量.ppt
- 西北大学信息科学与技术学院:《信息与编码》课程教学课件(PPT讲稿)第二章 离散信源及其信息测度.ppt
- 西北大学信息科学与技术学院:《信息与编码》课程教学课件(PPT讲稿)第一章 绪论.ppt
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第二章 媒体信息处理技术(2.2)图像处理技术.ppt
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第二章 媒体信息处理技术(2.3)视频处理技术.ppt
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第三章 数据压缩技术 3.1 数据压缩的基本原理 3.2 数据压缩方法分类 3.3 常用压缩编码方法 3.3.1 信息熵编码.ppt
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第三章 数据压缩技术 3.3.2 预测编码.ppt
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第三章 数据压缩技术 3.3.3 变换编码 3.3.4 矢量量化编码.ppt
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第三章 数据压缩技术 3.4 图像压缩标准的混合编码.ppt
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第四章 光盘存储技术 4.1 光盘技术的发展与应用 4.2 CD_ROM光盘系统 4.2.1 光盘制作原理与方法 4.2.2 CD_ROM的物理存储格式.ppt
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第四章 光盘存储技术 4.2.4 CD_ROM驱动器工作原理 4.3 CD_I交互式光盘系统.ppt
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第五章 多媒体网络与通信技术 5.1 概述 5.2 可视电话系统 5.3 多媒体会议系统.ppt
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第五章 多媒体网络与通信技术 5.4 分布式CSCW系统.ppt
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第六章 多媒体数据库与超文本技术 6.1 MDBS体系结构 6.2 多媒体数据模型.ppt
- 南京航空航天大学:《多媒体技术及其应用》课程教学资源(PPT课件讲稿)第六章 多媒体数据库与超文本技术 6.3 超文本系统的基本概念.ppt
- 哈尔滨工业大学:《智能建筑网络通信技术》讲义.ppt
- 《数据库原理》第1章 绪论.ppt
- 《数据库原理》第2章 数据模型.doc
- 《数据库原理》SS2K3AccessMeth.ppt
- 《数据库原理》学生选课信息查询.doc
- 《数据库原理》查询课程信息.doc
- 《数据库原理》第3章 关系数据库语言SQL.doc
- 《数据库原理》第4章(图1).doc