主题:哪位搞音频或者语音的,请教一个基本概念 -- 黑猫夜行
上过大学物理应该做过示波器实验,音频就相当于示波器屏幕上显示的波形。
这个波形X轴是时间,Y轴是电压。
采样频率的高低决定了时间采样的精细度,频率越高能还原出的音频频率就越高;
每个采样点的数值代表了这个时间点的电压值(相对值),位数越多还原出的电压值就越准确。
数字音频就等于用直方图来代替曲线图,很明显,直方图每一个长方条越细,高度的分辨率越高,长方条的顶点连成的曲线与原曲线就越接近。
16bit就是每个采样点量化(用A/D转换器)后的数值是个16位二进制数,分辨率为65536。楼下说的1024是10位二进制数。
音频电压是交流的,正负电压都有,所以这个16位数要能表示出正负来。为了处理方便,一般使使数值向上平移。
为表示方便以下以10位为例:
音频瞬间电压的绝对值并不重要,重要的是相对值,所以以下的具体电压变一下可无妨,只要所有点按同样比例变就行。
10位二进制数分辨率为1024,如果表示一个0-10V的电压,数值0=0V,512=5V,1024=10V,其他按比例算。
如果表示一个-5-+5V的电压,可以把512定为0V,1024就是+5V,0就是-5V。其他同样按比例算。
因为是交流信号,我们要还原的是各点数值在X、Y值上连成的相对曲线,所以这个曲线只要不变形,向上、下平移一段距离对还原没有影响,就象示波器看波形上下移动扫描基线一样。你把某一个wav的data chunk里所有采样点都减少或者增加一个常量后生成新的wav,实际上就是把音频曲线向下(减少)或向上(增加)平移一点。而实际把音频电压量化成数字信号时为了保证不失真都不会用满,所以少量平移不会影响原来的音质。但移的多了造成超出范围(就象示波器把波形一部分移出屏幕外),所有超出范围的点都变成最低电压或最高电压(这有个术语叫削顶,在示波器上看就是最高的部分或最低的部份变成平直线),这就造成失真,如果移的太多就会变成最高电压或最低电压的一条直线,还原出就是直流电压,这就没了声音。
- 相关回复 上下关系8
🙂似乎你是不理解麦克风的工作原理啊。 闲看蚂蚁上树 字16 2007-05-13 21:18:49
🙂你问的是PCM的编码规则吧?找ITU-T G.711即可 2 悄悄的 字85 2007-05-13 09:50:46
🙂有一些播放器是可显示波形和频谱的 2 大脚丫 字605 2007-05-13 07:17:13
🙂俺没搞过音频,搞过类似的波形处理。
🙂你改变采样频率后 1 喜欢辣椒 字128 2007-05-13 02:44:25
🙂依靠采样后的电平值量化 1 闲看蚂蚁上树 字0 2007-05-12 19:25:00
🙂一段音乐色彩的丰富是由音乐的频率宽度决定的 1 【子衿】 字267 2007-05-12 18:45:57
🙂嘿嘿,说得不太准 2 曾经 字217 2007-05-14 19:35:05