主题:哪位搞音频或者语音的,请教一个基本概念 -- 黑猫夜行
楼主的问题其实很简单:
wav文件里每个数据点里到底存的是什么?为什么加一点减一点听不出区别?
这单纯就是声音波形曲线如何离散量化的问题。44.1k的意思就是每1/44100秒做一次a/d。16bit就是每个a/d结果得到的数字是16位长,也就是说总共有2^16个也就是65536个离散量化级(也可能是2^15个,我忘了正负数如何处理的了,不过反正就是这意思)。
如果不做其他处理,那么这16位数据就是wav数据块里每个数据点里存的数。当然wav允许几种不同的存法,有PCM,alaw, ulaw等。这样文件里每个数据点里存的就是最初的16位原始数据再经过处理的结果(比如alaw,ulaw是原始数的log)。
至于为什么每个数据点加点减点听不出多大区别,可能有好几个原因。比如有的播放器自带normalizer,这样就把加的减的量等于过滤掉了。还有就是既然有那么多量化级,每次到底加多少减多少合适?人耳的敏感度不是线性的,有可能加的减的部分正好不敏感。还有溢出问题等等。
- 相关回复 上下关系8
🙂哪位搞音频或者语音的,请教一个基本概念 1 黑猫夜行 字442 2007-05-12 16:20:37
🙂DC不会影响AC啊 1 海贼王 字228 2007-05-16 15:10:37
🙂答黑猫的问题,说说我的看法 2 曾经 字2069 2007-05-14 18:56:50
🙂居然绕到采样频率上了,难怪楼主越看越糊涂
🙂44.1K不就是在采样吗。 闲看蚂蚁上树 字29 2007-05-15 03:18:42
🙂但楼主问的是如何“量化”啊 1 随园过客 字71 2007-05-15 06:20:33
🙂大家不过是把那些参数都解释了一遍。 闲看蚂蚁上树 字275 2007-05-15 06:40:36
🙂感谢楼下诸位,每人一花 1 黑猫夜行 字138 2007-05-13 10:18:01