淘客熙熙

主题:【原创】科学的欣赏流行乐 -- 比的原理

共:💬309 🌺1010 🌵31
分页树展主题 · 全看首页 上页
/ 21
下页 末页
    • 家园 上次去中关村看到有个招牌叫“中国科学院声学研究”

      有种不明觉厉的感觉,今天一看楼主的帖子就想起来了。。

    • 家园 专业的来了,前排占位
    • 家园 请教一下:

      你的所谓“基频”是怎么确定的?是事先知道发声者的最低声音频率,以此频率的倍数作取样点,抽取不同频率下的时间波形?还是人为指定一个低频为基频,再等间隔取样?

      比如第一张所谓气泡音的图,“基频”是146Hz,为什么定为146Hz?是不是你定为150Hz也能得到一张类似的时间波形曲线?

      当然这个不影响你的讲解,只是你这里的“基频”和“泛音”的定义与一般信号分析理论里的有所不同,我想搞清楚一点,便于理解你的这套名词的定义。

      • 家园 跟管理员交流过了

        结论是,把争端集中在一个回帖里解决,不要再开新贴战斗。

        我觉得,你是误解了声谱图,同时没注意到我的图下半部分才是频谱图。我第四章更新了一下我的图是如何做的,转发一下

        点看全图

        外链图片需谨慎,可能会被源头改

        此图由两部分组成,上半部分为声谱图(Spectrogram),下半部分为频谱图(Spectrum)。

        先看上图:

        横坐标是时间,纵坐标是频率值,同一时间的纵线上存在着数个波,重合而成最终的波。颜色越亮则表示波的振幅越大。混乱的背景都是伴奏,我们只观察人声线。

        再看下图:

        下图反映了上图的某个时间点(上图中的黄线)的频率分布。横坐标为频率,纵坐标为振幅。这个图更有利于直观的观察泛音的成分和强弱。

        频谱/声谱图是如何制作的

        我们都知道原始的声音是波形图,不过原始的波形图并没有太大研究价值,而且事实上也看不出“波形”。因为震动频率太高,比如帕瓦罗蒂的high c吧,500多的震动频率,表示一秒钟要震动500多次,那肯定是看上去一大坨,类似这样:

        点看全图

        外链图片需谨慎,可能会被源头改

        放大几十倍之后,大约能看出波形,类似这样

        点看全图

        外链图片需谨慎,可能会被源头改

        无论哪种都不适合研究。

        所以音频解析的过程是:取连续采样点,一般是4096个点,考虑到音频文件的采样率一般是44.1k,所以就是取了1/10秒之内的数据。然后对这4096个点作做快速傅里叶变换,就得到了频谱图。频谱图的信息是4096个点,每一个点对应的是这个频率上的振幅。

        频谱图反应的是在这个时间点上的频率分布情况。

        严格的说应该是这1/10秒内的平均情况。

        来一张典型频谱图,看看跟我的图下部是不是一回事:

        点看全图

        外链图片需谨慎,可能会被源头改

        将当前时间点的频谱画到声谱图里就得到了瀑布图(第二章视频中的图)。画法是:振幅越大的点,用越亮的颜色。

        纵坐标是频率,从下到上大约是0到6000。

        所以一个人唱了个C5,那他的基频就大概是500,第一泛音是1000,第二泛音是1500,画到声谱图上的结果就是从下到上每隔500画一个点,根据振幅有颜色的区别。

        随着时间的推移,声谱图会不断向右延伸,这样我们就得到了一段时间内频率分布图。比如一个C5的线在声谱图上水平延续了5秒,那表示该歌手唱了C5五秒。

        声谱图上类似“波”的东西是颤音,也就是歌手演唱中不断改变音高,所以自然会不断改变纵坐标。

        来一张wiki的声谱图:

        点看全图

        外链图片需谨慎,可能会被源头改

        最后,频谱图/声谱图的wiki链接

        外链出处

        你如果有不同意见请作自己的频谱图。

        通宝推:二手玫瑰,
      • 家园 先做图

        作图的时候当然不知道谁是基频啦,也不需要知道。

        然后人工观察出基频,再上线。图上的线都是辅助线,跟原图没关系的。

        • 家园 所以我才认为你的基频是人为指定的。

          这种方法只是人为设定一个频率间隔(也就是“基频”),然后在频域等间隔取样,得出一系列时间波形。

          这个方法当然可以大致说明你想说明的那些东西,但名词和概念的使用上与一般信号分析理论有所不同,属于一套独特系统。

          比如说你的“基频”的概念,实际上与你上面给出的几个“分段的正弦波”图形里的基频概念,不是一回事。

          • 家园 你似乎根本没理解

            无论我指定什么基频,做出的图都没有任何区别。

            建议学习一下频谱是怎么做出来的:

            外链出处

            基本上,任何一个音频软件都有做频谱/声谱图的功能,这早已经是业内统一的分析方法。

            基频也不是我发明的概念,看这里

            外链出处

            任何一段声音,只要用标准的方法去解析,得出的结果都是一样的。基频也不会根据解析的方法不同而有所不同。

            你可以尝试用一些能自动寻找基频的软件,不过这些都没有人眼看的准。拿出一张图来,人眼基本一眼就能判断哪个是基频。所以我都是手动加基频线的。

            我重复一下:我加上去的线跟原图毫无关系,纯粹的辅助线。

            • 家园 你这句话是错的:无论我指定什么基频,做的图都没有任何区别

              我曾经是教授《信号分析》课程的教师。

              这里只是在跟你讨论,以搞清楚你提到的一些概念。因为从你文章里看,所用语言系统(概念的定义)与一般信号理论有所不同,某些说法大有商榷余地。例如上面有人提到的你对泛音的理解就是一例。

              不过总的来说,你的文章对大多数人来说,比较新颖。因此俺也送了花。

              • 家园 那请告诉我基频不同做的图有什么区别

                也许跟信号分析的系统有区别。但是在音频分析领域,我说的都是通用的概念。

                • 家园 你选的基频位置不同,所得波形是不同的,但是不影响你想解释

                  你选的基频位置不同,所得波形是不同的,但是不影响你讲解你想解释的东西。

                  以不同位置为基频取出的波形,是个“渐变”的过程,位置相差不大时,变化不多,位置差别大了,变化就明显了。

                  比如你的第一张图,基频选择是146Hz,你改选150Hz,所得图形差别不大,但如果你选择292Hz作为基频时,差别就大了(你图中就有292的),这个292基频,实际就是你146作基频时的二次泛音(这个“二次泛音”是按你的定义说的,严格来说,这个说法不对)。

                  • 家园 我懂你的意思了

                    那只是绘制的不同,图本身没有不同。

                    如果我选292做基频的话,相当于把图整体向左压缩了一半。这就好比我们有一个图,可以放大缩小,那我们会选一个合适的大小来观察。但是,图本身并没变。

                    而且,仅仅是频谱图变化,也就是下面的图。上面的图毫无任何变化。

                    你想说的是二次谐波吧,谐波和泛音类似但是不等价。二次谐波等于第一泛音,一次谐波等于基频。

                    我觉得,你对声音信号处理缺乏一些了解,建议看一下我给的链接。无论是基频还是泛音,都是业内通用的叫法。

分页树展主题 · 全看首页 上页
/ 21
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河