“微波炉声音之谜”外网爆火:这段旋律,是往高还是往低?
最近这个视频在网上火了。一对男女因为微波炉的音调问题吵得不可开交:女的说旋律最后一个音是往上走的,男的非说是往下走的。
你听听看,你觉得是往上的还是往下的?
音乐人查理·普斯(Charlie Puth)跑出来救场,用钢琴和自己的绝对音感支持女方观点。男方见杠不过,转换思路直接联系微波炉厂家,最终大获全胜——厂家证实,写程序的时候确实最后一个音是往下走的。
此外,你有没有发现这个视频里还有另外一个细思极恐的点?我发现:女方和查理听到的是这个:
而男方和我听到的是这个:
到这里,我们又发现了一个可怕的事实:什么音调走向啊!明明开头的音都听得不一样啊!
这是世界的Bug,还是互联网的阴谋?作为一个声音认知研究员,我可以来尝试解释一下这个现象是咋回事。鉴于讲清楚这事儿需要的篇幅较长,先简单说个结论:听到音走高走低都没错,事情就是这么神奇。
自然界没有单独的音
在研究微波炉声音之前,介绍下“谢帕德音调错觉”。
先上视频再解释:
是不是感觉这个音调一直在不停地上升?如果你的视频是循环播放的,你将会永远保持“上升”的听感。但音调怎么可能升个没完呢?怎么还不炸?
国外网友感叹:我听了7年了,音调还没降下来
音调“升”个没完,是因为这里每一个音都是若干个音的组合,并不是只有以一个音在没完没了地爬升。在视频里我们能看到大约8到9根频率形成的“棒棒”,也就是说,每一个时刻,我们所听到的音都不是一个单独的音,而是8到9个音组成的混合音。它们组合起来,让你有了音调不停上升的错觉。
事实上,自然界的所有音都是不同频率的声波组合在一起的音。换句话说,由单一频率声波形成的“纯音”在自然界是不存在的。
所以,回到微波炉了。事实上,听起来机械又清晰的4个音,至少都是由2个音组成的。就像前面贴的五线谱,第1个音里不仅有do,也至少还有so;而第4个音里至少包含一个do还有一个比它高了八度的do。当然,对于没有争议的第2个音、第3个音来说,其实也是一样的:它们也并不单纯,只是没那么明显罢了。
千人千耳,同音不同调
现在我们知道微波炉的声音是由多个音组成的了,那为什么有人听到了高音、有人听见了低音呢?
我们知道,声音是振动发出的。一个物体振动的时候,它自己的一部分在振动,和它相连接的其它固体也会发生振动。这些部分振动的频率各不相同,组合在一起,就形成了一个特殊的频率组合,这个频率的组合我们就叫做这个物体振动的“音色”。
从声学的角度来说,一个物体的音色是由它的频谱决定的。
举个例子来说,频谱看起来是这样的:
频谱图,横轴为频率,纵轴为振幅
在这个图上我们可以看得出,振幅的最高点出现在大约300赫兹的部分。也就是说,这个物体的主体每秒钟振动300次。而后面在大约600赫兹、900赫兹、1200赫兹等等的部位也出现了一些很高的幅度。不难发现,这些频率都是主频300赫兹的整数倍。在声学和乐理中,相差整数倍的频率被叫做“八度”,组合在一起的话,人耳听到会觉得非常和谐。
再回到微波炉,想象一下上面的图就是微波炉的第4个音。有争议的第4个音是由很多频率组成的,女孩听到了里面高音的do,男孩听到的是低音的do。
事情得到解释了……吗?可是为什么视频里一个人听见的是高音、一个是低音呢?就不能都听见同一个音吗?
在我们的脑子里有一个统计学模型,它基于以往的生活经验运作,当我们听到不同频率的声音同时传来时,就要依靠这个模型来计算哪个音最有可能是这个声音的主频的概率。对音高的判断发生在我们浅层的意识里,这是我们自己的主观意识很难察觉到的过程。
不同的人有不同的生活经验,还有不同的头颅形状和耳道尺寸,所以对他们来说,当(比如说)300赫兹、600赫兹、900赫兹的声波同时传来的时候,有人会认为300赫兹是主频,有人可能觉得600赫兹是主频。
这就解释了为什么“同一个音人听到却不一样”:根本就不是只有一个音,而是有多个音的组合,有人注意到比较低的音,有人注意到比较高的音。
还是回到微波炉吧
概括性的道理讲完,我们来实践性地分析下这个微波炉。我对视频里的微波炉声调进行了非常简单的频谱分析:
在这个图上,横向的是时间,4个不同的区域标出了1到4这四个微波炉发出的音。在纵向上,从低到高代表了每个音的频率分布。另外,我还用蓝色的框强调标出了第1个音和第4个音。
我们先来看看视频争议的焦点:第4个音。从频谱分析上可以看出,第4个音的能量集中在大约2.2k赫兹的部位。在它的下方,1.1k赫兹那条线若隐若现。
单独播放频率的时候,我发现女主和查理的看法和频谱仪一致:第4个音是2.2k赫兹。但男主和微波炉厂家认为的,是下面低八度的1.1k赫兹频率。这些音都是在第4个音里面的,谁也没幻听。
第4个音的问题说到这里也差不多了。那为什么大家听到的第1个音也不一样呢?
首先是听觉系统的问题。可能是女主的听觉系统对突然出现的短促音来不及反应,把频谱里的主音判断成属音,因而感受到的音调比较低。
其次,是微波炉的锅。因为第一个音本来应该是do,却被它近似演奏成了si(这也不能真怪微波炉,人家又不是专业音响设备)。事实上,除了一些民族音乐外,以si开头的音乐并不算普遍,而且我们会认为微波炉只是个普通的厨房电器,顶多只能发出do、mi、so这3个音,所以这个音被一部分人听成了so。这从一个侧面说明了人们对音的高低判断有不同的大脑模式。这些模式并没有优劣之分,只是在概率取舍上有不同而已。
补充说明一下:我们对音高的判断永远不是100%确定的。我们的大脑根据以往听音经验对当下的声音信号进行概率判别,哪个概率高就采信哪个作为认知的基准。
好了,对于把第1个音听成so的人来说,就很容易解释第4个音的分歧:我们现在写出两条旋律:
以及
这是视频中女主面临的选择:前3个音分别是so、mi、so,这是确定无疑的。那么该怎么确定第4个音呢?这个旋律的走向应该是上面那条,还是下面那条?哪个概率更高一些?
你自己哼唱一下也会发现,显然上面那条更合理,听起来更像是一个电子设备发出的声音。于是在判别第4个音的过程中,你的经验再次发挥作用,大脑决定采信第一条旋律的走向。至此,以女主为代表的人群就完成了这个旋律的认知。
不得不说,和蓝黑裙子白金裙子、Laural & Yanny的故事一样,这个视频又和我们的大脑玩了个小把戏!
作者:萌叔哦卖糕
编辑:李小葵
一个AI
人脑不行,你考虑把自己训练成人工智能吗?指南在这儿。
本文来自果壳,未经授权不得转载.
如有需要请联系sns@guokr.com