“微波炉声音之谜”外网爆火：这段旋律，是往高还是往低？| 果壳科技有意思

科学人

2370字
需用时 04:44

“微波炉声音之谜”外网爆火：这段旋律，是往高还是往低？

果壳

“微波炉声音之谜”外网爆火：这段旋律，是往高还是往低？

原创萌叔哦卖糕果壳

最近这个视频在网上火了。一对男女因为微波炉的音调问题吵得不可开交：女的说旋律最后一个音是往上走的，男的非说是往下走的。

你听听看，你觉得是往上的还是往下的？

音乐人查理·普斯（Charlie Puth）跑出来救场，用钢琴和自己的绝对音感支持女方观点。男方见杠不过，转换思路直接联系微波炉厂家，最终大获全胜——厂家证实，写程序的时候确实最后一个音是往下走的。

此外，你有没有发现这个视频里还有另外一个细思极恐的点？我发现：女方和查理听到的是这个：

而男方和我听到的是这个：

到这里，我们又发现了一个可怕的事实：什么音调走向啊！明明开头的音都听得不一样啊！

这是世界的Bug，还是互联网的阴谋？作为一个声音认知研究员，我可以来尝试解释一下这个现象是咋回事。鉴于讲清楚这事儿需要的篇幅较长，先简单说个结论：听到音走高走低都没错，事情就是这么神奇。

自然界没有单独的音

在研究微波炉声音之前，介绍下“谢帕德音调错觉”。

先上视频再解释：

是不是感觉这个音调一直在不停地上升？如果你的视频是循环播放的，你将会永远保持“上升”的听感。但音调怎么可能升个没完呢？怎么还不炸？

国外网友感叹：我听了7年了，音调还没降下来

音调“升”个没完，是因为这里每一个音都是若干个音的组合，并不是只有以一个音在没完没了地爬升。在视频里我们能看到大约8到9根频率形成的“棒棒”，也就是说，每一个时刻，我们所听到的音都不是一个单独的音，而是8到9个音组成的混合音。它们组合起来，让你有了音调不停上升的错觉。

“棒棒”放大的样子

事实上，自然界的所有音都是不同频率的声波组合在一起的音。换句话说，由单一频率声波形成的“纯音”在自然界是不存在的。

所以，回到微波炉了。事实上，听起来机械又清晰的4个音，至少都是由2个音组成的。就像前面贴的五线谱，第1个音里不仅有do，也至少还有so；而第4个音里至少包含一个do还有一个比它高了八度的do。当然，对于没有争议的第2个音、第3个音来说，其实也是一样的：它们也并不单纯，只是没那么明显罢了。

千人千耳，同音不同调

现在我们知道微波炉的声音是由多个音组成的了，那为什么有人听到了高音、有人听见了低音呢？

我们知道，声音是振动发出的。一个物体振动的时候，它自己的一部分在振动，和它相连接的其它固体也会发生振动。这些部分振动的频率各不相同，组合在一起，就形成了一个特殊的频率组合，这个频率的组合我们就叫做这个物体振动的“音色”。

从声学的角度来说，一个物体的音色是由它的频谱决定的。

举个例子来说，频谱看起来是这样的：

频谱图，横轴为频率，纵轴为振幅

在这个图上我们可以看得出，振幅的最高点出现在大约300赫兹的部分。也就是说，这个物体的主体每秒钟振动300次。而后面在大约600赫兹、900赫兹、1200赫兹等等的部位也出现了一些很高的幅度。不难发现，这些频率都是主频300赫兹的整数倍。在声学和乐理中，相差整数倍的频率被叫做“八度”，组合在一起的话，人耳听到会觉得非常和谐。

再回到微波炉，想象一下上面的图就是微波炉的第4个音。有争议的第4个音是由很多频率组成的，女孩听到了里面高音的do，男孩听到的是低音的do。

事情得到解释了……吗？可是为什么视频里一个人听见的是高音、一个是低音呢？就不能都听见同一个音吗？

在我们的脑子里有一个统计学模型，它基于以往的生活经验运作，当我们听到不同频率的声音同时传来时，就要依靠这个模型来计算哪个音最有可能是这个声音的主频的概率。对音高的判断发生在我们浅层的意识里，这是我们自己的主观意识很难察觉到的过程。

不同的人有不同的生活经验，还有不同的头颅形状和耳道尺寸，所以对他们来说，当（比如说）300赫兹、600赫兹、900赫兹的声波同时传来的时候，有人会认为300赫兹是主频，有人可能觉得600赫兹是主频。

这就解释了为什么“同一个音人听到却不一样”：根本就不是只有一个音，而是有多个音的组合，有人注意到比较低的音，有人注意到比较高的音。

还是回到微波炉吧

概括性的道理讲完，我们来实践性地分析下这个微波炉。我对视频里的微波炉声调进行了非常简单的频谱分析：

在这个图上，横向的是时间，4个不同的区域标出了1到4这四个微波炉发出的音。在纵向上，从低到高代表了每个音的频率分布。另外，我还用蓝色的框强调标出了第1个音和第4个音。

我们先来看看视频争议的焦点：第4个音。从频谱分析上可以看出，第4个音的能量集中在大约2.2k赫兹的部位。在它的下方，1.1k赫兹那条线若隐若现。

单独播放频率的时候，我发现女主和查理的看法和频谱仪一致：第4个音是2.2k赫兹。但男主和微波炉厂家认为的，是下面低八度的1.1k赫兹频率。这些音都是在第4个音里面的，谁也没幻听。

第4个音的问题说到这里也差不多了。那为什么大家听到的第1个音也不一样呢？

首先是听觉系统的问题。可能是女主的听觉系统对突然出现的短促音来不及反应，把频谱里的主音判断成属音，因而感受到的音调比较低。

其次，是微波炉的锅。因为第一个音本来应该是do，却被它近似演奏成了si（这也不能真怪微波炉，人家又不是专业音响设备）。事实上，除了一些民族音乐外，以si开头的音乐并不算普遍，而且我们会认为微波炉只是个普通的厨房电器，顶多只能发出do、mi、so这3个音，所以这个音被一部分人听成了so。这从一个侧面说明了人们对音的高低判断有不同的大脑模式。这些模式并没有优劣之分，只是在概率取舍上有不同而已。

补充说明一下：我们对音高的判断永远不是100%确定的。我们的大脑根据以往听音经验对当下的声音信号进行概率判别，哪个概率高就采信哪个作为认知的基准。

好了，对于把第1个音听成so的人来说，就很容易解释第4个音的分歧：我们现在写出两条旋律：