下载客户端

音乐比语言早100万年：一部从“脚步声”开始的人类史

2026-05-24 09:19

来源：澎湃新闻·澎湃号·湃客

听全文

利物浦大学音乐学教授Michael Spitzer在Big Think的最新一期完整访谈中，用近一个小时讲了一件事：音乐不是娱乐附属品，它是一套比语言更古老的生物系统，塑造了人体结构、大脑回路和社会组织方式。访谈发布于2026年5月11日。

Spitzer是贝多芬研究权威，同时横跨美学、认知心理学、人类学和演化生物学多个领域。1966年生于尼日利亚，在以色列长大，1973年赎罪日战争期间随家人移民英国，后在牛津大学Merton学院完成本科、南安普顿大学获博士学位，2010年从杜伦大学转至利物浦。他在2021年出版的《The Musical Human: A History of Life on Earth》被BBC Radio 4选为"本周之书"，由英国戏剧导演Simon McBurney朗读。神经科学家Daniel Levitin写过一本畅销书《This Is Your Brain on Music》，专门研究大脑如何处理音乐，他对Spitzer这本书的评价是"音乐领域的《枪炮、病菌与钢铁》"。Spitzer写这本书的起因，是读完Yuval Harari的《人类简史》之后觉得缺了一块。Harari讲的是智人的故事，但音乐比智人至少早100万年。动物有音乐，鸟和鲸有音乐。"The musical human is a musical animal." 大多数音乐史在讲哪个作曲家在什么时候写了什么曲子，Spitzer要讲的是更大的画面。

1. 没有录音的100万年：声音不留痕迹，怎么证明音乐存在

1877年，美国发明家Edison制造出第一台留声机。在此之前，人类没有任何声音记录。乐器的材料会降解，皮革、弦线、木头都无法保存。能留下来的只有石头做的打击乐器，比如钟乳石、坦桑尼亚的岩石锣，以及约4万年前的骨笛。这批骨笛出土于德国西南部施瓦本汝拉山区的Hohle Fels洞穴，2017年被列入UNESCO世界遗产，用一种翼展近三米的大型猛禽秃鹫的骨头制成，保存了五个指孔，长约22厘米。弦乐器出现得更晚：竖琴和鲁特琴需要动物肠子搓成的弦，这意味着它们只能在人类驯化牲畜、发明畜牧业之后才可能出现。陶瓷出现后，人们把兽皮蒙在陶器上做成最早的框鼓，但兽皮也会降解，具体年代无从确定。

没有直接证据，Spitzer用跨学科拼图来补缺口：解剖学演化史、工具技术史、语言学逆向建模、全球狩猎采集社会的田野观察。他举了一个推理范例。大约150万年前，人类祖先中的直立人Homo Erectus发明了双面手斧，斧刃两侧完全对称。直立人是最早走出非洲的人属物种，脑容量约为现代人的三分之二，已经能使用火并制造复杂工具。制造对称形状需要两种能力，一是对美感形式的追求，二是跨模态的心智运算。心理学研究表明，工具领域的认知能力可以映射到声音领域，因为人类认知是跨感官通道的。对称投射到声音里，就是节拍，就是规则的节奏。有理由推断，能制造双面手斧的直立人，也能用那把斧头敲出对称的节奏。

让最早的人族区别于猿类共同祖先的标志，是直立行走。大约440万至400万年前，一种学名叫Ardipithecus ramidus的早期人族站起来走了，古人类学家给她取了个昵称叫"Ardi"，化石在埃塞俄比亚被发现。从Ardi开始，行走的节奏就刻进了人类音乐。Spitzer说这不只是比喻。直立行走启动了一整套进化连锁反应：大脑与肌肉运动之间建立了神经连接，人类学会把脚步声识别为可预测的模式，而模式给你的是时间感，你能预测下一拍什么时候来。直立行走还催生了一个持久的隐喻，"音乐在移动"。音乐并不真的在移动，它只是声波在空气中飘，但我们想象一个音走向另一个音，几乎所有音乐都在展开一段旅程。这段想象中的旅程，是人类祖先走出非洲那段真实旅程的遥远回声。

站起来之后，颅腔容积增大了两倍多。更大的大脑意味着运动皮层的连接增强，手指因此变得灵巧，有能力制作和演奏笛子。直立还释放了胸腔空间，呼吸更自如；喉头在声道中下降，舌骨演化让人能精确控制发音。和生活在东非的vervet monkey绿猴一比就明白了：绿猴只能发出四种叫声，每种对应一种天敌的警报，比如一种叫声专门警告"有鹰"，另一种警告"有豹"。而人类声道能产生上千种声音，远超功能需求。当声音产出的能力超过了传递信息的需要，就有了"多余"。这个多余的空间，就是音乐开始的地方。你开始玩声音，为声音本身而享受声音，不再服务于任何功能。Spitzer认为这是人类音乐从动物叫声中分离出来的分水岭。

2. 月鸟、骨笛刻线和洞穴共振点：音乐的本质是记忆系统

巴布亚新几内亚南部高地的Kaluli部落相信音乐来自一种叫mooney bird的果鸠。在他们的信仰里，飞翔在森林树冠上方的鸟就是祖先在说话。模仿果鸠的叫声，就是在参与生命的大循环，把祖先的歌唱回去。这就是口传历史。

Spitzer说他在写书过程中发现的一个深层信息是：音乐从头到尾都在和记忆打交道。两百万年前一个人教儿子怎么打石头，儿子记住了。传统就是"凝固的肌肉记忆"，一种触觉层面的模因。骨笛上刻着平行的短线，告诉演奏者手指该放在哪里，五个孔本身就是一套操作说明，这也是记忆。在西方，贝多芬的《英雄交响曲》排演的是一个民族经历拿破仑战争的集体记忆。这部交响曲最初题献给拿破仑，1804年拿破仑称帝后贝多芬愤怒地撕掉了题词页，改名为"英雄"，纪念的是一个理想而非一个人。所有音乐，无论东西方，无论追溯到多远，都和记忆紧密捆绑。

骨笛的出土位置本身就是线索。考古学家发现，南德骨笛的碎片散落在洞穴中共振效果最好的地点，暗示了音乐和建筑之间天生的联姻。Spitzer说，西方的教堂本质上就是一个用来敬拜神的洞穴，素歌和教堂石壁之间的共鸣并非偶然。洞穴是阴暗、危险的地方，是野兽的巢穴，是通向神秘力量的入口，它们被保留给特殊的仪式，借助石壁对笛声、人声和钟乳石敲击声的惊人回响来完成仪式。

洞穴之外，篝火旁的火堆是日常的音乐空间。火的固定性对应着仪式的固定性，火堆的环形对应着仪式的循环重复。猎后的庆祝、分食的仪式，都围绕火堆展开，而在那个场景里，唱歌和身体运动没有分界线。西方后来发明了"music"这个单词，把歌唱、乐器演奏、舞蹈、讲故事全部装进一个容器里。但在大多数文化中，这些活动各有各的名字，本来就是一体的。

3. 喀麦隆俾格米人每次弹同一首曲子，听起来都不一样

如果按照最宽的镜头来看智人的演化，三个大时代依次是狩猎采集、农耕定居和城市文明。每个时代对应着不同的心态，也对应着不同形态的音乐。

游牧生活决定了一切：你不会背着重乐器穿越草原。音乐只能靠嗓音，或者一支轻便的笛子、一件小型打击乐器。生活在喀麦隆热带雨林中的俾格米人是地球上最古老的族群之一，他们以复杂的多声部合唱闻名，每次演奏同一首曲子，听起来都不一样。"作品"这个概念，一首可以被重复的曲子，是后来才有的现代发明。更重要的是，在狩猎采集社会里，创造音乐的人和听音乐的人是同一批人。作曲家和听众的分离，是纯粹的现代产物。

不同环境塑造了不同的音乐功能。英国旅行作家Bruce Chatwin在1987年出版的《The Songlines》中记录了澳洲原住民用"歌之路"导航沙漠的传统：每一处地貌标记一首歌，音乐充当GPS。在萨满的引领下，音乐被视为一种飞行，带领族人穿越宇宙的层级，抵达祖先所在的"梦幻之地"。因纽特人住在北极冰原的冰屋里，狭小封闭，不能打架，音乐的核心功能是管理愤怒和冲突，所以因纽特歌曲充满笑声和玩笑。Spitzer注意到，雪地不像沙地那样留下脚印，无法用物理痕迹导航，所以因纽特人更多在脑中构建路径网络，文化的网络逐渐取代了足迹的网络。

把全球狩猎采集民族做横向比较，会发现一个共同核心：人与动物的纠缠。达尔文1836年随"小猎犬号"到达澳洲时，观察到原住民在仪式中模仿几维鸟和袋鼠的舞步。因纽特人在歌中模仿海豹幼崽的声音来引诱猎物，北美原住民模仿野牛幼崽的叫声。音乐的目的之一，是讲述"我们从哪里来"的起源故事，而那个起源指向动物。

发明农业之后，一切都变了。定居下来，思维模式从线性旅程变成了季节循环。音乐"生了根"，每个季节、生命周期的每个节点都有对应的音乐。可重复的"作品"概念出现了，音乐结构本身变得和生活一样循环往复。

从农场迁移到城镇，乐器可以做大做重了，钟和锣出现，竖琴和鲁特琴这类精密脆弱的乐器也有了保存条件。音乐的功能随着社会分层而改变：它开始服务于权力，为王公贵族和教会增添威仪。音乐家成为职业群体，"音乐会"这种形式出现了，但它需要一个前提，听众有闲暇。百万年来大多数人从来没听过"音乐会"，他们的音乐在田里、在船上、在纺车旁。

Spitzer举了两个例子来说明劳动如何塑造音乐形态。海上水手拉锚时，紧凑的空间和协同发力的节奏直接塑造了sea shanty（水手号子）的曲调，比如经典的《Blow the Man Down》，歌词节拍就和拉绳的动作完全同步。而棉花地里的holler完全不同，这种19世纪美国南方种植园中黑人劳工在田间喊唱的音乐形式，因为开阔的空间要求你把声音抛远，嗓音变成悠长的哀号，不少人认为布鲁斯和爵士的根就在那个哀号里。纺布也是一样：纺车旋转的节奏刻在了纺织歌的旋律里，spinning songs就是纺车声的记忆。

4. 泥板、墓碑和修士：一千年前改变世界的殖民工具

文明一旦发明文字，就开始尝试写下音乐。美索不达米亚的巴比伦人和苏美尔人创造了最早的音乐记谱法。现存最古老的乐谱是约公元前1400年的胡里安赞歌第六号，20世纪50年代在今天叙利亚地中海沿岸的古城乌加里特遗址出土，用楔形文字刻在泥板上，记录了献给果园女神Nikkal的赞歌以及里拉琴的指法说明，至今学者对其旋律的还原仍有争议。

第一首可以完整演奏的乐曲是Seikilos墓志铭。1883年，苏格兰考古学家在今天土耳其Aydın附近的古城特拉勒斯遗址发现了一块大理石墓碑，上面用古希腊文刻着旋律和歌词。铭文写道"Seikilos赠予Euterpe"，多数学者认为是一位丈夫为亡妻所作。歌词只有四行，大意是"活着的时候，尽情发光吧，不要有任何悲伤，因为生命短暂，时间终将来索取一切"。这块墓碑现藏于丹麦国家博物馆，距今约两千年。

但真正改变音乐史走向的，是大约1025年意大利本笃会修士Guido d'Arezzo发明的线谱。Guido生活在约991年至1033年间，他不仅发明了线谱，还创造了至今仍在使用的音阶唱名系统do-re-mi-fa-sol-la，取自一首拉丁赞美诗每行的第一个音节。起初是四条线，后来演变为五条。这个发明的逻辑是权力的逻辑：把圣咏写下来，确保基督教帝国最边远角落的修士，哪怕是在英格兰北端的哈德良长城，也唱着完全一样的旋律。哈德良长城是罗马皇帝哈德良在公元122年下令修建的军事防线，横贯英格兰北部，标志着罗马帝国的最北疆界。

1519年西班牙征服者Hernán Cortés入侵墨西哥时，随身带着西班牙复调音乐的五线谱手抄本，教阿兹特克人演唱西班牙对位法。阿兹特克帝国当时是中美洲最强大的文明，首都特诺奇提特兰的人口超过20万，比同时期的伦敦还大。仅仅10年之后，到1530年，阿兹特克音乐家已经在墨西哥大教堂里演唱西班牙复调了。五线谱成了全球化的尖刀。

把音符钉在纸上，像钉住一只蝴蝶。大多数人说话或唱歌时，音高是滑动的、波动的、不固定的。五线谱把音冻住了，变得精确但也冰冷、机械。更深层的后果：音乐从"活动"变成了"对象"。音乐本来是一种行为，像跳舞或跑步。一旦变成对象，就分裂出了"创造者"和"机械复制者"，作曲家和演奏者。传统被冻结成一座"想象中的音乐作品博物馆"。

西方还有一个独特的问题：把作曲家神化了。最初，灵感被认为来自上帝。到了19世纪"上帝死了"之后，作曲家本人就被抬到了神的位置，拥有神一样的权威。这种权威延伸到乐谱上的每一个音符，演奏者的角色被压缩为忠实复制伟大的巴赫或贝多芬在其"神圣智慧"中立法的内容。正因如此，我们今天反而可以相当精确地还原1800年贝多芬奏鸣曲的演奏方式。但越远离西方作曲家的权威范围，往东或往南走，就越无法确定几百年前的音乐到底是什么样。

Spitzer拿印度古典音乐做对比。印度古典音乐分为南北两大体系：南方的卡纳提克传统以固定的乐曲结构著称，北方的印度斯坦传统更强调即兴发挥。两者都是有机的、不断演化的口传体系，从师父传到弟子。弟子的工作不是机械复制一部作品，而是围绕作品的核心思想做创造性的即兴发挥。

5. 孔子在杏树下弹古琴，琴声融入风声

西方和东方在音乐观念上的分裂，可以追溯到对"声音"本身的态度。西方把"音符"和"声音"概念性地切割开了。东方没有这条边界。

孔子生活在公元前551年至前479年间，他的传统形象是在杏树下弹古琴。古琴是中国最古老的弹拨乐器之一，七根弦，平放在桌上弹奏，音色极其细微，和风声、竹声、水声融为一体。音乐与自然之间没有界限。Spitzer认为，这种对自然声音的敏感贯穿了整个中国和日本的音乐传统，而西方丢失了这种感知。

1978年在湖北随州擂鼓墩出土的曾侯乙编钟是这种东方声学传统的物证。65口青铜钟按大小排列在三层钟架上，总重超过2500公斤，铸造于公元前433年，墓主曾侯乙是战国时期曾国的一位诸侯。Spitzer的评价非常笃定：两千多年前，中国的声学科学远超西方。钟产生的声学泛音极其复杂，每口钟能敲出两个不同的音，无法用简单的算术比例捕捉，这就是为什么西方音乐体系里几乎没有钟的位置，西方人只能把钟流放到教堂塔楼上。只有中国人掌握了钟的演奏方法，理解了声音的复杂本质。

从全球尺度看，西方音乐其实只是众多文明传统中的一支，而且在音乐对自然声音的理解上，长期落后于中国、印度和中东。改变格局的是五线谱带来的标准化和殖民扩张的力量。但风水轮流转：如今两股潮流正从太平洋和大西洋两侧涌向西方。非洲音乐通过爵士和摇滚成了欧美的通用语言；K-pop正在重新教育西方人理解声音。

音乐随贸易和征服流动，但到了新土地就变了基因。丝绸之路上的商队带着香料，也带着鲁特琴和提琴。这两种乐器从中亚起源，传到中国、日本、印度、中东，最终抵达德国和西班牙，每到一个地方就换一个名字。维多利亚时代的基督教传教士去非洲时带去了赞美诗，这就是为什么今天大多数非洲国歌听起来像基督教赞美诗。1520年的里斯本，非洲人占了城市人口的10%，他们带来的Chaconne和Sarabande两种舞蹈，即恰空舞和萨拉班德舞，最终出现在Johann Sebastian Bach（1685-1750）的组曲里。这位德国作曲家的巴洛克音乐里，藏着非洲货物。

这种文化吸收的终极案例是日本。日本每年除夕演出贝多芬《第九交响曲》，这个传统始于20世纪早期。在日本人眼里，贝多芬的音乐契合的是礼仪、正式、尊重传统的日式美学。西方人在《第九》里听到的是个体的张扬，日本人听到的是群体的融合与自我的消弭，一种禅的品质。Spitzer的判断是：一旦音乐被一种新文化吸收，就不再属于原来的文化了。贝多芬在日本就是日本作曲家，就像板球被印度吸收后就变成了印度运动。

6. "宇宙级笑话"：人类的音乐天赋不如鸟

1977年NASA把一张金唱片送上旅行者号飞船，上面录了巴赫的勃兰登堡协奏曲、美国摇滚乐先驱Chuck Berry的Johnny B. Goode、所罗门群岛的排箫、爪哇的宫廷甘美兰。甘美兰是东南亚一种以青铜打击乐器为主的合奏形式，音色独特，和西方管弦乐完全不同。假如一个外星人在十亿年后打开这张唱片，它能从这堆风格迥异的音乐中提取出某种共同的"人类特征"吗？

Spitzer认为能。人类是"扁平地带的居民"，占据着一条极其狭窄的感知带。我们听不到鲸鱼那么低的频率，也听不到蝙蝠那么高的频率。我们的歌不像鲸歌那样长达23小时，也不像蝠歌那样短到一次振翅。但外星人也会发现，人类音乐和动物音乐有一个共同的结构特征：层级重复。音符在小节中重复，小节在乐句中重复，乐句在段落中重复，段落在作品中重复。鸟和鲸的音乐也有这种结构。区分物种的线索在于运动方式：鲸鱼的音乐有漂浮在水中的流体节奏，鸟的歌声和鸟的动作一样急促跳跃，而人类音乐里有一种独特的行走节拍，可以追溯到400万年前南方古猿的第一步。

这种层级重复有一个更深的根源：分形。过去解释音乐与宇宙的关系，用的是"天体和谐"的古老说法。公元前6世纪的希腊哲学家毕达哥拉斯发现弦长比例与音程之间的数学关系，认为宇宙运行遵循同样的和谐比例；16世纪波兰天文学家哥白尼也相信行星轨道中隐含着音乐比例。Spitzer提出了一个他认为更有意思的框架。把噪音的声谱图放大，波形在任何尺度上都呈现自相似性，就像海岸线或云的边缘。风吹过草地的声音、水的涟漪，都是分形的，人耳觉得舒服。音乐和自然噪音共享同一种数学结构，正如星系和脑细胞共享同一种形状。这让音乐从根本上是"自然的"。

但这里出现了Spitzer所说的"宇宙级笑话"。把镜头拉到最远，看清智人音乐在整个物种图谱中的位置，会发现一个反直觉的事实：和鸟相比，人类的音乐天赋差得多。人类沿猿类路线演化，而猿在音乐能力上远不如鸟。鸟拥有vocal learning这种能力，可以创造性地学习新歌曲；猿做不到，只能发出天生的叫声。昆虫能集体同步脉冲节奏，部分鸟类也有节奏感，猿没有。人类是从一个"不会音乐"的祖先出发，从零开始重新演化出了音乐。

这解释了两件事：人类音乐既是天生的也是后天习得的，因为我们没有鸟那样的"自带"能力；人类对鸟鸣一直怀有某种怀旧式的不安感，因为鸟鸣是天然的，而人类音乐不是。人类真正带到桌面上的，是"大综合"能力：把昆虫的节奏、鸟的旋律、猿类的肢体姿态拼在一起，再叠加上情感驱动和对死亡的意识。"The fact that we die haunts us, and the idea of a limit is one of the boundary conditions of human music." 没有人类情感和对生命有限性的意识，分形结构和层级结构仍然会存在，但那不叫音乐。

7. 上千个幼儿听到《威廉·退尔》序曲，本能地跳了起来

人类音乐最独特的地方在于声音和运动之间的神经连接。大脑中负责运动的区域和负责听觉的区域之间存在通路，鸟类通常没有这种连接，少数例外如凤头鹦鹉。这条通路意味着，你摇晃婴儿时用的节奏，会决定这个婴儿长大后喜欢什么样的节奏。我们天生就有模仿节奏的冲动，这源于大脑中的镜像神经元：看见别人做一个动作时，你不需要自己动，脑中的镜像神经元已经在同步响应了。打哈欠会传染，情绪也会传染。听到一首悲伤的歌，你的镜像神经元在模仿那首歌编码的人类悲伤，身体不自觉地与之共振。

Spitzer讲了一个他亲历的场景。他带着幼小的孩子去了一场音乐会，现场有上千个幼儿。乐团一演奏《独行侠》的主题曲，也就是意大利歌剧作曲家Rossini（1792-1868）写的《威廉·退尔》序曲中那段著名的急速段落，所有幼儿本能地跟着节奏上下跳。这些孩子从来没有听过这首曲子。为了排除"是父母在引导孩子跳"的可能性，实验把婴儿从父母膝盖上拿下来单独测试，结果一样。节奏反应是婴儿自带的，不是大人教的。

音乐引发鸡皮疙瘩的原因同样值得深究。医学上叫piloerection，通常由突然的音量爆发或极端音乐体验触发。触发鸡皮疙瘩的脑区和处理恐惧的脑区相同，这就是为什么鸡皮疙瘩的生理反应和受惊时一样，汗毛竖起。但你享受这种"恐惧"。Spitzer给出的定义：音乐审美的本质之一，是学会从极端体验中抽走危险。就像坐过山车，或者站在安全观景台上看火山爆发。"Music is violence without the danger."

大脑处理音乐的层次和大脑的进化层次一一对应。最底层的脑干是最简单生物都有的，它对突然的巨响做出惊吓反射。往上一层，基底神经节，也就是爬行动物阶段就有的脑区，判断声音是愉悦还是不愉悦。再上一层，杏仁核，哺乳动物才发展出的脑区，处理悲伤、快乐、愤怒、恐惧这些情绪。最上层的新皮层处理模式识别和音乐的复杂结构。Spitzer说，沉浸在音乐中时，你实际上在逆行穿越大脑的进化层级，从最现代的新皮层一直下潜到最古老的脑干。他把音乐叫做**"通往自然之母的脐带"**，是一种"心理时间旅行"。规律是：越深入大脑底层，音乐的反应越普遍、越跨文化。

达尔文在1872年出版的《人与动物的情感表达》中最早观察到情绪有适应性功能。快乐是达成目标时的反应，愤怒是目标被阻断时的反应，悲伤是失去所爱时的反应，恐惧是面对蛇这类威胁时的本能反射，你会冻住、战斗或逃跑。音乐充满了类似的反应。音乐由模式构成，模式可以被允许完成，也可以被突然打断。当你在音乐中听到冲击或模式的中断，大脑启动的是和野外面对危险时相同的机制。当然，没有人在音乐中死去，这只是那种原始反应的衍生效果。但这正是音乐能以如此内脏级的方式表达情绪的原因。

音乐还有一个令人惊讶的事实：音乐训练会改写大脑结构。多数人用右脑处理音乐。经过专业训练的音乐家转为左脑主导，用处理语言的同一个颞叶区域来处理音乐，这合理，因为复杂音乐确实和语言一样复杂。学乐器附带的迁移技能远不止"会弹琴"：注意力控制、时间管理、团队协作、专注力训练。

8. 音乐可以是药，但医生得学会开处方

把音乐当纯粹的放松或娱乐，严重低估了它的功能。Spitzer列了一张清单：音乐能对抗孤独，而孤独是心理健康的最大威胁，你甚至不需要和别人一起演奏，只要听就能接入一个社交网络，因为每一个音符都是由社会惯例塑造的。音乐降低皮质醇，缓解压力。音乐用多巴胺制造快感。音乐是标记记忆的利器，你能通过一首歌精确回到过去的某个瞬间。音乐能表达语言无法捕捉的身份认同和深层情感。这就是为什么青少年会把人生中特定阶段听到的歌曲印刻为自己身份的一部分，因为音乐对词语来说太精确了，词语反而追不上音乐。

但音乐也能伤害大脑。关塔那摩湾是美国设在古巴的军事拘留设施，"9·11"之后用于关押恐怖主义嫌疑人，那里曾用高分贝播放囚犯厌恶的音乐作为审讯手段。你讨厌的音乐开大音量，就是一种攻击。Spitzer特别提醒：把音乐当药物处方没问题，但必须教会医生"开什么药"。阿尔茨海默症患者不适合听巴洛克音乐，重复性太强。抑郁症患者不适合听强化那种状态的音乐。不同症状需要不同的声音方案。Spitzer用的词是"bespoke"，定制，像定制任何药物一样定制音乐。

而"放松"这个词本身就有误导。Spitzer说，听音乐时有太多事情在同时发生，"放松"暗示着被动，而聆听是一项主动的、创造性的活动。

9. 音乐已经存在了100万年，不值得为未来十年焦虑

Spitzer对未来的预测建立在一个前提上：音乐已经存在了至少100万年，对未来十年或一百年的焦虑只是一个针尖上的事。在贝多芬的时代，一个人一辈子能听到两次交响乐就算幸运了。今天，音乐的可得性堪比自来水。

有人担心互联网让所有音乐趋同成一团灰色均质物。Spitzer不这么看，理由有两条。第一，每个艺术家都有要与众不同的竞争驱动力，时尚总是被打破的。第二，音乐流派已经分化出成千上万个子类型，只要人类还有不同的身份认同，就会创造不同的音乐来表达自己。音乐同质化的前提是身份同质化，而这从未发生过。

他对未来做了三个预测。

第一个：音乐将越来越功能化、个性化。他能想象有一天，医生给你"注射"精确定制的声音来治疗抑郁或情绪障碍，像定制药物一样定制音乐。

第二个：人与技术的融合会继续深化。你手里握着iPhone的时候，你已经是一个共生体了。K-pop几乎就是从消费者和数字文化的互动中"进化"出来的。Spitzer提醒，技术从来不是阴暗的，4万年前的骨笛就是一件技术产品，它延伸了人类的声音和手指。IBM研发的Watson Beat是一个用人工智能辅助音乐创作的程序，Spitzer说它和任何乐器没有本质区别，都是延伸人类想象力的工具。机器抛出可能性，人类负责判断、编辑、选择、塑形。同时，互联网正在让音乐回到它最初的状态，疫情加速了这一转变。通过各种数字平台，普通人可以在家里创作和分享音乐。我们正在重新获得数千年前那种人人参与的音乐状态，那才是常态。

第三个，也是最大胆的一个：未来的音乐可能不只关乎声音。它可能涉及味觉、色彩、身体感知，以及人类目前狭窄的听觉频谱之外的频率。我们可以放大、延伸听觉范围。就像德国先锋派作曲家Karlheinz Stockhausen（1928-2007）一生致力于用电子技术拓展音乐的边界，或者Beyoncé今天在视觉、舞蹈和音乐之间创造的跨感官体验，几百年前的莫扎特或贝多芬完全无法想象一样，我们也无法想象未来等待我们的可能性。

Spitzer这期访谈真正做到的事，是把"音乐"从消费品的位置拽出来，放回它在人类物种史中的位置：一套比语言更古老的信号系统，塑造了身体结构，改写了大脑回路，组织了社会关系，并在全球化过程中充当了文化基因的载体。五线谱作为控制工具的历史、东方声学传统对西方的碾压式领先、人类在音乐天赋上不如鸟类的事实，都是容易被流行叙事忽略的知识点。

核心问答

Q1: 音乐到底有多古老？

远比语言古老。直立行走（约400万年前）已经产生了节奏的基础，双面手斧（约150万年前）暗示了对称节拍的认知能力，最早的物证是德国施瓦本汝拉山区洞穴出土的骨笛，距今约4万年。音乐的历史是从脚步声开始的。

Q2: 为什么说人类"不擅长"音乐？

人类沿猿类路线演化，猿没有声音学习能力，没有节奏感。鸟和昆虫在这两项上都比猿强。人类是从音乐能力几乎为零的起点，把昆虫的节奏、鸟的旋律、猿的姿态拼合起来，再加上情感和对死亡的意识，重新从零建造了音乐。这让人类音乐既是天生的也必须是后天学习的。

Q3: 听音乐时大脑在做什么？

在做"进化时间旅行"。新皮层处理模式和复杂结构，杏仁核处理情绪，基底神经节判断愉悦度，脑干对冲击做出惊吓反射。越深入大脑底层，音乐的反应越普遍、越跨文化。这也是为什么音乐能引发鸡皮疙瘩：触发的是和恐惧相同的回路，只是被抽走了危险。

原标题：《音乐比语言早100万年：一部从“脚步声”开始的人类史》

阅读原文

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

我要举报