下载客户端

科学星期五︱用两千种喝法测试：普通人能品出葡萄酒的好坏吗

尚知雨(圣路易斯华盛顿大学哲学神经科学心理学混合博士在读)

2015-07-31 18:04

来源：澎湃新闻

“科学星期五”是一档关于科学和科技的栏目，逢周五播出，给有好奇心的人。今天我们通过近年来八组、近两千人参与的科学实验，看看普通人到底能否品出红酒的好坏。

“我喜欢思考那些葡萄成长的年岁；思考太阳曾是怎样照耀着的；思考是否下过雨。我喜欢想到那些精心照管过，细心挑选出那些葡萄的人。如果那是一瓶陈酒，有多少故人已经逝去。我喜欢葡萄酒的不断演化，好像如果我今天打开一瓶酒，它的味道会与其他任何一天打开时都不相同，因为一瓶葡萄酒是真正活着的。它不断地演化着，并且变得愈加细腻丰富。当然，直到它达到顶峰为止，就如你的那瓶61年一样，之后就开始了它不可避免的，缓慢而稳定的衰落……”

电影《杯酒人生》海报

这是在影片《杯酒人生》中女主角向男主角解释她爱上葡萄酒的缘由。笔者并不如女主角那么浪漫，在好长的一段话里只读出了两个简单的理由：风味和情怀。

把风味和情怀分割开来大概是种错误：能够区分出葡萄酒里的种种果香，或者了解倾倒葡萄酒的正确手法，以防体温改变葡萄酒的口感等等，本身就是一种情怀。要说风味和情怀登峰造极到混而为一的，恐怕要算令狐冲品出丹青生的葡萄酒里陈中有新、新中有陈的奥妙。估计唯有区分出火电、水电来源不同甚至核电机组产地不同导致的不同音质才能与之比肩。

但是笔者是俗人，谈不了情怀，只能勉强单独谈谈风味。好呢，那么问题来了，在日常饮酒中，我们真的能够品味出葡萄酒的好坏，甚至品味出其中“细腻丰富”的口感和气味吗？还是我们对于葡萄酒的品赏，和令狐冲以及火电水电的故事一样，不过人类的丰富想象的结晶而已呢？要考察的命题很简单：“在日常品酒活动中，常人可以系统、可靠、有效地品味出葡萄酒的好坏”。那么直接看数据。

对于上述命题，我们直接祭出现成好用的杀手锏—— 随机双盲实验。在这种实验中，实验参与者均不知道酒样的产地、年份、价格等其他外部信息。研究者给受试者随机提供酒样。然后由受试者按照他们个人的喜好打分。根据一份颇为著名的研究，在2007年到2008年之间，研究者进行了超过6000次随机双盲实验，共计涉及506名受试者和523种不同的葡萄酒。

结果显示，对于未经过品酒训练的常人，葡萄酒的售价和受试者对其的评价呈现极其微弱的负相关关系（统计学意义上显著）。而对于经过品酒训练的专家，葡萄酒的售价和受试者对其的评价呈现极其微弱的正相关关系（统计学意义上显著）。后来的研究多次提供了类似的结果。比如一篇2014年的新研究显示，有过一定品酒训练的受试者对葡萄酒的评价和葡萄酒的售价呈现极其微弱的负相关（统计学意义上不显著）。举一个糟糕的例子：产自普里尼-蒙哈榭少女一级园的Guy Amiot酒庄，售价90美元一瓶的霞多丽竟然比同组其他便宜的葡萄酒得到的评分都低。

换言之，上述的研究显示，隐去了价格、标签等外部信息以后，常人的喜好和葡萄酒的贵贱并没有强烈的正相关关系。这样的研究是有问题的。毕竟，葡萄酒的质量和售价并不能画等号。有的酒卖得贵可能的确是因为优质。有的酒卖得贵只是，呃，单纯卖得贵而已啊！

对此，研究者又参考了其他可能说明葡萄酒质量的数据。首先，研究者收集了不少成对的葡萄酒。每对由一支日常款、一支珍藏款（Reserve），但是其他数据，包括产地、年份都完全一致的葡萄酒组成。面对每一对葡萄酒，他们每瓶各取两次样，然后从总计四份样本里随机挑选三份提供给受试者。受试者在品赏之后回答哪一份酒样与其他两份不同，以及他们更喜欢哪一份酒样。如果受试者随便乱猜的话，三选一，猜中的概率是33%。

研究者们召集了381名受试者品尝了总共829对葡萄酒。最后，答对的比例是40.7%，比随便乱猜高出来那么一点点（统计学意义上显著）。即使在猜对的情况下，受试者偏好珍藏款葡萄酒的比例只有51.6%，比随便乱猜（也就是50%）还是只高出一点点，而且统计学意义上还不显著。这也就是说，即使受试者能够品味出区别，我们也没有证据显示他们能够品味出好坏。

说不定，“珍藏款”也就是商家的营销伎俩而已。让我们再参考一个数据。众所周知，葡萄酒的好坏取决于葡萄质量好坏。葡萄质量好坏又取决于出产当年的气候条件，包括日照、降水等多个因素。这决定了在葡萄酒行业里，有好年份坏年份之说。同一组研究者对于好年份和坏年份的差别也进行了研究。

他们选择了除了出产年份不同，其他数据都一致的五种葡萄酒。出产年份的选择参考了世界著名品酒师罗伯特•帕克的打分，即选择了相关葡萄酒好年坏年差距十分明显的年份。研究者召集了241名受试者使用一样的实验方法品赏了总共593对葡萄酒。结果唯一答对概率高于随便乱猜的酒种是来自于极其著名的波尔多产区的波美侯红酒。遗憾的是，这只是品出了区别，还不是品出了好坏。对于所有正确品出区别的受试者里，仅有51%喜欢好年份的酒。而在所有品出波美侯红酒区别的受试者里，仅有55%喜欢来自好年份的酒。

换言之，在好年份坏年份的研究中，对于波美侯红酒，受试者总算是以极其微弱的优势答出了好年份的好酒。不幸的是，就我所知，这则研究是所有相关的、使用了大样本的科学研究里，对于品酒行业最为有利的研究。

电影《云中漫步》里的葡萄园

上述的研究把葡萄酒的售价、品类和年份当作葡萄酒质量的指标。为什么不直接使用品酒专家对各色葡萄酒的评价呢？因为，呃，我们还不知道品酒专家存不存在呢。

“专家”是一个很难定义的概念。要符合什么要求才能够成为专家？我们常认为专家得在特定领域里“颇有战功”：比如说在比赛里屡战屡胜，或者在研究里总是先人一步得出正确解答等等。但是对于品酒，什么是“正确解答”？毕竟，我们没有很好的、独立的办法来验证品酒人的主观汇报。研究者认为，对于品酒专家，大概有两个要求是最基本的。首先，同一名专家对来自同一瓶葡萄酒的多个样本要能够反复给出稳定、一致的评价。其次，专家们应该能够对于同一瓶葡萄酒形成评价共识。

一如往常，让我们看看数据。先说说一致性。在加州每年州集市中，吸引了众多品酒专家的品酒比赛会给出铜奖、银奖和金奖三种奖项——当然还有悲剧的不入选。每瓶葡萄酒得到的奖项取决于多名专家对于无数份没有任何标识的酒样的评价。为了检验一致性，研究人员统计了2009年加州州集市64名专家对约3000种酒的评价。考虑到64名专家的数量并不多，研究人员又选用了澳洲葡萄酒研究所571名专家的评分数据。

研究人员设置的合格标准是，在对四瓶酒，每瓶酒三份样本总计十二份样本进行顺序随机的品赏中，出现小于或者等于两次评价不一致，并且评价不一致的水平只有一级之差（比如说从铜奖到银奖），算作合格。按照这个标准，在这六百多名专家中，只有不到30%算是合格。接下来说说共识。在2003年里同时进入了五项重要品酒比赛的375种葡萄酒里，没有一种取得了四项或更多的金奖。在至少获得了一枚金奖的葡萄酒中，其中75%在另一项比赛中被评选为不入围，23%被评为铜奖。也就是说，有98%的金奖葡萄酒在不同的比赛中获得了完全不一致的评价。更加糟糕的是，研究者准备了两种模型，第一种是评价随机分派，第二种是评价也受到葡萄酒质量的影响。前者完全可以解释上述375种葡萄酒在五项比赛中的成绩，而后者却不能。

换言之，在上述的测试中，品酒专家的表现极其糟糕，糟糕到我们甚至不能够确定品酒专家是否真实存在。或许上述的研究并不说明品酒专家不存在。另一种可能的解释是：大多数品酒专家只是欺世盗名，大多数的葡萄酒滥竽充数。只有30%的专家是真专家，只有2%的葡萄酒真正值得金奖。遗憾的是，这样的解读面对两个问题：首先，在实际生活里，我们怎么找出真专家，真好酒？其次，对于嗅觉和味觉的机理的研究显示，品酒专家不太可能存在。

当代的研究认为，我们显意识的口感和气味判断往往十分不牢靠：极其容易受到环境因素的影响，极易受到我们认知系统的操控；面对复杂的情况，不同人之间的判断一致性也非常低。在日常品酒活动中，无论是在州集会的品酒比赛中或者是在高贵的餐馆里，我们的嗅觉和味觉总是不断受到其他食物甚至是他人体味等种种环境因素的影响。

更加糟糕的是，光品味出风味的区别远远不够。按照品酒情怀的要求，我们不但需要品赏出好坏，还需要更进一步品赏出杯中的葡萄酒是“樱桃果香”、“覆盆子果香”抑或是别的果香。这简直是难上加难。所以我们显意识的判断需要依赖其他的信息加以补足。那具体是哪些信息呢？唔，比如说葡萄酒的价格标签，外部描述，还有受试者心理的预期。

关于葡萄酒的纪录片《美酒家族》剧照

在2008年的一项研究里，研究者考察了20名受试者。他们每个人都要进行6次品赏。除了标注酒样价格以外，研究者隐藏了酒样的一切信息。而且标注还不靠谱：受试者得到的标注为5美元和45美元的酒样其实来自同一瓶售价5美元的葡萄酒。而标注为10美元和90美元的酒样来自同一瓶售价90美元的葡萄酒。标注为35美元的酒来自实际售价也是35美元的葡萄酒。结果，研究者发现，面对来自同一瓶葡萄酒的酒样，仅仅是因为标注不同，受试者的喜好打分就大不相同，并且他们明显更偏向标注（而不是实际售价）更昂贵的葡萄酒。在实验结束以后，受试者纷纷表示他们品尝到了五种不同的葡萄酒。实验八周之后，研究者对受试者又进行了一次测试。这一次，还是一样的酒样，只是不再告知价格。结果显示，受试者对价格贵贱各不同的酒样的喜好打分并没有统计意义上显著的区别。

而在另一份研究中，研究者把一瓶相同的葡萄酒装入两个不同的酒瓶。一支酒瓶上写着“特级酒” (Grand Cru)，而另外一支酒瓶上写着日常餐酒(vin de table)。大概读者此时都已经猜到结果了：受试者强烈地倾向于标注着“特级酒”的那一瓶。

最恶搞的研究要放最后。在这份小样本测试中，研究者们准备了三份葡萄酒样品。一份是白葡萄酒，一份是红葡萄酒，而第三份是把上述的白葡萄酒用红色无味染料染色的“红葡萄酒”。这份染色的白葡萄酒的外观和真正的红葡萄酒毫无区别。研究者们招募了54名本科学生，并且让他们进行了两轮品酒。在第一轮实验里，研究者们给受试者一杯白葡萄酒和一杯红葡萄酒，以及一份常见的，描述葡萄酒气味的词汇表。受试者可以参照提供的词汇表，也可以发挥自己的想象来描述手中两杯葡萄酒的气味。对受试者使用的词汇进行分析发现：对于红、白葡萄酒气味的描述的确有显著的区别。描述红葡萄酒气味的词汇经常和红色的、深色的物件有关（比如说 “有红莓味”和“有樱桃味”等词汇），而描述白葡萄酒气味的词汇经常和黄色的或者透明的物件有关（比如说“有柠檬味”和“有干草味”等词汇）。

在第二轮品酒实验里，研究者们给受试者一杯白葡萄酒和一杯染色的红葡萄酒（两杯葡萄酒除了颜色不同以外毫无差别），以及他们之前使用过的词汇列表。对于词汇列表中的每一个词汇，受试者们需要选择两杯葡萄酒之中哪一杯最符合该词汇描述。

结果，研究者们发现，受试者们基本上都用了描述红葡萄酒气味的词汇描述了染色的白葡萄酒。

虽然是小样本实验，上述研究的基本原理被其他大量的实验证实。比如说，在一份对果酱和茶水的味觉实验里，研究者让受试者对“同一份”样本进行两次品尝。受试者看到的是同一个标签和同一个容器，但是研究者乘机调换了容器里的内容。结果，在口味差异极大的肉桂苹果味果酱和葡萄味果酱组中，只有不到一半的受试者意识到样本遭到了调换。而在黑加仑子果酱和蓝莓果酱组里，仅仅有20%的受试者意识到样本遭到了调换。

换言之，我们对于葡萄酒的风味的品赏，很大程度上来自于和葡萄酒本身口感和气味无关的信息，譬如说价格、标签、颜色、他人的介绍还有因此形成或者事前已有的心理预期。当我们抹除了这些信息之后，在日常品酒活动中，无论是常人还是专家，看起来都没有办法系统地区分出葡萄酒的好坏。所以，就品酒这件事，看起来还真是握着的是酒，喝着的都是情怀呐！

参考资料：

Ashton, R. H. (2014). Wine as an experience good: Price versus enjoyment in blind tastings of expensive and inexpensive wines. Journal of Wine Economics, 9(02), 171-182.

Brochet, F. (2001). Chemical object representation in the field of consciousness. Application presented for the grand prix of the Académie Amorim following work carried out towards a doctorate from the Faculty of Oenology, General Oenology Laboratory, 351.

Goldstein, R., Almenberg, J., Dreber, A., Emerson, J. W., Herschkowitsch, A., & Katz, J. (2008). Do more expensive wines taste better? Evidence from a large sample of blind tastings. Journal of Wine Economics, 3(01), 1-9.

Hall, L., Johansson, P., Tärning, B., Sikström, S., & Deutgen, T. (2010). Magic at the marketplace: Choice blindness for the taste of jam and the smell of tea. Cognition, 117(1), 54-61.

Morrot, G., Brochet, F., & Dubourdieu, D. (2001). The color of odors. Brain and language, 79(2), 309-320.

Plassmann, H., O'Doherty, J., Shiv, B., & Rangel, A. (2008). Marketing actions can modulate neural representations of experienced pleasantness. Proceedings of the National Academy of Sciences, 105(3), 1050-1054.

Weil, R. L. (2001). Parker v. Prial: The death of the vintage chart. Chance, 14(4), 27-31.

Weil, R. L. (2005). Analysis of reserve and regular bottlings: Why pay for a difference only the critics claim to notice?. Chance, 18(3), 9-15.

澎湃新闻报料：021-962866

澎湃新闻，未经授权不得转载

我要举报

#科学星期五 #红酒 #红酒品鉴 #双盲测试