澎湃Logo
下载客户端

登录

  • +1

“鸡娃”能否决定孩子的未来?诺贝尔经济学奖得主的思考

王翔
2021-10-19 07:32
来源:澎湃新闻
澎湃商学院 >
字号

“双减”之后,你是应该“躺平”还是换个方式继续“鸡娃”?这是以“海淀妈妈”为代表的“鸡娃家长”们近期热议的话题。

新科诺贝尔经济学奖得主、美国经济学家约书亚·安格里斯特(Joshua D.Angrist)与他已故的合作者阿兰·克鲁格(Alan B. Krueger)的研究,也许能帮助我们更好地理解这一问题。

安格里斯特和克鲁格最著名的研究之一,就是在上世纪90年代运用“断点回归法”证明了教育年限长的人更有可能获得高收入。看来,似乎连诺奖得主都论证了“鸡娃”有理。不过,他们在本世纪的研究又发现,与在普通公立中学学习相比,进入精英中学没有使学生取得更优秀的高考成绩。而克鲁格的另一项研究结果则表明,毕业于常春藤盟校的学生与毕业于普通州立大学的学生相比,其收入水平并无显著差异。所以更全面的结论应该是:多接受教育是有益的,但是接受精英教育的好处并不明显。

其实,在他们之前,关于教育经历与个人成就的研究早已汗牛充栋。而安格里斯特之所以能够获得诺奖,并非因为他的研究结论多么新颖,而是他运用的方法排除了很多复杂的内生性因素的影响(如个人禀赋、家庭收入等),从而证实(或证伪)了因果关系的存在。(内生性因素的影响可以简单举例说明:一个有钱人家的孩子更有可能受到好的教育,毕业后也容易借助父母的人脉找到高收入的工作,因此我们很难得知教育对收入的影响程度。)

古希腊哲学家德谟克利特曾说道:“找到一个事情的原因,胜过当上波斯人的国王”。因果关系为何如此重要,因为发现因果关系是如此之难。发现因果关系又为何困难呢?因为我们的生活中有太多的“障眼法”。

一、样本的偏差

关于是否要“鸡娃”的问题,其实美国人也早就关注过。上世纪40年代,《时代》杂志曾刊登这样一则报道:对耶鲁大学1924届毕业生的调查发现,他们的平均年收入高达2.5万美元。按照当时美元的购买力,大概相当于现在的200多万元人民币。看起来,只要想方设法把自己的孩子送进名校,孩子的未来就可以高枕无忧了。

其实,这个结论里的“障眼法”很多,例如每个人填报收入的时候是不是都会说实话?那些想要避税或者不想露富的人可能少报收入,而那些虚荣心强的人则可能多报收入。再如,那些毕业于耶鲁大学的政治家、企业家和知名学者显然更容易被研究者找到,而那些流浪汉和破产的商人则不然。

再看另一个例子,1898年“美西战争”期间,美国海军的死亡率是千分之九,而同期纽约市民的死亡率是千分之十六。海军征兵部门用这个数据来说明参军是安全的。这一不合常理的结论,也是样本的偏差导致的:能够参军的,都是年轻人且都要经过体检,大多都是身强体壮的;而纽约市民中,则包含很多老弱病残。因此,两个数据根本不具有可比性。

二、概念的游戏

香港中文大学李连江教授,把从样本推断总体的过程称为“惊险的一跃”,就像洄游的三文鱼,一不小心就会跳进棕熊的嘴里。例如,我们常常用平均情况来反映总体情况,但是“平均”的概念却有很大的迷惑性。美国统计学家达莱尔·哈夫(Darrell Huff)在他的经典著作《统计数据会说谎》里就说,“平均数是一个经常被使用的诡计,有时出于无心,但更多的时候是明知故犯”。

《统计数据会说谎》,达莱尔·哈夫 著,靳琰、武钰璟 译,中信出版集团2018版

回到上面那个例子,假设我们找到了耶鲁大学1924届的全部毕业生,他们也都愿意填报自己的真实收入,我们得出的平均收入是可靠的吗?显然,就像网友们经常调侃的,把我跟中国首富平均一下,我也是亿万富翁了。平均数计算起来更为方便,而中位数更能反映总体情况。

除了“平均”的概念之外,生活中“玩概念”的例子还有很多。例如,从一些企业发布的数据来看,网约车司机、外卖员的薪水比很多公司白领更高。其实,白领的工作时间是按工作日计算的,所以网友把在公司洗手间方便戏称为“带薪如厕”;而网约车司机和外卖员等待接单的时间却并没有被计算在内,他们如厕的时间更不可能有薪水。

再如,美国医保机构曾以患者出院后30天内计划外再次住院的指标(即“二次入院率”)来作为衡量医院治疗水平的指标之一,于是有些医院就将再次入院的病人划为“门诊”或者“急诊”而非“住院”,从而偷换了概念。

又如,假设有一家公司声称,他们家的商品利润率只有1%。看起来,这是一家一心为消费者着想的良心公司。可是,把钱投给这家公司还不如存在银行里利息高,这家公司的投资人都是傻子吗?其实不然。假设我每天早上都花100元买一个商品,下午101元卖出去,利润率确实只有1%,可是我一年的投资回报率却高达365%。这里玩的就是“利润率”和“投资回报率”的概念。

三、误导性的宣传

“历史是任人打扮的小姑娘”,数据也是如此。利用统计数据所做的宣传,就像修图时的“眼睛放大”和“瘦脸瘦身”模式一样,常常刻意突出一些东西、隐藏一些东西。

例如,我们知道,老年人在医疗方面的支出一般比年轻人要高,有过病史的人购买商业保险往往比没有病史的人贵。如果有一家保险公司告诉你,不分年龄大小、不限健康状况、不需要体检报告,任何人只要花一两百块钱就可以买他家的医疗险,最高能赔几百万。是不是我们捡到了大便宜?其实,仔细阅读保险条款我们也许会发现,这款保险的起付线设定得非常高,也就是说大多数人都得不到赔付。

关于交通安全的宣传更有意思。假设有人说,去年死于空难的人数是1980年的100倍。难道现在的飞机比以前的更不安全?显然不是,而是因为现在坐飞机的人数比1980年要多得多。再如,假设统计数据显示去年死于火车事故的人有数千人之多,难道坐火车并没有我们想象的那么安全?其实有可能这几千人里面大部分是穿越铁道被撞死的,或者扒火车摔死的。假设有统计数据告诉你,无人驾驶汽车发生的车祸数量只有普通汽车的千分之一。我们能否得出结论:无人驾驶更安全呢?不能。因为无人驾驶汽车的数量原本就比普通汽车要少得多。

四、错误的归因

发现因果关系很难,发现错误的因果关系却很容易。错误的因果归因,常常有以下几种情况:

一是倒果为因。假设有研究表明,抽烟的学生通常学习成绩更差,我们能否得出结论:抽烟影响学习?其实未必。也有可能是成绩差的学生由于心情郁闷而学会了抽烟。假设有研究表明,女博士“大龄未婚”的比例既高于男博士,也高于女硕士,我们能否得出结论:读博士不利于女性找对象?其实未必。也许是因为知识水平更高的女性更能接受晚婚或者独身。达莱尔·哈夫书中提到的一个更有趣的例子是:一个太平洋岛国的居民发现健康人身上大多有虱子,于是他们相信虱子有利于健康,其实是因为虱子更喜欢健康人,这也是颠倒因果关系带来的谬误。

二是混淆相关关系与因果关系。同样是面对“抽烟的学生学习成绩更差”这样的统计数据,我们既可能犯倒果为因的错误,也可能把共变关系误认为因果关系(共变关系就是看起来有联系的两件事都是第三件事的结果,例如喜欢“混社会”的学生可能成绩更差同时也更容易抽烟)。达莱尔·哈夫的书中还举了一个例子:有人发现美国马萨诸塞州长老会牧师的工资与古巴哈瓦那的朗姆酒价格密切相关。难道牧师们涨工资之后大量采购了朗姆酒?或者教会因为倒卖朗姆酒获利所以提高了牧师的工资?其实二者之间并没有因果关系,而是当时全球物价上涨带来的结果而已。

三是扩大因果解释的范围。前面提到,安格里斯特和克鲁格证明了教育年限长的人更有可能获得高收入。然而真理往前多走一步有可能就是谬误。他们的研究对象仅限于义务教育阶段。也就是说,硕士的收入未必高于本科生,博士的收入也未必高于硕士。

四是把无关误认为有关。2020年1月,《柳叶刀》杂志上发表了两篇关于新冠肺炎的流行病学报告,从统计数据看似乎男性更容易感染新冠病毒。而进一步的研究发现,上述结论只是因为样本数量较小而且性别数据比其他数据更容易获得,是否易感其实与性别无关。再如,如果我们发现,爱喝牛奶的欧美人比不爱喝牛奶的非洲人患癌症的比例高得多,我们能否得出结论说喝牛奶易患癌?未必,可能只是因为非洲人均寿命很短,大多数人还没来得及得癌症就死于其他疾病,是否喝牛奶(也许)与是否患癌无关。同样的,耶鲁大学的毕业生更有钱,也可能是因为他们本来就有钱,而与他们受到的教育无关。

在《统计数据会说谎》一书中,达莱尔·哈夫引用了英国前首相本杰明·迪斯雷利(Benjamin Disraeli)的话:“世界上有三种谎言:谎言、弥天大谎和统计数据”。其实,除了那些造假或有误的数据之外,大多数数据能够帮助我们弥补经验直觉的不足,从而更好地了解这个世界。但是,对于拓展人类的知识与智慧而言,我们不仅需要数据,更需要对数据的科学的因果解释,以及独立思考、拒绝盲从的精神。正如启蒙运动的格言“勇于求知”(Dare to Know),要找到真相,只有靠我们自己。我想,这是安格里斯特等人的研究给我们最重要的启示。

(作者王翔为复旦大学数字与移动治理实验室研究员、主任助理,主要研究方向:数字时代的公共治理、公共部门人力资源管理。)

    责任编辑:蔡军剑
    校对:刘威
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈