澎湃Logo
下载客户端

登录

  • +1

讲座︱康文林:用大数据解读缙绅录

王含梅 张嘉雯 整理
2017-03-03 13:59
来源:澎湃新闻
私家历史 >
字号

2月27日晚,香港科技大学康文林教授做客华中师范大学“开放与交叉”主题系列讲座,于逸夫国际会议中心作了一场学术报告,题为“清代官员的仕途:基于缙绅录数据库分析的新认识”。本次讲座由华中师大近代史研究所付海晏教授主持。

康教授最初跟随李中清先生做人口学研究,合著的《压力下的生活》曾获得2004年古根海姆奖。之后利用北京大学、苏州大学的学生学籍档案对两校学生社会来源进行研究,专著《无声的革命》引起了学界热议。此次报告也是基于李中清—康文林研究团队近年来有关缙绅录数据库研究的新发现。

讲座现场

缙绅录数据的完整性和可用性

缙绅录是记录官员的职掌、姓名、出身、籍贯、字号、科举、现任官职、任职地点、机关、官职品阶等基本情况的专书。清代继承了出版官吏名册的传统,缙绅录成为记录全国职官信息最全面、系统的资料,如果是旗人还要对旗分和民族进行区分,如果有爱新觉罗的身份还要另加标记。清华大学图书馆和科技史暨古文献研究所整理了馆藏的缙绅录,汇编成《清代缙绅录集成》(95卷),这是康文林教授“清代缙绅录量化数据库”项目组目前最为主要、录入优先级别最高的材料来源。清代缙绅录每三个月有一个本子,每一个本子大概有1.5万条记载,粗略估计大概有280万条记录,有40万个官员的记载。项目组目前录入了大概有8万条记载,约20万个官员的记录。去年也在其他图书馆找到了档案资料或其他本子的缙绅录,打算把剩下的164个本子的数据全部录入,粗算大概有500万条记录。

每个记载基本都有姓和名。如果一个官职下没有记载,说明这个官职空缺。这也许就是民间会买卖交易缙绅录的原因。一个数据只是一个截面,每个记载的史料价值是不可否认的,可是如果我们要对某一个人仕途生涯做跨年的分析,就需要把这些截面连接起来。做成追踪性的记载,从而做成生活史。这种追踪在西方史学中是很难实现的,因为姓、名的重复和较大的人口流动,无法做到有效的识别。而在中国一个人的姓名,尤其是精英阶层,他们的名中可能自身就带有一些家族的或辈分的信息。加之来源地的限制,省—县—里,使得人名与来源地的二重限定,唯一性高达97.37%。但较难的是旗人,因为他们没有名字,姓氏重复率高,但通过他们的旗分可以再次缩小范围。唯一性的确定成为数据库各条目之间链接的关键。

过去的中国特别是官僚制度在海外是最受关注的一个侧重点。千百年前中国已经有了自己的官僚制度的概念,官员的选拔、提拔等都已经有比较成熟的系统。而在国外,大概18世纪,一般的国家,官吏多通过朋友关系或其他方式,不像中国这么系统化。中国的官僚制度、科举制度受到了西方学者的关注。以往基本靠传统的政治学或历史学的方法分析理解,了解过去政府的系统。项目组希望将缙绅录整理成数据,通过个人微观的数据来分析清代官僚体制,通过无数万个数据来分析官员的仕途。之前学界研究清代官吏并没有这样的微观数据。

大数据分析下的缙绅录能看到什么? 

清朝政府提供了科举、捐纳和旗人身份三种不同的仕进途径,三种方式相互交错。一般世人强调科举的重要性,通过科举能够进阶高官,科举也被誉为具有中国特色的选官制度。但缙绅录量化数据库的分析结果表明,事实可能并非如此。在最近的研究中,康文林意识到低估了捐纳的重要性。以往捐纳被认为出现在政府缺钱或是开始腐败的时候,其实通过量化研究发现捐纳是一种正常途径。清代另一个官员来源是由身份决定的,在中央机构中旗人占有绝对的优势,旗人身份比汉人进士身份更容易进入1-3品的高品级官员群体,即使1900年以后还是以旗人为主。这对我们来说似乎是一种惊喜,因为我们大多数人认识到的是通过科举入仕,而事实上高官中只有一小部分大概15%-20%的比例是进士出身。从另一个角度来看,汉人的出身似乎也决定了他们的仕途,1-3品高官中只有3%-5%的汉人,40%-60%的汉人进士可以做4-6品的官,大多数科举入仕的官员都处于7-9品的职位,这也许不是他们的愿望,但起码也是地方精英吧。

利用量化数据分析也可考察官员的地域分布。在缙绅录的量化下,我们能够看到官员多出自于浙江、顺天、江苏、安徽等地。但是在这样的统计中,湖南排名并不靠前。有趣的是,湖南在高官中的排名却更高一些。所以通过细致的地理分析来探索同乡关系或地域对官员提拔的影响,也许是一个很好的研究切入点,同时可以利用人际网络的方法做进一步的检验。

在之前的研究中,关于官僚精英仕途长短的信息鲜有所见,一般印象是官员的仕途可长达数十年,甚至一辈子。但根据缙绅录量化数据库的分析,似乎说明下层官员往往流动性非常大,这也是之前没有意识到的。大约有多达80%的官员任职3年之后就不再为官,仅有8%-9%的官员能够为官15年以上。通过这些研究,可以让我们了解清政府的官僚体制、官员流动等情况。

缙绅录与题名录的匹配,使我们对官僚群体有了整体理解,能够发现考试名次与仕途以及品次也有明确的关联。考中进士并不意味着就可以做官,最多有60%的人在十年内可以得到官职。而官员品级的高低与他们的考试名次是有直接的关系。一甲、二甲的进士也很少直接上1-3品的官职,但无疑会有优势。旗人如果考中进士,仕途似乎顺利许多,做到高官的几率比汉人高。另外,考试的名次似乎也决定了初次任职的地点。在前第一至二十四名的考生中,大约有70%的人可以在北京任职,而其他名次较为落后的官员,任职地域则相对较远。

大体来说,康教授认为该数据库能够具有以下功用:对清代官僚系统的整体认识;窥探家庭与社会网络对官员仕途的影响;明确科举、捐纳、八旗在官僚系统中的角色;扩充中国史的相关中央数据;助益当代管理学与政治学的发展。

缙绅录量化数据库的未来计划

过去一般把科举或进士当作官员来研究,实际上从目前做的分析来看,进士只是官员的来源的一种。下一步项目组还会关注官员的任职、生涯、流动等其他方面的情况,八旗还有皇室的爱新觉罗氏的人在清朝做官的生涯。将来的研究计划是对这三种来源途径的人群做分别研究。另外,我们也可以比较清代做官的途径对他们以后的仕途有什么影响,还可以理解每个部门每个机关的的提拔方式。

现在的项目比较完整的是清末和1820-1860年的情况,然而没有清初的数据,将来完成后时间段是1720-1910年。以后想做清末到民国的官员数据,看看清末官员是否对民国有影响。项目组还计划把缙绅录和其他的数据库、家谱做匹配链接,进一步分析家庭背景、社会来源对仕途的影响,尤其是对科举家族、世官家族的追踪研究,理解科举与捐纳的关系,一些家族通过科举、捐纳并行的手段维持家族成员做官。像何炳棣先生利用题名录对明清科举社会流动的研究,康文林则希望从科举的数据中找到有关的家族内的信息,比如从进士题名录中找到官员的祖父、太祖父的名字,再将此名进行搜索,看他的祖父是否做过官,用以观察官员代际的流动。还有用进士的数据,来分析中进士或名次的前后是否对做官有影响。以及用社会网络分析法,将CBDB(中国历代人物传记数据库)以及题名录、朱卷、乡试录、同年齿录、捐纳名录等史料构建的量化数据库匹配连接,看官员们之间的人际关系。通过整合尽可能多的官员背景数据,将定量分析与传统史学方法相结合,可以研究科举途径、家庭背景、社会网络、财产等因素对于官员群体仕途的影响。

清代缙绅录的记载内容孤立而零散,一个数据只是一个截面,创建数据库的初衷就是想把这一个个截面连接起来,对长达近两个世纪的清代官员群体做到有效追踪研究,这似乎是一项艰辛而宏大的学术理想。这个项目使我们第一次有这样一个机会做这个数据库,不论是中国还是外国,有一个国家所有官员如此长时段的数据库。相比国外,似乎也没有缙绅录这样的资料,也许很难做到如此规模的数据库。项目组准备将来把这个数据库公开,因为这是一个宏大的项目,在退休之前是做不完的,还有许多想法,希望在数据公开后,有更多的人利用这个微观大数据来做一些宏大的历史研究。

康文林教授以上的举例已经揭示出一些非常有趣的话题,大数据分析历史的方法使得清代官员与仕途展现出一种意想不到的面相,亟待学界的深入讨论。有听众指出大数据对于当下的历史学研究来说,能够对传统史学研究起到补充作用。特别是面对长期以来的一个争议,即历史解决的问题是否具有有效性?大数据历史在此方面就做了许多工作。但也会带来反思,大数据本身的有效性和维度在哪里?因此,在利用大数据分析时还应回到历史的本位,进行结合与对话。

    校对:张亮亮
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈