澎湃Logo
下载客户端

登录

  • +1

东京审判70周年|全球首个可全文检索的相关文献数据库上线

澎湃新闻记者 罗昕
2016-05-06 14:49
来源:澎湃新闻
文化课 >
字号
历史上著名的“东京审判”于1946年5月3日开始进行,历时两年半,共开庭818次,受理证据在4300件以上,判决书长达1213页。审判结束后,中国代表曾带回两箱档案文件,但这些档案在中国多已散失。
东京审判中国法官梅汝璈之女梅小侃曾说起参加远东国际军事法庭的17个中国人里面,父亲是唯一一个留下著作的。但《远东国际军事法庭》这本书还没完成,梅汝璈先生就去世了。

也因此,有关东京审判的文献资料弥足珍贵。今年5月3日是远东国际军事法庭开庭70周年纪念日。上海交通大学出版社在今年上线了“东京审判文献数据库”,这是全球首个可进行庭审记录全文检索的东京审判文献资源数据库。

澎湃新闻了解到,该数据库一期内容资源约6000万字,其中英文版《远东国际军事法庭庭审记录》近5万页;日文版《远东国际军事法庭证据文献》有3万余页;庭审现场、人物等照片约700幅;视频资料50分钟。

可全文检索

打开http://tokyotrial.cn/,澎湃新闻发现数据库首页设有人物、年表、庭审记录、证据、研究资料、影像资料等子栏目,而人物一块又可以细分为法官、检察官、A级战犯、证人、律师五个部分。

以A级战犯中的东条英机为例,通过全文检索“东条英机”或者“Tojo Hideki”(东条英文名)后,会出现涉及这一头号战犯的人物信息、庭审记录、图片、音视频资料,以及相关研究论文索引目录等。进入“东条英机”的人物页面后,会显示相关的所有信息。

东条英机的人物信息

值得一提的还有年表部分,数据库将东京审判分为准备、检方主张立证、辩方反驳、审理、判决五个阶段。每个阶段里,凡有庭审记录的日子都有当天庭审的内容摘要。比如在1946年6月4日,“检方主张立证‘前提的立证’第一次审理开始,首席检察官季南代表检方进行开场陈述。”

年表

上海交通大学出版社数字出版事业部张洁介绍说,这样有利于学者按时间查找东京审判文献资料,也利于公众的知识普及。上述部分所有网民都可自由浏览。

如果要详细浏览庭审记录,则需要拥有登录数据库的权限。澎湃新闻登录发现,详细的庭审记录可实现PDF(图片)浏览,也可实现XML(文本)浏览。换言之,该数据库并不仅仅把庭审记录的纸质版扫描到库里,还对每一页的记录进行了文本数字化处理,使得对全部的庭审记录都可进行搜索,复制和添加批注等操作。

“我们还开发了混合浏览模式,即PDF(图片)和文本对照阅读。后者方便阅读与复制,而前者方便与原件校验。”上海交通大学出版社副社长宗德宝如是说。

PDF(图片)和文本对比

他告诉澎湃新闻,东京审判文献数据库最强大的功能在于可全文检索,数据库提供了一个统一的检索入口以方便用户查询到全部的相关信息。澎湃新闻发现库中有关“溥仪”的庭审记录有250多条,有关“Nanking”(南京的英文旧译)的庭审记录有200多条,关于“南京大屠杀”(“atrocities in Nanking”,“the rape of Nanking”,“Nanking incident”)也屡屡在庭审记录中被提及。

有意思的是,技术人员还会对庭审记录里出现的“一人多名”进行标识。比如“Emperor”或“Henry”也是指溥仪,“CHIANG Kai-Shek”、“CHIANG Chih-Shih”则都指代蒋介石。

输入“溥仪”出现的检索内容

实现中英日对照阅读

澎湃新闻发现,数据库目前已经实现了不同语种间的对照阅读系统功能,用户可以在同一界面方便地对照查看不同语言的庭审记录版本。宗德宝说:“通过呈现庭审记录的不同语言版本,研究者可以开展比较研究,如不同语言描述是否有差异。”

不同语言版本的对比

对于东京审判文献数据库,上海交通大学东京审判研究中心研究员赵玉蕙说:“我要是使用者,就希望数据库能提供几部资料集成的全文检索。”

目前,全球有关东京审判的文献除美国国家档案馆之外,各自散落藏于美国、英国、法国、澳大利亚、新西兰、荷兰、印度及日本等图书馆以及研究机构。很长时间里,国内除了东京审判判决书和中国法官梅汝璈尚未完成的个人著述,没有其他有关东京审判的正式出版文献。

直到2014年,国内陆续有“大部头”文献资料诞生:80卷英文版《远东国际军事法庭庭审记录》及《索引、附录》,50卷日文版《远东国际军事法庭证据文献集成》及《索引、附录》,还有上个月刚举办首发式的12卷《远东国际军事法庭庭审记录·中国部分》。

在上海交通大学东京审判研究中心主任程兆奇看来,东京审判这样重要的资料不仅要保留在象牙塔里面,而且应该让更多人去了解,让东京审判研究这件事做得更深刻、更扎实。他告诉澎湃新闻:“数据库是一个工具,为人们了解东京审判提供更多方便。”

宗德宝也告诉澎湃新闻,出版社下一阶段将对日文版《远东国际军事法庭东京审判庭审记录》、《国际检察局讯问记录》等资料分别进行数字化和标引,《远东国际军事法庭庭审记录·中国部分》也在做标引,约6000分钟东京审判视频已完成档案的查找统计工作,现已委托相关公司从国外采购,未来数据库的内容会更加完善。

宗德宝还表示,目前已有南京市图书馆、中国人民大学图书馆等机构在试用数据库,但他也坦言,出版社一直“纠结”如何兼顾数据库的社会效益与经济效益。“目前不是所有内容都免费开放。但我们希望有足够的资金支持来实现今后的内容添加与维护,有朝一日可实现完全开放。”

    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈