现代快报讯(记者 刘静妍 / 文 见习记者 顾闻 / 摄)" 大案牍术 " 是什么?这个词,就连文史专家也觉得陌生。《长安十二时辰》热播,带火了这个虚拟现实的术语。剧中解释,相当于现代的大数据。靖安司中,徐宾最擅长在档案中发掘有用信息。
△江苏省档案馆
唐朝对档案的利用,真的这么发达吗?不知道。但进入档案数字化时代的今天," 大案牍术 " 真的可以实现,而且会越来越便捷。近日,现代快报记者探访了江苏省档案馆,揭秘现实版 " 大案牍术 "。
用电脑查阅公开档案,方便快捷
" 我们在电视剧《长安十二时辰》里看到的,所谓的 " 大案牍术 ",实际上是作者的艺术创作,是一种虚构。" 江苏省档案馆管理部主任蔡宜军也关注到了这部剧,他告诉现代快报记者,剧中,在很短时间内,利用档案查能到很多东西,并且很快得出结论。这在当时的历史条件下,几乎不可能实现的。
" 大案牍术 " 依赖的是人脑的记忆,而每次都要临时调度大量人力和物力,去突击整理和分析档案。" 而现在有了现代化的工具,依赖计算机,我们可以把人力、物力的投入放在平时。而当需要查询、利用的时候,就很便捷了。"
8 月 9 日下午,在江苏省档案馆,不少人正用查档大厅电脑查询想找的档案。前来查档的,有编史修志的学者,有为办理退休手续查阅相关材料的企事业单位人员,有查阅本单位文书档案的机关人员等等。
" 带着身份证过来,便可以查阅开放档案。" 一位工作人员介绍,身份证验证过之后,便可以获得一个授权码。然后在查档区的计算机上登录系统,根据题名、年份、责任者、机构等进行检索。检索到想要的内容,提交申请,获得审批之后,便可以看到全文了。
揭秘数字化的幕后:环环相扣,都是精细活儿
△有破损的旧档案
现在,在档案馆的查档大厅,要检索、利用档案,已经非常便捷了。但其实,这背后是一系列的 " 细致活儿 "。现代快报记者探访了江苏省数字档案中心,见证了纸质档案数字化的幕后全流程。从档案出库、拆卷、编页码等前处理,到修裱、扫描、著录和数据挂接,再到最后档案装订、入库 …… 环环相扣,并且每个环节都要伴随着质量检查。
△修裱
首先是拆卷,进行初步的鉴定和简单的筛选,看看里面有没有破损的地方、重复的内容,然后进行编页码。" 不是每一卷都是非常完整的,有的打开以后破损很严重,拆的时候就要很小心。参差不齐、大小不一、黑白不均,有的有老鼠咬过的,有水淹过的、有火烧过的 ……" 江苏省数字档案中心副主任刘兢兢介绍,历史档案的纸张,会有破损、皱褶、折痕,拆卷之后,要先压平,需要修裱的要拿去修。有的破损纸张,还要经过修裱。全部都处理好了,才能进行扫描。过去的档案,并不像现在都是 A4 纸打印的,非常整齐。经济困难时期的老档案里,还有利用纸张反面空白页形成文件正文的。
△编页码
△著录
著录是最重要的环节,与档案的检索、查阅直接相关。90 后李乐宁是著录组组长,现代快报记者采访时,她正聚精会神地对着电脑屏幕,在密密麻麻的表格中依次输入档号、文件号、责任者、题名、文种等信息。长时间盯着电子表格,不会眼花吗?她说,工作六七年,也不是没出过差错,但总体上已经练得很娴熟了。" 在著录项里,要把档案的信息提取出来。比如简报,如果只把简报两个字录入在档案的题名里,那么就没有检索的意义了,因此需要提取出:什么时间、什么内容的简报。" 刘兢兢介绍。而档案的文本并不统一,有繁体的、文言的、毛笔写成的,甚至还有别字、有文法不规范的,这就必须人工著录,现在的自动识别难以完成。
△数据挂接
著录完成之后,是数据上传、挂接,完成目录与扫描图片的关联。最后,普通的档案要经过装订,线装书还要恢复原貌,大小不等的便条要整齐地贴在里面,档案才能入库保存。
" 文字、声像、录音、图片,各种载体的档案都要数字化。现在大批量的是纸质档案的数字化工作。数字化,是为了把纸质档案变成数字化的档案,便于跨馆、跨区域、跨时空地利用。纸质档案的数字化,是其中非常重要的一部分。"
档案原件保存在库房,得以颐养天年
档案数字化以后,珍贵的原件便可以回到库房 " 颐养天年 " 了。档案库房,对于温湿度都是有规定的,要求温度控制在 14~24 ℃,相对湿度应控制在 45~60%,稳定的环境,能使档案得到妥善的保存。
江苏省档案馆的特藏库,是 " 镇馆之宝 " 的集中之地。馆藏珍贵档案,都保存在这个库房:有中国档案文献遗产《朋僚函札》《南京长江大桥建设档案》以及重点革命历史档案;有唐代以来的书画精品、明代诰命和清代翁同龢的题跋;还有 3 万多盒录像带、12 万张照片、5000 多枚印章等特殊载体档案 ……
其中,录像带保存了八九十年代江苏电视台播放的所有新闻类、专题类、文艺类等节目。老照片已经全部数字化了,属于公开档案的部分照片,在一楼查档大厅都能查阅到,而这些照片的原件就不再直接提供利用了。还有唱片档案,是从上世纪 20 年代至 60 年代的黑胶唱片,则保存了穿越近百年而来的声音,包括当时上海知名歌手周旋、京剧名家的唱片等等,这些现在基本上也都数字化了,但目前还没有上网公开。
" 这些全部要数字化,分期分批公开。" 江苏省档案馆法规宣教处处长张少敏说。
未来档案更 " 智慧 ",将实现全文检索
在江苏省档案馆,有一个区域,整齐排列着一排排大约一人高的柜子,柜子由一格格抽屉组成,抽屉里装着满了小卡片。蔡宜军介绍,这些是最初的纸质档案检索工具,比如人名卡片。在档案数字化之前,它们在早期的 " 大案牍术 " 中扮演着重要角色。
经过一段时间的发展和演变,现在,江苏省档案馆正在进行档案的全文数字化,也就是,把原来的档案变成计算机可以识别的图片格式文件,通过题名、责任者等著录项中的关键词来检索。
" 下一步的发展,是把档案转化成可以进行全文搜索的数据格式。加上现在各行各业形成的电子文档,这些都是可以进行全文数据检索的。" 蔡宜军说,以这为基础,才能实现档案的 " 大数据 " 管理、检索和应用。
国家档案局原局长、中央档案馆原馆长杨冬权也曾提出:" 档案数字化,是把纸质档案扫描成图片,这些图片上的档案内容,还需要人来解读,不能成为数据,由电脑来处理;今后,应该把这些图片转化为电脑可以读的字,变成电脑可以任意检索的数据,进入大数据系统,可以任意检索、主动推送、深度挖掘。" 这也就是 " 智慧档案 ",比现在的档案数字化更高级。因为档案数字化需要对扫描的档案进行文字识别、注录标题并输入电脑,工作量是非常巨大,难度也很大。今后全文内容识别的 OCR 技术更先进,但这也是未来必须要做的,是档案人的下一个目标方向和风口。
(编辑 周冬梅)
登录后才可以发布评论哦
打开小程序可以发布评论哦