档案数字化工作流程
档案数字化是指把纸质的档案转化为电子档案然后保存到相应的管理软件中方便储存,和后期的调用,那么正常的档案数字化流程是什么样的呢?简单的来说是大致分为整理-扫描-编目-储存。
操作方法
- 01
一、术语和定义 1、数字化 用计算机技术将模拟信号转换为数字信号的处理过程。 2、纸质档案数字化 采用扫描仪或数码相机等数码设备对纸质档案进行数字加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。 3、数字图像 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。 4、黑白二值图像 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。 5、连续色调静态图像 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。 6、分辨率 单位长度内图像包含的点数或像 素数,一般用每英时点数(dpi)表示。 7、失真度 对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。 8、可懂度 数字图像向人或机器提供信息的能力。 9、图像压缩 清除图像冗余或图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。
- 02
二、纸质档案数字化基本要求 1、基本原则 纸质档案数字化的基本原则是使档案信息资源准确方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。 2、数字化对像的确定原则 应当对所要进行数字化的对象按照一定的原则和方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化。
- 03
1)符合国家法律法规的原则 纸质档案的数字化,必须符合国家档案开放规定以及有关规定。 2)价值性原则 属于归档范围且应永久或长期保存的、社会利用价值高的档案可列入数字化加工的范围。 3、基本环节 纸质档案数字化的基本环节主要包括:档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。
- 04
档案扫描 1、扫描方式 1)根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。 2)纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。 2、扫描色彩模式 1)扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。 2)页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。 3)页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。 4)页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。 3 、扫描分辨率 1)扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。 2)采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建议选择≥200dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。 3)需要进行OCR汉字识别的档案,扫描分辨率建议选择≥300dpi。
- 05
图像处理 1 、图像数据质量检查 1)对图像偏斜度、清晰度、失真度进行检查。发现不符合图像质量要求时,应重新进行图像的处理。 2)由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。 3)发现文件漏扫时,应及时补扫并正确插入图像。 4)发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。 5)认真填写相关表单,记录质检结果和处理意见。 2、纠偏 对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。 3、去污 对图像页面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理。
- 06
数据关联 以纸质档案目录数据库为依据, 将每一份纸质档案文件扫描所得的一个或多个图像存储为一 份图像文件。 将图像文件存储到相应文件夹时, 要认真核查每一份图象文件的名称与档案目 录数据库中该份文件的档号是否相同, 图像文件的页数与档案目录数据库中该份文件的页数 是否一致, 图像文件的总数与目录数据库中文件的总数是否相同等。