兰台学苑

兰台学苑

  • 当前位置:首页   兰台学苑  兰台学苑
  • DA/T31—2017《纸质档案数字化规范》全文及解读

    2022-03-10发布单位:信息档案作者:发布人:喻灿荣审核人:

    △纸质档案数字化加工流程图,仅供参考

     

    纸质档案数字化规范

    DA/T31—2017

     

    1 范围

    本标准规定了纸质档案数字化技术和管理要求。本标准适用于采用扫描设备对纸质档案的数字化加工过程的管理。

     

    2 规范性引用文件

    下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

    GB/T 20530-2006 文献档案资料数字化工作导则

     

    DA/T 1 档案工作基本术语

     

    DA/T 18 档案著录规则

     

    ISO/TR 13028 信息与文献 档案数字化实施指南(Information and Documentation — Implementation guidelines for digitization of records)

     

     

    3 术语和定义

    GB/T 20530-2006、DA/T 1、DA/T 18界定的以及下列术语和定义适用于本文件。

    3.1数字化 digitization

    利用计算机技术将模拟信号转换为数字信号的处理过程。

    3.2数字图像digital image

    表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。

    3.3纸质档案数字化digitization of paper-based records

    采用扫描仪等设备对纸质档案进行数字化加工,使其转化为存储在磁带、磁盘、光盘等载体上的数字图像,并按照纸质档案的内在联系,建立起目录数据与数字图像关联关系的处理过程。

    3.4分辨率resolution

    单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。

     

    4 总则

    4.1 各单位应根据档案的珍贵程度、开放程度、利用率、亟待抢救程度、数字化资金情况等因素统筹规划、科学开展纸质档案数字化工作。纸质档案数字化工作的开展应遵循ISO/TR 13028和GB/T 20530提出的要求和建议。

    4.2 纸质档案数字化的基本环节主要包括:数字化前处理、目录数据库建立、档案扫描、图像处理、数据挂接、数字化成果验收与移交等。

    4.3 应采取有效的管理和技术手段,确保纸质档案数字化成果质量。纸质档案数字化应遵循档案管理的客观规律,真实反映档案内容,最大程度地展现档案原貌。

    4.4 纸质档案数字化过程中,应保存数字化项目信息、技术环境、数字化各类技术参数等方面的元数据。元数据元素的确定应符合ISO/TR 13028提出的要求。

    4.5 应加强纸质档案数字化各环节的安全管理,确保档案实体和档案信息的安全。

    4.6 加工涉密档案时,应按照涉密档案相关保密要求开展工作。

    5 组织与管理

    5.1 机构及人员

    5.1.1 应建立纸质档案数字化工作组织,对数字化工作进行统筹规划、组织实施、协调管理、安全保障、技术保障、监督检查、成果验收等,确保数字化工作的顺利开展。

    5.1.2 应配备具有相应能力的工作人员,包括熟悉档案业务并具有较高的调查研究水平和良好的组织领导能力的管理人员,熟悉相关标准规范并能够为纸质档案数字化工作各环节提供技术支持的技术人员,掌握一定数字化基础知识并熟悉本职工作的操作人员等。应通过科学规范的管理制度,对工作人员进行规范化管理。为强化数字化工作的安全性,应加强对外聘工作人员的审核。

    5.2 基础设施

    5.2.1 应配备专用加工场地,并进行合理布局,形成档案存放、数字化前处理、档案著录、档案扫描、图像处理、质量检查等工作区域。

    5.2.2 加工场地的选择及温湿度等环境的控制不应不利于档案实体的保护。场地内应配备可覆盖全部场地的防火、防水、防有害生物、防盗报警、视频监控等安全管理的设施设备。

    5.2.3 应合理规划、配备和管理纸质档案数字化设施设备,确保设施设备安全、先进,能够满足数字化工作的需要。

    5.3 工作方案

    5.3.1 应在充分调研的基础上,制定科学合理的工作方案,确保纸质档案数字化工作达到预期目标。

    5.3.2 纸质档案数字化工作方案应包括数字化对象、工作目标、工作内容、成本核算、数字化技术方法和主要技术指标、验收依据、人员安排、责任分工、进度安排、安全管理措施等内容。数字化对象的确定应综合考虑档案的珍贵程度、开放程度、利用率、亟待抢救程度、数字化资金情况等因素。

    5.3.3 宜对纸质档案数字化工作方案进行专家论证,确保其科学、规范、合理。

    5.3.4 纸质档案数字化工作方案应经审批后严格执行。工作方案审批结果应与数字化工作过程中形成的其他文件一并保存。

    5.4 管理制度

    5.4.1 应制定科学化、规范化的管理制度,并在工作过程中严格执行,以有效保障档案安全和纸质档案数字化成果质量。

    5.4.2 纸质档案数字化管理制度应包含岗位管理、人员管理、场地管理、设备管理、数据管理、档案实体管理等方面的制度。

    岗位管理制度主要规定数字化工作各岗位的工作目标和职责,形成明确的岗位业务流程规范、考核标准、奖惩办法等;人员管理制度主要对人员的安全责任、日常行为、外聘人员信息审核及管理、非工作人员来访登记等进行规范;场地管理制度主要对人员出入和工作场地内基础设施、环境、网络、监控设施、现场物品、证件等的管理进行规范;设备管理制度主要对数字化工作各环节涉及的全部设备的管理进行规范;数据管理制度主要对数字化各环节所产生的数据的管理进行规范;档案实体管理制度主要对档案实体在数字化过程中的交接、管理、存放等工作进行规范。

    5.5 工作流程控制

    5.5.1 应依据相关的法律法规和各类技术标准,制定相关的工作流程和各环节操作规范等,对纸质档案数字化全过程进行有效的控制,确保数字化成果质量。纸质档案数字化流程示例参见附录A。

    5.5.2 应加强对纸质档案数字化工作的全流程安全管理。

    5.5.3 应建立完善的问题反馈机制,对纸质档案数字化工作过程中后端环节发现前端环节中产生的问题进行及时反馈和修正。

    5.6 工作文件管理

    5.6.1 应根据情况制定符合实际要求的纸质档案数字化工作文件,以此加强对数字化工作的管理。主要包括纸质档案数字化工作方案、纸质档案数字化审批书、纸质档案数字化流程单、数据验收单、项目验收报告、纸质档案数字化成果移交清单等,采取外包方式实施时,还应包括项目招标文件、投标文件、中标通知书、项目合同、保密协议等。部分工作单示例参见附录B。

    5.6.2 应加强对纸质档案数字化工作文件的管理,明确数字化工作过程中形成的工作文件的整理、归档、移交等管理要求。

    5.7 档案数字化外包

    5.7.1 纸质档案数字化工作如需外包,档案部门应从企业性质、股东组成、安全保密、企业规模、注册资金情况等方面严格审查数字化加工企业的相关资质;按照GB/T 20530-2006第5章的要求评估数字化加工企业的技术能力;从规章制度的建立健全程度等方面考查加工企业的管理能力。

    5.7.2 在项目实施过程中,应依据《档案数字化外包安全管理规范》(档办发[2014]7号),从档案部门、数字化服务机构、数字化场所、数字化加工设备、档案实体、数字化成果移交接收与设备处理等层面执行严格的安全管理要求。

    5.7.3 档案部门应指派专门人员参与纸质档案数字化外包业务的监督、指导,完成质量监控、进度监控、投资监控、安全监控和协调沟通等方面的工作。

     

    6 档案出库

    6.1 档案保管部门应按照纸质档案数字化工作方案确定的数字化对象开展档案调取、清点、登记等前期准备工作,并提交档案出库申请,经相关责任人批准后,严格按照档案库房管理规定为数字化对象办理出库相关手续,并与数字化部门共同清点无误后,对档案进行交接出库。

    6.2 纸质档案数字化过程中,应设置距离数字化加工场所较近的保管库用以临时存放纸质档案,并对纸质档案的领取与归还进行严格管理,认真做好检查、清点、登记等工作,确保纸质档案的安全。

     

    7 数字化前处理

    7.1 确定扫描页

    原则上应将确定为数字化对象的纸质档案全部扫描,不宜进行挑扫。如有不需要扫描的页面应加以标注。

    7.2 编制页号

    7.2.1 应对没有页号或页号不正确的档案重新编制页号。

    7.2.2 重新编制页号时,应在统一位置书写页号,且不压盖档案内容。

    7.2.3 书写页号所使用的笔、墨等不应破坏档案原件或对档案长期保存造成影响。

    7.2.4 应将破损页面、缺页等特殊情况进行登记。

    7.3 目录数据准备

    7.3.1 按照目录数据库建立时制定的数据规则,对照档案原件内容,规范档案中的目录内容。

    7.3.2 对需在目录数据库中进行标记的情况进行标记。

    7.4 拆除装订

    应以对纸质档案的保护为原则确定是否拆除装订。如需拆除装订物,应注意保护档案不受损害,并对排列顺序不准确的档案进行重排。特殊装订且拆除装订后需恢复的档案,在拆除装订物时应采用拍照等方式记录档案原貌,以便于恢复。

    7.5 技术修复

    7.5.1 破损严重或其他无法直接进行扫描的纸质档案,应先由专业技术人员进行技术修复。

    7.5.2 折皱不平影响扫描质量的纸质档案应先进行压平等相应技术处理。

    8 目录数据库建立

    8.1 应制定目录数据库数据规则,包括数据字段长度、字段类型、字段内容要求等。目录数据库数据规则的制定应符合DA/T 18对档案著录的要求。在纸质档案目录准备与目录数据库建立工作中均应严格遵守。

    8.2 数据库选择应考虑可转换为通用数据格式,以便于数据交换。

    8.3 数据库结构的设计应特别注意保持档案的内在联系,有利于纸质档案数字化成果的管理和利用。

    8.4 将纸质档案数字化前处理工作中对纸质档案目录进行修改、补充的结果录入数据库,形成准确、完整的目录数据。

    8.5 可采用计算机自动校对与人工校对相结合的方式,对目录数据的质量进行检查,包括著录项目的完整性、著录内容的规范性和准确性等。发现不合格的数据应及时进行修改。

    9 档案扫描

    9.1 基本要求

    档案扫描应根据纸质档案原件实际情况、数字化目的、数字化规模、计算机网络和存储条件等选择相应的扫描设备,和进行相关参数的设置和调整。参数的设置和调整应保证扫描后数字图像清晰、完整、不失真,图像效果最接近档案原貌。

    9.2 扫描设备

    9.2.1 扫描设备的选择应特别注意对档案实体的保护,尽量采用对档案实体破坏性小的扫描设备进行数字化。

    9.2.2 超出所使用扫描仪扫描尺寸的档案可采用更大幅面扫描仪进行扫描,也可以采用小幅面扫描仪分幅扫描后进行图像拼接的方式处理。分幅扫描时,相邻图像之间应留有足够的重叠,并且采用标版等方式明确说明分幅方法;若后期采用软件自动拼接的方式,重叠尺寸建议不小于单幅图像对应原件尺寸的1/3。

    9.2.3 应遵循相关设备的使用规律进行定期维护、保养。

    9.3 扫描色彩模式

    9.3.1 为最大限度保留档案原件信息,便于多种方式的利用,宜全部采用彩色模式进行扫描。

    9.3.2 页面中有红头、印章或插有照片、彩色插图、多色彩文字等的档案,应采用彩色模式进行扫描。

    9.3.3 页面为黑白两色,并且字迹清晰、不带插图的档案,也可采用黑白二值模式进行扫描。

    9.3.4 页面为黑白两色,但字迹清晰度差或带有插图的档案,也可采用灰度模式扫描。

    9.4 扫描分辨率

    9.4.1 扫描分辨率的选择,应保证扫描后图像清晰、完整,并综合考虑数字图像后期利用方式等因素。

    9.4.2 扫描分辨率应不小于200dpi。如文字偏小、密集、清晰度较差时,建议扫描分辨率不小于300dpi。

    9.4.3 如有COM输出、仿真复制、印刷出版等其他用途时,可根据需要调整扫描分辨率。需要进行COM输出的档案,扫描分辨率建议不小于于300 dpi;需要进行高精度仿真复制的档案,扫描分辨率建议不小于600 dpi;需要进行印刷出版的档案,可结合档案幅面、印刷出版幅面、印刷精度要求等选择合适的分辨率。

    9.5 存储格式

    9.5.1 纸质档案数字图像长期保存格式为TIFF、JPEG或JPEG2000等通用格式,图像压缩率的选择可根据实际应用的需求而定。

    9.5.2 纸质档案数字图像利用时,也可从网络浏览速度、易操作性、存储空间占用等方面进行综合考虑,将图像转换为PDF等其他格式。

    9.5.3 同一批档案应采用相同的存储格式。

    9.6 图像命名

    9.6.1 应以档号为基础对数字图像命名。图像命名方式的选择应确保图像命名的唯一性。

    9.6.2 建议将数字图像存储为单页文件,并按档号与图像流水号的组合对图像命名。

    9.6.3 数字图像确需存储为多页文件时,可采用该档案的档号对图像命名。   

    9.6.4 应科学建立纸质档案数字图像的存储路径,确保数据挂接的准确性。

     

    10 图像处理

    10.1 图像拼接

    对分幅扫描形成的多幅数字图像,应进行拼接处理,合并为一个完整的图像,以保证纸质档案数字图像的整体性。拼接时应确保拼接处平滑地融合,拼接后整幅图像无明显拼接痕迹。

    10.2 旋转及纠偏

    对不符合阅读方向的数字图像应进行旋转还原。对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。

    10.3 裁边

    如需对数字图像进行裁边处理,应在距页边最外延至少2至3毫米处裁剪图像。

    10.4 去污

    如需对数字图像进行去污处理,以去除在扫描过程中产生的污点、污线、黑边等影响图像质量的杂质,应遵循展现档案原貌的原则,处理过程中不得去除档案页面原有的纸张褪变斑点、水渍、污点、装订孔等痕迹。

    10.5 图像质量检查     

    10.5.1 数字图像不完整、无法清晰识别或图像失真度较大时,应重新扫描。

    10.5.2 对于漏扫、重扫、多扫等情况,应及时改正。

    10.5.3 数字图像的排列顺序与档案原件不一致时,应及时进行调整。

    10.5.4 对数字图像拼接、旋转及纠偏、裁边、去污等处理情况进行检查,发现不符合图像质量要求时,应重新进行图像处理。

    11 数据挂接

    11.1 应借助相关软件对数据库中的目录数据与其对应的纸质档案数字图像进行挂接,以实现目录数据与数字图像的关联。

    11.2 逐条对挂接结果进行检查,包括目录数据与纸质档案数字图像对应的准确性、已挂接数字图像与实际扫描数量的一致性、数字图像是否能正常打开等,发现错误及时进行纠正。

    12 数字化成果验收与移交

    12.1 验收方式

    12.1.1 建议档案部门成立专门的验收组对纸质档案数字化成果进行验收。

    12.1.2 应采用计算机自动检验与人工检验相结合的方式对纸质档案数字化成果进行验收检验。

    12.2 验收内容

    12.2.1 纸质档案数字化成果包括数字图像、档案目录数据、元数据、数字化工作中产生的工作文件、存储载体等。

    12.2.2 应对目录数据进行验收,主要包括数据库中各条目的内容、格式等的准确程度、必填项是否填写等。

    12.2.3 应对元数据进行验收,主要包括元数据元素的完整性和赋值规范性等。

    12.2.4 应对数字图像进行验收,主要包括数字化参数、存储路径、命名的准确性、图像的完整性、排列顺序的准确性、图像质量等。

    12.2.5 应对数据挂接进行验收,主要包括目录数据与其对应的数字图像的挂接的准确性等。

    12.2.6 应对工作文件进行验收,主要包括工作文件的完整性、规范性等。

    12.2.7 应对存储载体进行验收,主要包括载体的可用性、有无病毒等。

    12.3 验收指标

    能够采用计算机自动检验的项目应采用计算机自动检验的方式进行100%检验,检验合格率应为100%。对于无法用计算机自动检验的项目,可根据情况以件或卷为单位采用抽检的方式进行人工检验。抽检比率不得低于5%,对于数据库条目与数字图像内容对应的准确性,抽检合格率应为100%,其他内容的抽检合格率应不低于95%。

    12.4 验收结论

    12.4.1 每批纸质档案数字化成果质量检验达到本标准12.2和12.3的要求,予以验收“通过”。验收未通过应视情况进行返工或修改后,重新进行验收。

    12.4.2 验收完成后须经验收组成员签字。验收“通过”的结论,必须经相关领导审核、签字后方有效。

    12.5 移交

    验收合格的数据应按照纸质档案数字化工作方案及时移交,并履行交接手续。移交单示例参见附录B。

     

    13、档案归还入库

    13.1 档案装订

    纸质档案数字化工作完成后,拆除过装订物的档案如需装订,应注意保持档案原貌,做到安全、准确、无遗漏。

    13.2 档案归还入库

    按照档案入库相关要求对纸质档案进行处理和清点,并履行档案入库手续。

     

     

    以下为DA/T 31—2017《纸质档案数字化技术规范》 解读

      

      近年来,在纸质档案数字化工作迅速推进的同时,纸质档案数字化对象、管理与利用方法以及技术条件等都在不断发展。因此,及时修订DA/T 31—2005《纸质档案数字化技术规范》,适时调整相关要求,对科学规范纸质档案数字化工作具有重要的现实意义。2017年8月2日,DA/T 31—2017《纸质档案数字化规范》正式发布,并于2018年1月1日起正式实施。

    修订思路

    1 与有关标准相协调

    在标准修订过程中,课题组特别注意与相关标准的协调,主要体现在以下方面:

    首先,按照GB/T 1.1—2009《标准化工作导则 第1部分:标准的结构和编写原则》的规定和要求编写,在修订过程中,遵循GB/T 20000《标准化工作指南》、GB/T 20001《标准编写规则》、GB/T 20002《标准中特定内容的起草》等基础性标准的要求。其次,保持与DA/T 31—2005相关要求的连贯性,汲取其精华内容。但同时也与时俱进,紧跟技术发展趋势,对相关管理、技术提出恰当要求。再次,既保持与国际标准ISO/TR 13028《信息与文献 档案数字化实施指南》和国家标准GB/T 20530—2006《文献档案资料数字化工作导则》等标准的一致性,又突出我国现阶段及未来档案工作发展的特色。

    2 增加管理要求

    DA/T 31—2005主要从技术角度对纸质档案数字化工作提出要求,对管理方面的内容涉及较少。随着纸质档案数字化工作的推进,实际工作中对纸质档案数字化工作标准化管理需求愈加急迫。因此,在修订过程中,课题组特别对纸质档案数字化工作的组织和管理进行了详细设计,并提出了明确要求。为此,此次修订将标准名称由《纸质档案数字化技术规范》修改为《纸质档案数字化规范》。

    3 细化和调整技术要求

    纸质档案数字化工作在很大程度上依赖于信息技术,而信息技术的迅速发展使相关技术条件也发生了很大变化。及时对技术要求进行细化和调整,使之符合当前纸质档案数字化工作的实际需求是此次修订的一项重要任务。

    4 强化安全要求

    安全是档案工作的重中之重,随着纸质档案数字化工作的广泛开展,特别是在任务量巨大的情况下,很多单位采取了外包方式开展纸质档案数字化工作,其安全问题不容忽视。此次修订特别注重对档案安全(包括档案实体安全和档案信息安全)的保障,从管理和技术等不同角度对其进行规范。

    部分内容解读

    1 组织与管理

    在纸质档案数字化工作广泛开展的今天,科学规范的管理工作对于确保数字化成果质量和数字化工作效率具有十分重要的意义。课题组希望通过对相关章节内容的完善,使纸质档案数字化管理工作更加系统化、科学化,从而便于纸质档案数字化管理工作的规范化开展。

    具体内容集中体现在标准第5章,内容包括机构及人员、基础设施、工作方案、管理制度、工作流程控制、工作文件管理、档案数字化外包等,基本涵盖了纸质档案数字化管理工作的全部内容。管理工作的实施,应达到确保档案安全、提高档案数字化成果质量、提高工作效率的目标。

    2 数字化前处理

    此次修订将DA/T 31—2005的“档案整理”更名为“数字化前处理”,并对其内容进行了完善,主要包括确定扫描页、编制页号、目录数据准备、拆除装订、技术修复等。这一章的修订重点突出了两方面的思想:一是建议纸质档案数字化全部扫描,不建议进行挑扫;二是保护档案原件。“全部扫描”主要体现在“确定扫描页”部分,主要目的是确保档案信息完整,同时避免对纸质档案进行二次扫描。“档案保护”思想则贯穿整章内容。

    例如,针对档案数字化过程中是否拆除装订物这一问题,DA/T 31—2005要求:“在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物”。此次修订,要求从对档案保护的角度出发,如钢锭装订的档案,随着时间的推移,钢锭生锈,会破坏档案,对于这种情况,就应该建议拆除钢锭装订,改用线装。如果装订本身具有历史特色,就要慎重考虑是否需要恢复原装订和能否恢复原装订。

    为此,DA/T 31—2017规定:“应以对纸质档案的保护为原则确定是否拆除装订”“特殊装订且拆除装订后需恢复的档案,在拆除装订物时应采用拍照等方式记录档案原貌,以便于恢复”。

    3 技术参数

    随着时代的发展,纸质档案数字化成果需求逐渐趋于多样化,同时,由于技术条件发展迅速,使存储成本等方面的限制逐渐淡化。因此,纸质档案数字化技术参数的选择需多元化、细化,才能满足不同需求。同时,也要遵循一个原则,即对纸质档案原件的保护,尽量只动一次纸质档案,就满足多重利用需求。

    1)色彩模式

    色彩模式是数字世界中表示颜色的一种算法。扫描仪的色彩模式一般分为彩色、灰度、黑白3种色彩模式。色彩模式选择,应考虑多种因素:①原件情况。对于影像清晰、档案原件色彩简单、色彩对比强烈的原件,如白纸黑字的普通打印文件,在其他条件均达到最佳的情况下,采取3种色彩模式扫描的图像清晰程度差异不明显。而对于影像不够清晰,以及色彩对比不够强烈的原件,采取彩色模式扫描的图像,在展现档案原件细节、清晰程度等方面要明显优于灰度模式或黑白模式扫描的图像。

    ②硬件条件。过去,由于硬件条件的限制,一般会综合考虑图像质量、访问速度、存储成本等方面的因素选择色彩模式。而随着技术的进步,硬件考量因素将越来越被弱化。

    ③后期应用。彩色模式可以转换为灰度模式或黑白模式,所以,为了尽可能多地采集信息,彩色模式无疑是最理想的选择,对后期应用也是较为灵活的选择。但是,也有例外情况。对于需要进行COM输出的档案,色彩模式对输出效果的影响与缩微胶片输出设备可接受的图像色彩模式有很大关系。

    例如,国内使用的一部分缩微胶片输出设备只能接受黑白色彩模式的图像,如扫描为彩色模式的图像需转换为黑白模式方可进行输出,这与直接扫描成黑白模式的图像输出效果相比,后者的效果更佳。所以,在制定纸质档案数字化方案时,在条件允许的情况下,应尽量避免格式转化,以减少信息损失。如果无法避免格式转化,则应根据原件情况、软件情况等制定合理的方案,将信息损失降到最低。

    结合课题组的调研结果,从最大程度保留原件信息的角度考虑,标准建议在进行批量数字化的过程中,应尽量将其扫描成彩色模式。同时此次修订提出必须扫描成彩色模式的情况,即“页面中有红头、印章或插有照片、彩色插图、多色彩文字等的档案,应采用彩色模式进行扫描。”此外,考虑到我国各级各类档案部门差异,要求全部扫描成彩色模式不够现实。因此,此次修订提出了可扫描成黑白模式和灰度模式的情况。

    2)分辨率

    分辨率是指扫描设备对扫描对象每英寸的采样点数。分辨率与扫描图像大小和清晰程度以及扫描时长都有直接关系。扫描图像分辨率越高,所占用的扫描时间越长,扫描形成文件也会越大,图像清晰程度相对越好。但是,通过采用技术标板测试研究可知,当分辨率的设置达到一定程度时,分辨率的增加不会明显改善清晰程度,但是却会大大增加存储空间。所以,在实际工作中,应根据可接受的图像大小和清晰程度的实际情况来选择合适的分辨率。

    在现有技术条件下,综合考虑不同档案馆基础条件的差异,标准提出:“扫描分辨率应不小200DPI,如文字偏小、密集、清晰度较差时,建议扫描分辨率不小于300DPI”的一般原则。当然,如果扫描后的档案还需进行后续处理和利用的话,分辨率的选择则应考虑利用需求因素。例如,进行COM输出的图像分辨率不应低于300DPI,进行仿真复制的数字图像分辨率不应低于600DPI。

    3)存储格式

    存储格式即图像文件存放在计算机存储设备上的格式。目前,常用的图像存储格式主要有TIFF、JPEG、JPEG2000、PDF、OFD等,不同格式适用的应用场景不同。TIFF存储信息量大,适用于图像的长期存储;JPEG具有调节图像质量的功能,允许用不同的压缩比例对文件进行压缩,方便在图像质量和文件大小之间找到平衡点;而提供网络应用时,则建议存储为PDF、OFD格式。值得一提的是,在“对纸质档案只动一次”的原则下,应首先满足档案长期安全保存的需要。

    4 图像处理

    随着信息技术的发展,存储设备成本将呈下降趋势。而纸质档案数字化成果的利用则是一个长期过程,应用方式也多种多样。因此,需要对图像质量进行严格控制。当图像质量与存储空间存在矛盾时,课题组始终坚持将数字化图像质量作为主要考量因素,将图像占用的存储空间作为次要考量因素的原则。因此,此次修订去掉了一些节省存储空间的处理原则。在执行该标准开展图像处理工作时,也应时刻坚持上述原则。

    5 成果验收

    DA/T 31—2005相比,DA/T 31—2017对纸质档案数字化成果验收环节的要求进行了较为详细的划分。验收内容主要包括:数字图像、档案目录数据、元数据、数字化工作中产生的工作文件、存储载体等指标。验收方式的选择对数字化成果质量的保障也具有关键作用。随着信息技术的发展,计算机自动检测的方法更为多样,范围更为广泛。

    目前,纸质档案数字化成果质量检查软件正日趋成熟,在标准中提出并提倡采用计算机自动检测的要求具备相应的技术条件。为此,课题组针对档案数字化成果验收指标进行细分,对于能够通过计算机程序自动化方式验收的指标,提出100%验收比率和100%合格率的要求。对于无法采用计算机程序自动化验收的指标,根据具体情况提出不同的合格率要求。