logo资料库

数字档案馆系统设计案例.doc

第1页 / 共5页
第2页 / 共5页
第3页 / 共5页
第4页 / 共5页
第5页 / 共5页
资料共5页,全文预览结束
功能需求分析* ——数字档案馆系统设计之一 金更达 何达多 何嘉荪* (浙江大学档案馆·310028) 【摘要】本文首先分析了数字档案馆所面临的信息环境、多样化管理对象和多元化管理目标, 然后提出了数字档案馆系统建设的九大功能需求。 【关键词】数字档案馆,功能需求 Analysis of Function Requirements for Digital Archive System Jin Gengda,He daduo, He Jiasun (Zhejiang University Archive, 310028) 1.引言 政府信息化工程的快速发展,既给档案事业的发展提供了前所未有的机遇,同时又构成 了对档案事业建设和发展的严峻挑战。如何使档案信息化与政府信息化建设同步发展,已成 为档案馆一项重要而紧迫的任务。近年来,国内外档案及相关领域为应对大量产生的数字信 息,特别是政府数字信息,使之不因时间的推移、技术的改变而持续有效并且以之为基础对 外提供原始、权威、真实、完整、一致的数据与服务给用户所带来挑战,对数字档案馆的实 用技术和应用方案进行了相关的理论探讨和实践,使数字档案馆不仅是当今档案管理研究的 一大热点,而且也成为了我国档案事业发展的战略重点。 我国关于数字档案馆的研究起步较迟,据不完全统计和文献分析,我国学术界对数字档 案的研究主要体现在对数字档案馆的认识、概念定义、作用、模式、如何建设和发展趋势以 及数字档案馆建设介绍等方面1,对数字档案馆理念、建设目标、功能需求及其实现方法、 标准规范等都未形成统一的认识①。相比之下,我国数字档案馆建设实践却走在理论研究的 前面。然而,由于缺乏理论指导和相关标准滞后,我国目前已经在建的数字档案馆项目呈现 出各自为政的现象,同时我国大多数数字档案馆项目仍处于观望阶段。鉴于此,本文旨在为 成功建设数字档案馆而提出其概要的功能需求,以作为制订数字档案馆系统设计方案的基 础。 2.数字档案馆概念 关于数字档案馆到目前为止还没有一个比较统一的定义。何嘉荪教授认为:“数字档案 馆不仅仅是馆藏得到数字化以及管理工作实现了信息化的档案馆和档案馆群体;它实质上是 一个通过计算机互联网络有序处理和集成管理在结构各异的多种信息平台上产生的、多样化 的电子文件、档案以及其他信息,确保这些数字信息资源的真实性、完整性和持久有效性, 并实现上述信息资源跨库共享的超大规模、分布式和可扩展的数字信息系统。”②为实现建设 上述数字档案馆的目标,首先应该了解数字档案馆所面临的信息环境、管理对象和目标。 2.1 复杂的信息环境 * 本论文属浙江省档案局科技项目《数字档案馆系统整体解决方案研究》(项目编号:2005-R-1)的研究成果。 * 金更达,浙江大学档案馆,副研究馆员,发文 30 余篇,Email:jgd@lib.zju.edu.cn,电话:0571-88273302; 何达多,浙江大学档案馆馆长,副研究馆员,EMAIL:hdd@zju.edu.cn,电话:0571-88273051; 何嘉荪,浙江大学信息资源管理研究所教授,Email: profhejs@mail.hz.zj.cn ; 1 截止 2005 年 1 月 29 日为止,清华学术期刊全文数据库中篇名包含“数字档案馆”的论文共有 194 篇。 —1—
随着社会信息化进程的加速发展,数字档案馆将面临复杂的信息环境,这种信息环境 的复杂性集中体现在电子文件系统的分布式和异构性。所谓分布式是指数字资源及其所依赖 的系统并非存储于同一个场地的计算机存储设备上,而是分散地存储在各个相关的不同场地 上,并可通过网络将它们连结在一起。所谓异构性是指电子文件所依赖的系统是异构的,不 仅表现为系统平台与应用平台的异构性,而且表现为数据结构、数据模型、数据格式等方面 的结构各异。造成信息环境复杂性的主要原因在于缺乏统一的建设标准和系统模型,致使各 地各部门如雨后春笋般涌现出来的办公自动化、电子政务工程形成了各自为政的局面,直接 导致了分布式异构系统的急剧增加,并对档案部门实施电子文件管理带来了诸多的难题。具 体而言,这些难题表现为在电子文件的捕获、真实性保障、电子文件长期保存、存储管理和 一体化检索服务等方面的系列问题。 2.2 多样化的管理对象 如前所述,数字档案馆不仅仅是馆藏得到数字化以及管理工作实现了信息化的档案馆和 档案馆群体;它实质上是一个通过计算机互联网络有序处理和集成管理在结构各异的多种信 息平台上产生的、多样化的电子文件、档案以及其他信息。因此,它的任务,在提倡政务信 息公开和向整个社会提供现行文件服务的今日,不能如以前的传统档案馆一样,仅仅负责管 理“运动到最后阶段藏入档案馆的文件”——档案。因而,数字档案馆馆藏的来源主要应该 有以下渠道: (1) 传统管理的档案目录数据库; (2) 已经储存在传统档案馆中的传统载体档案文件的数字化; (3) 在电子政务系统、电子商务系统以及各种业务信息系统中形成的电子文件。 除第 1 、2 种渠道的信息资源之外,目前数字档案馆必须面对和加以管理的是大量的、 在馆外多种多样结构各异的计算机技术平台中形成的现行电子文件、档案和其他信息资源。 这些文件和档案不可能具有统一的结构,有些是非结构化数据(如 WORD 文件),有些是结构 化数据(如数据库文件),有些又是半结构化数据(如邮件文件),就是说这些电子文件既具 有异构性,同时又具有多样性,而且是分布存放在上述结构各异的信息系统平台之中。 2.3 多元化的建设目标 关于数字档案馆的理论研究与实践,国外起步较早,而且发展很快。以欧、美为代表的 发达国家从 20 世纪 90 年代初就开始从理论和概念上对数字档案馆进行了研究与探讨③。以 美国为例,20 世纪 90 年代中期,作为美国数字化图书馆建设项目的组成部分,美国国家档 案与文件管理局(National Archives and Records Administration,简称 NARA)启动了 数字档案馆建设计划,并成立了数字档案馆特别工作小组,开始进行数字档案馆的研究和建 设工作,并于 2000 年建立了数字档案馆系统④ 。据文献分析,国外关于数字档案馆的建设 目标主要在于三个方面:首先是保证数字信息的真实性、权威性和完整性;其次是确保数字 信息的长久有效性,不因时间的移转、技术的改变而无法持续长久地提供利用;第三,确保 每一个公民都有平等使用数字信息的能力和权力⑤。 除上述三个目标之外,笔者认为,面对复杂的信息环境和多样化的电子文件,数字档案 馆还应具有以下目标: (1)数字档案馆应具有传统档案辅助管理功能。笔者认为,数字档案馆是从传统档案 馆发展而来,因此,数字档案馆必须具有辅助管理传统档案的功能,而且这些管理功能在数 字档案馆中应得到极大的优化,使管理更为科学、有效。 (2)集成管理分布式存储的、具有多样性和异构性的电子文件。集成(integration) 含综合、融合、整合成为整体和一体化的意思,其哲学内涵是指由系统的整体性及系统核心 的统摄、凝聚作用而导致的使若干相关部分或因素合成为一个新的统一整体的建构及其有序 化过程⑥。对数字档案馆而言,集成可以分为三个层面,即系统集成、数据集成和服务集成。 —2—
“系统集成”指的是形成、运行、管理、储存和输出电子文件的系统平台相互之间的集成; “数据集成”指的是多样性的电子文件(包括元数据)以及其他信息资源在内的集成。这两 种“集成”综合起来又可以称为对电子文件的集成管理,我们认为,它是依托系统的运行特 点、模式和目标,以现代 IT 技术为手段,对系统运行全过程进行的全方位的有效管理。这 种管理,具体而言是“对多种系统平台以及产生于其中的电子文件——具有分布性、自治性 和异构性的电子文件运动全过程施行的,足以保障电子文件真实性的,动态的、有效的和全 方位的综合统一管理”⑦。 (3)通过集成管理和建立电子文件实时捕获和共享机制,消除信息孤岛现象,根据特 定权限和保密规定有效实现为整个社会提供现行文件服务以及档案信息资源的共享,并能够 为不同类型的用户群体提供有效的档案信息资源服务。 3.数字档案馆功能需求 根据上述对数字档案馆的理解,我们认为,目前数字档案馆建设必然具有以下需求。 3.1 根据“前端控制”原则,促进在电子政务系统和各种业务系统中实现电子文件的“档 案化”管理,从而在源头确保自己管辖和即将管辖的电子文件的真实性、完整性和有机关 联性。 电子政务的实施势必产生大量的电子文件,档案馆有责任完整地捕获这些电子文件,并 确保这些电子文件的真实性、完整性和有机关联性。然而由于电子文件的特性以及所处信息 环境的复杂性,按传统档案的收集方法(事后收集)难以确保电子文件的真实性、完整性和 有机关联性。根据电子文件管理国际标准 ISO15489,对电子文件的管理应该采用“全程管 理”原则,保证电子文件在整个生命周期内都能受到档案部门统一、严密的控制。为此必须 利用元数据,实现对电子文件的全程管理。具体而言,应该采用“前端控制”原则,在电子 政务系统中实现对电子文件的“档案化”管理,也就是说,以元数据为控制工具和采取网络 实时捕获等手段,在电子文件形成或处理过程中就确保并且能够证明电子文件的真实性、完 整性和有效性。可以说“前端控制”是实现电子文件全程管理的重要保障,是全面、系统、 优化思想的集中体现;是确保电子文件真实可靠、完整安全、长期可读的有效策略;也是优 化管理功能,提高管理效率的科学理念。 3.2 传统档案信息资源的数字化。 传统档案信息资源数字化是数字档案馆的基础,是国家档案信息化的重要组成部分。数 字化应包含两个层面的含义,一是指传统档案通过数字化技术(如扫描、OCR 技术、多媒体 技术等)形成可供网络浏览或检索的数字资源;二是为这些数字资源建立相关的元数据信息。 数字档案馆系统必需包含将传统档案信息资源数字化的相关工具。 3.3 自动实时捕获现行电子文件及其元数据。 在传统档案管理中,档案馆档案的收藏一般情况下是在它们形成以后十年到二十年以后 进行的,并且必须采取相关立档单位上交、档案馆接收的模式。档案部门在这种模式中扮演 的基本上是一种“事后”以及“被动”的角色。也就是说,只能在文件形成若干时间以后接 收;以及如果相关立档单位不交,也就无法接收。然而,把这种模式移植到电子文件管理和 数字档案馆建设中,却是无法接受的。这是因为一方面,数字档案馆必须也能向用户提供现 行文件服务;另一方面也是因为计算机网络系统的脆弱性,使得数字档案馆无法完全排除来 自网络的各种危害;再加上数字信息对系统的依赖性、易逝性和易篡改性等特征,尽管在电 子政务中实现了前端控制和档案化管理,也很难保证档案部门在这种事后接收模式中收到的 所有电子文件都具有真实性。所以,文件管理国际标准 ISO15489 规定,档案部门有责任实 时主动捕获现行电子文件及其元数据,即在文件正式形成或(立档单位外来收文)收到时就 由档案部门捕获,并对其实施统一、严密的控制。国家标准:GB/T 18894-2002(电子文件归 —3—
档与管理规范)第 7.3 款也规定,电子文件的“逻辑归档可实时进行”,国家档案局 2003 年 7 月下发的《电子公文归档管理暂行办法》第六条更规定电子公文一般应在办理完毕后即时 向机关档案部门归档。可以说实时主动捕获电子文件及其元数据是优化档案管理功能和提高 管理效率的科学理念,也是实现电子文件“前端控制”和“全程管理”的又一措施。它既有 利于保障电子文件的真实性,使档案部门能够在第一时间掌握电子文件的最权威版本,从而 对电子文件实施统一严密的控制,同时也打破了传统档案管理被动接收的模式。 3.4 对分布存储的具有多样性、异构性的电子文件进行集成管理并且确保其长期有效。 数字档案馆管理的电子文件、档案和其他信息资源,必须采取集中式与分布式相结合的 储存方式。集中式储存的一般情况下是需要永久保存的电子档案;分布式储存的则是现行电 子文件和不需要进档案馆永久保存的电子档案。有鉴于此,数字档案馆必须大量面对和加以 管理的,是在多种多样结构各异的计算机技术平台中形成的电子文件、档案和其他信息资源。 它们不仅没有统一的结构,而且具有多样性和异构性、甚至是复合的文件并且分布存放在上 述结构各异的信息系统平台之中。为此,数字档案馆系统必须能够支持对分布存放在外部多 种异构信息系统平台中和集中存放在数字档案馆自身存储器中的数字对象的集成管理。 所谓长期有效性是指电子文件在整个生命周期中都能够被有效利用和阅读。为应对电子 文件的“范式转换”(软硬件环境的升级换代),数字档案馆系统应能支持两种存储模式: “位”存储和“功能”存储。位存储保证电子文件没有任何改变,即每一位(bit)均保持 原样。功能存储的实现是通过随着时间的变化改变存储内容的格式,以保证当旧有格式淘汰 后,电子文件还能够被随时调用(可浏览、可运行、可检索等),即保证电子文件的长期有 效性。对于档案馆而言,位存储保证了电子文件的原始性,而功能存储则是保障电子文件长 效性的理想的存储状态。 3.5 对档案信息资源进行深层次开发利用。 档案信息资源的深层次开发利用是档案馆面临的一项重要工作。数字档案馆除了必须具 备对档案信息资源进行组织分类、标识和统一检索的功能之外,还应具备强有力的、能够建 设专题档案信息资源库和进行管理的编研工具。 3.6 对电子文件保管处置的业务流程进行智能化处理。 档案保管处置是档案馆的日常工作。在传统档案管理中,档案的保管处置是被动进行的, 工作人员必须亲自查询(哪些档案保管期限或者保密期限已经届满等等…..),否则很难详 细完整地了解档案保管处置的实际状况,以便及时进行处置。为应对这个问题,在数字档案 馆系统中,必须实现对电子文件保管处置业务流程智能化处理的功能,即由系统自动判别并 形成档案保管处置工作任务和自动发送消息通知工作人员进行相应的处置。 3.7 实现对分布式、异构信息资源的跨库检索。 由于数字档案馆处理和集成的电子文件、档案具有分布性、异构性和多样性,这就要求 数字档案馆系统本身具有高度的可扩展性。由于这些信息资源分布在不同的数据库中,而且 这些数据库具有分布性和异构性,对实现档案信息资源的共享利用带来了极大的障碍,因而 跨库检索极为必要。 3.8 以用户为中心的网络信息服务。 为用户服务是建设数字档案馆的目的,为此必须根据档案信息化建设的要求,采取以用 户为中心的网络信息服务模式,对用户群体进行分类,针对不同的用户提供不同的网络信息 服务。 3.9 建立完善的数字档案馆安全保障体系。 安全保障体系是数字档案馆正常运行的关键环节,可以划分为四个部分:第一,为切实 保证保密文件和档案的绝对安全,从物理上区隔保密网、内部网和公众网是完全必要的。数 字档案馆系统必须适应这一要求,并且在确保所有保密文件绝对安全可靠的前提条件下集成 —4—
管理三个网上所有电子文件和档案的机制。第二,确保数字档案馆系统和各种档案信息资源 内容的安全可靠。由于网络技术、数字化技术的快速发展与广泛应用,以及病毒与黑客的泛 滥,网络特别是互联网已被视为“最不安全”的区域。为保障档案信息的真实性、完整性、 可靠性、可用性,防范病毒与黑客的攻击,成为数字档案馆安全保障体系建设应首先考虑的 问题。第三,应该能确保恰当的档案信息资源在恰当的时间和地点内传递给恰当的用户使用。 档案馆与其他信息部门(如图书馆)有较大的差异,其保管的档案信息资源并非完全对外公 开,而是具有相应的密级。事实上我国大多数档案信息是不对外公开的,因此如何保障这些 档案信息的机密性,并且可以实现“有向”服务,设置各种级别的利用权限,使恰当的档案 信息资源在恰当的时间和地点内传递给恰当的用户使用,也成为安全保障体系建设应考虑的 重要问题。第四,在档案信息化实践中,虽然对数字档案馆采取众多的安全措施,但仍难免 因各种原因出现故障导致档案信息的严重破坏,其严重程度不亚于前两个问题,而解决这一 问题的最好方法则是数据维护、数据备份,因此建立完善的数据备份和恢复机制是数字档案 馆安全保障体系建设的另外一个重要问题。 4. 结束语 随着社会信息化成为国家现代化建设的战略举措,加强档案信息化建设,是档案事业发 展的必然选择。在全国掀起的档案信息化浪潮中,“数字档案馆”建设实已成为我国档案事 业发展的战略目标。目前,我国已有多个地区实施了数字档案馆工程,其中较有影响的有深 圳数字档案馆工程、青岛数字档案馆建设项目、萧山数字档案馆建设项目,这三个项目的建 设模式分别被称为深圳模式、青岛模式和萧山模式。然而根据我们的调研和分析,由于我国 理论研究和相关标准规范的滞后,大多数数字档案馆项目建设仍处于“数字化档案馆”建设 阶段,通常以档案目录数据库建设为核心,对部分数字档案信息资源进行了收集、管理,有 选择地对部分档案信息进行了数字化,并通过互联网络提供档案信息资源的利用,其主要作 用是实现了对档案信息资源管理和信息利用,而在集成管理分布式存储的、具有多样性和异 构性的电子文件、保障档案数字信息的真实性、完整性、持久有效性和信息利用的平等性等 方面却涉足不深。因此,希望本文所探讨的数字档案馆功能需求能为今后数字档案馆建设起 到参考作用。尽管如此,笔者认为上述项目的启动已为我国数字档案馆的研究开创了新局面, 标志着我国档案信息化建设全面提速。 ① 黄志文. 我国数字档案馆研究评述. 上海档案,2002(2) ② 何嘉荪:保存电子文件背景信息的重要手段——再论全宗、案卷形态的异化,《档案学通 讯》2001 年第 5 期; 中国人民大学[复印报刊资料]《档案学》2002 年第 1 期转载; ③ 杨公之,《档案信息化建设实务》,中国档案出版社,2003 年 8 月 ④ NARA(National Archives and Records Administration), http://www.archives.gov/ ⑤ A Comprehensive Assessment of Public Information Dissemination (U.S. National Commission on Libraries and Information Science, final report, Volume 1, January 26, 2001) ⑥ 李宝山、刘志伟,《集成管理——高科技时代的管理创新》,北京:中国人民大学出版社, 1998,pp.32-38, ⑦ 金更达,何嘉荪. 数字档案馆模式探讨——基于元数据的电子文件集成管理与服务研究之 二. 档案学通讯,已录用。 —5—
分享到:
收藏