从国内外网页档案长期保存的项目来看,其多为公益性项目,同时大部分的项目都是在政府部门的支持下由多个部门联合参与或者举办的,如国家档案馆、高校、网络中心或者信息中心、商业部门和公益性机构。如澳大利亚的数字档案PANDORA项目和我国的“中国Web信息博物馆”项目,都是由图书馆、档案馆和高校联合参与的。基于网页采集的动态变化性和多样性等特点,仅有档案馆或者图书馆单独承担这类大项目是不现实的,因此必须鼓励多方力量共同参与到网页长期保存中。具体来说,就是要做好职能划分和利益分配的工作。首先,参与单位可以在法律允许的范围内对网页档案信息资源进行合理的利用,如图书馆和档案馆可以利用网页资源进行档案服务的深度开发与加工。其次,网页档案采集工作对技术的依赖性较高,因此还要支持和鼓励互联网企业或者信息技术企业参与到项目中,为采集项目提供技术上的支持。最后,还要不断丰富采集项目的资金来源,利用项目众筹和社会募捐等非政府拨款方式募集资金,为采集项目提供更多的资金支持。
当前网页档案信息的主要采集策略有两种,分别是完全性采集策略和部分性采集策略。完全性收集策略是指对网页的所有信息进行收集。目前,瑞典、奥地利和美国的多个网页档案保存项目采用了完全性采集策略。完全性采集策略的优势在于不需要人工对网页内容进行判断和复制,而是完全由机器完成这一操作,因此其成本较低。对于小型的、资金较为缺乏的档案管理部门,可适当地选择完全性收集策略,但需要注意对信息进行过滤。内容结构和类型较为单一的网站可通过设置关键词对无用信息进行过滤,同时建立定期的人工审核机制。
部分性采集策略是指有选择地对网页的某个类型或者学科的内容进行收集,因此其内容的专业性较强,主题也十分鲜明。与完全性采集策略不同的是,部分性采集以价值判断为基础,通过制定完善的采集标准限定采集的内容,因此标准是否合理就成为部分性采集是否成功的决定性因素。对此,档案管理部门在选择部分性采集策略时,应充分考虑到网页档案信息的动态变化性,对网页信息实行动态监控,并及时调整采集策略,不断提高网页采集的覆盖率。
本文题目:网页档案信息长期保存的策略
分享网址:/news43/151643.html
成都网站建设公司_创新互联,为您提供网站排名、品牌网站制作、星空体育app最新版本(2024已更新)、域名注册、网站收录、云服务器
广告
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源:
创新互联