最新客户 设计观点 优化建议 建站问答 行业资讯 常见问题 客户评价 资讯NEWS 为您提供技术解答,让您清楚自己的网站

网络信息资源长期保存的问题分析

作者:龙华网站建设 发布于:2019-7-31 9:23:52 点击量:

 网络信息的快速增长与“易逝性”使各部门对网络信息保存的需求变得必要和迫切。20世纪90年代中后期以来,国内外开展了一系列网络信息保存项目。基于此,本文对网络信息资源存档(Web Archive)研究现状进行了总结,希望档案部门在网络信息资源长期保存方面取得发展。《信息技术与标准化》宣传国家、信息产业部有关标准化与质量工作的政策、法规,报道深化改革形势下电子标准、质量工作的进展、成果、经验和动态,研究信息产业高新技术的发展对标准、质量工作的需求与开发,ISO9000标准发展动态,大力推进企业质量管理和质量体系认证工作,发布国际标准成果和新进(修)订动态,发布通过认证企业名录。

网络信息以呈现随机无序、爆炸式的指数增长,具有易逝性,网络信息资源的大量流逝问题(网络信息的存在周期为44天)引起了多方问题,如:教学中网址链接在使用时过期、网络虚拟遗产纠纷、游戏系统消失造成玩家经济和精神上的损失、人类社会的网络历史遗产的消失等问题,这些情况逐渐引起了各方关注。图书部门在对网络图书进行管理时,也管理了网络资源库中的一次文献、二次文献、灰色文献,通过对这些文献进行数据库建设并长期保存,随后开始进行网络出版物的保存和数据挖掘。创建信息资源或多种资源数据库是一种数字资源的档案化管理。这项工作做的比较好的是图书管理部门,其还协同法律、经济以及情报等多个部门参与工作,从而引起了多方对网络资源的重视。

1 网络信息资源长期保存问题产生的背景

  大数据时代,网络信息资源多格式存在,多渠道、爆炸式产生和增长,这为社会生活多方面提供了信息便利。但网络资源并不是任意获取,而是分等级的被人们获取,比如一次文献、二次文献或者灰色文献,政府网站中的政令信息、个人博客等。通过应用和总结,网络资源成膨胀式、难收集、难检索、易逝性呈现并消亡,因此许多有价值的网络信息资源亟待专人负责收集和保存。

  网络资源的特点决定了人们开始重视网络资源,重视对网络资源的开发来发挥其应有的作用,从而在大数据环境下为知识管理、信息挖掘提供资源。现在任何人都可以制作信息,个性化和全民性的信息生产多样化,已经无法控制。

2 网络信息资源长期保存概念的界定

  易混淆的概念主要有两个:一是客体方向,对客体界定的不明确;二是主体行为,即是主攻保存还是主攻利用。在客体方面,主要的表达方式集中在以下几个关键词上:数字资源、数字遗产、网络信息资源、网络资源。

2.1 对客体概念辨析

  数字资源是文献信息的表现形式之一,是将计算机技术、多媒体技术和通信技术融合而形成的以数字形式发布、存取和利用的信息资源总和。简单理解为基于计算机的信息资源总和。

  数字遗产是指互联网+上的数字文化遗产,即以互联网为承载形态的文字作品、资料、图片和影音形成一种文化传承的遗产,也就是现在互联网上的读书频道、文化频道、博客、论坛、BBS以及空间等里面涉及的创作、记录等内容。数字遗产——互联网上的文章、资料、图片和影音的保存,基本上都处于“不稳定”状态,一旦遭到来自非用户操作的删除、更改,甚至商业网站亏损倒闭后,个人空间就会被注销,内容就会受到不可逆转的毁灭。

网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。其具体是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。

  网络资源的外延更大一些,它除了信息资源外,还延伸到信息资源的引申资源,涉及关系网络和社群网络。而网络信息资源更偏向情报信息,与通过互联网获取的信息资源相比较而言,网络信息资源内涵于网络资源,网络资源是利用计算机系统通过通信设备传播和网络软件管理的信息资源。

2.2 对主体行为的理解

  网络信息资源存档会同网络信息资源长期保存这个概念相混淆。两者是相近但不相同的两个概念,双方都涉及网络资源以及网络资源的长期存取,即有关信息的共享问题。但是网络信息资源存档(WA)更注重对网络信息资源资源的建档和档案化管理。网络资源存档的内涵:有关主体有选择性地对具有长远保存价值的网络信息进行捕获、归档、存储等档案化管理过程,其基本目标是通过网络信息资源的存档,更全面、真实的反映和再现社会活动的本来面貌,并满足相关主体对网络信息的长远利用需求。具体有以下四点:一是WA的目的是再现社会活动的本来面貌,实现网络信息的长期保存和利用。二是WA的行为主体具有多样性。三是WA行为具有高度选择性。四是WA的行为程序具有规范性。笔者更倾向将WA定义为一种对网络信息资源档案化管理的行为。学界网络资源存档的理解还有:认为WA是一种对网页进行网页快照的行为。笔者认为网页快照无法满足多种格式的要求,目前视频和视频直播已成为网络较火的一种信息资源,这就是网页快照无法做到的。

3 档案部门应对网络信息长期保存的措施

3.1 从国家战略层面重视

  从国家宏观战略方向看,笔者认为国家档案部门应采用顶层设计,统一领导,分层管理的方式来建设我国的网络信息资源保存项目。同时,对国外具有保存价值的网络信息资源有选择性的进行保存和研究。

3.2 在政策上进行探索

  当前,档案信息化建设也将许多档案信息资源上传到网络上,因此,这就更加给网络信息资源的保存增加了压力。政策上的保障是其前提,也是指引方向的引路灯。下面提出一些笔者的建议。

  从内容上,可借鉴我国台湾地区的Web Archive做法,台湾网络典藏项目针对各级政府网站、教育及学术机关网站(研究机构、社会教育机构及大专院校及所属系所网站)、图书馆网站(各大专院校图书馆、专门图书馆、公共图书馆、图书咨询学研究单位及图书馆团体网站)、重大社会议题网站(以政治、经济、文化等各个领域社会重大议题为向导,收藏与该议题论述相关的网站,如:环境保护、教育改革、媒体改革、金融改革、土地规划、全民反恐以及公民投票等)构建了一个庞大的、体系化的政府工作网络,该网络更便于政府各部门之间的互联、互通,在提高效率的同时,更好的服务群众。

  从格式上,通过对文字格式、视频、音频、游戏服务器等的保存,进行项目编目,除采用存储器阵列等方式,还可以开发新型存储器等。这些可以学习国外先进科技,也可以参考其他国类似的项目。

3.3 在运行中寻求协作

  网络信息资源存档保存,既需要档案部门率先引领,同时也需要计算机技术部门的配合,技术难题是攻坚克难的关键。不仅如此,法律、标准、政策、企业等都需要协同进来。因为这一项目的成功应用,将会对社会生产和管理、经营带来不小的变革,因此需要这些部门共同努力。

4 网络信息资源长期保存存在的问题

4.1 对Web Archive的重视和认识程度不足

  许多游戏网站在运营十多年后,往往面临关闭服务器的境况。而该服务器的玩家却还在享受游戏带来的乐趣,当关闭服务器后,这类资源将面临永远消失的状况,如果WA项目忽视了此类资源,是否是对人类遗产的一大缺失。在21世纪的某些阶段,人类行为缺少了合理的解释,是因为未对当时网络信息资源的原生资源进行存档保存。因此,重视和重新认识网络信息资源,并对其进行档案化保存是一种对全人类记忆负责的表现,这些只是笔者了解到的某一种情况。对于政府机构、企事业单位来讲,都建设有自己的网站,对网站内容会进行及时更新,做好宣传,同时单位内部的业务也会通过网站进行沟通,这些原生的网络信息资源若不加以及时保存,待到查考时,将无从下手。

4.2 资金投入少

  技术和管理的革新,资金投入是硬性指标。只有大量的资金支持,才能在硬件更新上配备最好的设备。对于企业或政府而言,这类投入想要在短期内盈利,怕是很困难的。通常这种投入都伴随着时间而增长,很少有投资者能够具有前瞻性的看到长期投入对整体运作的意义,许多投资者和决策者很难做到有前瞻性的去审视对本企业的信息资源进行投入,更难看到这种投入的回报在生产和经营领域的贡献。

4.3 技术含量低

  网络信息资源存档保存所应用的计算机软件和开发软件形成的系统平台伴随着IT技术的不断翻新,需要不断更新。但是这目前在我国很难做到,因为许多档案尚属于国家非盈利部门,属于经营性企业的档案和网络信息资源也很难获得企业和部门的资金投入,这样就更难获得技术投入,许多部门的检索功能还停留在人工纸质和手动阶段。在技术方面我国较国外稍弱一些,但相信在借鉴他国发展历程并进行我国自主研发后,技术问题将迎刃而解,且指日可待。

本文地址:
上一篇: 提到网页相似度,你可能又踩雷了!下一篇: 网络信息安全治理难 看百度如何以AI技术破题
首页|加入我们|付款方式|常见问题|联系方式|售后服务|团队风采|网站地图|
总机:0755-28068648    客服热线:漆生:13828842088  E-mail:agewnet@agewnet.com
深圳市时代万网科技有限公司  备案号:粤ICP备09191268号
地址:深圳市龙华民治大道牛栏前大厦B1215和C1212     
品牌建站
推广优化
商务快车
空间邮箱
网站售后
邮箱售后
投诉建议
微信营销