前言:想要寫(xiě)出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇檔案數(shù)字化的關(guān)鍵技術(shù)范文,相信會(huì)為您的寫(xiě)作帶來(lái)幫助,發(fā)現(xiàn)更多的寫(xiě)作思路和靈感。
面對(duì)網(wǎng)絡(luò)時(shí)代城市建設(shè)迫切需要遠(yuǎn)程、公開(kāi)、快捷的城建檔案信息,面對(duì)館藏日益增多的案卷,傳統(tǒng)的城建檔案保存方式已明顯難以適應(yīng)迅速發(fā)展的新趨勢(shì)。以往一直采用的柜架式紙張保存和目錄式管理,不僅占用了大量庫(kù)房空間,管理成本高,而且易黃、易蛀,保管時(shí)易損壞;同時(shí),城建檔案數(shù)據(jù)庫(kù)中分類信息復(fù)雜,靠手工查詢速度慢。由于城建紙質(zhì)檔案量大,查閱起來(lái)耗時(shí)、耗力。傳統(tǒng)城建檔案使用的種種局限給城建檔案管理提出了更高的要求,信息技術(shù)的日新月異也給城建檔案工作帶來(lái)了新的研究課題。這一切,都使城建檔案數(shù)字化建設(shè)提上了議事日程。
2000年12月,國(guó)家檔案局、中央檔案館印發(fā)的《全國(guó)檔案事業(yè)發(fā)展“十五”計(jì)劃》,把“加快檔案信息化建設(shè)”、“加快現(xiàn)有檔案的數(shù)字化進(jìn)程”列入其中,同月國(guó)家檔案局在中國(guó)檔案管理現(xiàn)代化建設(shè)研討會(huì)上宣布:十五期間,我國(guó)將加快數(shù)字化檔案館的建設(shè)。由此,城建檔案數(shù)字化建設(shè)的問(wèn)題引起了人們的關(guān)注。
城建檔案信息數(shù)字化就是把紙質(zhì)檔案通過(guò)掃描、錄入信息到計(jì)算機(jī)數(shù)據(jù)庫(kù)中,以計(jì)算機(jī)存儲(chǔ)城建檔案信息。城建檔案的數(shù)字化并非一蹴而就,而是一個(gè)循序漸進(jìn)的過(guò)程。我們有必要對(duì)這個(gè)過(guò)程的各個(gè)環(huán)節(jié)進(jìn)行深入的分析和研究,只有在有了清楚認(rèn)識(shí)的基礎(chǔ)上,才能規(guī)劃好城建檔案管理的數(shù)字化之路,為今后的城建檔案數(shù)字化建設(shè)打好基礎(chǔ)。
1.確定城建檔案數(shù)字化指導(dǎo)思想與原則
城建檔案數(shù)字化指導(dǎo)思想是:以需求為導(dǎo)向,以利用為目的,充分利用計(jì)算機(jī)軟硬件功能,最大限度發(fā)揮人力資源和數(shù)字化加工設(shè)備能力,保護(hù)館藏城建檔案原件完好,保證數(shù)字化城建檔案真實(shí)準(zhǔn)確,更好地發(fā)揮城建檔案信息資源的作用。
城建檔案數(shù)字化原則是:遵循重要城建檔案數(shù)字化的價(jià)值性原則、常用城建檔案數(shù)字化的實(shí)用性原則、開(kāi)放城建檔案數(shù)字化的開(kāi)放性原則、褪跡城建檔案數(shù)字化的搶救性原則、解密城建檔案數(shù)字化的及時(shí)性原則、目錄數(shù)字化與全文數(shù)字化分步的時(shí)效性原則、城建檔案數(shù)字化加工與利用同步的一致性原則。
2.城建檔案數(shù)字化建設(shè)的步驟
城建檔案數(shù)字化建設(shè)需要投入,特別是建設(shè)初期軟硬件配置投入較大,建成后也要保持一定的運(yùn)行成本。因此,要按照成本效益最大化理論,細(xì)化城建檔案數(shù)字化建設(shè)的步驟,同時(shí)優(yōu)化城建檔案數(shù)字化的各種資源配置,根據(jù)不同的情況,進(jìn)行城建檔案專業(yè)人員和數(shù)字化技術(shù)人員、計(jì)算機(jī)和掃描設(shè)備的合理搭配,構(gòu)建城建檔案數(shù)字化投入小收益大的新模式。
2.1建立城建檔案數(shù)據(jù)庫(kù)
第一步,輸入文件級(jí)目錄。在建立數(shù)據(jù)庫(kù)的過(guò)程中,可邊輸入邊打印,一方面補(bǔ)齊卷內(nèi)文件目錄,另一方面檢驗(yàn)輸入的正確性,從而確保城建檔案數(shù)據(jù)庫(kù)的真實(shí)性、完整性和有效性。第二步,采用掃描儀、數(shù)碼相機(jī)等設(shè)備,實(shí)現(xiàn)原文件信息數(shù)字化。
2.2加強(qiáng)電子文件的收集和積累工作
電子文件包括電子文件內(nèi)容、電子文件載體和電子文件顯示、修改的電子計(jì)算機(jī)軟硬件平臺(tái)的組合,是未來(lái)數(shù)字城建檔案最主要的來(lái)源。為了確保所形成的電子文件不被丟失,保證電子文件是可存取、可利用和可理解的,必須及時(shí)對(duì)所形成的電子文件進(jìn)行收集積累。電子文件的收集積累,不僅保證電子文件的真實(shí)性,還維護(hù)了它的系統(tǒng)性、完整性,同時(shí),也防止了存有信息內(nèi)容的載體在個(gè)人手中發(fā)生丟失、損壞,從而保護(hù)電子文件的安全,為電子文件的歸檔打下基礎(chǔ)。
電子文件的收集積累范圍,應(yīng)嚴(yán)格按照國(guó)家有關(guān)規(guī)定執(zhí)行。用載體傳遞的電子文件,要按規(guī)定進(jìn)行登記、簽署,對(duì)于更改處,要填寫(xiě)更改單,按更改審批手續(xù)進(jìn)行,并存有備份件,防止出現(xiàn)差錯(cuò)。
2.3城建檔案數(shù)字化與上網(wǎng)利用同步
城建檔案數(shù)字化及管理流程重組是一個(gè)管理思想不斷地變化的過(guò)程,城建檔案數(shù)字化與上網(wǎng)利用同步即是新技術(shù)和新理念相互融合的表現(xiàn)。
數(shù)字化城建檔案分開(kāi)放與不開(kāi)放兩種,開(kāi)放城建檔案即上互聯(lián)網(wǎng),建立城建檔案資料網(wǎng)站,實(shí)施資源共享,在互聯(lián)網(wǎng)上向政府和社會(huì)提供城建檔案信息查閱。
3.不斷增強(qiáng)城建檔案數(shù)字化管理的技術(shù)含量
城建檔案數(shù)字化的建設(shè)過(guò)程重在管理,貴在控制。利用計(jì)算機(jī)進(jìn)行城建檔案數(shù)字化,任何一個(gè)邏輯錯(cuò)誤,都會(huì)給數(shù)據(jù)的管理和使用帶來(lái)麻煩或隱患。在互聯(lián)網(wǎng)上公開(kāi)不真實(shí)、不準(zhǔn)確的檔案,將在社會(huì)上產(chǎn)生不良影響。特別是在網(wǎng)絡(luò)環(huán)境下的流水作業(yè),上一道工序一定要為下一道工序負(fù)責(zé),各道工序工作量的對(duì)等與匹配同樣重要。實(shí)踐證明,建立數(shù)字化進(jìn)度數(shù)據(jù)庫(kù)、數(shù)字化質(zhì)量反饋庫(kù)、城建檔案利用登記數(shù)據(jù)庫(kù),通過(guò)技術(shù)手段將全面質(zhì)量管理思想引入城建檔案數(shù)字化建設(shè),實(shí)現(xiàn)全程管理、適時(shí)控制,才能達(dá)到強(qiáng)化數(shù)字化城建檔案質(zhì)量保證體系的目的。
4.著力提高數(shù)字化城建檔案的系統(tǒng)整體水平
[關(guān)鍵詞]地籍檔案;管理;數(shù)字化
[中圖分類號(hào)]G237 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1005-6432(2010)49-0096-03
1 當(dāng)前地籍檔案數(shù)字化的形勢(shì)和要求
2006年國(guó)土資源部《金土工程一期建設(shè)方案》中推進(jìn)信息化建設(shè)的要求和《地籍管理“十一五”發(fā)展規(guī)劃綱要》中都明確指出:“要建立統(tǒng)一配置、管理各類數(shù)據(jù)的數(shù)據(jù)集成管理平臺(tái),實(shí)現(xiàn)數(shù)據(jù)的可視化管理和服務(wù)”、“地籍檔案管理要實(shí)現(xiàn)數(shù)字化、可視化?!?/p>
長(zhǎng)期以來(lái),地籍檔案管理采用計(jì)算機(jī)輔助與手工操作相結(jié)合的方式,采用的載體都是傳統(tǒng)的紙質(zhì)檔案材料和相關(guān)電子表格、文檔,按照新時(shí)期檔案信息化的技術(shù)要求,要實(shí)現(xiàn)城市地籍檔案管理數(shù)字化、可視化,還應(yīng)該通過(guò)數(shù)字化加工處理,將紙質(zhì)檔案內(nèi)容轉(zhuǎn)換成計(jì)算機(jī)能夠存儲(chǔ)和識(shí)別的可視圖像文件。
延吉市國(guó)土資源局于2008年2月起結(jié)合全國(guó)第二次土地調(diào)查關(guān)于“建立四級(jí)土地利用數(shù)據(jù)庫(kù)和建立市縣地籍信息系統(tǒng)”的要求,開(kāi)始進(jìn)行檔案的掃描錄入工作。委托長(zhǎng)春市某航遙信息技術(shù)公司承擔(dān)檔案數(shù)字化掃描加工,預(yù)計(jì)掃描加工檔案約10萬(wàn)宗,約200萬(wàn)頁(yè),數(shù)據(jù)容量3.5~5T,工期預(yù)計(jì)為4個(gè)月。主要步驟是:①將每一卷檔案的所有卷內(nèi)內(nèi)容,即權(quán)屬資料、身份證明等申請(qǐng)材料、地籍調(diào)查表、審批表、相關(guān)圖紙、變更記錄等所有內(nèi)容,經(jīng)過(guò)掃描,以圖片格式存入計(jì)算機(jī)。②為掃描生成的圖片編制以地籍號(hào)為主的十級(jí)目錄文件名,并根據(jù)圖片文件名中的關(guān)鍵字段和現(xiàn)有的檔案信息系統(tǒng)實(shí)現(xiàn)鏈接。
對(duì)于今后接待的登記申請(qǐng),將直接在辦證大廳窗口用掃描儀進(jìn)行相關(guān)材料的掃描錄入,在完成土地登記后,可以直接生成地籍?dāng)?shù)字圖片檔案,同時(shí)形成紙質(zhì)和電子兩套檔案數(shù)據(jù)。圖片數(shù)據(jù)按文件名中的關(guān)鍵字段和現(xiàn)有的檔案信息系統(tǒng)實(shí)現(xiàn)鏈接。該系統(tǒng)是延吉市國(guó)土資源局于2004年研發(fā)并開(kāi)始應(yīng)用的,是以JSP技術(shù)和B/S模式,以Appache和Tomnet開(kāi)發(fā)服務(wù)器為平臺(tái)建立的地籍檔案查詢系統(tǒng)。
2 檔案數(shù)字化與數(shù)據(jù)處理的具體方法
地籍檔案與一般檔案相比,最突出的特點(diǎn)是圖文并茂和地理位置相關(guān)性,既有報(bào)告、批文、合同等文本性質(zhì)的檔案,也有宗地草圖、地籍圖、宗地圖等圖形、圖像的檔案。掃描和錄入時(shí)除選擇合適的硬、軟件設(shè)備外,還必須針對(duì)不同類別的檔案材料數(shù)字化的要求、采用不同的工作流程和技術(shù)方法進(jìn)行數(shù)據(jù)轉(zhuǎn)換與壓縮處理,以保障數(shù)字檔案材料的清晰、準(zhǔn)確和便于存儲(chǔ)與應(yīng)用。
3 文本類檔案的數(shù)字化與數(shù)據(jù)處理
地籍檔案的文本類檔案的數(shù)字化方法此次一概采用掃描錄入法(包括地籍檔案原件的文頭、手跡、圖表、印鑒等信息)。
3.1 掃描方式
針對(duì)檔案的清晰度采用不同的掃描方式,主要是黑白、灰度、彩色三種方式。對(duì)于比較清楚的紙質(zhì)檔案可采用黑白方式掃描,對(duì)于模糊的紙質(zhì)檔案采用8bit灰度方式掃描,對(duì)于有彩色圖章的紙質(zhì)檔案采用16bit彩色方式掃描,這樣既可以滿足檔案數(shù)字化的要求,又能減少存儲(chǔ)空間。
3.2 分辨率
確定掃描的分辨率是檔案掃描的關(guān)鍵環(huán)節(jié)之一。掃描的分辨率過(guò)高,掃描文件占據(jù)存儲(chǔ)空間大、使用不方便;掃描的分辨率太低,掃描圖像不清晰,滿足不了數(shù)字化管理的要求。經(jīng)多次試驗(yàn)研究,我們認(rèn)為,對(duì)于負(fù)載量不重的文件材料,選擇“200dpi”像素分辨率掃描比較合適、對(duì)負(fù)載量重的文件材料,載荷大的頁(yè)面,當(dāng)字跡看不清楚或者很難看清時(shí),采用更高的分辨率,直到能看清楚為止。分辨率以“50dpi”為步進(jìn)遞增。
3.3 存儲(chǔ)格式
掃描文件的格式有很多,其中最常用的有BMP、GIF、JPEG、PNG、TIFF和PCX等格式。BMP位圖格式的特點(diǎn)是包含的圖像信息較豐富,幾乎不進(jìn)行壓縮,缺點(diǎn)是占用磁盤(pán)空間過(guò)大。GIF格式的特點(diǎn)是壓縮比高,磁盤(pán)空間占用較少,其缺點(diǎn)是不能存儲(chǔ)超過(guò)256色的圖像。JPEG格式用有損壓縮方式去除冗余的圖像和彩色數(shù)據(jù),能獲得極高的壓縮率。TIFF格式的特點(diǎn)是圖像格式復(fù)雜、存儲(chǔ)信息多,且支持LZW無(wú)損壓縮方式,它存儲(chǔ)的圖像細(xì)微層次的信息非常多,圖像質(zhì)量高,故而非常有利于原稿的復(fù)制。此次我們選擇的是無(wú)損壓縮的TIFF格式作為掃描文件的存儲(chǔ)格式。
3.4 掃描后的技術(shù)處理
對(duì)掃描圖像的處理主要包括糾偏、旋轉(zhuǎn)、去黑邊、亮度和對(duì)比度的調(diào)整、色階調(diào)整、去雜點(diǎn)、消藍(lán)去污、拼接等。局部消藍(lán)能夠?qū)ψ舟E褪變的檔案進(jìn)行修復(fù),一般情況下通過(guò)調(diào)整亮度,一頁(yè)檔案的大部分文字都會(huì)掃描出來(lái),但有些地方會(huì)因太淺或太濃而看不清楚甚至看不出來(lái),這時(shí)就需要根據(jù)不同情況,對(duì)灰度掃描后形成的圖像分別設(shè)置不同的亮度比較值,然后轉(zhuǎn)換成實(shí)際黑白二值文件進(jìn)行存儲(chǔ),從而使全篇檔案都能清晰地顯示出來(lái)。這對(duì)于修復(fù)歷史檔案具有十分重要的意義。
4 圖形檔案的數(shù)字化與數(shù)據(jù)處理
與文本檔案材料相比,圖形檔案材料最大的特點(diǎn)是空間定位性和可量測(cè)性。圖形檔案材料的掃描主要有兩種方法,一是掃描成圖像格式;二是數(shù)字化成矢量格式。后者要在掃描后,對(duì)掃描圖像進(jìn)行屏幕矢量化或通過(guò)特殊的軟件自動(dòng)矢量化,對(duì)于矢量化形式的數(shù)字化,還應(yīng)該對(duì)圖形要素進(jìn)行分類、分層和編碼。我局現(xiàn)有的檔案管理系統(tǒng)已經(jīng)和地籍圖庫(kù)實(shí)現(xiàn)鏈接,所以此次采用的是前者。
4.1 圖形材料的掃描
地籍檔案的圖紙資料一般圖幅較大,大多是A1、A0幅面,A3、A4幅面的較少。因此,圖形掃描采用大幅面的掃描儀。對(duì)于1∶500、1∶2000比例尺的圖紙,圖面負(fù)荷不重,一般采用300dpi的掃描分辨率。對(duì)于1∶10000或更小比例尺的圖紙,由于圖面負(fù)荷較重,采用600dpi的掃描分辨率。
4.2 圖形數(shù)字化的精度
圖形數(shù)字化的精度要求較高,而且與圖紙的比例尺有很大關(guān)系。一般要求不大于原圖的0.3~0.5毫米。
5 掃描錄入的圖片文件名及目錄名命名格式和具體規(guī)范
5.1 文件名總體上采用定長(zhǎng)編碼加上前綴的方式
5.3 具體規(guī)范的補(bǔ)充
第一,獨(dú)立宗地?zé)o棟號(hào)、戶號(hào),應(yīng)在相應(yīng)位置補(bǔ)零。第二,原舊土地使用證的證號(hào),在字頭補(bǔ)零處理。第三,自治州一級(jí)的批件,使用證號(hào)末尾加Z,如果不滿11位,在S后、證號(hào)前加零補(bǔ)齊,如州件證號(hào)為“2002009”,則先變?yōu)椤癝2002009Z”,因?yàn)槲粩?shù)為9位,不足11位,需在S后和“2002009Z”前補(bǔ)零,變?yōu)椤癝002002009Z”,最終變成了11位。第四,抵押檔案(包括多證抵押)中裝在同一檔案袋中的檔案袋文件,保存的目錄應(yīng)在其原來(lái)應(yīng)有的目錄下,而不是抵押檔案目錄中,文件名仍按“12.文件命名規(guī)則”制定。第五,關(guān)于版本修改歷史:版本1.1修改了文件名稱最后的頁(yè)號(hào)表示前添加“_”。版本1.1.1修改了“12.文件命名規(guī)則如下”例2中棟號(hào)位數(shù)的錯(cuò)誤。版本1.1.2的修改內(nèi)容:①在“檔案類別”后增加了檔案變更次數(shù)內(nèi)容。②對(duì)州批件的使用證號(hào)做了詳細(xì)的命名規(guī)定。③對(duì)抵押檔案件的目錄命名和文件名命名規(guī)則做了規(guī)定。
6 檔案數(shù)字化存在的問(wèn)題
6.1 數(shù)字檔案的憑證價(jià)值問(wèn)題
第一,由于一系列技術(shù)和立法問(wèn)題還未解決,數(shù)字化檔案目前還不具備法律憑證效力,所以數(shù)字檔案只有參考價(jià)值而無(wú)憑證價(jià)值。
第二,技術(shù)上的問(wèn)題。①數(shù)字檔案具有易復(fù)制、修改、刪除的特點(diǎn),使得檔案“原件”的概念變得難以確認(rèn)。②計(jì)算機(jī)硬、軟件技術(shù)不斷更新?lián)Q代,因而無(wú)法通過(guò)載體、格式的鑒定來(lái)判定其原始性。
6.2 數(shù)字檔案信息的長(zhǎng)期存取問(wèn)題
第一,存儲(chǔ)的介質(zhì)材料。數(shù)字介質(zhì),無(wú)論磁盤(pán)還是光盤(pán)的壽命都遠(yuǎn)遠(yuǎn)無(wú)法和紙質(zhì)檔案相提并論。
第二,機(jī)讀語(yǔ)言格式。計(jì)算機(jī)語(yǔ)言平均每3個(gè)月就會(huì)問(wèn)世一種,而語(yǔ)言之間的互換大部分存在問(wèn)題。很難想象,若干年以后,我們用現(xiàn)行的機(jī)器語(yǔ)言描述的數(shù)據(jù),還能100%的還原。
第三,對(duì)設(shè)備的依賴。數(shù)字檔案必須依賴于計(jì)算機(jī)設(shè)備才能讀出,如設(shè)備發(fā)生故障、系統(tǒng)癱瘓,電子文件就讀不出來(lái);電子文件對(duì)其他設(shè)備環(huán)境的不兼容性,使其只能在某種設(shè)備上處理,而不能在其他設(shè)備上處理;不同軟件環(huán)境形成的電子文件存儲(chǔ)在載體上,有時(shí)難以互換;電子文件加密后,不解密就無(wú)法識(shí)別;技術(shù)設(shè)備更新時(shí),不及時(shí)解決格式轉(zhuǎn)換問(wèn)題,也無(wú)法讀取等。
6.3 數(shù)字檔案的失真問(wèn)題
此次檔案數(shù)字化的主要方式是掃描加工,在這一過(guò)程中造成數(shù)字檔案失真的原因還有以下幾個(gè)方面:其一,技術(shù)參數(shù)選擇不當(dāng)。針對(duì)不同色調(diào)、紙質(zhì)和字跡,有時(shí)需調(diào)整不同的技術(shù)參數(shù),如分辨率、明暗度、對(duì)比度等,選擇不當(dāng)會(huì)直接影響掃描的質(zhì)量,造成信息丟失、圖像模糊或產(chǎn)生額外信息,客觀上造成檔案原貌的改變。其二,工作失誤。檔案掃描是大量的重復(fù)勞動(dòng),難免有時(shí)失誤。如掃錯(cuò)檔案或打錯(cuò)順序,或存錯(cuò),或在建索引時(shí)鏈接錯(cuò)誤等,如不及時(shí)發(fā)現(xiàn),將直接導(dǎo)致數(shù)字化檔案失真。其三,轉(zhuǎn)換過(guò)程中的失真。在進(jìn)行數(shù)字檔案的遷移或在提供利用時(shí),往往需要將掃描后形成的圖像文件轉(zhuǎn)換成另一種格式的文件,如果格式選擇不當(dāng),同樣會(huì)導(dǎo)致數(shù)據(jù)發(fā)生變化。
6.4 數(shù)字檔案信息的安全問(wèn)題
主要表現(xiàn)為:其一,計(jì)算機(jī)病毒。網(wǎng)絡(luò)病毒的泛濫已對(duì)計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)構(gòu)成嚴(yán)重的威脅。其二,計(jì)算機(jī)黑客。黑客對(duì)信息資源的攻擊,程序設(shè)計(jì)高手可以篡改系統(tǒng)控制參數(shù)。其三,有竊取行為的間諜活動(dòng),窺視其機(jī)密信息進(jìn)行復(fù)制或擴(kuò)散。其四,有意破壞,摧毀系統(tǒng)的信息處理功能或破壞電子通信裝置。其五,人為或偶然事故造成的威脅。如工作人員操作失誤而產(chǎn)生的不可預(yù)知的事件、網(wǎng)絡(luò)系統(tǒng)軟件硬件的故障、電子系統(tǒng)故障引發(fā)的系統(tǒng)問(wèn)題等,所有這些,都使數(shù)字檔案信息的安全變得十分“脆弱”。
6.5 技術(shù)過(guò)時(shí)問(wèn)題
在飛速發(fā)展的IT業(yè)中,電腦硬件、操作系統(tǒng)、應(yīng)用軟件及存儲(chǔ)載體等不斷地被新產(chǎn)品所替代,雖然絕大多數(shù)新產(chǎn)品承諾向下兼容,但其兼容的“代”數(shù)在跨越若干年后,舊的數(shù)字信息就很難被新的硬件設(shè)備和軟件系統(tǒng)讀出?!凹夹g(shù)過(guò)時(shí)”的陰影一直會(huì)籠罩著數(shù)字信息。也有專家們提出的解決方案是數(shù)據(jù)遷移,但遷移卻存在著一個(gè)致命弱點(diǎn),就是每次遷移總會(huì)丟失一定的相關(guān)信息,這些丟失的信息積累起來(lái)會(huì)造成數(shù)字檔案信息無(wú)法準(zhǔn)確恢復(fù)原貌。
6.6 數(shù)字檔案建設(shè)的標(biāo)準(zhǔn)化問(wèn)題
地籍檔案數(shù)字化建設(shè)提出只是近十年的事,在全國(guó)開(kāi)展的情況也各有差異,而且受信息技術(shù)發(fā)展速度的影響,檔案信息系統(tǒng)至今沒(méi)有相應(yīng)的具體標(biāo)準(zhǔn)可遵循。此次延吉市國(guó)土資源局掃描錄入地籍檔案也是全州八個(gè)縣市的第一家,在吉林省也是名列前茅,具體的技術(shù)規(guī)程和方法還在實(shí)施中逐步研究探討。還遠(yuǎn)不能達(dá)到信息標(biāo)準(zhǔn)化建設(shè)和實(shí)現(xiàn)檔案信息資源共享。
7 結(jié) 論
在新時(shí)期地籍檔案數(shù)字化在可視化查詢和統(tǒng)計(jì)等方面具有以往檔案管理無(wú)可比擬的優(yōu)越性,但是也存在著由于自身的技術(shù)特點(diǎn)和介質(zhì)特點(diǎn)等原因造成的不可避免的缺陷和弱點(diǎn)。今后的檔案數(shù)字化建設(shè)的最重要環(huán)節(jié)即是實(shí)現(xiàn)國(guó)際標(biāo)準(zhǔn)化。在選擇的硬、軟件設(shè)備和選擇標(biāo)準(zhǔn)的數(shù)字化與數(shù)據(jù)處理方法時(shí),制定的數(shù)字化與數(shù)據(jù)處理工藝流程在兼顧標(biāo)準(zhǔn)化的同時(shí)一定要有前瞻性,盡可能和信息技術(shù)發(fā)展保持同步。減少信息資源和物資資源的浪費(fèi),實(shí)現(xiàn)階段性的可持續(xù)的發(fā)展。
參考文獻(xiàn):
隨著企業(yè)辦公引入互聯(lián)網(wǎng),運(yùn)用計(jì)算機(jī)參與企業(yè)檔案工作也是當(dāng)前要做的工作。目前企業(yè)檔案的數(shù)字化建設(shè)存在著不足之處,下文將對(duì)企業(yè)檔案數(shù)字化建設(shè)的認(rèn)識(shí)表述相關(guān)觀點(diǎn)以及提出相關(guān)措施。
一、企業(yè)檔案數(shù)字化建設(shè)的重要性
檔案是企業(yè)重要信息的存儲(chǔ)倉(cāng)庫(kù),同時(shí)又是信息利用的源頭,因此檔案管理工作對(duì)企業(yè)具有舉足輕重的作用。隨著國(guó)民經(jīng)濟(jì)的發(fā)展,檔案的管理和利用受到了越來(lái)越多的關(guān)注,并在企業(yè)單的發(fā)展中發(fā)揮著越來(lái)越重要的作用。做好檔案數(shù)字化將給企業(yè)檔案工作注入新的動(dòng)力,提高檔案管理和利用水平。有效提升檔案管理工作的效率,激活蘊(yùn)藏在檔案中的信息能量,使檔案信息能夠在更大的范圍內(nèi)得到更充分的利用。隨著當(dāng)前檔案信息的數(shù)量越來(lái)越龐大,企業(yè)工作人員信息、企業(yè)業(yè)務(wù)狀況等信息需要被詳細(xì)存儲(chǔ),紙質(zhì)檔案記錄已經(jīng)無(wú)法滿足現(xiàn)代社會(huì)的要求。和過(guò)去紙質(zhì)檔案相比,數(shù)字化檔案具有瀏覽方便、容量大、不占空間等優(yōu)勢(shì)。
二、企業(yè)檔案數(shù)字化建設(shè)的現(xiàn)狀與問(wèn)題
(一)缺乏企業(yè)檔案數(shù)字化建設(shè)標(biāo)準(zhǔn)化規(guī)范體系
當(dāng)前企業(yè)檔案數(shù)字化建設(shè)還存在著較多的不足。例如企業(yè)檔案數(shù)字化管理體系沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),當(dāng)前信息數(shù)字化管理的模式較多,對(duì)信息的分類、整理等均未實(shí)現(xiàn)統(tǒng)一。此外,當(dāng)前企業(yè)對(duì)檔案數(shù)字化管理的工作人?T的擇選沒(méi)有一套標(biāo)準(zhǔn)的選拔標(biāo)準(zhǔn),沒(méi)有專業(yè)的操作檔案數(shù)字化建設(shè)的工作人員,存在存儲(chǔ)操作失誤導(dǎo)致信息丟失的風(fēng)險(xiǎn)。
(二)缺少整體數(shù)字化建設(shè)流程的規(guī)劃與設(shè)計(jì)
當(dāng)前檔案的數(shù)字化建設(shè)屬于實(shí)踐的初期階段,并未形成系統(tǒng)的操作程序。在信息收集、整合、歸類、存儲(chǔ)等環(huán)節(jié),各個(gè)企業(yè)間的操作方式存在差異。企業(yè)同一部門(mén)內(nèi)的信息存儲(chǔ)方式不同,影響企業(yè)內(nèi)部工作人員的工作效率;就不同企業(yè)間的合作而言,信息的存儲(chǔ)程序不同,在一定程度上阻礙信息的交流與共享,阻礙企業(yè)間的進(jìn)一步合作與發(fā)展。
(三)企業(yè)檔案數(shù)字化建設(shè)的關(guān)鍵技術(shù)不成熟
企業(yè)檔案數(shù)字化建設(shè)的關(guān)鍵技術(shù)不夠成熟。企業(yè)檔案數(shù)字化管理的核心技術(shù)即存儲(chǔ)信息的技術(shù),廣義上的數(shù)字化信息存儲(chǔ)技術(shù)包括處理信息的全過(guò)程-----對(duì)獲取信息的分類、信息整合以及信息的存儲(chǔ)設(shè)備的擇選。實(shí)現(xiàn)信息數(shù)字化管理是整個(gè)過(guò)程最核心的環(huán)節(jié)是信息的存儲(chǔ)設(shè)備。當(dāng)前我國(guó)企業(yè)還屬于信息數(shù)字化建設(shè)道路上的初學(xué)者,信息存儲(chǔ)設(shè)備還有較大的發(fā)展空間。
(四)數(shù)字化建設(shè)中的信息安全和保密技術(shù)問(wèn)題
我國(guó)企業(yè)信息數(shù)字化建設(shè)面臨的難題是對(duì)于存儲(chǔ)信息的安全問(wèn)題以及保密措施。保證信息的安全以及相關(guān)的保密措施是存儲(chǔ)信息、實(shí)現(xiàn)信息數(shù)字化的重要環(huán)節(jié)。存儲(chǔ)的信息的安全得不到保障,信息保密措施得不到完善,信息的泄露和丟失,不僅花費(fèi)的存儲(chǔ)信息的人力、物力資源浪費(fèi),還存在給企業(yè)造成經(jīng)濟(jì)損失的風(fēng)險(xiǎn)。因此,保證信息的安全問(wèn)題以及信息的保密措施是當(dāng)前企業(yè)需要重視的重要環(huán)節(jié)。
三、新時(shí)期企業(yè)檔案數(shù)字化建設(shè)策略
(一)加強(qiáng)檔案數(shù)字化的軟、硬件設(shè)施建設(shè)
加強(qiáng)檔案數(shù)字化建設(shè)的設(shè)備是加快企業(yè)信息數(shù)字化管理的重要途徑之一。優(yōu)化人力資源、物力資源的配置,為企業(yè)檔案管理部提供必要的信息存儲(chǔ)設(shè)備。根據(jù)信息管理部分的實(shí)際操作需要,為信息管理部門(mén)提供相應(yīng)的工作電腦、復(fù)印機(jī)、掃描儀、互聯(lián)網(wǎng)以及從事信息管理的專業(yè)人員,保障企業(yè)檔案數(shù)字化建設(shè)順利實(shí)現(xiàn)。此外,隨著企業(yè)的需求以及電子設(shè)備的更新?lián)Q代,企業(yè)管理者也應(yīng)當(dāng)注意為相關(guān)信息存儲(chǔ)設(shè)備升級(jí),提高信息存儲(chǔ)部門(mén)的工作效率。
(二)加強(qiáng)電子文件的收集、積累和歸檔管理工作
隨著電腦辦公的普及,以電子文件形式為主的信息載體越來(lái)越多,電子文件成為了實(shí)現(xiàn)檔案數(shù)字化管理需要重視的問(wèn)題。注重電子文檔類型信息的收集、積累和歸檔,是保證企業(yè)大部分信息能夠?qū)崿F(xiàn)存儲(chǔ)、安全妥善保管的重要方式。此外,電子文檔的收集、歸檔也值得企業(yè)信息管理部門(mén)的重視。電子文檔具有占地面積小,隨時(shí)可進(jìn)行閱讀的優(yōu)勢(shì),重視電子文檔類信息的存儲(chǔ)是推動(dòng)企業(yè)實(shí)現(xiàn)檔案數(shù)字化管理的有力方式。
(三)建立和完善檔案數(shù)據(jù)庫(kù)
建立并逐漸完善企業(yè)信息檔案數(shù)據(jù)庫(kù)是推動(dòng)企業(yè)實(shí)現(xiàn)信息數(shù)字化管理的重要環(huán)節(jié)。建立信息數(shù)據(jù)庫(kù),將信息集中存儲(chǔ),按照相關(guān)的類別對(duì)信息進(jìn)行分類存儲(chǔ),能夠方便信息的快速查找和使用,提供企業(yè)工作人員的工作效率。此外,構(gòu)建信息數(shù)據(jù)庫(kù),大量信息的集中,對(duì)于推動(dòng)企業(yè)信息實(shí)現(xiàn)系統(tǒng)化管理具有積極意義。信息數(shù)據(jù)庫(kù)的建立使各項(xiàng)信息一目了然,能夠幫助信息管理部門(mén)剔除無(wú)用、存在誤差的信息,保證信息的準(zhǔn)確率。
(四)加強(qiáng)培訓(xùn),提高檔案管理人員的素質(zhì)
提高檔案管理工作人員的工作素質(zhì)是推動(dòng)實(shí)現(xiàn)檔案數(shù)字化建設(shè)的重要途徑。信息管理部門(mén)的工作人員是信息的直接處理者,因此要求工作人員具有一定的工作素質(zhì)。例如工作過(guò)程需要使用操作性復(fù)雜的設(shè)備或者工作程序繁雜等情況,均是對(duì)工作人員耐心以及仔細(xì)程度的考驗(yàn),提高檔案管理人員的工作素質(zhì)是工作完成質(zhì)量和效率的保障。
一、檔案基礎(chǔ)數(shù)據(jù)庫(kù)建設(shè)的緊迫性
今天,我們處于信息技術(shù)快速發(fā)展的知識(shí)經(jīng)濟(jì)時(shí)代,國(guó)家、城市綜合服務(wù)資源庫(kù)的建設(shè)是社會(huì)發(fā)展的需要,是加強(qiáng)政務(wù)公開(kāi)、實(shí)現(xiàn)便民服務(wù)的一項(xiàng)基礎(chǔ)性工作。我國(guó)已經(jīng)在人口、法人、自然資源與宏觀經(jīng)濟(jì)四大數(shù)據(jù)庫(kù)的建設(shè)方面取得較大成效,檔案作為人類社會(huì)活動(dòng)的歷史記載,檔案資源的開(kāi)發(fā)利用和檔案基礎(chǔ)數(shù)據(jù)庫(kù)的建設(shè)已經(jīng)成為國(guó)家信息資源建設(shè)的重要組成部分??梢哉f(shuō),檔案基礎(chǔ)數(shù)據(jù)庫(kù)的建設(shè)已經(jīng)成為各級(jí)各類檔案館面向社會(huì)提供檔案資源利用服務(wù)的基本職能,成為我國(guó)整合檔案信息資源、弘揚(yáng)民族文化、提高民族素質(zhì)的歷史性課題,同時(shí)也是我們檔案工作者采用現(xiàn)代化手段記憶當(dāng)今社會(huì)改革、建設(shè)、發(fā)展真實(shí)過(guò)程,支撐社會(huì)經(jīng)濟(jì)發(fā)展的歷史性責(zé)任和義務(wù),更是政務(wù)公開(kāi),提高辦事效率和促進(jìn)科學(xué)決策的依據(jù)。
美國(guó)、加拿大、澳大利亞、德國(guó)、韓國(guó)等一些發(fā)達(dá)國(guó)家已經(jīng)在檔案數(shù)字化、文檔一體化、數(shù)字資源長(zhǎng)期保存、數(shù)字檔案館等方面開(kāi)展了一些預(yù)言性、前瞻性和應(yīng)用性研究,相繼制定了電子文件管理的元數(shù)據(jù)格式與規(guī)范,研究開(kāi)發(fā)檔案管理信息系統(tǒng)、檔案資源共享的網(wǎng)站系統(tǒng)的建設(shè)思路和方法。2003年2月國(guó)際檔案理事會(huì)檔案著錄標(biāo)準(zhǔn)特別委員會(huì)正式公布了新修訂的第二版《規(guī)范記錄著錄規(guī)則》,于2004年第十六屆國(guó)際檔案大會(huì)上正式頒布修訂后的第二版《規(guī)范記錄著錄規(guī)則》,該檔案著錄規(guī)則對(duì)規(guī)范檔案目錄數(shù)據(jù)庫(kù)的檢索服務(wù),建立高質(zhì)量的目錄中心具有重要的參考價(jià)值。發(fā)達(dá)國(guó)家的經(jīng)驗(yàn)告訴我們,建設(shè)基礎(chǔ)數(shù)字資源庫(kù)的宗旨是遵循國(guó)際標(biāo)準(zhǔn),構(gòu)建跨區(qū)域的開(kāi)放檔案的共享資源庫(kù),針對(duì)公眾對(duì)檔案資源的利用需求提供高效率的查準(zhǔn)、查全服務(wù)機(jī)制。
目前在我國(guó),也有一些省市級(jí)檔案館開(kāi)展數(shù)字檔案館建設(shè),制定了符合各地區(qū)自己需求的數(shù)字檔案的元數(shù)據(jù)格式規(guī)范,建立了檔案目錄中心,提供部分開(kāi)放檔案信息的檢索服務(wù)功能,具有典型示范作用的有福建省檔案基礎(chǔ)數(shù)據(jù)庫(kù)建設(shè),它是基于分布式數(shù)據(jù)庫(kù),在原來(lái)單機(jī)和局域網(wǎng)絡(luò)的基礎(chǔ)上開(kāi)發(fā)完成,它連接了若干分布式數(shù)據(jù)庫(kù),并建立了檔案目錄數(shù)據(jù)庫(kù),檔案內(nèi)容數(shù)據(jù)庫(kù),等。但是多數(shù)檔案館還沒(méi)有真正建立全面的、系統(tǒng)的、面向公眾查檔需求的檔案基礎(chǔ)數(shù)據(jù)庫(kù),而只是建立了一些專門(mén)的特定主題的檔案數(shù)據(jù)庫(kù),只能滿足一些局部的特定的用戶需求,特別是開(kāi)放的檔案信息資源沒(méi)有實(shí)現(xiàn)集成,信息結(jié)構(gòu)不統(tǒng)一,檔案數(shù)據(jù)不系統(tǒng)、不完整、不共享,更為嚴(yán)重的是沒(méi)有形成一個(gè)統(tǒng)一的能夠描述數(shù)字檔案資源的格式規(guī)范和建設(shè)檔案基礎(chǔ)數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)方法、實(shí)現(xiàn)檔案資源的整合、組織與存儲(chǔ)的技術(shù)方案和行之有效的建設(shè)思路;另外,還由于建設(shè)檔案基礎(chǔ)數(shù)據(jù)庫(kù)的關(guān)鍵技術(shù),如海量、非結(jié)構(gòu)化的數(shù)據(jù)存儲(chǔ)解決方案,基于知識(shí)管理的數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘等技術(shù)尚未在檔案信息化領(lǐng)域得到廣泛應(yīng)用,這些因素都大大降低了檔案基礎(chǔ)數(shù)據(jù)庫(kù)建設(shè)的速度和質(zhì)量,致使各類檔案資源難以形成一個(gè)統(tǒng)一的資源庫(kù)整體,限制了檔案資源的深層次挖掘和廣泛化利用。
因此,研究檔案基礎(chǔ)數(shù)據(jù)庫(kù)的元數(shù)據(jù)標(biāo)準(zhǔn)集、數(shù)字化檔案信息的格式規(guī)范以及檔案基礎(chǔ)數(shù)據(jù)庫(kù)建設(shè)的思路和方法、各類結(jié)構(gòu)化和非結(jié)構(gòu)化檔案數(shù)據(jù)的組織、存儲(chǔ)和檢索利用的關(guān)鍵技術(shù)及整合應(yīng)用方案,以及提供檔案信息檢索服務(wù)的有效機(jī)制將成為當(dāng)前檔案館基礎(chǔ)數(shù)據(jù)庫(kù)建設(shè)的重要的基礎(chǔ)性工作。
二、檔案基礎(chǔ)數(shù)據(jù)庫(kù)建設(shè)的工作內(nèi)容
建設(shè)檔案基礎(chǔ)數(shù)據(jù)庫(kù)是一個(gè)長(zhǎng)期的、復(fù)雜的系統(tǒng)化工程,它包括各類標(biāo)準(zhǔn)規(guī)范的制定、檔案信息的組織與存儲(chǔ)、檔案資源的整合與集成、數(shù)據(jù)存儲(chǔ)服務(wù)器和提供數(shù)據(jù)檢索服務(wù)的軟硬件平臺(tái)的建設(shè)以及開(kāi)展基礎(chǔ)數(shù)據(jù)庫(kù)建設(shè)的組織與團(tuán)隊(duì)及其長(zhǎng)效服務(wù)機(jī)制的形成。而在眾多的數(shù)據(jù)庫(kù)建設(shè)工作中,標(biāo)準(zhǔn)規(guī)范與數(shù)據(jù)資源的滾動(dòng)建設(shè)則是最基本的也是最重要的內(nèi)容。
1.標(biāo)準(zhǔn)規(guī)范體系建設(shè)。包括元數(shù)據(jù)格式規(guī)范、管理規(guī)范和業(yè)務(wù)工作制度三大方面。制定數(shù)字化檔案的存儲(chǔ)標(biāo)準(zhǔn)與格式規(guī)范,明確檔案數(shù)據(jù)庫(kù)的存儲(chǔ)與訪問(wèn)方法。包括各門(mén)類數(shù)字化檔案元數(shù)據(jù)的組成、結(jié)構(gòu)、描述方式、著錄規(guī)則與要求;各種類型檔案內(nèi)容(包括文本、圖形、圖像、音頻、視頻以及非結(jié)構(gòu)化信息)的描述方法、格式要求、存取方式、訪問(wèn)機(jī)制等;檔案內(nèi)容與檔案元數(shù)據(jù)之間關(guān)聯(lián)模型的定義、檢索方式的確定;檔案目錄數(shù)據(jù)庫(kù)和內(nèi)容對(duì)象的分級(jí)存儲(chǔ)、統(tǒng)一管理、集成共享方式和要求。
制定檔案基礎(chǔ)數(shù)據(jù)庫(kù)建設(shè)的管理規(guī)范和制度,明確數(shù)據(jù)庫(kù)建設(shè)過(guò)程中的程序化和規(guī)范化操作方法。主要包括數(shù)字化數(shù)據(jù)庫(kù)的建設(shè)步驟、方法和要求;數(shù)字化檔案信息的網(wǎng)絡(luò)存儲(chǔ)、離線備份和災(zāi)難備份與恢復(fù)的功能、性能、技術(shù)規(guī)范和管理規(guī)定;數(shù)字化檔案信息的安全管理規(guī)范、備份方式與要求;備份的數(shù)字化檔案信息的管理方法等;檔案基礎(chǔ)數(shù)據(jù)庫(kù)的原始性保障措施,規(guī)定如何采用身份認(rèn)證、數(shù)據(jù)加密、電子簽名等技術(shù)確保檔案的真實(shí)、完整、有效和憑證性作用;數(shù)字化檔案信息的授權(quán)訪問(wèn)制度,定義開(kāi)放檔案、控制使用檔案、檔案的分類存儲(chǔ)和授權(quán)管理與訪問(wèn)制度。
制定檔案基礎(chǔ)數(shù)據(jù)庫(kù)建設(shè)的業(yè)務(wù)規(guī)范和制度,明確接收數(shù)字化檔案信息和開(kāi)展館藏檔案數(shù)字化加工的工作要求。主要包括數(shù)字化檔案的歸檔、移交、接收的工作制度和內(nèi)容、范圍、方式、方法及安全保障要求;開(kāi)展館藏?cái)?shù)字化加工的全過(guò)程工作方法、安全制度、保密措施、人員要求等;檔案基礎(chǔ)數(shù)據(jù)庫(kù)的滾動(dòng)建設(shè)與完善制度和工作要求。
2.檔案信息資源滾動(dòng)建設(shè)。主要包括數(shù)據(jù)庫(kù)平臺(tái)的建設(shè)以及數(shù)據(jù)著錄、數(shù)據(jù)處理、數(shù)據(jù)整合與數(shù)據(jù)備份系統(tǒng)的建設(shè)。數(shù)據(jù)庫(kù)平臺(tái)是指存儲(chǔ)檔案數(shù)據(jù)的軟硬件存儲(chǔ)系統(tǒng),包括網(wǎng)絡(luò)存儲(chǔ)設(shè)備的選型、安裝、調(diào)試和使用,數(shù)據(jù)庫(kù)管理系統(tǒng),存取數(shù)據(jù)的軟件平臺(tái),多門(mén)類檔案數(shù)據(jù)存儲(chǔ)方案的確定和實(shí)施,以及數(shù)據(jù)存儲(chǔ)系統(tǒng)的升級(jí)、維護(hù)與持續(xù)服務(wù)的計(jì)劃和工作要求等。檔案數(shù)據(jù)存儲(chǔ)系統(tǒng)的建設(shè)主要涉及到需求分析、方案確定、設(shè)備的購(gòu)買(mǎi)及其與服務(wù)器的連接等內(nèi)容,網(wǎng)絡(luò)存儲(chǔ)設(shè)備一般應(yīng)與服務(wù)器的購(gòu)買(mǎi)同步考慮。多數(shù)服務(wù)器供應(yīng)商提供存儲(chǔ)解決方案,并提供服務(wù)器與存儲(chǔ)設(shè)備之間的集成與互聯(lián)。
數(shù)據(jù)著錄系統(tǒng)是獲取檔案信息的門(mén)戶應(yīng)用,包括檔案內(nèi)容信息、檔案目錄和標(biāo)引等的錄入、修改、保存以及電子文件的上傳等內(nèi)容,著錄系統(tǒng)的建設(shè)主要是要將標(biāo)準(zhǔn)規(guī)范加以實(shí)施,在數(shù)據(jù)入口處將不合規(guī)范的數(shù)據(jù)進(jìn)行預(yù)處理,真正將符合檔案管理和保存要求的數(shù)據(jù)捕獲到數(shù)據(jù)庫(kù)存儲(chǔ)系統(tǒng)中。
數(shù)據(jù)處理系統(tǒng)是實(shí)現(xiàn)批量數(shù)據(jù)導(dǎo)入、導(dǎo)出、掛接和規(guī)范性校驗(yàn)的自動(dòng)化數(shù)據(jù)著錄系統(tǒng),一般由技術(shù)支持人員來(lái)完成,系統(tǒng)的建設(shè)需要根據(jù)檔案業(yè)務(wù)工作的需求,總結(jié)和預(yù)先定義數(shù)據(jù)處理的標(biāo)準(zhǔn)和自動(dòng)處理規(guī)則。
數(shù)據(jù)整合系統(tǒng)是在數(shù)據(jù)處理之前,根據(jù)檔案資源管理的需要,對(duì)檔案信息資源進(jìn)行分門(mén)別類的整理與規(guī)范化處理,以方便實(shí)現(xiàn)檔案信息資源的集成與共享。
數(shù)據(jù)備份系統(tǒng)建設(shè)的目的是提高數(shù)據(jù)的安全性,根據(jù)備份方案的不同,可以采取在線備份、脫機(jī)備份兩種方式。建設(shè)數(shù)據(jù)備份系統(tǒng),一方面要建立實(shí)施備份的軟硬件支撐平臺(tái)系統(tǒng),一方面要制定備份的策略和計(jì)劃,并在工作中實(shí)施和維護(hù),同時(shí)還需要對(duì)備份的數(shù)據(jù)實(shí)行全面的管理,這三方面內(nèi)容缺一不可。
三、檔案基礎(chǔ)數(shù)據(jù)庫(kù)建設(shè)是實(shí)現(xiàn)檔案資源共享、開(kāi)展社會(huì)化服務(wù)的基石
社會(huì)信息化使檔案信息資源面臨著一個(gè)全新的生存環(huán)境與發(fā)展空間。美國(guó)檔案學(xué)者杰拉爾德?漢姆先生曾指出:檔案應(yīng)該記載“人類生活的方方面面”,檔案工作者要“創(chuàng)造一個(gè)反映普通百姓生活喜好、需求的全新的文獻(xiàn)材料世界”,檔案館藏是反映“人類生活的廣闊領(lǐng)地” ①。因此,檔案資源唯有回歸社會(huì),得到最大限度的利用,才能體現(xiàn)檔案保管的價(jià)值和作用。事實(shí)告訴我們,實(shí)現(xiàn)檔案信息資源的集成化管理和共享化利用是檔案貼近公眾、服務(wù)社會(huì)的最佳解決方案。
要實(shí)現(xiàn)檔案信息資源的共享化利用,首先必須在檔案基礎(chǔ)數(shù)據(jù)庫(kù)的建設(shè)上下功夫,而檔案基礎(chǔ)數(shù)據(jù)庫(kù)的建設(shè)必須在檔案的形成、存儲(chǔ)和提供利用的各個(gè)環(huán)節(jié)加以重視。檔案的形成是一個(gè)從個(gè)體知識(shí)到組織知識(shí),再到社會(huì)知識(shí)轉(zhuǎn)換的文化積累、動(dòng)態(tài)跟蹤和滾動(dòng)發(fā)展的歷史記憶過(guò)程,檔案的開(kāi)發(fā)與利用則是人類傳承文明、創(chuàng)新發(fā)展的進(jìn)步與成長(zhǎng)的歷史形成過(guò)程。如圖1所示。這兩個(gè)相互銜接、彼此推動(dòng)的過(guò)程,循環(huán)往復(fù)、推陳出新構(gòu)成了人類社會(huì)的知識(shí)化動(dòng)增長(zhǎng)(Adaptive)和社會(huì)化自適應(yīng)的檔案資源形成過(guò)程模型。這表明了檔案文化通過(guò)“傳―承―積累―發(fā)展―傳”這樣一種類似于文化加工廠的生產(chǎn)工序,隨人類自身的代代繁衍而形成民族文化的生生不已、無(wú)始無(wú)終的傳承環(huán)鏈②。
圖1檔案資源的知識(shí)化共享和社會(huì)化服務(wù)過(guò)程模型
進(jìn)入21世紀(jì),我國(guó)的電子政務(wù)與各行各業(yè)的信息化已經(jīng)進(jìn)入了以知識(shí)管理為核心的快速提升和綜合運(yùn)營(yíng)的重要發(fā)展階段,信息技術(shù)的發(fā)展也把知識(shí)管理推到了一個(gè)核心重要的位置,“以知識(shí)為基礎(chǔ)的經(jīng)濟(jì)社會(huì)” 的提法更表明了人們對(duì)知識(shí)和技術(shù)在經(jīng)濟(jì)增長(zhǎng)中的作用有了更充分的認(rèn)識(shí)??梢韵胂?,未來(lái)的互聯(lián)網(wǎng)是一個(gè)豐富多彩的“知識(shí)網(wǎng)”,是一個(gè)儲(chǔ)存綜合知識(shí)的文化資源大倉(cāng)庫(kù)。檔案作為人類社會(huì)活動(dòng)的原始記錄者和忠實(shí)承載者,記錄了人類的社會(huì)成果的同時(shí)也揭示著人類文化,它是民族文化遺產(chǎn)的重要組成部分。同時(shí)檔案在文化傳承中占據(jù)著舉足輕重的地位,發(fā)揮著不可替代的作用, 正如張輯哲在其《維系之道―檔案與檔案管理》著作中所談:“正是由于有了檔案與檔案管理,人類才能夠不斷地在繼承中存在、發(fā)展,在存在、發(fā)展中延續(xù),不斷使自己真正成為一個(gè)連續(xù)的時(shí)空整體。檔案與檔案管理是人類社會(huì)時(shí)空統(tǒng)一性和連續(xù)性的維系之道……”。
檔案信息資源必將會(huì)成為未來(lái)“知識(shí)網(wǎng)”中不可或缺的重要組成部分,因此,在開(kāi)展檔案信息化建設(shè)過(guò)程中,首要重要的事情是建設(shè)高質(zhì)量的檔案基礎(chǔ)數(shù)據(jù)庫(kù),充分利用數(shù)據(jù)挖掘、數(shù)據(jù)分析工具提供快速檢索與服務(wù),實(shí)現(xiàn)檔案信息資源的社會(huì)化共享,才能真正體現(xiàn)檔案保存的價(jià)值和意義。
注釋:
①.F.杰拉爾德,漢姆,劉越南譯,檔案邊緣,《山西檔案》,1999年第1期.
關(guān)鍵詞:數(shù)字圖書(shū)館;信息數(shù)字化;存儲(chǔ)技術(shù);發(fā)展對(duì)策
數(shù)字圖書(shū)館是一個(gè)將信息資源以數(shù)字化方式存貯并通過(guò)網(wǎng)絡(luò)提供即時(shí)服務(wù)的信息系統(tǒng),因而信息資源數(shù)字化是實(shí)現(xiàn)數(shù)字圖書(shū)館的根本條件,也是數(shù)字圖書(shū)館正常運(yùn)轉(zhuǎn)的關(guān)鍵步驟。但目前高校信息數(shù)字化中由于種種原因還存在許多問(wèn)題,如重復(fù)建設(shè)、知識(shí)產(chǎn)權(quán)、技術(shù)應(yīng)用和標(biāo)準(zhǔn)與規(guī)范等問(wèn)題,這些都嚴(yán)重阻礙了我國(guó)數(shù)字圖書(shū)館的健康發(fā)展。因此,高校在實(shí)施信息數(shù)字化建設(shè)過(guò)程中,不僅需要更新觀念、統(tǒng)籌建設(shè),還要規(guī)范標(biāo)準(zhǔn)、加強(qiáng)立法、提高館員素質(zhì),更要加強(qiáng)適合我國(guó)國(guó)情的技術(shù)創(chuàng)新。
一、數(shù)字圖書(shū)館中的信息數(shù)字化
(一)信息數(shù)字化的內(nèi)涵
從社會(huì)信息化環(huán)境來(lái)說(shuō),數(shù)字圖書(shū)館是運(yùn)用計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、通信技術(shù)等多種信息技術(shù),對(duì)不同載體和類型的信息資源進(jìn)行搜集、選擇和規(guī)范化處理,使之以數(shù)字化的方式存儲(chǔ),建立分布式的館藏信息資源庫(kù)和虛擬信息資源庫(kù),并通過(guò)網(wǎng)絡(luò)向世界各地用戶提供無(wú)時(shí)空限制服務(wù)的信息系統(tǒng)。數(shù)字圖書(shū)館的主要職能是搜集、保存和傳遞數(shù)字化信息,可以稱之為數(shù)字化信息的存儲(chǔ)和傳遞中心,因而信息數(shù)字化建設(shè)無(wú)論從質(zhì)量還是從數(shù)量上都是數(shù)字圖書(shū)館發(fā)展的關(guān)鍵環(huán)節(jié)。
(二)信息數(shù)字化的關(guān)鍵技術(shù)
信息數(shù)字化技術(shù)包括數(shù)字化信息的生成技術(shù)、存儲(chǔ)技術(shù)和壓縮技術(shù)等,其關(guān)鍵技術(shù)是數(shù)字化信息的生成技術(shù)和存儲(chǔ)技術(shù)。1.數(shù)字化信息的生成技術(shù)包括有鍵盤(pán)錄入和非鍵盤(pán)錄入兩種方式,目前使用較多的是第二種方式。鍵盤(pán)錄入是一種手工轉(zhuǎn)換的文本模式;非鍵盤(pán)錄入包括手寫(xiě)識(shí)別技術(shù)、印刷文稿掃描識(shí)別技術(shù)、語(yǔ)音識(shí)別技術(shù)。在信息數(shù)字化實(shí)際工作中,高校許多數(shù)字圖書(shū)館都采用兩者相結(jié)合的方式來(lái)規(guī)避鍵盤(pán)錄入的較高錯(cuò)誤率和掃描方式對(duì)硬件的較高要求。2.數(shù)字化信息的存儲(chǔ)技術(shù)包括直接存儲(chǔ)技術(shù)和網(wǎng)絡(luò)存儲(chǔ)技術(shù)。直接存儲(chǔ)技術(shù)是目前大多數(shù)數(shù)字圖書(shū)館的數(shù)據(jù)存貯技術(shù),主要包括光盤(pán)塔技術(shù)、磁盤(pán)陣列技術(shù)和磁帶庫(kù)技術(shù);網(wǎng)絡(luò)存儲(chǔ)技術(shù)包括直接附加存儲(chǔ)(DAS)、網(wǎng)絡(luò)附加存儲(chǔ)(NAS)、存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)、小型計(jì)算機(jī)系統(tǒng)接口(ISCSI)技術(shù)和內(nèi)容尋址存儲(chǔ)(CAS)[1](P.20-21)。
二、信息數(shù)字化中存在的主要問(wèn)題
雖然我國(guó)數(shù)字圖書(shū)館建設(shè)中的信息數(shù)字化工作取得了一定的進(jìn)步,但由于觀念和技術(shù)的落后,信息數(shù)字化建設(shè)整體上呈現(xiàn)出數(shù)字信息資源重復(fù)建設(shè)嚴(yán)重、版權(quán)保護(hù)立法不健全、缺乏有力的技術(shù)支撐、標(biāo)準(zhǔn)和規(guī)范化建設(shè)滯后等問(wèn)題[2](P.13-14)。
(一)重復(fù)建設(shè)問(wèn)題
由于國(guó)內(nèi)各地區(qū)、各系統(tǒng)以及各館之間無(wú)一個(gè)權(quán)威的協(xié)調(diào)機(jī)構(gòu),也無(wú)規(guī)劃布局和分工實(shí)施計(jì)劃,數(shù)字圖書(shū)館建設(shè)缺乏全局性的統(tǒng)一規(guī)劃和政府權(quán)威部門(mén)的協(xié)調(diào),相當(dāng)多的所謂數(shù)字圖書(shū)館建設(shè)仍處于各自為政、貪大求全和相對(duì)分散的無(wú)序狀態(tài),信息資源重復(fù)現(xiàn)象的問(wèn)題嚴(yán)重。近年來(lái),我國(guó)各級(jí)政府投入了大量資金,各級(jí)各類數(shù)字圖書(shū)館都在進(jìn)行數(shù)字信息資源建設(shè),甚至引進(jìn)CNKI等數(shù)據(jù)庫(kù),這種現(xiàn)象在各大高校數(shù)字圖書(shū)館的信息數(shù)字化中也非常普遍,在相當(dāng)廣的范圍內(nèi)存在著潛在的數(shù)字信息資源重復(fù)建設(shè)問(wèn)題。
(二)知識(shí)產(chǎn)權(quán)問(wèn)題
隨著數(shù)字圖書(shū)館的開(kāi)通,數(shù)據(jù)庫(kù)的利用將越來(lái)越廣泛,由此產(chǎn)生的知識(shí)產(chǎn)權(quán)問(wèn)題就不可避免,其中爭(zhēng)論的焦點(diǎn)是關(guān)于網(wǎng)絡(luò)作品的制作、傳播和使用的版權(quán)保護(hù)問(wèn)題,讓一些數(shù)字圖書(shū)館在實(shí)踐中遭遇法律尷尬。著作權(quán)人公開(kāi)指責(zé)圖書(shū)館界濫用權(quán)利,嚴(yán)重?fù)p害了著作權(quán)人的利益;出版界也有人認(rèn)為文獻(xiàn)信息的數(shù)字化是復(fù)制出版界的出版物,在網(wǎng)上出現(xiàn)了成千上萬(wàn)的復(fù)制本、使出版界的經(jīng)濟(jì)利益受到損害;而圖書(shū)館界則認(rèn)為信息獲取的主動(dòng)權(quán)完全掌握在版權(quán)人手里,這樣會(huì)嚴(yán)重地影響知識(shí)的創(chuàng)造和傳播。因而制定網(wǎng)上數(shù)字化文獻(xiàn)的著作權(quán)法律法規(guī)已成當(dāng)務(wù)之急。
(三)技術(shù)應(yīng)用問(wèn)題
隨著電子出版物的收藏和網(wǎng)絡(luò)數(shù)字化資源的采集,圖書(shū)館越來(lái)越多的信息一入館就是數(shù)字化的,而傳統(tǒng)館藏,進(jìn)行數(shù)字化轉(zhuǎn)化所使用的技術(shù)主要是光學(xué)字符識(shí)別(OCR)掃描錄入方式。一般的OCR錄入系統(tǒng)能夠?qū)崿F(xiàn)對(duì)各種現(xiàn)代書(shū)籍、簡(jiǎn)繁體書(shū)籍、報(bào)刊雜志、公文檔案的錄入識(shí)別,且識(shí)別率高,還能實(shí)現(xiàn)各種校對(duì),然而,對(duì)于傳統(tǒng)館藏文獻(xiàn)的數(shù)字化,特別對(duì)含有繁體手寫(xiě)漢字的古籍文獻(xiàn)、簡(jiǎn)繁混排的中文文獻(xiàn)、專業(yè)性強(qiáng)的中文文獻(xiàn)以及難于機(jī)檢的漢字文獻(xiàn),OCR技術(shù)目前還存在很大的誤識(shí)率和拒識(shí)率,為此,需要對(duì)OCR系統(tǒng)進(jìn)行深入的研究和改進(jìn),提高其應(yīng)用的全面性,并要引入中文校對(duì)、錄入。
(四)標(biāo)準(zhǔn)與規(guī)范問(wèn)題
目前主要有:1.缺乏對(duì)標(biāo)準(zhǔn)規(guī)范重要性的認(rèn)識(shí);2.缺乏普遍接受和廣泛應(yīng)用的關(guān)鍵標(biāo)準(zhǔn)規(guī)范;3.缺乏對(duì)標(biāo)準(zhǔn)規(guī)范建設(shè)的系統(tǒng)化把握;4.缺乏對(duì)標(biāo)準(zhǔn)規(guī)范的開(kāi)放描述和開(kāi)放應(yīng)用;5.缺乏開(kāi)放、聯(lián)合、共享的標(biāo)準(zhǔn)規(guī)范建設(shè)與應(yīng)用機(jī)制。例如圖書(shū)館在信息資源建設(shè)過(guò)程中所采用的軟件系統(tǒng)差異很大,如ILAS系統(tǒng)、圖書(shū)館集成系統(tǒng)等,其標(biāo)準(zhǔn)和格式都不一致,導(dǎo)致開(kāi)發(fā)的數(shù)據(jù)庫(kù)不能兼容,檢索界面不一,檢索途徑也不同,檢索語(yǔ)言也無(wú)統(tǒng)一的規(guī)范控制,無(wú)法在網(wǎng)上實(shí)現(xiàn)資源共享。
三、信息數(shù)字化發(fā)展對(duì)策
(一)加強(qiáng)特色數(shù)字館藏建設(shè)
只有具有特色的數(shù)據(jù)才能贏得較高的網(wǎng)絡(luò)訪問(wèn)頻率,才具有資源共享的價(jià)值,也是各大數(shù)字圖書(shū)館以最小投入換取最大效益的文獻(xiàn)信息共享模式。因此,在進(jìn)行本館的信息數(shù)字化建設(shè)時(shí),除了需要全面考慮文獻(xiàn)價(jià)值、用戶需求、載體形態(tài)、技術(shù)可行性和著作版權(quán)等一般因素外,還需要科學(xué)而系統(tǒng)地考慮館藏內(nèi)容、館藏特色,尤其是館藏結(jié)構(gòu)和館藏級(jí)別。館藏級(jí)別一般可以劃分為永久保存級(jí)、服務(wù)級(jí)、鏡像級(jí)和鏈接級(jí)4個(gè)基本層次。永久保存級(jí)館藏是指具有確定的保存價(jià)值和用途,并具有惟一性的特色文獻(xiàn);服務(wù)級(jí)館藏是指十分有用和必須的虛擬館藏;鏡像級(jí)館藏是指其他數(shù)字圖書(shū)館館藏的拷貝,與永久保存級(jí)相同的是它們都是現(xiàn)實(shí)館藏,與之不同的是它缺乏惟一性;鏈接級(jí)館藏則是貯存于其他數(shù)字圖書(shū)館中的數(shù)字化信息資源,其內(nèi)容較為廣泛,與服務(wù)級(jí)館藏相比,它與用戶的相關(guān)性要低一些。只有通過(guò)這些特色數(shù)字館藏的建設(shè),才能真正優(yōu)化館藏文獻(xiàn)的結(jié)構(gòu),加快館藏信息利用,最大限度地避免重復(fù)建設(shè),從而提高整個(gè)社會(huì)文獻(xiàn)資源的保障水平和信息資源的開(kāi)發(fā)利用效率。
(二)從信息源頭加快信息數(shù)字化建設(shè)
文獻(xiàn)信息資源的源頭在出版社和出版商,每年都有數(shù)以萬(wàn)計(jì)的文獻(xiàn)資源被出版系統(tǒng)數(shù)字化,這個(gè)資源如能加以利用,將是一筆巨大的財(cái)富。據(jù)2001年統(tǒng)計(jì),全國(guó)530家出版社的圖書(shū)總量是154 526種[3](P.32-33),一年的文獻(xiàn)資源總量就相當(dāng)于一個(gè)中型圖書(shū)館文獻(xiàn)資源的全部館藏總量,而且還在逐年遞增。如果把信息數(shù)字化的生產(chǎn)重任交給出版商,將會(huì)帶來(lái)很大的經(jīng)濟(jì)效益和社會(huì)效益:一方面可以大量減少信息資源重復(fù)數(shù)字化帶來(lái)的人力、物力、財(cái)力的浪費(fèi);另一方面,信息資源數(shù)據(jù)庫(kù)的建設(shè)者可以通過(guò)與出版社合作取得授權(quán)來(lái)解決信息資源建設(shè)、傳播中的知識(shí)產(chǎn)權(quán)問(wèn)題,既能保護(hù)作者的知識(shí)產(chǎn)權(quán),又能照顧到出版商利益,同時(shí)還能讓各類文化、科技的文明成果納入數(shù)字圖書(shū)館,使其能為更多的人服務(wù),創(chuàng)造出更大的價(jià)值。
(三)開(kāi)發(fā)和利用先進(jìn)技術(shù)
無(wú)論是從數(shù)字圖書(shū)館建設(shè),還是從文獻(xiàn)信息數(shù)字化技術(shù)來(lái)說(shuō),技術(shù)問(wèn)題仍然是制約著信息資源共享的主要問(wèn)題。數(shù)字圖書(shū)館是采用現(xiàn)代高新技術(shù)的系統(tǒng)工程,不僅需要立項(xiàng)研究開(kāi)發(fā)新的應(yīng)用技術(shù),而且還需要各種高新技術(shù)成果的及時(shí)轉(zhuǎn)化和應(yīng)用。目前,信息資源數(shù)字化的關(guān)鍵技術(shù)在發(fā)達(dá)國(guó)家已趨于成熟,他山之石、可以攻玉,加強(qiáng)技術(shù)研發(fā)工作可以從以下幾個(gè)方面進(jìn)行:1.從高校數(shù)字圖書(shū)館建設(shè)項(xiàng)目的實(shí)際出發(fā),組織專人對(duì)信息數(shù)字化關(guān)鍵技術(shù)進(jìn)行跟蹤、研究、攻關(guān);2.借鑒引進(jìn)適合國(guó)情的國(guó)外先進(jìn)技術(shù)和先進(jìn)產(chǎn)品;3.集成和采用以國(guó)家“863”計(jì)劃為代表的國(guó)內(nèi)已有的科技成果;4.開(kāi)發(fā)適合我們自己的先進(jìn)技術(shù),如電子信息處理技術(shù)、指引庫(kù)技術(shù)、語(yǔ)音識(shí)別技術(shù)及信息媒介技術(shù),同時(shí)規(guī)范有關(guān)技術(shù)標(biāo)準(zhǔn)[4](P.55-56)。
(四)促進(jìn)信息數(shù)字化建設(shè)的規(guī)范化和標(biāo)準(zhǔn)化
信息數(shù)字化涉及文獻(xiàn)描述、組織和檢索多個(gè)方面,各個(gè)數(shù)字圖書(shū)館之間想共建共享信息資源,就必須統(tǒng)一標(biāo)準(zhǔn)。因此,圖書(shū)館數(shù)字化建設(shè)要走資源共享的道路,必須打破各自為政的局面,各圖書(shū)館文獻(xiàn)分類編目不統(tǒng)一,對(duì)資源共享造成很大的障礙,在書(shū)目數(shù)據(jù)方面,數(shù)據(jù)不標(biāo)準(zhǔn)就不能保證用戶從各個(gè)角度迅速、準(zhǔn)確地檢索資料。因此必須有一個(gè)數(shù)字圖書(shū)館全國(guó)中心,建立和健全全國(guó)數(shù)字圖書(shū)館使用的各種標(biāo)準(zhǔn)規(guī)范,協(xié)調(diào)規(guī)范資源庫(kù)建設(shè),解決信息數(shù)字化建設(shè)的標(biāo)準(zhǔn)化問(wèn)題。根據(jù)標(biāo)準(zhǔn),再由地區(qū)內(nèi)、地區(qū)間各館合作建庫(kù)或由地區(qū)文獻(xiàn)信息中心統(tǒng)一建庫(kù),各館錄用,最終達(dá)到全國(guó)的標(biāo)準(zhǔn)化。
(五)提高館員的信息處理技術(shù)與研究人員的素質(zhì)
隨著信息資源概念的發(fā)展,文獻(xiàn)信息數(shù)量和類型的增加,信息工作方式和手段的改進(jìn),圖書(shū)館的工作對(duì)象已不再局限于對(duì)傳統(tǒng)紙質(zhì)文獻(xiàn)和某些縮微資料或視聽(tīng)資料的一般性收集、整理、組織、管理等工作,數(shù)字圖書(shū)館面臨更多的信息載體和信息服務(wù)方式。例如,各種電子圖書(shū)、網(wǎng)絡(luò)信息資源、CD-ROM和其他電子資料已成為數(shù)字圖書(shū)館采訪和處理的主要對(duì)象,這對(duì)于長(zhǎng)期熟悉紙質(zhì)文獻(xiàn)的傳統(tǒng)圖書(shū)館員來(lái)說(shuō)就是一個(gè)巨大的挑戰(zhàn),同時(shí),數(shù)字圖書(shū)館還會(huì)帶來(lái)一系列需要解決的新問(wèn)題,如知識(shí)產(chǎn)權(quán)歸屬品種和復(fù)本的比例、購(gòu)書(shū)經(jīng)費(fèi)的分配等。在書(shū)刊分類和編目工作上,館員的技術(shù)性處理工作會(huì)迅速減少,但會(huì)被賦予需要更多知識(shí)的技能才能完成的新任務(wù)。也就是說(shuō),他們可能參與更多的信息技術(shù)工作、文獻(xiàn)信息研究和用戶研究工作??傊?,現(xiàn)在圖書(shū)館工作者應(yīng)當(dāng)是信息專家和信息工程師,是信息系統(tǒng)的設(shè)計(jì)者,也是信息用戶的導(dǎo)航者。鑒于此,在提升數(shù)字圖書(shū)館館員的素質(zhì)上,一方面可以通過(guò)吸收一批計(jì)算機(jī)、通訊、外語(yǔ)方面有特長(zhǎng)的人才充實(shí)圖書(shū)館人員隊(duì)伍;另一方面應(yīng)加強(qiáng)在職人員的培訓(xùn),提高其計(jì)算機(jī)、英語(yǔ)和專業(yè)綜合技能與素質(zhì),及時(shí)調(diào)整和優(yōu)化他們的知識(shí)結(jié)構(gòu),以適應(yīng)信息資源數(shù)字化建設(shè)的要求。
參考文獻(xiàn)
[1]陳柯明.談網(wǎng)絡(luò)環(huán)境下數(shù)字圖書(shū)館信息存儲(chǔ)技術(shù)應(yīng)用 發(fā)展[J].圖書(shū)館界,2004,(6).
[2]梁平.我國(guó)數(shù)字圖書(shū)館建設(shè)中的幾個(gè)問(wèn)題[J].中華醫(yī)學(xué) 圖書(shū)情報(bào)雜志,2004,(13).
檔案管理建議與意見(jiàn) 檔案工作意見(jiàn) 檔案管理制度 檔案管理 檔案專業(yè) 檔案合規(guī)管理 檔案信息化建議 檔案工作總結(jié) 檔案匯報(bào)材料 檔案工作論文 紀(jì)律教育問(wèn)題 新時(shí)代教育價(jià)值觀