隨信息技術(shù)的飛速發(fā)展,帶來了文檔管理及存儲、利用方式的革命。用文檔電子影像數(shù)字化信息代替紙張等傳統(tǒng)介質(zhì),不僅大大節(jié)約了存儲空間,無限地延長了保存時間,同時為查閱利用帶來了極大的便利,因此,文檔數(shù)字化逐漸得到圖書館、檔案館等各行各業(yè)用戶的一致認可。
文檔數(shù)字化是指利用計算機技術(shù)、網(wǎng)絡(luò)技術(shù)和智能識別技術(shù)將傳統(tǒng)的紙質(zhì)信息轉(zhuǎn)化成計算機內(nèi)碼或圖像。然后將數(shù)字化的信息發(fā)布于局域網(wǎng)、廣域網(wǎng),形成若干個數(shù)字信息集群,供相關(guān)人員方便地查詢利用。
國家863計劃數(shù)字圖書館戰(zhàn)略小組組長,原文化部副部長徐文伯指出:數(shù)字圖書館建設(shè)是一場沒有硝煙的戰(zhàn)爭,要用中文信息資源去占領(lǐng)這塊網(wǎng)絡(luò)陣地。國家檔案局國家檔案事業(yè)十五規(guī)劃明確提出,要大力推進檔案信息化建設(shè),在全國有條件的部分地區(qū)、部分行業(yè)率先建成一批數(shù)字化檔案館室。
在日趨激烈的國際競爭中,誰掌握了更多的信息資源,并使之轉(zhuǎn)化為經(jīng)濟技術(shù)優(yōu)勢,誰就掌握了競爭和生存發(fā)展的主動權(quán)。信息資源電子化是人類社會文明進步的必然趨勢,能否跟上國際潮流,完成信息資源電子化進程,關(guān)系到一個國家、一個民族的興衰。
數(shù)字化實施數(shù)字太微檔案數(shù)字化解決方案是指對檔案進行分類整理、標(biāo)引著錄、圖像掃描與處理、案卷整理、移交進館等工作的總稱。
一、檔案分類整理
檔案分類整理是指將文檔進行分解整理,包括原件的拆卷、起訂、粘貼頁撕開,頁號編寫有誤的重新編號。并按掃描后的電子文件組織形式進行重新分類,以便掃描時的批次處理。
二、檔案交接
分類整理后的檔案按時間先后或其他分類項順序提出、提卷時編寫檔案的頁號和需要掃描錄入的文件頁號及抽取不需掃描的頁面,并按實際頁數(shù)填寫詳細的檔案交接清單,并由雙方主管人員簽字。
三、標(biāo)引著錄
標(biāo)引著錄為了方便查閱與管理,打印制作檔案目錄及檔案封面,對文字錄入的準(zhǔn)確性要求較高,但要錄的文本域并不是完全統(tǒng)一的在某一頁面上,一些文本域要在多個文件中選擇,所以錄入時需要相關(guān)檔案管理人員進行指導(dǎo),制作相應(yīng)的《文字錄入工作說明書》,確保文本域錄入的準(zhǔn)確率。
四、檔案拆分
檔案拆分前要對檔案進行統(tǒng)一的編號,編制總頁號后,要從中選中需要掃描的頁面。再一次編制所需掃描的頁號,兩個頁號需用鉛筆的顏色或位置區(qū)分,以確保檔案還原時能夠清楚區(qū)別和核時頁數(shù)。
檔案拆分時要嚴(yán)格按照要求對不需掃描的頁進行標(biāo)注。
五、檔案的掃描
原件的掃描與存儲格式完全按照國家檔案管理的統(tǒng)一標(biāo)準(zhǔn)要求掃描。掃描人員按照《掃描與處理工作說明書》的要求,填寫移交清單(此移交清單是檔案拆分人員和掃描人員共同填寫)并簽字領(lǐng)取,再進行紙件掃描。掃描圖像使用先進的圖像掃描處理軟件(快圖像系統(tǒng)),掃描人員可根據(jù)原稿質(zhì)量,對系統(tǒng)進行定義,如自動傾斜校正、自動去污、自動分文件等批處理功能。在由系統(tǒng)自動處理功能的同時,掃描人員根據(jù)原件的實際情況做相應(yīng)的調(diào)整,如超大頁面的處理、紙張顏色深淺及薄厚的處理、掃描時可根據(jù)不同原件的情況,調(diào)整圖像的分辨率、閥值、明亮度以及掃描方式和掃描速度,確保在掃描圖像質(zhì)量清晰的情況下,使原件完好無損。
圖像的分辨率正常情況下為200dpi,如遇字間距和行間距過密、原件本身是復(fù)印件等字跡不清楚的情況,可適當(dāng)增加掃描的分辨率,但要保正圖像清晰的同時,又不影響遠程查詢和瀏覽的速度。
六、圖像處理
數(shù)字太微檔案數(shù)字化系統(tǒng)采用自動化處理和人工處理相結(jié)合的方式,確保圖像質(zhì)量的完美。通過校對系統(tǒng)對圖像進行校對,確保圖像順序正確、去斑點,在校對時,發(fā)現(xiàn)不合格圖像及時返回前一工序進行改正。
(1)污漬、黑邊、偏斜處理
(2)全文字面的掃描密度
(3)粘帖頁與表格
(4)插圖
(5)照片頁的處理
(6)存儲格式與頁面空間分辯率:200dpi圖像格式:TIFF、JPG儲存空間:A4,20-30KB/頁
七、質(zhì)量檢驗
對掃描處理完成后的圖像頁進行檢驗,對檔案拆分、掃描、修正、去污、插圖、照片的處理以及文本和圖像頁的匹配等質(zhì)量進行全面檢驗。
對文本域錄入與文本錄入域的標(biāo)引、文件的頁號及頁數(shù)進行對比,對掃描前圖像頁的標(biāo)引與掃描后的圖像頁的編號與頁數(shù)進行對比,發(fā)現(xiàn)不合格的登記清單并退回上一流程重新處理。
八、掛接
文本域錄入和掃描處理檢驗后的圖像成品,由系統(tǒng)自動進行文字圖像與系統(tǒng)的匹配掛接。掛接到檔案管理系統(tǒng)中后,進行再次的成品驗收。
九、案卷整理
檔案整理工作嚴(yán)格按照國家檔案局規(guī)定的相關(guān)標(biāo)準(zhǔn)和本單位的實際情況進行有序的整理,安排專人負責(zé)案卷合并與整理。