天天被操天天被操综合网,亚洲黄色一区二区三区性色,国产成人精品日本亚洲11,欧美zozo另类特级,www.黄片视频在线播放,啪啪网站永久免费看,特别一级a免费大片视频网站

現在位置:范文先生網>理工論文>計算機信息技術>地方文獻數據庫系統(tǒng)

地方文獻數據庫系統(tǒng)

時間:2023-02-22 16:00:10 計算機信息技術 我要投稿
  • 相關推薦

地方文獻數據庫系統(tǒng)


一、前言

地方文獻是我國公共圖書館藏書建設的重要組成部分。這些出版物記載和反映了當地社會發(fā)展的歷史進程,是國家的重要資源和財富。目前,地方文獻工作在我國省市、自治區(qū)公共圖書館已受到普遍重視,許多館建立了地方文獻專藏,對文獻的收集、整理、報道和利用做了大量工作,為當地的四化建設發(fā)揮了積極的作用。但是,我國的地方文獻工作基本上還是沿用傳統(tǒng)的理論和方法,在各方面已遠不能適應當今信息社會的要求。在今天新技術革命浪潮蓬勃興起的形勢下,公共圖書館的地方文獻工作怎樣才能適應時代的需要這一重要課題,已歷史地擺在我們圖書館工作者的面前。我們認為,面對新技術革命的挑戰(zhàn),地方文獻工作必須實現現代化,才能使傳統(tǒng)的地方文獻工作獲得新的發(fā)展,從而達到促進地區(qū)出版物資源共享的目的。基于這種認識,我館在原有地方文獻工作的基礎上,開始用電腦建立地方文獻數據庫。經過一年多的研制,該數據庫已初步建成并投入使用。為與國內同行交流,本文對該數據庫系統(tǒng)作簡要介紹。

二、收錄范圍與文獻源

建立地方文獻數據庫,首先要明確收錄范圍和解決文獻源問題。對地方文獻的收錄范圍,我館前館長杜定友先生曾提出過著名的“史料、地方出版物和地方人士著述”三部分的論述。在杜定友先生的倡導下,我館致力于地方文獻的收集工作,建立了廣東地方文獻專藏。根據我館地方文獻的收集入藏情況,我們擬定了地方文獻數據庫收錄范圍的原則:

1.具有廣東地方特點,并有一定學術、史料價值的文獻資料(包括有地方特點的科技文獻)。

2.反映本省人物(包括廣東籍知名人士以及在廣東有過影響的非廣東籍人士)生平、傳記、事跡的文獻資料。

3.有廣東地方特點的本省出版物和外省出版物。

4.廣東人士著述(擁有地方特點的文獻資料部分)。

對不予收錄的文獻,也作了如下規(guī)定:

1)雖是地方出版物,但內容并無地方特點的文獻資料。

2)作者雖是廣東人士,但文獻內容并無地方特點的著述。

3)無地方特點的科技文獻。

4)印刷質量差,內容貧乏的非正式出版物。

5)同收錄原則相悖的其它文獻資料。

具體的收錄范圍有24項。

地方文獻數據庫所收錄文獻的類型包括:專著,期刊、報紙、會議錄、匯編、學位論文、科技報告、專利文獻、手稿、地方志、族譜、檢索工具、參考工具、圖表、古籍等。其中檢索工具包括反映本省圖書館館藏的各種書目、文摘、聯合目錄;圖表包括地圖、氣象圖、地質圖;參考工具包括年鑒、手冊等;專利文獻只限于本省單位和個人申請的國內外專利;報紙限于本省出版報紙的目錄。

廣泛征集地方文獻資料,保證地方文獻數據庫有充足的文獻源,是建立地方文獻數據庫極為重要的一環(huán)。我館地方文獻工作,早在解放前即已引起重視。建國后,更加廣泛深入地開展了地方文獻的收集和整理工作。省人民政府曾先后發(fā)出三個關于地方文獻工作的文件,指定我館為全省地方文獻的征集工作機構和收藏中心,要求各級人民政府和各企事業(yè)單位,將所出版的文獻資料無償向我館繳送二冊,這為征集地方文獻打下了良好的基礎。在全省各有關單位的大力協助下,經過幾十年的努力,我館已逐步建立起擁有18萬冊,在海內外有一定影響的廣東文獻專藏,形成了廣東文獻的收藏中心。這是建立地方文獻數據庫的基礎。

建立地方文獻數據庫,在確定收錄范圍的同時,還要認真選擇和挖掘文獻源。因為地方文獻包括了反映當地歷史和現狀的文獻資料,數量以萬計,內容極為繁雜。圖書館應該首先選擇利用率高,有一定學術和史料價值的文獻存貯進電腦,其中科技文獻應占有相當的比例。這是時代的要求。因此,我館在建庫前對文獻源的選擇進行了較深入的研究,最后決定從現代期刊入手,對符合收錄范圍的期刊論文進行著錄標引,然后輸入電腦。目前文獻的前處理工作正順利進行,現已標引出地方文獻資料8,000多篇,輸入電腦5,000篇。對于其它類型的文獻資料,今后將有計劃按步驟地進行輸入,從而逐步建立起我省的地方文獻數據庫。

三、數據庫系統(tǒng)目標與模式

作為地方性情報檢索系統(tǒng)的地方文獻數據庫,其總目標是:收錄和存貯反映本省歷史和現狀的地方文獻資料目錄,編輯出版綜合性的地方文獻通報(書目)和各種專題的地方文獻目錄,為當地黨政軍領導機關和各科研生產單位提供文獻檢索服務;作為地方文獻的查目中心,將通過聯機網絡同當地的主要圖書情報部門聯網,逐步實現地方文獻的聯機編目和檢索,從而促進地區(qū)性的資源共享。

為了實現上述目標,我們根據本省的實際情況,為地方文獻數據庫設計了下述模式:

1.選擇具有良好漢字處理功能的遠程通訊能力的微型電腦作為數據錄入工作站和脫機檢索系統(tǒng),這一系統(tǒng)配有完整的外部設備,可獨立進行地方文獻書目數據的錄入、檢索和編輯出版地方文獻通報。對已輸入電腦的大量數據,可轉貯到軟盤,為將來在中、大型電腦上建庫作好數據準備。我館已購置了四套IBM5550中文電腦,其中一至二套用于地方文獻數據庫的建庫工作。

2.設置電腦聯機通訊線路,同當地計算中心的中、大型機聯網。利用主權的計算機資源建立地方文獻數據庫,一般可存貯幾百萬篇的文獻,從而為實現地方文獻書目數據的資源共享打下基礎。我館已同省計算中心達成協議,利用該中心引進的IBM 4341主機建立地方文獻數據庫,并在86年二月成功地進行了利用市內話線聯機通訊的試驗,計劃在明年內實現我館IBM5550同主機的聯網。

3.在本館購置中、小型主機后,將進一步完善地方文獻數據庫系統(tǒng),在省、市領導機關和主要科研機構設置檢索終端,并同當地的主要圖書情報部門聯網,進行聯機編目和檢索,從而使地方文獻數據庫真正達到資源共享的目的。

4.把電腦同縮微技術結合起來,實現地方文獻資料的全文檢索。我館準備在條件具備時,購置一套16毫米的縮微拍攝設備,用于拍攝地方文獻資料。在數據庫中檢索命中的文獻,可根據其文獻號,在縮微閱讀機上獲得原文。

在我省有關部門的大力支持下,經過全館同志的努力,廣東地方文獻數據庫的系統(tǒng)目標正在逐步實現。目前,在IBM 5550微機上已實現了以下功能:

1)地方文獻書目數據的錄入與存貯。針對地方文獻具有多種類型的特點,本數據庫根據國家文獻著錄標準,設置了多種文獻類型的自動格式識別程序,不但提供了完善的人機對話錄入和修改方式,而且能夠對錄入的書目數據自動進行著錄格式的自動識別,從而使書目數據達到標準化的要求。

2)編輯和打印綜合性檢索刊物《廣東文獻通報》。該刊物以及時報道我館新入藏地方文獻為宗旨,兩月出版一期。每期通報正文約70頁,按《中圖法》分類體系排列,并附有地區(qū)索引,方便縣、市圖書館、檔案館等有關單位從地區(qū)途徑查找文獻。從86年五月起,至今已出版文獻通報六期及通報的年度累積索引一冊。

3)自動編目功能,數據庫系統(tǒng)可根據輸入的地方文獻書目數據,自動生成數據庫倒排文檔,供文獻檢索之用。另外,還可根據指定的專題,編制各種類型的地方文獻專題書目,以及編制地方文獻的累積本。

4)文獻檢索功能。因受1BM 5550系統(tǒng)外存的限制,目前數據庫的存貯容量為25,000篇文獻。如將外存擴大到40MB,數據庫容量將可擴大到10萬篇。在此范圍內,用戶可從篇名、著者、分類、主題、地名等五個途徑進行聯機檢索,并允許用多個主題詞或多個檢索途徑進行組配,以提高檢準率。輸出結果既可在屏幕顯示,也可以用打印機輸出。

5)詞表管理功能。數據庫系統(tǒng)可對地方文獻標引詞表、地名表和機內分類表進行插入、修改、刪除等項操作,并提供編輯打印詞表的功能。目前我館已編制出《地方文獻標引詞表》、《廣東省地名表》和《地方文獻數據庫分類表》。

6)地方文獻征集和標引管理功能。數據庫能為地方文獻中的連續(xù)性出版物建立檔案,并有催索、記到、裝訂以及標引管理等功能,可以對地方文獻征集和標引實現科學管理。

除了上述功能外,我們計劃在87年上半年前,為該數據庫增加MARC機讀目錄生產、遠程聯機通訊等程序,使數據庫的各種功能進一步完善。

四、數據庫的設計與實現

本數據庫系統(tǒng)使用IBM5550高檔微機作處理機,其主要技術性能指標為:主機內存512-640KB,15英寸高分辨度顯示器、24針漢字打印機和鍵盤各一臺,可配8.1或20MB硬盤及5.25英寸軟盤各一臺。操作系統(tǒng)為IBM5550中文DOS(由MS-DOS演變而來),配有BASIC、COBOL、PASCAL、TORTRAN以及宏匯編等程序設計語言,還有dBASE2.0、DBASE3.0、SORT/MERGE、CWP、WORDSTAR、LOTUS 1-2-3等軟件。該機具有良好的多語種處理功能(中、英、日、俄均可處理)和遠程聯機通訊能力。屏幕顯示和打印輸出字形美觀。根據上述計算機資源的特點和省級公共圖書館地方文獻工作的業(yè)務流程,我們首先進行了數據庫的總體設計。該數據庫分為文獻庫、期刊庫、詞表庫三大部分:文獻庫實現各種地方文獻資料目錄的存貯和檢索(包括打印);征集庫實現連續(xù)出版物(包括圖書)的征集管理;詞表庫實現廣東地方文獻標引詞表的管理。所有程序在總控程序的調度下分塊進入內存運行。

總體設計方案確定后,使用什么語言實現?開始我們考慮用DBASE3.0。但后來經模擬試驗和論證,發(fā)現dBASE3.0用于開發(fā)文獻型的數據庫系統(tǒng)并不理想,原因是(1)記錄字段不能適應書目數據可變長的特點;(2)不能使用數組,而且程序變量限于128個,響應速度慢;(3)如作組配檢索一般要幾十秒的等待時間;(4)難以實現人機對話方式的檢索,即在檢索過程中無法修改檢索策略;谏鲜鲈颍覀儧Q定用編譯BASIC進行系統(tǒng)開發(fā)。在開發(fā)的過程中,盡可能采用自頂向下、分塊實現、逐步求精等行之有效的軟件開發(fā)技術,僅用了四個多月的時間,就完成了程序的設計和調試。經過半年多的試運行,根據暴露出的問題,我們又對程序作了較大修改,形成了第2版本。目前該系統(tǒng)的源程序共有4,000多行,17個運行模塊(占260KB)。以下對本數據庫的文件結構和主要算法作簡要介紹:

(一)文獻庫

文獻庫的任務是通過書目控制字段實現書目控制;按國家標準錄入和存貯文獻記錄;編輯和打印各種書目;提供多途徑的文獻檢索手段。文獻庫共設置了書目控制文件、主數據文件和倒排文件。

1)書目控制文件—該文件采用雜湊隨機文件結構,每個記錄由書目記錄控制關鍵字、文獻地址和沖突鏈組成(見圖1)。每個記錄的控制關鍵字,首先考慮用ISBN號(我國今年出版的圖書開始使用該號)。對沒有該號的圖書文獻,采用下述方法取號:

①整本文獻和非書資料,用:題名首字符 著者末字符 地區(qū)代碼 出版年 頁數。

②析出文獻用錄入號(即系統(tǒng)分配的順序號)。

書目控制關鍵字的取號要求是唯一性較為方便。本系統(tǒng)通過該文件將可對所有輸入數據庫的書目記錄進行控制,實現快速查找或修改。

2)主數據文件—該文件采用固定長記錄可變長字段的隨機文件結構,記錄長256字節(jié)。如有數據溢出,溢映部分將存入溢出文件中。本系統(tǒng)將所有書目數據劃分為3種類型:整本文獻、析出文獻和非書資料。每種類型的字段雖有不同,但可存貯于同一數據文件中,通過文獻類型代碼進行識別。為便于新數據的處理,本系統(tǒng)又將主數據文件分為新書文件和數據庫主文件兩種。新錄入的數據暫存于新書文件中,待打印出文獻通報和地區(qū)索引后,再合并入數據庫主文件。數據庫主文件的記錄是按文獻通報的順序號排列的。主數據文件的記錄字段考慮了同國家機讀目錄的一致性,在必要的時候可通過一個格式轉換程序,把書目數據的系統(tǒng)內部格式轉換為標準格式,以利于資源共享。本系統(tǒng)的書目記錄輸出,采用了漢字取整裝配技術,并按國家文獻著錄標準在各著錄項目中加入分隔符號。

3)數據庫倒排文件---該文件采用二級索引結構:第一級是雜湊隨機文件,每記錄分為前鏈和后鏈兩個字段。第二級是順序隨機文件,每記錄分為文獻地址和后鏈兩個字段。這樣,一級索引作為檢索入口指向二級索引,二級索引通過每個記錄的后鏈集中了相關文獻,通過文獻地址就能查得所需文獻。圖2為示意圖。采用這種文件結構的文獻檢索算法如下:

①接收一個檢索表達式→KEYS

②生成提問表(即把表達式中的關鍵字存入檢索比較工作區(qū))

③生成檢索邏輯尺

④根據工作區(qū)中元素的映射地址(雜湊)取出前鏈→R

⑤從R指示地址在二級索引中取出真正的文獻地址→后鏈→L

⑤按B指示地址在主數據文件中讀出一個書目記錄

⑦將該記錄同工作區(qū)元素作字符串比較,得到其文獻邏輯值

⑧文獻邏輯值同檢索邏輯尺作比較,符合者為命中文獻

⑨判L等于零?是則檢索結束,否則L→R,轉⑤

我們認為,這種以二級索引文件結構為基礎,用雜湊映射作為快速尋址,用邏輯尺進行二次精確檢索的算法,是一個新穎有效的算法。同時,在索引中僅存貯指針,可比傳統(tǒng)的索引文件節(jié)省75%的空間。本系統(tǒng)首次檢索的響應時間均低于2秒,二次檢索的響應時間則因檢索式的復雜程度而有不同程度的減慢。

(二)詞表庫

詞表庫的任務是對存貯在機內的地方文獻標引詞表進行查詢和管理。本系統(tǒng)詞表文件可分為主表和付表文件,主表存貯正式標引詞,付表存貯同義詞。為了實現首詞集中和快速查詞的目的,還設置了詞表入口文件。圖3為示意圖。

1)詞表入口文件--該文件為映射隨機文件,每記錄僅存第一個標引詞的地址,通過該詞第一個漢字的ASCLLI碼映射尋址。

2)主表文件--該文件為隨機文件,每記錄由標引詞字段和后鏈組成。通過后鏈便可查到首字相同的所有標引詞。

3)付表文件--該文件為順序文件,用于存貯正式標引詞的同義詞。

本系統(tǒng)通過上述文件結構和算法,已在機內建立了擁有4,000多個標引詞的詞庫,實現了標引詞快速查找、首詞集中顯示、標引詞擴檢與縮檢、同義詞參見和詞表打印等功能。

(三)征集庫

征集庫的任務是建立地方文獻連續(xù)出版物檔案,實現征集工作的現代化管理。征集庫的文件主要有刊號控制文件、現刊管理文件、期刊主文件、記到數據文件。

1)刊號控制文件---該文件用于存貯每種廣東期刊的刊號(包括郵局刊號和內部期刊登記號),對數據庫的期刊進行控制,其結構為雜湊隨機文件。每記錄有刊號和文獻地址兩個字段。

2)現刊管理文件---該文件用于存貯每種期刊的刊名、刊號、索取號、出版單位、地址、裝訂周期等管理數據,其結構為順序隨機文件。

3)期刊主文件---該文件用于存貯每種期刊的基本著錄事項。每記錄長256字節(jié),溢出部分存入溢出文件。

4)記到數據文件---用于存貯每種期刊的記到數據,每種刊作為一個邏輯記錄,采用二維數組結構。該文件以年為單位存貯數據,即每年生成一個記到文件。

以上文件的每個記錄均存在映射關系,即每種期刊記錄在不同文件中的地址是一致的。只要在刊號控制文件中查得某刊的地址,就可在各個文件中訪問有關記錄。由于我們采取了合理的文件結構,因而能使系統(tǒng)適應期刊經常發(fā)生的創(chuàng)刊、合刊、增刊、?⒏目、改刊名、改發(fā)行方式等動態(tài)變化,有較強的實用性。這點對于地方文獻征集工作的電腦化管理是至關重要的。

五、地方文獻的著錄與標引

為了達到資源共享的目的,地方文獻的著錄與標引也必須實現標準化。我館在建立地方文獻數據庫的過程中,對地方文獻的著錄和標引的標準化十分重視,采取了下面的一些做法:

1.在進行數據庫總體設計的同時,請本館有豐富文獻工作經驗的同志組成科研課題組,起草制定了《文獻標引員手冊》。該手冊對數據庫的收錄范圍、文獻著錄標引工作細則、文獻通報編制體例等都作了規(guī)定。從而為文獻著錄標引工作的標準化奠定了基礎。

2.在建庫前,對文獻標引員進行業(yè)務考核,選擇工作責任心強,經過圖書館專業(yè)培訓,有三年以上圖書館工作經驗,并有一定文獻工作實踐的同志擔任文獻標引員。

3.印制地方文獻書目數據錄入工作單,要求文獻標引員根據國家文獻著錄標準進行著錄,并按錄入單格式進行填寫。這樣可以減少因不熟悉著錄格式而產生的錯誤。

4.標引員標引的數據錄入單,由數據庫文獻工作組最后審核定稿。審核的內容包括:著錄文獻的選題、著錄的格式、分類和主題標引。在實踐中我們感到,標引文獻的審核,對提高數據庫的文獻質量,有著十分重要的作用,因此,應由有較高業(yè)務水平的同志負責把關,并注意保持文獻標引人員隊伍的相對穩(wěn)定。

5.數據庫書目數據均采用《中圖法》分類體系。對同一文獻的多個主題,盡量采取了組配方式生成分類號,以便充分發(fā)揮電腦多途徑檢索的優(yōu)勢。

6.以《漢語主題詞表》為基礎,根據地方文獻的特點編制文獻標引詞表!稘h語主題詞表》是一部綜合性的文獻標引工具,收詞多而廣泛。但由于《漢語主題詞表》的編制是從全國范圍的通用性來考慮的,對標引地方獨特事物,便缺乏實用性。因此,我們在力求使用詞表中正式主題詞的同時,根據地方文獻標引的需要,使用了許多“表外詞”,有些地方,還對詞表的規(guī)定作了一些變動。這可以從兩方面來說明:

1)由于新概念的大量涌現,詞表未及收入的新學科、新事物的新名詞,現已形成可描述的敘詞,例如:“經濟法”、“經濟糾紛”、“體制改革”、“第三產業(yè)”、“信息業(yè)”、“港元”……等等。它們在文獻中出現的頻率很高,但沒有合適的直接上位詞可用,也沒有合適的概念接近的詞可用,我們就把這些詞作為正式詞使用。

2)由于地方文獻的特性需要,常常為綜合性大型詞表所難以照應,如名勝、古跡這一范疇內,就只列了“圓明園”等15個詞,其中除“黃鶴樓”“孔廟”等詞外,多數是北京地區(qū)的名勝古跡,這確實是不合用也不夠用的。對這類情況我們作了一些調整。如詞表規(guī)定,“東江縱隊”、“瓊崖操隊”統(tǒng)用“華南抗日游擊隊”,也就是以上位概念取代具體事物,這從全國范圍的檢索需要來看可能是合理的。但從本地區(qū)出發(fā),“東縱”和“瓊縱”卻是專指性極強的詞。這兩支革命武裝有各自不同的歷史、活動地區(qū)、代表人物文獻量又很大。因此,我們改變“用”、“代”關系,不用“華南抗日游擊隊”,而直接用“東江縱隊”、“瓊崖縱隊”。有些類似情況而文獻量不大的,則采用直接上位詞做正式主題詞,加地方特有事物的關鍵詞,以“,”號倒置。如“寺廟,華南寺”、“寺廟,光孝寺”、“刺繡,廣繡”、“刺繡,潮繡”等。“,”號后的關鍵詞,僅起限定和說明的作用,不參加累積索引的輪排,也不作為檢索入口。凡地方事物、事件、人物而沒有相應的主題詞的,如:“黃埔軍!薄ⅰ扒鸱昙住钡鹊,則一律標關鍵詞。我們對這些使用過的關鍵詞,也注意了規(guī)范。

六、結束語

隨著我國圖書館事業(yè)的發(fā)展,地方文獻工作的現代化已是歷史發(fā)展的必然趨勢。地方文獻數據庫的建立,不但是我國地方文獻工作的新發(fā)展,而且必將推動和促進地區(qū)出版物的資源共享,其意義是十分重大的。我們衷心希望地方文獻工作的現代化走向新的水平。

〔出處〕 現代圖書情報技術 1987(2)



【地方文獻數據庫系統(tǒng)】相關文章:

文獻 地方文獻 地方文獻學論考08-09

論地方文獻08-09

地方文獻簡論08-09

收集地方文獻資料 編制地方文獻綜目08-09

論地方文獻與地方經濟08-09

試論地方文獻與地方文化的關系08-09

地方文獻三議08-09

地方文獻的搜集與整理08-09

地方文獻范疇初探08-09