天天被操天天被操综合网,亚洲黄色一区二区三区性色,国产成人精品日本亚洲11,欧美zozo另类特级,www.黄片视频在线播放,啪啪网站永久免费看,特别一级a免费大片视频网站

現(xiàn)在位置:范文先生網(wǎng)>理工論文>計(jì)算機(jī)信息技術(shù)>地方文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)

地方文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)

時(shí)間:2023-02-22 16:00:10 計(jì)算機(jī)信息技術(shù) 我要投稿
  • 相關(guān)推薦

地方文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)


一、前言

地方文獻(xiàn)是我國(guó)公共圖書館藏書建設(shè)的重要組成部分。這些出版物記載和反映了當(dāng)?shù)厣鐣?huì)發(fā)展的歷史進(jìn)程,是國(guó)家的重要資源和財(cái)富。目前,地方文獻(xiàn)工作在我國(guó)省市、自治區(qū)公共圖書館已受到普遍重視,許多館建立了地方文獻(xiàn)專藏,對(duì)文獻(xiàn)的收集、整理、報(bào)道和利用做了大量工作,為當(dāng)?shù)氐乃幕ㄔO(shè)發(fā)揮了積極的作用。但是,我國(guó)的地方文獻(xiàn)工作基本上還是沿用傳統(tǒng)的理論和方法,在各方面已遠(yuǎn)不能適應(yīng)當(dāng)今信息社會(huì)的要求。在今天新技術(shù)革命浪潮蓬勃興起的形勢(shì)下,公共圖書館的地方文獻(xiàn)工作怎樣才能適應(yīng)時(shí)代的需要這一重要課題,已歷史地?cái)[在我們圖書館工作者的面前。我們認(rèn)為,面對(duì)新技術(shù)革命的挑戰(zhàn),地方文獻(xiàn)工作必須實(shí)現(xiàn)現(xiàn)代化,才能使傳統(tǒng)的地方文獻(xiàn)工作獲得新的發(fā)展,從而達(dá)到促進(jìn)地區(qū)出版物資源共享的目的;谶@種認(rèn)識(shí),我館在原有地方文獻(xiàn)工作的基礎(chǔ)上,開始用電腦建立地方文獻(xiàn)數(shù)據(jù)庫(kù)。經(jīng)過一年多的研制,該數(shù)據(jù)庫(kù)已初步建成并投入使用。為與國(guó)內(nèi)同行交流,本文對(duì)該數(shù)據(jù)庫(kù)系統(tǒng)作簡(jiǎn)要介紹。

二、收錄范圍與文獻(xiàn)源

建立地方文獻(xiàn)數(shù)據(jù)庫(kù),首先要明確收錄范圍和解決文獻(xiàn)源問題。對(duì)地方文獻(xiàn)的收錄范圍,我館前館長(zhǎng)杜定友先生曾提出過著名的“史料、地方出版物和地方人士著述”三部分的論述。在杜定友先生的倡導(dǎo)下,我館致力于地方文獻(xiàn)的收集工作,建立了廣東地方文獻(xiàn)專藏。根據(jù)我館地方文獻(xiàn)的收集入藏情況,我們擬定了地方文獻(xiàn)數(shù)據(jù)庫(kù)收錄范圍的原則:

1.具有廣東地方特點(diǎn),并有一定學(xué)術(shù)、史料價(jià)值的文獻(xiàn)資料(包括有地方特點(diǎn)的科技文獻(xiàn))。

2.反映本省人物(包括廣東籍知名人士以及在廣東有過影響的非廣東籍人士)生平、傳記、事跡的文獻(xiàn)資料。

3.有廣東地方特點(diǎn)的本省出版物和外省出版物。

4.廣東人士著述(擁有地方特點(diǎn)的文獻(xiàn)資料部分)。

對(duì)不予收錄的文獻(xiàn),也作了如下規(guī)定:

1)雖是地方出版物,但內(nèi)容并無(wú)地方特點(diǎn)的文獻(xiàn)資料。

2)作者雖是廣東人士,但文獻(xiàn)內(nèi)容并無(wú)地方特點(diǎn)的著述。

3)無(wú)地方特點(diǎn)的科技文獻(xiàn)。

4)印刷質(zhì)量差,內(nèi)容貧乏的非正式出版物。

5)同收錄原則相悖的其它文獻(xiàn)資料。

具體的收錄范圍有24項(xiàng)。

地方文獻(xiàn)數(shù)據(jù)庫(kù)所收錄文獻(xiàn)的類型包括:專著,期刊、報(bào)紙、會(huì)議錄、匯編、學(xué)位論文、科技報(bào)告、專利文獻(xiàn)、手稿、地方志、族譜、檢索工具、參考工具、圖表、古籍等。其中檢索工具包括反映本省圖書館館藏的各種書目、文摘、聯(lián)合目錄;圖表包括地圖、氣象圖、地質(zhì)圖;參考工具包括年鑒、手冊(cè)等;專利文獻(xiàn)只限于本省單位和個(gè)人申請(qǐng)的國(guó)內(nèi)外專利;報(bào)紙限于本省出版報(bào)紙的目錄。

廣泛征集地方文獻(xiàn)資料,保證地方文獻(xiàn)數(shù)據(jù)庫(kù)有充足的文獻(xiàn)源,是建立地方文獻(xiàn)數(shù)據(jù)庫(kù)極為重要的一環(huán)。我館地方文獻(xiàn)工作,早在解放前即已引起重視。建國(guó)后,更加廣泛深入地開展了地方文獻(xiàn)的收集和整理工作。省人民政府曾先后發(fā)出三個(gè)關(guān)于地方文獻(xiàn)工作的文件,指定我館為全省地方文獻(xiàn)的征集工作機(jī)構(gòu)和收藏中心,要求各級(jí)人民政府和各企事業(yè)單位,將所出版的文獻(xiàn)資料無(wú)償向我館繳送二冊(cè),這為征集地方文獻(xiàn)打下了良好的基礎(chǔ)。在全省各有關(guān)單位的大力協(xié)助下,經(jīng)過幾十年的努力,我館已逐步建立起擁有18萬(wàn)冊(cè),在海內(nèi)外有一定影響的廣東文獻(xiàn)專藏,形成了廣東文獻(xiàn)的收藏中心。這是建立地方文獻(xiàn)數(shù)據(jù)庫(kù)的基礎(chǔ)。

建立地方文獻(xiàn)數(shù)據(jù)庫(kù),在確定收錄范圍的同時(shí),還要認(rèn)真選擇和挖掘文獻(xiàn)源。因?yàn)榈胤轿墨I(xiàn)包括了反映當(dāng)?shù)貧v史和現(xiàn)狀的文獻(xiàn)資料,數(shù)量以萬(wàn)計(jì),內(nèi)容極為繁雜。圖書館應(yīng)該首先選擇利用率高,有一定學(xué)術(shù)和史料價(jià)值的文獻(xiàn)存貯進(jìn)電腦,其中科技文獻(xiàn)應(yīng)占有相當(dāng)?shù)谋壤_@是時(shí)代的要求。因此,我館在建庫(kù)前對(duì)文獻(xiàn)源的選擇進(jìn)行了較深入的研究,最后決定從現(xiàn)代期刊入手,對(duì)符合收錄范圍的期刊論文進(jìn)行著錄標(biāo)引,然后輸入電腦。目前文獻(xiàn)的前處理工作正順利進(jìn)行,現(xiàn)已標(biāo)引出地方文獻(xiàn)資料8,000多篇,輸入電腦5,000篇。對(duì)于其它類型的文獻(xiàn)資料,今后將有計(jì)劃按步驟地進(jìn)行輸入,從而逐步建立起我省的地方文獻(xiàn)數(shù)據(jù)庫(kù)。

三、數(shù)據(jù)庫(kù)系統(tǒng)目標(biāo)與模式

作為地方性情報(bào)檢索系統(tǒng)的地方文獻(xiàn)數(shù)據(jù)庫(kù),其總目標(biāo)是:收錄和存貯反映本省歷史和現(xiàn)狀的地方文獻(xiàn)資料目錄,編輯出版綜合性的地方文獻(xiàn)通報(bào)(書目)和各種專題的地方文獻(xiàn)目錄,為當(dāng)?shù)攸h政軍領(lǐng)導(dǎo)機(jī)關(guān)和各科研生產(chǎn)單位提供文獻(xiàn)檢索服務(wù);作為地方文獻(xiàn)的查目中心,將通過聯(lián)機(jī)網(wǎng)絡(luò)同當(dāng)?shù)氐闹饕獔D書情報(bào)部門聯(lián)網(wǎng),逐步實(shí)現(xiàn)地方文獻(xiàn)的聯(lián)機(jī)編目和檢索,從而促進(jìn)地區(qū)性的資源共享。

為了實(shí)現(xiàn)上述目標(biāo),我們根據(jù)本省的實(shí)際情況,為地方文獻(xiàn)數(shù)據(jù)庫(kù)設(shè)計(jì)了下述模式:

1.選擇具有良好漢字處理功能的遠(yuǎn)程通訊能力的微型電腦作為數(shù)據(jù)錄入工作站和脫機(jī)檢索系統(tǒng),這一系統(tǒng)配有完整的外部設(shè)備,可獨(dú)立進(jìn)行地方文獻(xiàn)書目數(shù)據(jù)的錄入、檢索和編輯出版地方文獻(xiàn)通報(bào)。對(duì)已輸入電腦的大量數(shù)據(jù),可轉(zhuǎn)貯到軟盤,為將來(lái)在中、大型電腦上建庫(kù)作好數(shù)據(jù)準(zhǔn)備。我館已購(gòu)置了四套IBM5550中文電腦,其中一至二套用于地方文獻(xiàn)數(shù)據(jù)庫(kù)的建庫(kù)工作。

2.設(shè)置電腦聯(lián)機(jī)通訊線路,同當(dāng)?shù)赜?jì)算中心的中、大型機(jī)聯(lián)網(wǎng)。利用主權(quán)的計(jì)算機(jī)資源建立地方文獻(xiàn)數(shù)據(jù)庫(kù),一般可存貯幾百萬(wàn)篇的文獻(xiàn),從而為實(shí)現(xiàn)地方文獻(xiàn)書目數(shù)據(jù)的資源共享打下基礎(chǔ)。我館已同省計(jì)算中心達(dá)成協(xié)議,利用該中心引進(jìn)的IBM 4341主機(jī)建立地方文獻(xiàn)數(shù)據(jù)庫(kù),并在86年二月成功地進(jìn)行了利用市內(nèi)話線聯(lián)機(jī)通訊的試驗(yàn),計(jì)劃在明年內(nèi)實(shí)現(xiàn)我館IBM5550同主機(jī)的聯(lián)網(wǎng)。

3.在本館購(gòu)置中、小型主機(jī)后,將進(jìn)一步完善地方文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng),在省、市領(lǐng)導(dǎo)機(jī)關(guān)和主要科研機(jī)構(gòu)設(shè)置檢索終端,并同當(dāng)?shù)氐闹饕獔D書情報(bào)部門聯(lián)網(wǎng),進(jìn)行聯(lián)機(jī)編目和檢索,從而使地方文獻(xiàn)數(shù)據(jù)庫(kù)真正達(dá)到資源共享的目的。

4.把電腦同縮微技術(shù)結(jié)合起來(lái),實(shí)現(xiàn)地方文獻(xiàn)資料的全文檢索。我館準(zhǔn)備在條件具備時(shí),購(gòu)置一套16毫米的縮微拍攝設(shè)備,用于拍攝地方文獻(xiàn)資料。在數(shù)據(jù)庫(kù)中檢索命中的文獻(xiàn),可根據(jù)其文獻(xiàn)號(hào),在縮微閱讀機(jī)上獲得原文。

在我省有關(guān)部門的大力支持下,經(jīng)過全館同志的努力,廣東地方文獻(xiàn)數(shù)據(jù)庫(kù)的系統(tǒng)目標(biāo)正在逐步實(shí)現(xiàn)。目前,在IBM 5550微機(jī)上已實(shí)現(xiàn)了以下功能:

1)地方文獻(xiàn)書目數(shù)據(jù)的錄入與存貯。針對(duì)地方文獻(xiàn)具有多種類型的特點(diǎn),本數(shù)據(jù)庫(kù)根據(jù)國(guó)家文獻(xiàn)著錄標(biāo)準(zhǔn),設(shè)置了多種文獻(xiàn)類型的自動(dòng)格式識(shí)別程序,不但提供了完善的人機(jī)對(duì)話錄入和修改方式,而且能夠?qū)︿浫氲臅繑?shù)據(jù)自動(dòng)進(jìn)行著錄格式的自動(dòng)識(shí)別,從而使書目數(shù)據(jù)達(dá)到標(biāo)準(zhǔn)化的要求。

2)編輯和打印綜合性檢索刊物《廣東文獻(xiàn)通報(bào)》。該刊物以及時(shí)報(bào)道我館新入藏地方文獻(xiàn)為宗旨,兩月出版一期。每期通報(bào)正文約70頁(yè),按《中圖法》分類體系排列,并附有地區(qū)索引,方便縣、市圖書館、檔案館等有關(guān)單位從地區(qū)途徑查找文獻(xiàn)。從86年五月起,至今已出版文獻(xiàn)通報(bào)六期及通報(bào)的年度累積索引一冊(cè)。

3)自動(dòng)編目功能,數(shù)據(jù)庫(kù)系統(tǒng)可根據(jù)輸入的地方文獻(xiàn)書目數(shù)據(jù),自動(dòng)生成數(shù)據(jù)庫(kù)倒排文檔,供文獻(xiàn)檢索之用。另外,還可根據(jù)指定的專題,編制各種類型的地方文獻(xiàn)專題書目,以及編制地方文獻(xiàn)的累積本。

4)文獻(xiàn)檢索功能。因受1BM 5550系統(tǒng)外存的限制,目前數(shù)據(jù)庫(kù)的存貯容量為25,000篇文獻(xiàn)。如將外存擴(kuò)大到40MB,數(shù)據(jù)庫(kù)容量將可擴(kuò)大到10萬(wàn)篇。在此范圍內(nèi),用戶可從篇名、著者、分類、主題、地名等五個(gè)途徑進(jìn)行聯(lián)機(jī)檢索,并允許用多個(gè)主題詞或多個(gè)檢索途徑進(jìn)行組配,以提高檢準(zhǔn)率。輸出結(jié)果既可在屏幕顯示,也可以用打印機(jī)輸出。

5)詞表管理功能。數(shù)據(jù)庫(kù)系統(tǒng)可對(duì)地方文獻(xiàn)標(biāo)引詞表、地名表和機(jī)內(nèi)分類表進(jìn)行插入、修改、刪除等項(xiàng)操作,并提供編輯打印詞表的功能。目前我館已編制出《地方文獻(xiàn)標(biāo)引詞表》、《廣東省地名表》和《地方文獻(xiàn)數(shù)據(jù)庫(kù)分類表》。

6)地方文獻(xiàn)征集和標(biāo)引管理功能。數(shù)據(jù)庫(kù)能為地方文獻(xiàn)中的連續(xù)性出版物建立檔案,并有催索、記到、裝訂以及標(biāo)引管理等功能,可以對(duì)地方文獻(xiàn)征集和標(biāo)引實(shí)現(xiàn)科學(xué)管理。

除了上述功能外,我們計(jì)劃在87年上半年前,為該數(shù)據(jù)庫(kù)增加MARC機(jī)讀目錄生產(chǎn)、遠(yuǎn)程聯(lián)機(jī)通訊等程序,使數(shù)據(jù)庫(kù)的各種功能進(jìn)一步完善。

四、數(shù)據(jù)庫(kù)的設(shè)計(jì)與實(shí)現(xiàn)

本數(shù)據(jù)庫(kù)系統(tǒng)使用IBM5550高檔微機(jī)作處理機(jī),其主要技術(shù)性能指標(biāo)為:主機(jī)內(nèi)存512-640KB,15英寸高分辨度顯示器、24針漢字打印機(jī)和鍵盤各一臺(tái),可配8.1或20MB硬盤及5.25英寸軟盤各一臺(tái)。操作系統(tǒng)為IBM5550中文DOS(由MS-DOS演變而來(lái)),配有BASIC、COBOL、PASCAL、TORTRAN以及宏匯編等程序設(shè)計(jì)語(yǔ)言,還有dBASE2.0、DBASE3.0、SORT/MERGE、CWP、WORDSTAR、LOTUS 1-2-3等軟件。該機(jī)具有良好的多語(yǔ)種處理功能(中、英、日、俄均可處理)和遠(yuǎn)程聯(lián)機(jī)通訊能力。屏幕顯示和打印輸出字形美觀。根據(jù)上述計(jì)算機(jī)資源的特點(diǎn)和省級(jí)公共圖書館地方文獻(xiàn)工作的業(yè)務(wù)流程,我們首先進(jìn)行了數(shù)據(jù)庫(kù)的總體設(shè)計(jì)。該數(shù)據(jù)庫(kù)分為文獻(xiàn)庫(kù)、期刊庫(kù)、詞表庫(kù)三大部分:文獻(xiàn)庫(kù)實(shí)現(xiàn)各種地方文獻(xiàn)資料目錄的存貯和檢索(包括打。;征集庫(kù)實(shí)現(xiàn)連續(xù)出版物(包括圖書)的征集管理;詞表庫(kù)實(shí)現(xiàn)廣東地方文獻(xiàn)標(biāo)引詞表的管理。所有程序在總控程序的調(diào)度下分塊進(jìn)入內(nèi)存運(yùn)行。

總體設(shè)計(jì)方案確定后,使用什么語(yǔ)言實(shí)現(xiàn)?開始我們考慮用DBASE3.0。但后來(lái)經(jīng)模擬試驗(yàn)和論證,發(fā)現(xiàn)dBASE3.0用于開發(fā)文獻(xiàn)型的數(shù)據(jù)庫(kù)系統(tǒng)并不理想,原因是(1)記錄字段不能適應(yīng)書目數(shù)據(jù)可變長(zhǎng)的特點(diǎn);(2)不能使用數(shù)組,而且程序變量限于128個(gè),響應(yīng)速度慢;(3)如作組配檢索一般要幾十秒的等待時(shí)間;(4)難以實(shí)現(xiàn)人機(jī)對(duì)話方式的檢索,即在檢索過程中無(wú)法修改檢索策略;谏鲜鲈,我們決定用編譯BASIC進(jìn)行系統(tǒng)開發(fā)。在開發(fā)的過程中,盡可能采用自頂向下、分塊實(shí)現(xiàn)、逐步求精等行之有效的軟件開發(fā)技術(shù),僅用了四個(gè)多月的時(shí)間,就完成了程序的設(shè)計(jì)和調(diào)試。經(jīng)過半年多的試運(yùn)行,根據(jù)暴露出的問題,我們又對(duì)程序作了較大修改,形成了第2版本。目前該系統(tǒng)的源程序共有4,000多行,17個(gè)運(yùn)行模塊(占260KB)。以下對(duì)本數(shù)據(jù)庫(kù)的文件結(jié)構(gòu)和主要算法作簡(jiǎn)要介紹:

(一)文獻(xiàn)庫(kù)

文獻(xiàn)庫(kù)的任務(wù)是通過書目控制字段實(shí)現(xiàn)書目控制;按國(guó)家標(biāo)準(zhǔn)錄入和存貯文獻(xiàn)記錄;編輯和打印各種書目;提供多途徑的文獻(xiàn)檢索手段。文獻(xiàn)庫(kù)共設(shè)置了書目控制文件、主數(shù)據(jù)文件和倒排文件。

1)書目控制文件—該文件采用雜湊隨機(jī)文件結(jié)構(gòu),每個(gè)記錄由書目記錄控制關(guān)鍵字、文獻(xiàn)地址和沖突鏈組成(見圖1)。每個(gè)記錄的控制關(guān)鍵字,首先考慮用ISBN號(hào)(我國(guó)今年出版的圖書開始使用該號(hào))。對(duì)沒有該號(hào)的圖書文獻(xiàn),采用下述方法取號(hào):

①整本文獻(xiàn)和非書資料,用:題名首字符 著者末字符 地區(qū)代碼 出版年 頁(yè)數(shù)。

②析出文獻(xiàn)用錄入號(hào)(即系統(tǒng)分配的順序號(hào))。

書目控制關(guān)鍵字的取號(hào)要求是唯一性較為方便。本系統(tǒng)通過該文件將可對(duì)所有輸入數(shù)據(jù)庫(kù)的書目記錄進(jìn)行控制,實(shí)現(xiàn)快速查找或修改。

2)主數(shù)據(jù)文件—該文件采用固定長(zhǎng)記錄可變長(zhǎng)字段的隨機(jī)文件結(jié)構(gòu),記錄長(zhǎng)256字節(jié)。如有數(shù)據(jù)溢出,溢映部分將存入溢出文件中。本系統(tǒng)將所有書目數(shù)據(jù)劃分為3種類型:整本文獻(xiàn)、析出文獻(xiàn)和非書資料。每種類型的字段雖有不同,但可存貯于同一數(shù)據(jù)文件中,通過文獻(xiàn)類型代碼進(jìn)行識(shí)別。為便于新數(shù)據(jù)的處理,本系統(tǒng)又將主數(shù)據(jù)文件分為新書文件和數(shù)據(jù)庫(kù)主文件兩種。新錄入的數(shù)據(jù)暫存于新書文件中,待打印出文獻(xiàn)通報(bào)和地區(qū)索引后,再合并入數(shù)據(jù)庫(kù)主文件。數(shù)據(jù)庫(kù)主文件的記錄是按文獻(xiàn)通報(bào)的順序號(hào)排列的。主數(shù)據(jù)文件的記錄字段考慮了同國(guó)家機(jī)讀目錄的一致性,在必要的時(shí)候可通過一個(gè)格式轉(zhuǎn)換程序,把書目數(shù)據(jù)的系統(tǒng)內(nèi)部格式轉(zhuǎn)換為標(biāo)準(zhǔn)格式,以利于資源共享。本系統(tǒng)的書目記錄輸出,采用了漢字取整裝配技術(shù),并按國(guó)家文獻(xiàn)著錄標(biāo)準(zhǔn)在各著錄項(xiàng)目中加入分隔符號(hào)。

3)數(shù)據(jù)庫(kù)倒排文件---該文件采用二級(jí)索引結(jié)構(gòu):第一級(jí)是雜湊隨機(jī)文件,每記錄分為前鏈和后鏈兩個(gè)字段。第二級(jí)是順序隨機(jī)文件,每記錄分為文獻(xiàn)地址和后鏈兩個(gè)字段。這樣,一級(jí)索引作為檢索入口指向二級(jí)索引,二級(jí)索引通過每個(gè)記錄的后鏈集中了相關(guān)文獻(xiàn),通過文獻(xiàn)地址就能查得所需文獻(xiàn)。圖2為示意圖。采用這種文件結(jié)構(gòu)的文獻(xiàn)檢索算法如下:

①接收一個(gè)檢索表達(dá)式→KEYS

②生成提問表(即把表達(dá)式中的關(guān)鍵字存入檢索比較工作區(qū))

③生成檢索邏輯尺

④根據(jù)工作區(qū)中元素的映射地址(雜湊)取出前鏈→R

⑤從R指示地址在二級(jí)索引中取出真正的文獻(xiàn)地址→后鏈→L

⑤按B指示地址在主數(shù)據(jù)文件中讀出一個(gè)書目記錄

⑦將該記錄同工作區(qū)元素作字符串比較,得到其文獻(xiàn)邏輯值

⑧文獻(xiàn)邏輯值同檢索邏輯尺作比較,符合者為命中文獻(xiàn)

⑨判L等于零?是則檢索結(jié)束,否則L→R,轉(zhuǎn)⑤

我們認(rèn)為,這種以二級(jí)索引文件結(jié)構(gòu)為基礎(chǔ),用雜湊映射作為快速尋址,用邏輯尺進(jìn)行二次精確檢索的算法,是一個(gè)新穎有效的算法。同時(shí),在索引中僅存貯指針,可比傳統(tǒng)的索引文件節(jié)省75%的空間。本系統(tǒng)首次檢索的響應(yīng)時(shí)間均低于2秒,二次檢索的響應(yīng)時(shí)間則因檢索式的復(fù)雜程度而有不同程度的減慢。

(二)詞表庫(kù)

詞表庫(kù)的任務(wù)是對(duì)存貯在機(jī)內(nèi)的地方文獻(xiàn)標(biāo)引詞表進(jìn)行查詢和管理。本系統(tǒng)詞表文件可分為主表和付表文件,主表存貯正式標(biāo)引詞,付表存貯同義詞。為了實(shí)現(xiàn)首詞集中和快速查詞的目的,還設(shè)置了詞表入口文件。圖3為示意圖。

1)詞表入口文件--該文件為映射隨機(jī)文件,每記錄僅存第一個(gè)標(biāo)引詞的地址,通過該詞第一個(gè)漢字的ASCLLI碼映射尋址。

2)主表文件--該文件為隨機(jī)文件,每記錄由標(biāo)引詞字段和后鏈組成。通過后鏈便可查到首字相同的所有標(biāo)引詞。

3)付表文件--該文件為順序文件,用于存貯正式標(biāo)引詞的同義詞。

本系統(tǒng)通過上述文件結(jié)構(gòu)和算法,已在機(jī)內(nèi)建立了擁有4,000多個(gè)標(biāo)引詞的詞庫(kù),實(shí)現(xiàn)了標(biāo)引詞快速查找、首詞集中顯示、標(biāo)引詞擴(kuò)檢與縮檢、同義詞參見和詞表打印等功能。

(三)征集庫(kù)

征集庫(kù)的任務(wù)是建立地方文獻(xiàn)連續(xù)出版物檔案,實(shí)現(xiàn)征集工作的現(xiàn)代化管理。征集庫(kù)的文件主要有刊號(hào)控制文件、現(xiàn)刊管理文件、期刊主文件、記到數(shù)據(jù)文件。

1)刊號(hào)控制文件---該文件用于存貯每種廣東期刊的刊號(hào)(包括郵局刊號(hào)和內(nèi)部期刊登記號(hào)),對(duì)數(shù)據(jù)庫(kù)的期刊進(jìn)行控制,其結(jié)構(gòu)為雜湊隨機(jī)文件。每記錄有刊號(hào)和文獻(xiàn)地址兩個(gè)字段。

2)現(xiàn)刊管理文件---該文件用于存貯每種期刊的刊名、刊號(hào)、索取號(hào)、出版單位、地址、裝訂周期等管理數(shù)據(jù),其結(jié)構(gòu)為順序隨機(jī)文件。

3)期刊主文件---該文件用于存貯每種期刊的基本著錄事項(xiàng)。每記錄長(zhǎng)256字節(jié),溢出部分存入溢出文件。

4)記到數(shù)據(jù)文件---用于存貯每種期刊的記到數(shù)據(jù),每種刊作為一個(gè)邏輯記錄,采用二維數(shù)組結(jié)構(gòu)。該文件以年為單位存貯數(shù)據(jù),即每年生成一個(gè)記到文件。

以上文件的每個(gè)記錄均存在映射關(guān)系,即每種期刊記錄在不同文件中的地址是一致的。只要在刊號(hào)控制文件中查得某刊的地址,就可在各個(gè)文件中訪問有關(guān)記錄。由于我們采取了合理的文件結(jié)構(gòu),因而能使系統(tǒng)適應(yīng)期刊經(jīng)常發(fā)生的創(chuàng)刊、合刊、增刊、?、改刊期、改刊名、改發(fā)行方式等動(dòng)態(tài)變化,有較強(qiáng)的實(shí)用性。這點(diǎn)對(duì)于地方文獻(xiàn)征集工作的電腦化管理是至關(guān)重要的。

五、地方文獻(xiàn)的著錄與標(biāo)引

為了達(dá)到資源共享的目的,地方文獻(xiàn)的著錄與標(biāo)引也必須實(shí)現(xiàn)標(biāo)準(zhǔn)化。我館在建立地方文獻(xiàn)數(shù)據(jù)庫(kù)的過程中,對(duì)地方文獻(xiàn)的著錄和標(biāo)引的標(biāo)準(zhǔn)化十分重視,采取了下面的一些做法:

1.在進(jìn)行數(shù)據(jù)庫(kù)總體設(shè)計(jì)的同時(shí),請(qǐng)本館有豐富文獻(xiàn)工作經(jīng)驗(yàn)的同志組成科研課題組,起草制定了《文獻(xiàn)標(biāo)引員手冊(cè)》。該手冊(cè)對(duì)數(shù)據(jù)庫(kù)的收錄范圍、文獻(xiàn)著錄標(biāo)引工作細(xì)則、文獻(xiàn)通報(bào)編制體例等都作了規(guī)定。從而為文獻(xiàn)著錄標(biāo)引工作的標(biāo)準(zhǔn)化奠定了基礎(chǔ)。

2.在建庫(kù)前,對(duì)文獻(xiàn)標(biāo)引員進(jìn)行業(yè)務(wù)考核,選擇工作責(zé)任心強(qiáng),經(jīng)過圖書館專業(yè)培訓(xùn),有三年以上圖書館工作經(jīng)驗(yàn),并有一定文獻(xiàn)工作實(shí)踐的同志擔(dān)任文獻(xiàn)標(biāo)引員。

3.印制地方文獻(xiàn)書目數(shù)據(jù)錄入工作單,要求文獻(xiàn)標(biāo)引員根據(jù)國(guó)家文獻(xiàn)著錄標(biāo)準(zhǔn)進(jìn)行著錄,并按錄入單格式進(jìn)行填寫。這樣可以減少因不熟悉著錄格式而產(chǎn)生的錯(cuò)誤。

4.標(biāo)引員標(biāo)引的數(shù)據(jù)錄入單,由數(shù)據(jù)庫(kù)文獻(xiàn)工作組最后審核定稿。審核的內(nèi)容包括:著錄文獻(xiàn)的選題、著錄的格式、分類和主題標(biāo)引。在實(shí)踐中我們感到,標(biāo)引文獻(xiàn)的審核,對(duì)提高數(shù)據(jù)庫(kù)的文獻(xiàn)質(zhì)量,有著十分重要的作用,因此,應(yīng)由有較高業(yè)務(wù)水平的同志負(fù)責(zé)把關(guān),并注意保持文獻(xiàn)標(biāo)引人員隊(duì)伍的相對(duì)穩(wěn)定。

5.?dāng)?shù)據(jù)庫(kù)書目數(shù)據(jù)均采用《中圖法》分類體系。對(duì)同一文獻(xiàn)的多個(gè)主題,盡量采取了組配方式生成分類號(hào),以便充分發(fā)揮電腦多途徑檢索的優(yōu)勢(shì)。

6.以《漢語(yǔ)主題詞表》為基礎(chǔ),根據(jù)地方文獻(xiàn)的特點(diǎn)編制文獻(xiàn)標(biāo)引詞表!稘h語(yǔ)主題詞表》是一部綜合性的文獻(xiàn)標(biāo)引工具,收詞多而廣泛。但由于《漢語(yǔ)主題詞表》的編制是從全國(guó)范圍的通用性來(lái)考慮的,對(duì)標(biāo)引地方獨(dú)特事物,便缺乏實(shí)用性。因此,我們?cè)诹η笫褂迷~表中正式主題詞的同時(shí),根據(jù)地方文獻(xiàn)標(biāo)引的需要,使用了許多“表外詞”,有些地方,還對(duì)詞表的規(guī)定作了一些變動(dòng)。這可以從兩方面來(lái)說(shuō)明:

1)由于新概念的大量涌現(xiàn),詞表未及收入的新學(xué)科、新事物的新名詞,現(xiàn)已形成可描述的敘詞,例如:“經(jīng)濟(jì)法”、“經(jīng)濟(jì)糾紛”、“體制改革”、“第三產(chǎn)業(yè)”、“信息業(yè)”、“港元”……等等。它們?cè)谖墨I(xiàn)中出現(xiàn)的頻率很高,但沒有合適的直接上位詞可用,也沒有合適的概念接近的詞可用,我們就把這些詞作為正式詞使用。

2)由于地方文獻(xiàn)的特性需要,常常為綜合性大型詞表所難以照應(yīng),如名勝、古跡這一范疇內(nèi),就只列了“圓明園”等15個(gè)詞,其中除“黃鶴樓”“孔廟”等詞外,多數(shù)是北京地區(qū)的名勝古跡,這確實(shí)是不合用也不夠用的。對(duì)這類情況我們作了一些調(diào)整。如詞表規(guī)定,“東江縱隊(duì)”、“瓊崖操隊(duì)”統(tǒng)用“華南抗日游擊隊(duì)”,也就是以上位概念取代具體事物,這從全國(guó)范圍的檢索需要來(lái)看可能是合理的。但從本地區(qū)出發(fā),“東縱”和“瓊縱”卻是專指性極強(qiáng)的詞。這兩支革命武裝有各自不同的歷史、活動(dòng)地區(qū)、代表人物文獻(xiàn)量又很大。因此,我們改變“用”、“代”關(guān)系,不用“華南抗日游擊隊(duì)”,而直接用“東江縱隊(duì)”、“瓊崖縱隊(duì)”。有些類似情況而文獻(xiàn)量不大的,則采用直接上位詞做正式主題詞,加地方特有事物的關(guān)鍵詞,以“,”號(hào)倒置。如“寺廟,華南寺”、“寺廟,光孝寺”、“刺繡,廣繡”、“刺繡,潮繡”等!,”號(hào)后的關(guān)鍵詞,僅起限定和說(shuō)明的作用,不參加累積索引的輪排,也不作為檢索入口。凡地方事物、事件、人物而沒有相應(yīng)的主題詞的,如:“黃埔軍!、“丘逢甲”等等,則一律標(biāo)關(guān)鍵詞。我們對(duì)這些使用過的關(guān)鍵詞,也注意了規(guī)范。

六、結(jié)束語(yǔ)

隨著我國(guó)圖書館事業(yè)的發(fā)展,地方文獻(xiàn)工作的現(xiàn)代化已是歷史發(fā)展的必然趨勢(shì)。地方文獻(xiàn)數(shù)據(jù)庫(kù)的建立,不但是我國(guó)地方文獻(xiàn)工作的新發(fā)展,而且必將推動(dòng)和促進(jìn)地區(qū)出版物的資源共享,其意義是十分重大的。我們衷心希望地方文獻(xiàn)工作的現(xiàn)代化走向新的水平。

〔出處〕 現(xiàn)代圖書情報(bào)技術(shù) 1987(2)



【地方文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)】相關(guān)文章:

文獻(xiàn) 地方文獻(xiàn) 地方文獻(xiàn)學(xué)論考08-09

論地方文獻(xiàn)08-09

地方文獻(xiàn)簡(jiǎn)論08-09

收集地方文獻(xiàn)資料 編制地方文獻(xiàn)綜目08-09

論地方文獻(xiàn)與地方經(jīng)濟(jì)08-09

試論地方文獻(xiàn)與地方文化的關(guān)系08-09

地方文獻(xiàn)三議08-09

地方文獻(xiàn)的搜集與整理08-09

地方文獻(xiàn)范疇初探08-09