- 相關(guān)推薦
地方文獻(xiàn)數(shù)據(jù)庫(kù)建設(shè)初探
吉安地區(qū)坐落在贛中南,是一座歷史悠久的地理文化名城,擁有豐富的地方文獻(xiàn)資源。建立吉安地方文獻(xiàn)資源數(shù)據(jù)庫(kù),為地方經(jīng)濟(jì)建設(shè)服務(wù),是圖書館與地方經(jīng)濟(jì)建設(shè)相結(jié)合的有效途徑。
1 吉安地方文獻(xiàn)數(shù)據(jù)的采集
地方文獻(xiàn)是指有關(guān)當(dāng)?shù)氐囊磺匈Y料,表現(xiàn)為不同時(shí)期各種記載形式的文獻(xiàn),如:圖書、雜志、報(bào)紙、圖片、影片、畫片、拓本、表格、傳單、票據(jù)、文告、手稿、簿籍等。因此,地方文獻(xiàn)的數(shù)據(jù)可以從時(shí)間、空間、內(nèi)容等方面進(jìn)行采集。
1.1時(shí)間順序
吉安是一個(gè)歷史悠久的文化名城,有著 500年的歷史。我們收集地方文獻(xiàn)數(shù)據(jù)時(shí),可以按照時(shí)間順序,從古代—近現(xiàn)代—當(dāng)代的順序進(jìn)行收集。如我館編撰的《井岡山革命斗爭(zhēng)史研究資料索引》,就是按照時(shí)間順序進(jìn)行的,從井岡山革命根據(jù)地的創(chuàng)立(1927.9—1928.2)井岡山革命根據(jù)地的鞏固和發(fā)展 (1928.2—1929.1)井岡山軍民堅(jiān)持斗爭(zhēng)(1929.1—1930.2)
1.2空間范圍
地方文獻(xiàn)具有典型的地域性,使得地方文獻(xiàn)的出現(xiàn)始終與一定的地域相聯(lián)系。吉安地理位置復(fù)雜,從地形、地貌到各區(qū)方言,再到各地習(xí)俗都有很大的區(qū)別。所以,我們可以按照地理空間,一般是按行政區(qū)劃來(lái)劃分。市下設(shè)縣,縣下設(shè)鄉(xiāng)鎮(zhèn),直到村。以地名來(lái)收集地方文獻(xiàn),按地域區(qū)分隸屬關(guān)系,以地名作為細(xì)類和子目,將庫(kù)容文獻(xiàn)各歸其類,有利于編制地名歸類文獻(xiàn)檢索子系統(tǒng),形成一個(gè)樹杈式的檢索結(jié)構(gòu)。
1.3 內(nèi)容范圍
地方文獻(xiàn)是某一地域自然現(xiàn)象、社會(huì)現(xiàn)象的知識(shí)記錄。天、地、人、事、物,包羅萬(wàn)象,按內(nèi)容進(jìn)行劃分可分為:
1.3.1人文、歷史類數(shù)據(jù)
(1) 吉安地區(qū)研究數(shù)據(jù) (歷史、現(xiàn)狀、人文)。對(duì)于吉安市近500 年的歷史,按時(shí)間空間順序,對(duì)期間的歷史、現(xiàn)狀、人文、風(fēng)俗進(jìn)行收集,形成該地研究數(shù)據(jù)庫(kù)。我館歷時(shí) 3年之久,編撰了《井岡山革命斗爭(zhēng)史研究資料索引》,匯編了全國(guó)圖書、報(bào)刊文獻(xiàn)當(dāng)中所載的有關(guān)井岡山斗爭(zhēng)資料1300余條,集中反映了井岡山革命斗爭(zhēng)史和井岡山精神。
(2) 本地區(qū)名人數(shù)據(jù)。吉安自古以來(lái)就人杰地靈,從“人生自古誰(shuí)無(wú)死,留取丹心照汗青”的文天祥,到一代文豪歐陽(yáng)修,再到賀子珍、袁文才、王佐等一代革命家,到曾慶紅等新一代國(guó)家領(lǐng)導(dǎo)人。以這些歷代名人組成專題數(shù)據(jù)庫(kù),對(duì)于其中的有特殊貢獻(xiàn)的名人,可追加全文數(shù)據(jù)庫(kù)、照片數(shù)據(jù),輔之以字畫、印章等必不可少的內(nèi)容。我館目前正在建立《古代吉安名人研究資料索引》,計(jì)劃將陸續(xù)出版歐陽(yáng)修、文天祥、楊萬(wàn)里、劉過(guò)、劉辰翁、周大必等古代名人的研究資料索引,目前已出版 《楊萬(wàn)里研究資料索引》、《歐陽(yáng)修研究資料索引》。
(3)古籍?dāng)?shù)據(jù)。包括本地的全部古籍地方文獻(xiàn)的專題數(shù)據(jù)庫(kù)。由于古籍珍貴,甚至有的是孤本,不便于查詢,可通過(guò)光電掃描技術(shù),存入計(jì)算機(jī)。如《楊萬(wàn)里研究資料索引》中收錄了楊萬(wàn)里的詩(shī)、詞、文;《歐陽(yáng)修研究資料索引》中收錄了其詩(shī)、詞、文賦以及其史學(xué)觀、經(jīng)濟(jì)觀、書法等。
(4)地方志數(shù)據(jù)。包括本地全部史志的專題數(shù)據(jù)。按照地域范圍,依次逐步采集。
(5)姓氏淵源數(shù)據(jù)。建立專題數(shù)據(jù)庫(kù),可根據(jù)需要建立全文數(shù)據(jù)庫(kù)。
(6)譜牒多媒體數(shù)據(jù)。
(5)、(6) 兩種數(shù)據(jù)在 《楊萬(wàn)里研究資料索引》和 《歐陽(yáng)修研究資料索引》當(dāng)中都有所反映,資料分別介紹了歐陽(yáng)修、楊萬(wàn)里的家世、生平、年譜。
1.3.2 商情類數(shù)據(jù)
(1)行業(yè)動(dòng)態(tài)數(shù)據(jù)。包括吉安地區(qū)熱門、重點(diǎn)行業(yè),如政策動(dòng)態(tài)、市場(chǎng)、投資趨勢(shì),形成旅游、電子、生物等行業(yè)特色專題數(shù)據(jù)。
(2) 地方企業(yè)名錄數(shù)據(jù)。吉安有許多企業(yè),如電線電纜總廠、江西電視機(jī)廠、八三四廠。建立地方企業(yè)名錄數(shù)據(jù)庫(kù),以公司名稱、業(yè)務(wù)經(jīng)營(yíng)范圍、產(chǎn)品名稱等反映公司行業(yè)主題特征的字段作為基本索引字段,以公司地址、電話、員工數(shù)字段作為輔助索引字段。
(3)地市名特產(chǎn)數(shù)據(jù)。吉安地區(qū)有許多地方名特產(chǎn),如:遂川狗牯腦茶葉、泰和武山烏骨雞、安;鹜鹊龋运麄兊漠a(chǎn)地、用途、成分等字段來(lái)描述,形成專題數(shù)據(jù)庫(kù)。
(4)旅游資料數(shù)據(jù)。吉安旅游區(qū)和待開發(fā)旅游區(qū),如:井岡山旅游區(qū)、遂川湯湖、吉安青原山道教勝地、八都毛主席故居、君山湖度假村等,按他們的地理位置、主要景點(diǎn)、服務(wù)項(xiàng)目、歷史典故等字段形成數(shù)據(jù)庫(kù)。
(5)地區(qū)農(nóng)業(yè)科技數(shù)據(jù)庫(kù)。吉安是個(gè)以農(nóng)業(yè)為主的地區(qū),開發(fā)多種經(jīng)濟(jì)作物,如:茶葉、玉米、煙葉、甘蔗等等,數(shù)據(jù)庫(kù)重點(diǎn)介紹地方特色產(chǎn)品的歷史、種植、栽培、加工等技術(shù)。
1.3.3 綜合數(shù)據(jù)
介紹該地各行業(yè)、各個(gè)方面的百科全書性綜合數(shù)據(jù)。
2 吉安地方文獻(xiàn)數(shù)據(jù)庫(kù)的設(shè)計(jì)
2.1書目型數(shù)據(jù)庫(kù)
書目型文獻(xiàn)數(shù)據(jù)庫(kù)即二次文獻(xiàn)數(shù)據(jù)庫(kù),儲(chǔ)存原始文獻(xiàn)的題名、著者文獻(xiàn)出處、文摘、主題詞等項(xiàng)目。其價(jià)值在于把用戶指引到所需要的原始文獻(xiàn),如歐陽(yáng)修研究,把對(duì)歐陽(yáng)修研究的文章進(jìn)行二次加工,形成書目索引,可設(shè)計(jì)為書目型數(shù)據(jù)庫(kù)。在對(duì)吉安地方文獻(xiàn)進(jìn)行分類時(shí),可把本地區(qū)名人數(shù)據(jù),人文、歷史類數(shù)據(jù),古籍、地方志數(shù)據(jù)建成書目型數(shù)據(jù)庫(kù)。目前我館建立的《古代吉安名人數(shù)據(jù)庫(kù)》,就可按照其索引資料建立書目型數(shù)據(jù)庫(kù)。
2.2 源數(shù)據(jù)庫(kù)
源數(shù)據(jù)庫(kù)即一次信息庫(kù),儲(chǔ)存用戶作為檢索目的而要求獲得的數(shù)據(jù)、事實(shí)或文本。其價(jià)值在于檢索的結(jié)果可以直接滿足用戶的信息要求。按照信息形式不同可分為:
(1)數(shù)值型數(shù)據(jù)庫(kù)。如:吉安地方工農(nóng)業(yè)總產(chǎn)值、市場(chǎng)等。
(2)詞典型數(shù)據(jù)庫(kù)。把姓氏淵源數(shù)據(jù)、地方企業(yè)名錄、地市名特產(chǎn)品數(shù)據(jù)、旅游資源數(shù)據(jù)、農(nóng)業(yè)科技等建成詞典型數(shù)據(jù)庫(kù)。
(3) 全文本數(shù)據(jù)庫(kù)。名人著作數(shù)據(jù)庫(kù)、古籍?dāng)?shù)據(jù)庫(kù)等可建成全文本數(shù)據(jù)庫(kù)。
有些數(shù)據(jù)還可能是上述 3 種形式的結(jié)合。如:本地名人數(shù)據(jù)庫(kù)中歐陽(yáng)修、楊萬(wàn)里研究資料,包括了他們的原著及其研究論文、政治思想觀點(diǎn)、家世生平和年譜等等,內(nèi)容復(fù)雜,可建成一些復(fù)合式專題數(shù)據(jù)庫(kù)。
2.3 數(shù)據(jù)庫(kù)地址指針在數(shù)據(jù)庫(kù)文檔組織中的使用
利用倒排擋形式,把由基本索引字段構(gòu)成的基本索引款目和由輔助索引字段構(gòu)成的輔助索引款目采用倒排的形式,描述其特征標(biāo)識(shí)、存取號(hào)、字段位置。在實(shí)踐中,為了提高聯(lián)機(jī)響應(yīng)的速度,常采用兩級(jí)索引的倒排文檔結(jié)構(gòu),即將倒排文檔分為詞典文檔和存取號(hào)文檔,
詞典文檔也稱為索引文檔款目,內(nèi)容包含特征標(biāo)識(shí)、含有該標(biāo)識(shí)的記錄總數(shù)、關(guān)聯(lián)到存取號(hào)文檔的指針。詞典文檔相當(dāng)于一個(gè)索引詞表,其規(guī)模由索引詞數(shù)量決定,基本不受數(shù)據(jù)庫(kù)文獻(xiàn)或數(shù)據(jù)記錄增加的影響,可以極大提高系統(tǒng)對(duì)檢索終端的響應(yīng)速度。存取號(hào)文檔的款目主要包括與詞典文檔指針關(guān)聯(lián)的存儲(chǔ)地址、含有該標(biāo)識(shí)的記錄存取號(hào),以及該標(biāo)識(shí)在記錄中所處的字段及其位置。這樣的兩級(jí)索引結(jié)構(gòu)不僅包括了原倒排的全部?jī)?nèi)容,而且使主機(jī)聯(lián)機(jī)響應(yīng)速度得到極大的提高。這是由于特征標(biāo)識(shí)與含有該標(biāo)識(shí)的存取號(hào)及其字段位置的分離。雖然使文檔的結(jié)構(gòu)更為復(fù)雜,卻突破了原先倒排文檔的索引款目會(huì)因記錄的增加而數(shù)百倍增加,進(jìn)而因文檔的規(guī)模擴(kuò)大而影響檢索速度的限制。在 《歐陽(yáng)修研究資料索引數(shù)據(jù)庫(kù)》當(dāng)中,由于數(shù)據(jù)庫(kù)規(guī)模大,所以也可使用指針來(lái)達(dá)到提高聯(lián)機(jī)響應(yīng)的速度。如使用輔助索引倒排的兩級(jí)結(jié)構(gòu)。
另外,使用鏈接link把書目型數(shù)據(jù)庫(kù)和文摘型數(shù)據(jù)庫(kù)、全文數(shù)據(jù)庫(kù)都可以連接起來(lái),實(shí)現(xiàn)根據(jù)檢索需求,查找地方文獻(xiàn)的題錄、文摘或全文的目的。
〔出處〕 科技情報(bào)開發(fā)與經(jīng)濟(jì)2003(9)
【地方文獻(xiàn)數(shù)據(jù)庫(kù)建設(shè)初探】相關(guān)文章:
職業(yè)學(xué)校班級(jí)學(xué)風(fēng)建設(shè)初探08-16
淺談地方道路建設(shè)與發(fā)展08-12
新時(shí)期加強(qiáng)領(lǐng)導(dǎo)干部作風(fēng)建設(shè)初探08-12
評(píng)語(yǔ)初探08-17
中學(xué)生網(wǎng)絡(luò)道德素質(zhì)測(cè)評(píng)體系建設(shè)初探08-16
網(wǎng)上德育初探08-17
“愉快教學(xué)”初探08-19
河南省基礎(chǔ)教育資源共建共享區(qū)域聯(lián)盟建設(shè)初探08-20