天天被操天天被操综合网,亚洲黄色一区二区三区性色,国产成人精品日本亚洲11,欧美zozo另类特级,www.黄片视频在线播放,啪啪网站永久免费看,特别一级a免费大片视频网站

現(xiàn)在位置:范文先生網(wǎng)>教學(xué)論文>綜合教育論文>解讀美國(guó)數(shù)字檔案館的核心技術(shù)

解讀美國(guó)數(shù)字檔案館的核心技術(shù)

時(shí)間:2023-02-20 10:18:16 綜合教育論文 我要投稿
  • 相關(guān)推薦

解讀美國(guó)數(shù)字檔案館的核心技術(shù)

 【內(nèi)容提要】EAD  DTD技術(shù)無(wú)疑是當(dāng)今美國(guó)數(shù)字檔案館的核心技術(shù),本文準(zhǔn)確、清晰地剖析了美國(guó)的編碼檔案著錄文獻(xiàn)類型定義(EAD  DTD)技術(shù)的形成、記錄結(jié)構(gòu)、構(gòu)成元素、相關(guān)屬性及其著錄方法,這對(duì)于建立和發(fā)展我國(guó)自己的EAD  DTD具有非常重要的參考價(jià)值。
【摘  要  題】海外縱覽
【  正  文】
  序言:數(shù)字檔案館的建設(shè)已經(jīng)成為當(dāng)今全球檔案界最熱門(mén)的話題之一,我國(guó)也不例外。本文就是在此背景下開(kāi)始嘗試探索美國(guó)數(shù)字檔案館的核心技術(shù)——EAD  DTD技術(shù)。下面筆者將分兩部分對(duì)EAD產(chǎn)生的歷史背景和核心概念(全宗概念)、EAD技術(shù)內(nèi)幕(記錄結(jié)構(gòu)、構(gòu)成元素、相關(guān)屬性、及其著錄方法)進(jìn)行論述,本文僅作拋磚引玉,如有不妥,還望大家批評(píng)指正。
      第一部分 EAD  DTD產(chǎn)生的歷史背景和核心概念
    1 EAD  DTD產(chǎn)生的歷史背景
  EAD是基于《通用檔案著錄國(guó)際標(biāo)準(zhǔn)》(ISAD(G))之上的一部檔案著錄交流標(biāo)準(zhǔn)。它是以標(biāo)準(zhǔn)通用標(biāo)記語(yǔ)言(SGML)和擴(kuò)展標(biāo)記語(yǔ)言(XML)文獻(xiàn)類型定義(DTD)的形式存在的。SGML是一個(gè)硬件和軟件獨(dú)立的標(biāo)準(zhǔn),這個(gè)用來(lái)建立文本資料編碼方案的標(biāo)準(zhǔn)是由國(guó)際標(biāo)準(zhǔn)組織維護(hù)的。SGML首次于1986年推出,在政府、工業(yè)、學(xué)術(shù)界獲得巨大的成功。由于SGML很復(fù)雜,程序員發(fā)現(xiàn)很難用來(lái)編制軟件。因此,1998年2月由世界廣域網(wǎng)聯(lián)盟(W3C)推出了SGML的可兼容子集,即XML。XML和其他一些相應(yīng)的標(biāo)準(zhǔn)(如,擴(kuò)展式樣語(yǔ)言(XSL)、擴(kuò)展鏈接語(yǔ)言(XLink)提供了SGML和相關(guān)標(biāo)準(zhǔn)(如,DSSSL  and  HyTime)的大部分功能,因此,軟件編程人員感到XML容易使用。由于DTD與SGML和XML兼容,所以,EAD  DTD就充分地利用了現(xiàn)存的SGML軟件和XML軟件的優(yōu)點(diǎn)。1998年8月底,也就在美國(guó)檔案工作者協(xié)會(huì)(以下簡(jiǎn)稱為SAA)年會(huì)召開(kāi)之際(8月31日—9月6日在佛羅里達(dá)州的奧蘭多市召開(kāi)),SAA下屬的檔案信息交換委員會(huì)(CAIE)下設(shè)的編碼檔案著錄(簡(jiǎn)稱EAD)工作組和美國(guó)國(guó)會(huì)圖書(shū)館下屬的網(wǎng)絡(luò)發(fā)展和馬克(MARC)標(biāo)準(zhǔn)辦公室聯(lián)合發(fā)布了《編碼檔案著錄文獻(xiàn)類型定義1.0版》(英文稱作“EAD  DTD  Version  1.0”,為了不與其他行業(yè)制定的DTD相混淆,美國(guó)人將此標(biāo)準(zhǔn)簡(jiǎn)稱為“EAD  DTD”,但是他們常常為了簡(jiǎn)便稱之為“EAD”。)。與此同時(shí),SAA的季刊《美國(guó)檔案工作者》出版了刊名上分別標(biāo)上1997年第3、第4期的兩期?瑢iT(mén)介紹有關(guān)EAD的研制背景和案例應(yīng)用研究。之后SAA將兩本期刊合二為一出版,題名為《編碼檔案著錄:背景、理論和案例研究》。1999年初,SAA下設(shè)的EAD工作組出版了一本題名為《編碼檔案著錄應(yīng)用指南1.0版》。這三本著作是研究EAD技術(shù)的重要依據(jù)。
  EAD  DTD在反映ISAD(G)的同時(shí),強(qiáng)調(diào)檔案著錄的等級(jí)性質(zhì)和著錄的繼承性。EAD  DTD中的一套變比較多的著錄元素集就是用來(lái)著錄整個(gè)匯集或者全宗的?陀^地來(lái)說(shuō),EAD在利用先進(jìn)技術(shù)轉(zhuǎn)換檔案著錄方面還處于非常早期的階段,目前大多數(shù)EAD的實(shí)施應(yīng)用注重顯示,不注重標(biāo)引,標(biāo)引相對(duì)簡(jiǎn)單。然而,由于網(wǎng)絡(luò)檢索和全文標(biāo)引極大地增強(qiáng)了對(duì)著錄記錄以及對(duì)應(yīng)的資料的檢索,因此需要研究傳統(tǒng)檔案著錄在新的聯(lián)機(jī)環(huán)境下是否有效、哪些地方需要改、哪些地方需要增加、以什么方式并且怎樣完全地開(kāi)發(fā)利用檔案著錄信息。因此,EAD也正在進(jìn)一步朝著全面揭示檔案著錄信息的方向發(fā)展。與此同時(shí),目前國(guó)際上有組織機(jī)構(gòu)正編制一份基于國(guó)際檔案理事會(huì)的《團(tuán)體機(jī)構(gòu)、個(gè)人和家族檔案規(guī)范記錄國(guó)際標(biāo)準(zhǔn)《(ISAAR(CPF))的DTD,這將與EAD兼容,也將便利于建立一個(gè)傳記和歷史數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)對(duì)于充當(dāng)檔案著錄和資源網(wǎng)關(guān)的團(tuán)體機(jī)構(gòu)、個(gè)人、和家族的文獻(xiàn)進(jìn)行處理,這個(gè)數(shù)據(jù)庫(kù)本身是一個(gè)重要的資源,并且將有利于分散的和復(fù)雜的全宗的著錄。
  EAD的國(guó)際使用帶來(lái)了與語(yǔ)言相關(guān)的問(wèn)題,那些母語(yǔ)不是英語(yǔ)的檔案人員無(wú)法理解和應(yīng)用這個(gè)原來(lái)針對(duì)英語(yǔ)國(guó)家的標(biāo)準(zhǔn)。因此,必須編制其他語(yǔ)種的EAD  DTD版本和使用手冊(cè)。目前HyTime公司已經(jīng)研制出了EAD  DTD的特殊語(yǔ)種版本,它能夠作為一個(gè)規(guī)范形式與英語(yǔ)版本進(jìn)行交流和交換,這將有利于EAD的進(jìn)一步國(guó)際化,我們國(guó)內(nèi)檔案界應(yīng)該抓住機(jī)遇,制定相應(yīng)的中國(guó)EAD  DTD標(biāo)準(zhǔn)。自從1996年2月EAD的第一初版發(fā)布以來(lái),在許多美國(guó)、加拿大、英國(guó)(尤其是公共檔案局)檔案庫(kù)房,和一些歐洲、拉丁美洲、澳大利亞檔案庫(kù)房都在執(zhí)行EAD計(jì)劃。就像任何標(biāo)準(zhǔn)需要發(fā)展一樣,EAD也正在發(fā)展之中并將繼續(xù)發(fā)展。EAD目前正由美國(guó)國(guó)會(huì)圖書(shū)館(LC)和SAA聯(lián)合維護(hù)。國(guó)會(huì)圖書(shū)館負(fù)責(zé)實(shí)體上的維護(hù),SAA負(fù)責(zé)行政上和智能上的維護(hù)。在SAA內(nèi)部,EAD工作組(簡(jiǎn)稱EADWG)直接負(fù)責(zé)繼續(xù)的發(fā)展。工作組的代表分別來(lái)自SAA,LC,研究圖書(shū)館組公司(RLG),聯(lián)機(jī)計(jì)算機(jī)圖書(shū)館中心(OCLC)和國(guó)際檔案理事會(huì)(ICA),還有兩個(gè)國(guó)際成員,一個(gè)來(lái)自加拿大,另一個(gè)來(lái)自英國(guó)。
  世界各國(guó)的實(shí)踐經(jīng)驗(yàn)告訴我們,只有當(dāng)一個(gè)標(biāo)準(zhǔn)實(shí)現(xiàn)了它所服務(wù)的團(tuán)體的原則和目標(biāo)的話,標(biāo)準(zhǔn)才會(huì)成功。而當(dāng)那些負(fù)責(zé)標(biāo)準(zhǔn)管理維護(hù)的組織機(jī)構(gòu)真正代表整個(gè)用戶團(tuán)體的話,標(biāo)準(zhǔn)才能反映團(tuán)體的原則和目標(biāo)。可以預(yù)見(jiàn)的是,隨著EAD在國(guó)際上的使用,EAD工作組的成員也將擴(kuò)大,最終將成為一個(gè)國(guó)際組織。我們國(guó)內(nèi)檔案界應(yīng)該積極與EAD工作組聯(lián)系,獲取信息、增進(jìn)交流,以便于加快研制我國(guó)自己的EAD  DTD標(biāo)準(zhǔn)的步伐。
    2 對(duì)于蘊(yùn)含在EAD技術(shù)中的全宗概念的正確理解
  美國(guó)EAD  DTD標(biāo)準(zhǔn)的核心概念之一就是全宗,因此,正確理解全宗概念對(duì)于我們把握編碼著錄技術(shù)來(lái)說(shuō)是至關(guān)重要的!锻ㄓ脵n案著錄國(guó)際標(biāo)準(zhǔn)》公布的一份全宗的整理的各個(gè)層次的模型示意圖(見(jiàn)下圖)是一張等級(jí)模型圖(這張圖只是顯示了一種典型的情況,并沒(méi)有包括所有可能的層次組合,全宗層次以下的各個(gè)層次的數(shù)量是由實(shí)際檔案決定的。)。這張圖有助于我們清晰地理解全宗這一概念。
  附圖
  事實(shí)上,許多了解美國(guó)檔案檔案工作的人都知道,美國(guó)人不喜歡使用全宗(fonds)這個(gè)詞,而更喜歡使用匯集(collection)這個(gè)詞。對(duì)于世界上大多數(shù)其他國(guó)家來(lái)說(shuō),匯集是指基于一個(gè)或者幾個(gè)標(biāo)準(zhǔn)之上的資料的“有意圖的聚集”,是與資料的“有機(jī)產(chǎn)生”相對(duì)而言的。

解讀美國(guó)數(shù)字檔案館的核心技術(shù)

在美國(guó)的用法中,有意圖地聚集資料是“人造的匯集”(artificial  collection)的意思。在英國(guó),盡管有時(shí)候使用單數(shù)形式的“檔案”(archive)來(lái)代表“全宗”(fonds),但是最近還是使用“匯集”這個(gè)詞。然而,我們知道,檔案著錄是用來(lái)描述既是“有機(jī)產(chǎn)生”的全宗又是“人造的匯集”。所以,這兩個(gè)詞必將共存一個(gè)相當(dāng)長(zhǎng)的時(shí)期。
      第二部分 EAD技術(shù)內(nèi)幕解讀
    1 高層次元素
  EAD規(guī)定任何編碼檢索工具都由兩部分組成,而這兩部分所在的層次也稱為最基本層次。即,(1)第1個(gè)最基本層次,第1部分提供關(guān)于檢索工具本身的信息(包括它的題名、編撰者、編撰日期等等)。(2)第2個(gè)最基本層次,第二部分提供關(guān)于檔案資料主體的信息(包括一個(gè)匯集,一個(gè)記錄組,一份全宗或者由許多份系列構(gòu)成的一份檔案資料)。EAD將第1部分分成2個(gè)高層次元素,分別稱作EAD頭標(biāo)元素(用<eadheader>表示)、首要事情元素(用<frontmatter>表示)。第2部分被放在第3個(gè)高層次元素中,此元素稱為檔案著錄元素(用<archdesc>表示)。這兩部分或者說(shuō)這3個(gè)高層次元素被放在最外層的元素中,此最外層的元素稱為編碼檔案著錄元素(用<ead>表示)。也就是說(shuō),<ead>包含丁上述3個(gè)高層次元素。EAD規(guī)定,為了在名稱上有別于上述2個(gè)最基本層次及其包含的3個(gè)高層次元素,<ead>也被稱為最外層元素。如下表所示。
  附圖
  目前,EAD共收錄了145個(gè)元素及其對(duì)應(yīng)的標(biāo)識(shí)符,除了上述的<ead>、<eadheader>、<frontmatter>、<archdesc>4個(gè)元素,剩下的141個(gè)元素將或多或少地根據(jù)元素設(shè)置規(guī)定和實(shí)際需要出現(xiàn)在<eadheader>、<frontmatter>、<archdesc>3個(gè)高層次元素中,有些元素會(huì)根據(jù)檔案資料的內(nèi)容著錄需要反復(fù)出現(xiàn)多次,或者在整個(gè)結(jié)構(gòu)的多個(gè)地方出現(xiàn)。例如,在文后將提到的鏈接元素,由于實(shí)際的著錄內(nèi)容需要指向一個(gè)或幾個(gè)電子檢索工具,所以,在EAD記錄結(jié)構(gòu)的任何需要指出鏈接的地方將使用鏈接元素,這樣,用戶在瀏覽器屏幕上將會(huì)看到一個(gè)個(gè)超鏈接,這些超鏈接指向一個(gè)個(gè)電子檢索工具,這難道不是我們想要得到的最佳效果嗎?答案顯然是肯定的。當(dāng)然,所有的144個(gè)元素都會(huì)被最外層的<ead>元素包圍起來(lái),形成一個(gè)整體,便于計(jì)算機(jī)識(shí)別和信息處理。
    2 EAD頭標(biāo)元素和首要事情元素
  2.1 EAD頭標(biāo)元素
  EAD使用EAD頭標(biāo)元素來(lái)獲取有關(guān)具體檢索工具的創(chuàng)建、修改、出版和發(fā)行的信息,它由4個(gè)子元素組成,有些子元素可以被進(jìn)一步細(xì)分,即,(1)第1個(gè)子元素是EAD標(biāo)識(shí)符元素,它為檢索工具提供惟一的識(shí)別號(hào)或者代碼,能夠指出出處、來(lái)源、和標(biāo)識(shí)符類型。(2)第二個(gè)子元素是文件著錄元素,包含了許多有關(guān)檢索工具的書(shū)目信息,其中包括作者姓名、題名、副題名、主辦者(上述三者都被包含在題名說(shuō)明元素中),也包括版本、出版者、系列相關(guān)附注。(3)第5個(gè)子元素是外形著錄元素,是用來(lái)記錄檢索工具的語(yǔ)種、記錄誰(shuí)和什么時(shí)候?qū)Υ宋墨I(xiàn)進(jìn)行編碼著錄的。(4)第4個(gè)元素是修訂著錄元素,概述了對(duì)這份經(jīng)編碼檔案著錄過(guò)的文獻(xiàn)所作的任何修訂。這4個(gè)子元素以及下一級(jí)元素的次序是由EAD規(guī)定好的,為了便于機(jī)器處理信息,這些元素次序的前后次序不能顛倒(在文后的元素介紹中,如果沒(méi)有特別說(shuō)明,元素中的子元素的著錄先后次序是任意排列的,例如,段落元素中的33個(gè)子元素的著錄次序是根據(jù)實(shí)際著錄內(nèi)容來(lái)決定的。)。EAD頭標(biāo)元素中著錄的內(nèi)容往往不是手工著錄的內(nèi)容,但是對(duì)于編制機(jī)讀檢索工具業(yè)說(shuō)是非常重要的,因?yàn)檫@是機(jī)讀檢索工具的基本信息。另外EAD頭標(biāo)元素中的內(nèi)容可以用來(lái)產(chǎn)生電子版和印刷版檢索工具的題名頁(yè)。
  2.2 首要事情元素
  EAD也包括一個(gè)可選擇的元素,叫做首要事情元素,它能用來(lái)產(chǎn)生一個(gè)可以按地方檔案機(jī)構(gòu)自己擬訂的信息優(yōu)先順序進(jìn)行排列的題名頁(yè)。因此,在此元素中的題名頁(yè)子元素與上述文件著錄子元素中的題名頁(yè)子元素的使用方法一樣。首要事情元素也可以用來(lái)對(duì)結(jié)構(gòu)進(jìn)行編碼,例如,序言、題獻(xiàn)頁(yè)、或者其他有關(guān)編制、出版情況、檢索工具的使用情況的文本。這是EAD能夠?yàn)橛脩籼峁﹤(gè)性化服務(wù)的一個(gè)突出表現(xiàn)。在越來(lái)越強(qiáng)調(diào)因特網(wǎng)信息的個(gè)性化服務(wù)的今天,EAD的這種元素設(shè)置無(wú)疑是順應(yīng)了當(dāng)今用戶檢索需求的發(fā)展潮流。是值得我們借鑒的一個(gè)重要方面。
    3 檔案著錄元素
  第3個(gè)高層次元素是檔案著錄元素。在此元素中信息是以等級(jí)制形式被完好地組織起來(lái)。檢索工具通常以幾個(gè)不同的、但在細(xì)節(jié)上相關(guān)的層次描述一個(gè)由許多記錄或者文件組成的單元。在這里,首先利用檔案著錄元素從總體上對(duì)檔案進(jìn)行描述,之后,對(duì)從屬部分進(jìn)行著錄(用<dsc>表示)。另外,對(duì)于檔案著錄元素可以設(shè)定它的層次屬性,以便于明確整個(gè)單元的性質(zhì),屬性值主要有匯集、記錄組、全宗、系列等。
  經(jīng)過(guò)上述介紹,我們知道,具體的著錄方法是:檔案人員通過(guò)撰寫(xiě)EAD元素就開(kāi)始了編碼檔案著錄,之后,編寫(xiě)必須的EAD頭標(biāo)元素及其子元素和具體內(nèi)容。接著也許會(huì)編寫(xiě)首要事情元素及其子元素和具體內(nèi)容。之后,就要編寫(xiě)檔案著錄元素,并對(duì)此元素設(shè)定其屬性值。然后,是對(duì)于整個(gè)單元進(jìn)行數(shù)據(jù)描述。其中,描述性識(shí)別元素(用<did>表示)對(duì)于確保檔案單元或組成部分的高質(zhì)量的基本著錄來(lái)說(shuō)是最重要的元素之一,它能便利于信息的檢索和輸出。
  3.1 描述性識(shí)別元素
  描述性識(shí)別元素可以包含13個(gè)描述信息的子元素,它們是檔案著錄的重要元素。即,標(biāo)目、摘要、容器、數(shù)字化檔案物件、數(shù)字化檔案物件組、附注、來(lái)源、載體描述、載體出處、庫(kù)房、單元日期、單元識(shí)別、單元題名元素。另外,描述性識(shí)別元素可以用一些屬性值加以限制,以便于使得這個(gè)元素具有更加專指的內(nèi)容識(shí)別作用,例如,標(biāo)簽、類型、編碼類似物等屬性值。對(duì)于可供選擇的編碼類似物這個(gè)屬性值來(lái)說(shuō),設(shè)定此值后,可以在此元素內(nèi)著錄一些相應(yīng)的馬克字段或子字段以及規(guī)范數(shù)據(jù)。而使用此值,檔案人員可以通過(guò)計(jì)算機(jī)程序從EAD檢索工具中自動(dòng)地產(chǎn)生框架層次的馬克記錄;使用此值,也可以幫助檢索和標(biāo)引系統(tǒng)識(shí)別在聯(lián)機(jī)目錄中的書(shū)目記錄和檔案檢索工具之間的可匹配的數(shù)據(jù)元素。
  3.2 敘述性信息
  當(dāng)使用上述的描述性識(shí)別子元素著錄的檔案資料的基本信息后,可以進(jìn)行單元的組成部分的著錄。然而,檢索工具編制者很可能會(huì)提供有關(guān)整個(gè)單元的內(nèi)容、背景或者范圍方面的敘述性信息。這些著錄通常出現(xiàn)在以下一些子元素中,例如,行政管理信息、自傳或歷史、范圍和內(nèi)容、組織機(jī)構(gòu)、整理元素。對(duì)于這些信息類目,編碼者也許會(huì)使用標(biāo)目元素來(lái)提供一個(gè)基于地方檔案館選擇之上的標(biāo)目。例如,只要內(nèi)容是被標(biāo)識(shí)為自傳歷史元素,EAD允許編碼者在標(biāo)目元素中著錄任一標(biāo)目來(lái)識(shí)別一個(gè)自傳附注或者機(jī)構(gòu)歷史。此例的具體標(biāo)目可以選定為:自傳摘要,自傳,簡(jiǎn)·多的關(guān)鍵日期(Jane  Doe’s  Key  Dates)。從結(jié)構(gòu)上來(lái)說(shuō),這些元素通常還包含段落元素或者各種類型的清單元素。而清單元素包

括年表清單元素,年表清單元素又包含年表清單項(xiàng)自、日期、事件元素,由于實(shí)際著錄需要這些元素中可以包含一些顯示文件鏈接和圖表顯示的元素。
  3.3 段落元素
  段落元素特別有用,它包含了33個(gè)子元素,可以進(jìn)一步限定段落的格式、鏈接和詞匯控制等。例如,規(guī)范檢索標(biāo)目元素(在第六部分有詳細(xì)說(shuō)明。),鏈接組元素等(在第七部分有詳細(xì)說(shuō)明。),表格元素(在第八部分有詳細(xì)說(shuō)明)。
  3.4 嵌套著錄和標(biāo)識(shí)深度之間的關(guān)系
  因?yàn)橛懈鞣N智能和經(jīng)濟(jì)的因素(例如,檔案編碼人員的素質(zhì)和能力各不相同,檔案機(jī)構(gòu)的經(jīng)費(fèi)有多有少。)將影響一個(gè)機(jī)構(gòu)的標(biāo)識(shí)的深度,EAD允許檔案機(jī)構(gòu)和編碼人員根據(jù)自身能力、機(jī)構(gòu)財(cái)力和用戶需求來(lái)決定元素的嵌套次數(shù),以便于為用戶提供盡可能詳細(xì)的和特殊的信息。例如,前面提到的行政管理信息元素,包含了有關(guān)一個(gè)機(jī)構(gòu)的檔案資料的采購(gòu)、處理、管理。此元素標(biāo)識(shí)了有關(guān)檔案的來(lái)源、采購(gòu)、檢索和復(fù)制限制條件、縮微和數(shù)字化替代品的可獲得性情況、首選的引用形式、和其他著錄細(xì)節(jié),這些著錄細(xì)節(jié)是用來(lái)幫助用戶了解如何接近檔案資料和如何充分利用用戶已經(jīng)找到的信息。在行政管理信息元素中可以單獨(dú)著錄的子元素主要有保管人歷史、增加物、采購(gòu)信息、鑒定信息、檢索限制條件、用戶限制條件、可獲得的選擇形式、首選的引用、處理信息、段落、附注元素。
  3.5 第3個(gè)高層次元素中的其他一些元素及其著錄先后次序
  現(xiàn)在來(lái)簡(jiǎn)單回顧一下,對(duì)于第3個(gè)高層次元素來(lái)說(shuō),以上已經(jīng)介紹了它的6個(gè)子元素,即,(1)描述性識(shí)別元素;(2)行政管理信息元素;(3)整理元素;(4)自傳或歷史元素;(5)組織機(jī)構(gòu)元素;(6)范圍和內(nèi)容元素。此外,還有其他7個(gè)在著錄中經(jīng)常用到的子元素,即,(7)輔助描述性數(shù)據(jù)元素,將在第五部分詳細(xì)說(shuō)明;(8)規(guī)范檢索標(biāo)目元素,將在第六部分詳細(xì)說(shuō)明;(9)數(shù)字化檔案物件元素,已經(jīng)被包含在3.1部分中,限于篇幅不作說(shuō)明;(10)數(shù)字化檔案物件組元素,已經(jīng)被包含在3.1部分中,限于篇幅不作說(shuō)明;(11)附注元素,內(nèi)容較繁雜,限于篇幅不作說(shuō)明;(12)其他描述性數(shù)據(jù)元素,將在第五部分詳細(xì)說(shuō)明;(13)從屬組件著錄元素,將在第四部分詳細(xì)說(shuō)明。而這13個(gè)子元素的著錄先后順序?yàn)椋?,7,2,3,4,8,9,10,11,12,5,6,13。下面就對(duì)第3個(gè)高層次元素中沒(méi)有介紹過(guò)的一些重要元素及其著錄方法分別予以說(shuō)明。
    4 從屬組件著錄元素
  當(dāng)檔案編碼人員完成了一個(gè)記錄或者一份文件的第3個(gè)高層次元素(即,檔案著錄元素)的著錄后,接著,就要利用從屬組件著錄元素(用<dsc>表示,主語(yǔ)義上可以譯為從屬組成部分著錄元素)對(duì)此記錄或者文件的從屬部分進(jìn)行著錄了。(在這里,需要特別說(shuō)明的是,組件(component)是一個(gè)計(jì)算機(jī)專業(yè)術(shù)語(yǔ)。組件就是組成部分的意思,而本文前面提到的物件(object),也是一個(gè)計(jì)算機(jī)專業(yè)術(shù)語(yǔ),是一個(gè)物體、一個(gè)對(duì)象、一個(gè)單元的意思。邏輯上來(lái)說(shuō),物件包含了許多個(gè)組件,或者說(shuō),物件是由許多個(gè)組件構(gòu)成的。目前,我國(guó)計(jì)算機(jī)專業(yè)的許多教材都采用“對(duì)象”這一譯法,但是在我國(guó)許多計(jì)算機(jī)專業(yè)網(wǎng)站上有許多教材采用“物件”這一譯法。筆者認(rèn)為,譯為“物件”更加合理,因?yàn)槲锛嗽S多組件,理解起來(lái)比較合理、順暢。)在這個(gè)元素中,著錄傳統(tǒng)檢索工具的每個(gè)部分,例如,系列、容器清單、日歷。這個(gè)元素的內(nèi)容通常是以幾種不同的表格形式來(lái)體現(xiàn)等級(jí)制結(jié)構(gòu),當(dāng)然就必須對(duì)這個(gè)元素賦加一個(gè)類型屬性值。類型屬性值主要有4種。即,(1)類型屬性值:分析性概覽型;作用:用來(lái)識(shí)別含有許多系列或者子系列的著錄。(2)類型屬性值:深入詳細(xì)型;作用:用來(lái)識(shí)別一個(gè)含有許多容器或文件夾的清單,日歷,或者是一個(gè)含有許多項(xiàng)目的清單。(3)類型屬性值:組合型;作用:用來(lái)識(shí)別每個(gè)系列的著錄后面緊隨著一個(gè)含有許多容器或文件夾的清單的情況。(4)類型屬性值:其他類型;作用:用來(lái)識(shí)別與上述不同的情況。
  下面讓我們來(lái)看一個(gè)具體著錄過(guò)程。第一步,著錄大致的提要清單。在撰寫(xiě)好第1個(gè)從屬組件著錄元素(用<dec>表示)后,就要設(shè)置此元素的類型屬性值和層次屬性值。例如,如果檔案編碼人員想要提供在一個(gè)匯集中的所有系列的提要清單,那么,他或她將屬性值設(shè)置為分析性概覽型,并且撰寫(xiě)組件層次元素(用<c01>至<c12>表示)。還要設(shè)置層次屬性值為系列,再利用以前在第三個(gè)高層元素中提到的各項(xiàng)子元素并且依照相同的元素順序來(lái)著錄。值得一提的是,一般來(lái)說(shuō),著錄從屬組件著錄元素時(shí),將不再重復(fù)著錄在檔案著錄元素中的描述性識(shí)別元素(用<did>表示)中的子元素。例如,在第3高層次元素中的<did>元素中的庫(kù)房元素和來(lái)源元素等表示的信息會(huì)被組件層次元素(用<c01>表示)繼承。其他<did>元素中的子元素在組件層次元素中將會(huì)被經(jīng)常用到以便于在低一級(jí)層次上著錄更加新或者更加詳細(xì)的內(nèi)容,具體有:標(biāo)目,摘要,容器,數(shù)字化檔案物件,數(shù)字化檔案物件組,附注,載體著錄,載體出處,單元日期,單元識(shí)別,單元題名元素。第二步,著錄全宗等級(jí)結(jié)構(gòu)。完成第一步后,只是對(duì)于一份全宗著錄了一個(gè)大概的提要清單,要想全部地反映整個(gè)全宗的層層等級(jí)結(jié)構(gòu),還必須完成第二步著錄工作。具體是:將第2個(gè)從屬組件著錄元素的類型屬性值設(shè)置為深入詳細(xì)型,這樣就可以反映出容器的清單。容器清單中的每個(gè)系列、子系列、文件、項(xiàng)目的等級(jí)制結(jié)構(gòu)都通過(guò)組件元素的永無(wú)窮盡的層層嵌套反映出來(lái)。在這里,每低一層次的元素在網(wǎng)頁(yè)上顯示的時(shí)候都能夠繼承上一層次的著錄信息,這樣就避免了重復(fù)著錄。EAD就是依據(jù)XML(擴(kuò)展性標(biāo)識(shí)語(yǔ)言)標(biāo)準(zhǔn)設(shè)計(jì)的標(biāo)記語(yǔ)言,當(dāng)瀏覽器依據(jù)XML標(biāo)準(zhǔn)設(shè)計(jì)后,瀏覽器就能正確地反映出這樣復(fù)雜的檔案文件的等級(jí)結(jié)構(gòu),而這正是我們夢(mèng)寐以求的東西。
    5 輔助描述性數(shù)據(jù)元素和其他描述性數(shù)據(jù)元素
  在檔案著錄元素和從屬組件著錄元素中還有兩個(gè)重要的元素分別是輔助描述性數(shù)據(jù)元素和其他描述性數(shù)據(jù)元素。
  5.1 輔助描述性數(shù)據(jù)元素
  輔助描述性數(shù)據(jù)元素是用來(lái)提供輔助的描述性信息,以便于用戶利用在檢索工具中有特征的資料。這包括附加的資料檢索工具(例如,索引,文件規(guī)劃和其他檢索工具),也包括與檢索工具著錄中有些資料相關(guān)的或者相分離的資料的清單或著錄。此元素主要包含以下一些子元素:書(shū)目、文件規(guī)劃、索引、附注、其他檢索工具、段落、相關(guān)資料、相分離的資料元素。而書(shū)目元素之下又包含3個(gè)子元素:檔案參照、書(shū)目參照、擴(kuò)展的參照元素。
  5.2 其他描述性數(shù)據(jù)元素
  其他描述性數(shù)據(jù)元素是一個(gè)特殊的元素,它是用來(lái)標(biāo)識(shí)無(wú)法著錄在其他EAD類目中的任何信息,主要是用在將舊的紙質(zhì)檢索工具轉(zhuǎn)換為新的電子檢索工具的時(shí)候(即,在回溯轉(zhuǎn)換時(shí)候)。此外,令人感到高興的是,1999年初,由美國(guó)全國(guó)人文科學(xué)捐贈(zèng)組織部分資助的(美國(guó)傳統(tǒng)虛擬檔案館計(jì)劃)和加州大學(xué)校長(zhǎng)辦公室部分資助的《加州大學(xué)EAD計(jì)劃》都采用于同一份由4所美國(guó)大學(xué)(杜克大學(xué)、斯坦福大學(xué)、哈佛大學(xué)、加州大學(xué))聯(lián)合起草的《EAD回溯轉(zhuǎn)換準(zhǔn)則》,此《準(zhǔn)則》共57頁(yè),是EAD的一個(gè)重要補(bǔ)充,也具有極大的研究?jī)r(jià)值。
    6 規(guī)范檢索標(biāo)目元素
  以上是對(duì)檢索工具的

主要部分進(jìn)行編碼著錄,這些編碼著錄工作無(wú)疑都是為了便于用戶檢索。但是,用戶往往也可能檢索一些存在于檢索工具中的字符串,例如,名稱,個(gè)人名稱,團(tuán)體名稱,家族名稱,地理名稱,職業(yè),功能,形式和類型術(shù)語(yǔ),主題,題名。EAD針對(duì)上述這些字符串規(guī)定了相應(yīng)的元素,它們分別是:名稱、個(gè)人名稱、團(tuán)體名稱、家族名稱、地理名稱、職業(yè)、功能、形式和類型術(shù)語(yǔ)、主題、題名元素。所有這些元素都允許使用屬性值來(lái)限定這些元素的內(nèi)容,例如,個(gè)人名稱到底是作者、編者、還是攝影師,必須用屬性值加以說(shuō)明;使用的規(guī)范專業(yè)詞匯是否符合國(guó)會(huì)圖書(shū)館主題詞表、國(guó)會(huì)圖書(shū)館名稱規(guī)范檔、藝術(shù)和建筑敘詞表、職業(yè)題名詞典等等,也必須用屬性值加以說(shuō)明。EAD規(guī)定必須將上述這些元素都放在規(guī)范檢索標(biāo)目元素之下,而規(guī)范檢索標(biāo)目元素可以根據(jù)具體檔案文件內(nèi)容的著錄需要放在檔案著錄元素或者從屬組件著錄元素之下,也可以放在段落元素或者單元題名元素之下,這樣放置是為了便于用戶對(duì)這些元素進(jìn)行自由地檢索。實(shí)際上,這些元素是與聯(lián)機(jī)目錄中的馬克記錄的主要款目標(biāo)目字段(1XX)、主題附加款目標(biāo)目字段(6XX)、附加款目標(biāo)目字段(7XX)相對(duì)應(yīng)的。這種對(duì)應(yīng)有利于計(jì)算機(jī)根據(jù)EAD記錄按照轉(zhuǎn)換程序自動(dòng)生成馬克記錄?傊,這些元素中的內(nèi)容經(jīng)過(guò)規(guī)范化后將更加有利于用戶檢索信息,也將提高用戶的查準(zhǔn)率和查全率。
    7 指針、參照和鏈接等元素
  在編碼著錄時(shí),當(dāng)只需要指出單向的鏈接時(shí),可以使用以下這些元素:檔案參照、書(shū)目參照、數(shù)字化檔案物件、擴(kuò)展的指針、擴(kuò)展的參照、指針、參照元素。當(dāng)需要著錄多個(gè)方向的鏈接時(shí),可以使用以下這些元素;數(shù)字化物件出處、擴(kuò)展的指針出處、擴(kuò)展的參照出處、指針出處、參照出處元素。這些出處信息都被放置在數(shù)字化檔案物件組元素、或者是指針組元素、或者是鏈接組元素中。所有以上這些鏈接元素都可以放置在段落元素中或者是EAD記錄結(jié)構(gòu)中的任何地方,目的是為了便于EAD記錄可以隨處地在記錄的任何地方顯示超文本和超媒體。這樣就為檢索工具在聯(lián)機(jī)環(huán)境下動(dòng)態(tài)的顯示記錄及其超鏈接(準(zhǔn)確地說(shuō)是鏈接到其他電子檢索工具)鋪平了道路。
    8 表格元素
  在EAD記錄中,表示表格除了在從屬組件著錄元素中針對(duì)此元素附加一個(gè)類型屬性值后可以通過(guò)幾種不同的表格形式來(lái)體現(xiàn)等級(jí)制結(jié)構(gòu)以外,在許多情況下,可以通過(guò)字體的變換來(lái)顯示表格內(nèi)容。但是,檢索工具常常包含了大量以表格形式出現(xiàn)的文本或者信息,例如,在自傳中的多欄目的年代表、高度結(jié)構(gòu)化的文件規(guī)劃、其他輔助描述性數(shù)據(jù)元素。因此,為了達(dá)到再現(xiàn)真實(shí)的檔案表格的效果,通常在某一些復(fù)雜文件的EAD標(biāo)記語(yǔ)言中嵌入一個(gè)表格結(jié)構(gòu)。通過(guò)對(duì)列、行、單元格的限定就可以描述一個(gè)表格。
  美國(guó)EAD編碼著錄技術(shù)自正式發(fā)布至今已經(jīng)4年多了,國(guó)內(nèi)僅僅發(fā)表了幾篇關(guān)于EAD的介紹性文章,至今沒(méi)有一篇詳細(xì)論述EAD技術(shù)內(nèi)幕的論文。究其原因,主要是由于研究人員受到英語(yǔ)語(yǔ)言知識(shí)、計(jì)算機(jī)技術(shù)知識(shí)、檔案編目知識(shí)、物力、財(cái)力等諸多客觀條件限制,無(wú)法開(kāi)展對(duì)這項(xiàng)新技術(shù)的理論研究和應(yīng)用研究。雖然在研究EAD的道路上困難重重,然而只要我們一起努力、齊心協(xié)力,就一定能夠?qū)⒀芯窟M(jìn)行到底。本文行將結(jié)束,但是筆者深信大家對(duì)EAD的研究不會(huì)終止。


【解讀美國(guó)數(shù)字檔案館的核心技術(shù)】相關(guān)文章:

綜合性檔案館館藏檔案數(shù)字化鑒定探討08-05

無(wú)線遠(yuǎn)程監(jiān)控控系統(tǒng)的核心技術(shù)研究08-06

證券投資 基金評(píng)估體系的核心技術(shù)構(gòu)造與實(shí)例08-07

參觀檔案館02-21

互聯(lián)網(wǎng)搜索:核心技術(shù)與商業(yè)模式主宰沉浮08-05

解讀 及規(guī)定08-05

解讀父親08-16

M系列新一代數(shù)據(jù)采集產(chǎn)品核心技術(shù)08-06

美國(guó)的作文02-02