天天被操天天被操综合网,亚洲黄色一区二区三区性色,国产成人精品日本亚洲11,欧美zozo另类特级,www.黄片视频在线播放,啪啪网站永久免费看,特别一级a免费大片视频网站

現(xiàn)在位置:范文先生網(wǎng)>教學(xué)論文>綜合教育論文>解讀美國數(shù)字檔案館的核心技術(shù)

解讀美國數(shù)字檔案館的核心技術(shù)

時間:2023-02-20 10:18:16 綜合教育論文 我要投稿
  • 相關(guān)推薦

解讀美國數(shù)字檔案館的核心技術(shù)

 【內(nèi)容提要】EAD  DTD技術(shù)無疑是當(dāng)今美國數(shù)字檔案館的核心技術(shù),本文準(zhǔn)確、清晰地剖析了美國的編碼檔案著錄文獻(xiàn)類型定義(EAD  DTD)技術(shù)的形成、記錄結(jié)構(gòu)、構(gòu)成元素、相關(guān)屬性及其著錄方法,這對于建立和發(fā)展我國自己的EAD  DTD具有非常重要的參考價值。
【摘  要  題】海外縱覽
【  正  文】
  序言:數(shù)字檔案館的建設(shè)已經(jīng)成為當(dāng)今全球檔案界最熱門的話題之一,我國也不例外。本文就是在此背景下開始嘗試探索美國數(shù)字檔案館的核心技術(shù)——EAD  DTD技術(shù)。下面筆者將分兩部分對EAD產(chǎn)生的歷史背景和核心概念(全宗概念)、EAD技術(shù)內(nèi)幕(記錄結(jié)構(gòu)、構(gòu)成元素、相關(guān)屬性、及其著錄方法)進(jìn)行論述,本文僅作拋磚引玉,如有不妥,還望大家批評指正。
      第一部分 EAD  DTD產(chǎn)生的歷史背景和核心概念
    1 EAD  DTD產(chǎn)生的歷史背景
  EAD是基于《通用檔案著錄國際標(biāo)準(zhǔn)》(ISAD(G))之上的一部檔案著錄交流標(biāo)準(zhǔn)。它是以標(biāo)準(zhǔn)通用標(biāo)記語言(SGML)和擴(kuò)展標(biāo)記語言(XML)文獻(xiàn)類型定義(DTD)的形式存在的。SGML是一個硬件和軟件獨(dú)立的標(biāo)準(zhǔn),這個用來建立文本資料編碼方案的標(biāo)準(zhǔn)是由國際標(biāo)準(zhǔn)組織維護(hù)的。SGML首次于1986年推出,在政府、工業(yè)、學(xué)術(shù)界獲得巨大的成功。由于SGML很復(fù)雜,程序員發(fā)現(xiàn)很難用來編制軟件。因此,1998年2月由世界廣域網(wǎng)聯(lián)盟(W3C)推出了SGML的可兼容子集,即XML。XML和其他一些相應(yīng)的標(biāo)準(zhǔn)(如,擴(kuò)展式樣語言(XSL)、擴(kuò)展鏈接語言(XLink)提供了SGML和相關(guān)標(biāo)準(zhǔn)(如,DSSSL  and  HyTime)的大部分功能,因此,軟件編程人員感到XML容易使用。由于DTD與SGML和XML兼容,所以,EAD  DTD就充分地利用了現(xiàn)存的SGML軟件和XML軟件的優(yōu)點(diǎn)。1998年8月底,也就在美國檔案工作者協(xié)會(以下簡稱為SAA)年會召開之際(8月31日—9月6日在佛羅里達(dá)州的奧蘭多市召開),SAA下屬的檔案信息交換委員會(CAIE)下設(shè)的編碼檔案著錄(簡稱EAD)工作組和美國國會圖書館下屬的網(wǎng)絡(luò)發(fā)展和馬克(MARC)標(biāo)準(zhǔn)辦公室聯(lián)合發(fā)布了《編碼檔案著錄文獻(xiàn)類型定義1.0版》(英文稱作“EAD  DTD  Version  1.0”,為了不與其他行業(yè)制定的DTD相混淆,美國人將此標(biāo)準(zhǔn)簡稱為“EAD  DTD”,但是他們常常為了簡便稱之為“EAD”。)。與此同時,SAA的季刊《美國檔案工作者》出版了刊名上分別標(biāo)上1997年第3、第4期的兩期?,專門介紹有關(guān)EAD的研制背景和案例應(yīng)用研究。之后SAA將兩本期刊合二為一出版,題名為《編碼檔案著錄:背景、理論和案例研究》。1999年初,SAA下設(shè)的EAD工作組出版了一本題名為《編碼檔案著錄應(yīng)用指南1.0版》。這三本著作是研究EAD技術(shù)的重要依據(jù)。
  EAD  DTD在反映ISAD(G)的同時,強(qiáng)調(diào)檔案著錄的等級性質(zhì)和著錄的繼承性。EAD  DTD中的一套變比較多的著錄元素集就是用來著錄整個匯集或者全宗的?陀^地來說,EAD在利用先進(jìn)技術(shù)轉(zhuǎn)換檔案著錄方面還處于非常早期的階段,目前大多數(shù)EAD的實(shí)施應(yīng)用注重顯示,不注重標(biāo)引,標(biāo)引相對簡單。然而,由于網(wǎng)絡(luò)檢索和全文標(biāo)引極大地增強(qiáng)了對著錄記錄以及對應(yīng)的資料的檢索,因此需要研究傳統(tǒng)檔案著錄在新的聯(lián)機(jī)環(huán)境下是否有效、哪些地方需要改、哪些地方需要增加、以什么方式并且怎樣完全地開發(fā)利用檔案著錄信息。因此,EAD也正在進(jìn)一步朝著全面揭示檔案著錄信息的方向發(fā)展。與此同時,目前國際上有組織機(jī)構(gòu)正編制一份基于國際檔案理事會的《團(tuán)體機(jī)構(gòu)、個人和家族檔案規(guī)范記錄國際標(biāo)準(zhǔn)《(ISAAR(CPF))的DTD,這將與EAD兼容,也將便利于建立一個傳記和歷史數(shù)據(jù)庫,這個數(shù)據(jù)庫對于充當(dāng)檔案著錄和資源網(wǎng)關(guān)的團(tuán)體機(jī)構(gòu)、個人、和家族的文獻(xiàn)進(jìn)行處理,這個數(shù)據(jù)庫本身是一個重要的資源,并且將有利于分散的和復(fù)雜的全宗的著錄。
  EAD的國際使用帶來了與語言相關(guān)的問題,那些母語不是英語的檔案人員無法理解和應(yīng)用這個原來針對英語國家的標(biāo)準(zhǔn)。因此,必須編制其他語種的EAD  DTD版本和使用手冊。目前HyTime公司已經(jīng)研制出了EAD  DTD的特殊語種版本,它能夠作為一個規(guī)范形式與英語版本進(jìn)行交流和交換,這將有利于EAD的進(jìn)一步國際化,我們國內(nèi)檔案界應(yīng)該抓住機(jī)遇,制定相應(yīng)的中國EAD  DTD標(biāo)準(zhǔn)。自從1996年2月EAD的第一初版發(fā)布以來,在許多美國、加拿大、英國(尤其是公共檔案局)檔案庫房,和一些歐洲、拉丁美洲、澳大利亞檔案庫房都在執(zhí)行EAD計劃。就像任何標(biāo)準(zhǔn)需要發(fā)展一樣,EAD也正在發(fā)展之中并將繼續(xù)發(fā)展。EAD目前正由美國國會圖書館(LC)和SAA聯(lián)合維護(hù)。國會圖書館負(fù)責(zé)實(shí)體上的維護(hù),SAA負(fù)責(zé)行政上和智能上的維護(hù)。在SAA內(nèi)部,EAD工作組(簡稱EADWG)直接負(fù)責(zé)繼續(xù)的發(fā)展。工作組的代表分別來自SAA,LC,研究圖書館組公司(RLG),聯(lián)機(jī)計算機(jī)圖書館中心(OCLC)和國際檔案理事會(ICA),還有兩個國際成員,一個來自加拿大,另一個來自英國。
  世界各國的實(shí)踐經(jīng)驗(yàn)告訴我們,只有當(dāng)一個標(biāo)準(zhǔn)實(shí)現(xiàn)了它所服務(wù)的團(tuán)體的原則和目標(biāo)的話,標(biāo)準(zhǔn)才會成功。而當(dāng)那些負(fù)責(zé)標(biāo)準(zhǔn)管理維護(hù)的組織機(jī)構(gòu)真正代表整個用戶團(tuán)體的話,標(biāo)準(zhǔn)才能反映團(tuán)體的原則和目標(biāo)?梢灶A(yù)見的是,隨著EAD在國際上的使用,EAD工作組的成員也將擴(kuò)大,最終將成為一個國際組織。我們國內(nèi)檔案界應(yīng)該積極與EAD工作組聯(lián)系,獲取信息、增進(jìn)交流,以便于加快研制我國自己的EAD  DTD標(biāo)準(zhǔn)的步伐。
    2 對于蘊(yùn)含在EAD技術(shù)中的全宗概念的正確理解
  美國EAD  DTD標(biāo)準(zhǔn)的核心概念之一就是全宗,因此,正確理解全宗概念對于我們把握編碼著錄技術(shù)來說是至關(guān)重要的!锻ㄓ脵n案著錄國際標(biāo)準(zhǔn)》公布的一份全宗的整理的各個層次的模型示意圖(見下圖)是一張等級模型圖(這張圖只是顯示了一種典型的情況,并沒有包括所有可能的層次組合,全宗層次以下的各個層次的數(shù)量是由實(shí)際檔案決定的。)。這張圖有助于我們清晰地理解全宗這一概念。
  附圖
  事實(shí)上,許多了解美國檔案檔案工作的人都知道,美國人不喜歡使用全宗(fonds)這個詞,而更喜歡使用匯集(collection)這個詞。對于世界上大多數(shù)其他國家來說,匯集是指基于一個或者幾個標(biāo)準(zhǔn)之上的資料的“有意圖的聚集”,是與資料的“有機(jī)產(chǎn)生”相對而言的。

解讀美國數(shù)字檔案館的核心技術(shù)

在美國的用法中,有意圖地聚集資料是“人造的匯集”(artificial  collection)的意思。在英國,盡管有時候使用單數(shù)形式的“檔案”(archive)來代表“全宗”(fonds),但是最近還是使用“匯集”這個詞。然而,我們知道,檔案著錄是用來描述既是“有機(jī)產(chǎn)生”的全宗又是“人造的匯集”。所以,這兩個詞必將共存一個相當(dāng)長的時期。
      第二部分 EAD技術(shù)內(nèi)幕解讀
    1 高層次元素
  EAD規(guī)定任何編碼檢索工具都由兩部分組成,而這兩部分所在的層次也稱為最基本層次。即,(1)第1個最基本層次,第1部分提供關(guān)于檢索工具本身的信息(包括它的題名、編撰者、編撰日期等等)。(2)第2個最基本層次,第二部分提供關(guān)于檔案資料主體的信息(包括一個匯集,一個記錄組,一份全宗或者由許多份系列構(gòu)成的一份檔案資料)。EAD將第1部分分成2個高層次元素,分別稱作EAD頭標(biāo)元素(用<eadheader>表示)、首要事情元素(用<frontmatter>表示)。第2部分被放在第3個高層次元素中,此元素稱為檔案著錄元素(用<archdesc>表示)。這兩部分或者說這3個高層次元素被放在最外層的元素中,此最外層的元素稱為編碼檔案著錄元素(用<ead>表示)。也就是說,<ead>包含丁上述3個高層次元素。EAD規(guī)定,為了在名稱上有別于上述2個最基本層次及其包含的3個高層次元素,<ead>也被稱為最外層元素。如下表所示。
  附圖
  目前,EAD共收錄了145個元素及其對應(yīng)的標(biāo)識符,除了上述的<ead>、<eadheader>、<frontmatter>、<archdesc>4個元素,剩下的141個元素將或多或少地根據(jù)元素設(shè)置規(guī)定和實(shí)際需要出現(xiàn)在<eadheader>、<frontmatter>、<archdesc>3個高層次元素中,有些元素會根據(jù)檔案資料的內(nèi)容著錄需要反復(fù)出現(xiàn)多次,或者在整個結(jié)構(gòu)的多個地方出現(xiàn)。例如,在文后將提到的鏈接元素,由于實(shí)際的著錄內(nèi)容需要指向一個或幾個電子檢索工具,所以,在EAD記錄結(jié)構(gòu)的任何需要指出鏈接的地方將使用鏈接元素,這樣,用戶在瀏覽器屏幕上將會看到一個個超鏈接,這些超鏈接指向一個個電子檢索工具,這難道不是我們想要得到的最佳效果嗎?答案顯然是肯定的。當(dāng)然,所有的144個元素都會被最外層的<ead>元素包圍起來,形成一個整體,便于計算機(jī)識別和信息處理。
    2 EAD頭標(biāo)元素和首要事情元素
  2.1 EAD頭標(biāo)元素
  EAD使用EAD頭標(biāo)元素來獲取有關(guān)具體檢索工具的創(chuàng)建、修改、出版和發(fā)行的信息,它由4個子元素組成,有些子元素可以被進(jìn)一步細(xì)分,即,(1)第1個子元素是EAD標(biāo)識符元素,它為檢索工具提供惟一的識別號或者代碼,能夠指出出處、來源、和標(biāo)識符類型。(2)第二個子元素是文件著錄元素,包含了許多有關(guān)檢索工具的書目信息,其中包括作者姓名、題名、副題名、主辦者(上述三者都被包含在題名說明元素中),也包括版本、出版者、系列相關(guān)附注。(3)第5個子元素是外形著錄元素,是用來記錄檢索工具的語種、記錄誰和什么時候?qū)Υ宋墨I(xiàn)進(jìn)行編碼著錄的。(4)第4個元素是修訂著錄元素,概述了對這份經(jīng)編碼檔案著錄過的文獻(xiàn)所作的任何修訂。這4個子元素以及下一級元素的次序是由EAD規(guī)定好的,為了便于機(jī)器處理信息,這些元素次序的前后次序不能顛倒(在文后的元素介紹中,如果沒有特別說明,元素中的子元素的著錄先后次序是任意排列的,例如,段落元素中的33個子元素的著錄次序是根據(jù)實(shí)際著錄內(nèi)容來決定的。)。EAD頭標(biāo)元素中著錄的內(nèi)容往往不是手工著錄的內(nèi)容,但是對于編制機(jī)讀檢索工具業(yè)說是非常重要的,因?yàn)檫@是機(jī)讀檢索工具的基本信息。另外EAD頭標(biāo)元素中的內(nèi)容可以用來產(chǎn)生電子版和印刷版檢索工具的題名頁。
  2.2 首要事情元素
  EAD也包括一個可選擇的元素,叫做首要事情元素,它能用來產(chǎn)生一個可以按地方檔案機(jī)構(gòu)自己擬訂的信息優(yōu)先順序進(jìn)行排列的題名頁。因此,在此元素中的題名頁子元素與上述文件著錄子元素中的題名頁子元素的使用方法一樣。首要事情元素也可以用來對結(jié)構(gòu)進(jìn)行編碼,例如,序言、題獻(xiàn)頁、或者其他有關(guān)編制、出版情況、檢索工具的使用情況的文本。這是EAD能夠?yàn)橛脩籼峁﹤性化服務(wù)的一個突出表現(xiàn)。在越來越強(qiáng)調(diào)因特網(wǎng)信息的個性化服務(wù)的今天,EAD的這種元素設(shè)置無疑是順應(yīng)了當(dāng)今用戶檢索需求的發(fā)展潮流。是值得我們借鑒的一個重要方面。
    3 檔案著錄元素
  第3個高層次元素是檔案著錄元素。在此元素中信息是以等級制形式被完好地組織起來。檢索工具通常以幾個不同的、但在細(xì)節(jié)上相關(guān)的層次描述一個由許多記錄或者文件組成的單元。在這里,首先利用檔案著錄元素從總體上對檔案進(jìn)行描述,之后,對從屬部分進(jìn)行著錄(用<dsc>表示)。另外,對于檔案著錄元素可以設(shè)定它的層次屬性,以便于明確整個單元的性質(zhì),屬性值主要有匯集、記錄組、全宗、系列等。
  經(jīng)過上述介紹,我們知道,具體的著錄方法是:檔案人員通過撰寫EAD元素就開始了編碼檔案著錄,之后,編寫必須的EAD頭標(biāo)元素及其子元素和具體內(nèi)容。接著也許會編寫首要事情元素及其子元素和具體內(nèi)容。之后,就要編寫檔案著錄元素,并對此元素設(shè)定其屬性值。然后,是對于整個單元進(jìn)行數(shù)據(jù)描述。其中,描述性識別元素(用<did>表示)對于確保檔案單元或組成部分的高質(zhì)量的基本著錄來說是最重要的元素之一,它能便利于信息的檢索和輸出。
  3.1 描述性識別元素
  描述性識別元素可以包含13個描述信息的子元素,它們是檔案著錄的重要元素。即,標(biāo)目、摘要、容器、數(shù)字化檔案物件、數(shù)字化檔案物件組、附注、來源、載體描述、載體出處、庫房、單元日期、單元識別、單元題名元素。另外,描述性識別元素可以用一些屬性值加以限制,以便于使得這個元素具有更加專指的內(nèi)容識別作用,例如,標(biāo)簽、類型、編碼類似物等屬性值。對于可供選擇的編碼類似物這個屬性值來說,設(shè)定此值后,可以在此元素內(nèi)著錄一些相應(yīng)的馬克字段或子字段以及規(guī)范數(shù)據(jù)。而使用此值,檔案人員可以通過計算機(jī)程序從EAD檢索工具中自動地產(chǎn)生框架層次的馬克記錄;使用此值,也可以幫助檢索和標(biāo)引系統(tǒng)識別在聯(lián)機(jī)目錄中的書目記錄和檔案檢索工具之間的可匹配的數(shù)據(jù)元素。
  3.2 敘述性信息
  當(dāng)使用上述的描述性識別子元素著錄的檔案資料的基本信息后,可以進(jìn)行單元的組成部分的著錄。然而,檢索工具編制者很可能會提供有關(guān)整個單元的內(nèi)容、背景或者范圍方面的敘述性信息。這些著錄通常出現(xiàn)在以下一些子元素中,例如,行政管理信息、自傳或歷史、范圍和內(nèi)容、組織機(jī)構(gòu)、整理元素。對于這些信息類目,編碼者也許會使用標(biāo)目元素來提供一個基于地方檔案館選擇之上的標(biāo)目。例如,只要內(nèi)容是被標(biāo)識為自傳歷史元素,EAD允許編碼者在標(biāo)目元素中著錄任一標(biāo)目來識別一個自傳附注或者機(jī)構(gòu)歷史。此例的具體標(biāo)目可以選定為:自傳摘要,自傳,簡·多的關(guān)鍵日期(Jane  Doe’s  Key  Dates)。從結(jié)構(gòu)上來說,這些元素通常還包含段落元素或者各種類型的清單元素。而清單元素包

括年表清單元素,年表清單元素又包含年表清單項自、日期、事件元素,由于實(shí)際著錄需要這些元素中可以包含一些顯示文件鏈接和圖表顯示的元素。
  3.3 段落元素
  段落元素特別有用,它包含了33個子元素,可以進(jìn)一步限定段落的格式、鏈接和詞匯控制等。例如,規(guī)范檢索標(biāo)目元素(在第六部分有詳細(xì)說明。),鏈接組元素等(在第七部分有詳細(xì)說明。),表格元素(在第八部分有詳細(xì)說明)。
  3.4 嵌套著錄和標(biāo)識深度之間的關(guān)系
  因?yàn)橛懈鞣N智能和經(jīng)濟(jì)的因素(例如,檔案編碼人員的素質(zhì)和能力各不相同,檔案機(jī)構(gòu)的經(jīng)費(fèi)有多有少。)將影響一個機(jī)構(gòu)的標(biāo)識的深度,EAD允許檔案機(jī)構(gòu)和編碼人員根據(jù)自身能力、機(jī)構(gòu)財力和用戶需求來決定元素的嵌套次數(shù),以便于為用戶提供盡可能詳細(xì)的和特殊的信息。例如,前面提到的行政管理信息元素,包含了有關(guān)一個機(jī)構(gòu)的檔案資料的采購、處理、管理。此元素標(biāo)識了有關(guān)檔案的來源、采購、檢索和復(fù)制限制條件、縮微和數(shù)字化替代品的可獲得性情況、首選的引用形式、和其他著錄細(xì)節(jié),這些著錄細(xì)節(jié)是用來幫助用戶了解如何接近檔案資料和如何充分利用用戶已經(jīng)找到的信息。在行政管理信息元素中可以單獨(dú)著錄的子元素主要有保管人歷史、增加物、采購信息、鑒定信息、檢索限制條件、用戶限制條件、可獲得的選擇形式、首選的引用、處理信息、段落、附注元素。
  3.5 第3個高層次元素中的其他一些元素及其著錄先后次序
  現(xiàn)在來簡單回顧一下,對于第3個高層次元素來說,以上已經(jīng)介紹了它的6個子元素,即,(1)描述性識別元素;(2)行政管理信息元素;(3)整理元素;(4)自傳或歷史元素;(5)組織機(jī)構(gòu)元素;(6)范圍和內(nèi)容元素。此外,還有其他7個在著錄中經(jīng)常用到的子元素,即,(7)輔助描述性數(shù)據(jù)元素,將在第五部分詳細(xì)說明;(8)規(guī)范檢索標(biāo)目元素,將在第六部分詳細(xì)說明;(9)數(shù)字化檔案物件元素,已經(jīng)被包含在3.1部分中,限于篇幅不作說明;(10)數(shù)字化檔案物件組元素,已經(jīng)被包含在3.1部分中,限于篇幅不作說明;(11)附注元素,內(nèi)容較繁雜,限于篇幅不作說明;(12)其他描述性數(shù)據(jù)元素,將在第五部分詳細(xì)說明;(13)從屬組件著錄元素,將在第四部分詳細(xì)說明。而這13個子元素的著錄先后順序?yàn)椋?,7,2,3,4,8,9,10,11,12,5,6,13。下面就對第3個高層次元素中沒有介紹過的一些重要元素及其著錄方法分別予以說明。
    4 從屬組件著錄元素
  當(dāng)檔案編碼人員完成了一個記錄或者一份文件的第3個高層次元素(即,檔案著錄元素)的著錄后,接著,就要利用從屬組件著錄元素(用<dsc>表示,主語義上可以譯為從屬組成部分著錄元素)對此記錄或者文件的從屬部分進(jìn)行著錄了。(在這里,需要特別說明的是,組件(component)是一個計算機(jī)專業(yè)術(shù)語。組件就是組成部分的意思,而本文前面提到的物件(object),也是一個計算機(jī)專業(yè)術(shù)語,是一個物體、一個對象、一個單元的意思。邏輯上來說,物件包含了許多個組件,或者說,物件是由許多個組件構(gòu)成的。目前,我國計算機(jī)專業(yè)的許多教材都采用“對象”這一譯法,但是在我國許多計算機(jī)專業(yè)網(wǎng)站上有許多教材采用“物件”這一譯法。筆者認(rèn)為,譯為“物件”更加合理,因?yàn)槲锛嗽S多組件,理解起來比較合理、順暢。)在這個元素中,著錄傳統(tǒng)檢索工具的每個部分,例如,系列、容器清單、日歷。這個元素的內(nèi)容通常是以幾種不同的表格形式來體現(xiàn)等級制結(jié)構(gòu),當(dāng)然就必須對這個元素賦加一個類型屬性值。類型屬性值主要有4種。即,(1)類型屬性值:分析性概覽型;作用:用來識別含有許多系列或者子系列的著錄。(2)類型屬性值:深入詳細(xì)型;作用:用來識別一個含有許多容器或文件夾的清單,日歷,或者是一個含有許多項目的清單。(3)類型屬性值:組合型;作用:用來識別每個系列的著錄后面緊隨著一個含有許多容器或文件夾的清單的情況。(4)類型屬性值:其他類型;作用:用來識別與上述不同的情況。
  下面讓我們來看一個具體著錄過程。第一步,著錄大致的提要清單。在撰寫好第1個從屬組件著錄元素(用<dec>表示)后,就要設(shè)置此元素的類型屬性值和層次屬性值。例如,如果檔案編碼人員想要提供在一個匯集中的所有系列的提要清單,那么,他或她將屬性值設(shè)置為分析性概覽型,并且撰寫組件層次元素(用<c01>至<c12>表示)。還要設(shè)置層次屬性值為系列,再利用以前在第三個高層元素中提到的各項子元素并且依照相同的元素順序來著錄。值得一提的是,一般來說,著錄從屬組件著錄元素時,將不再重復(fù)著錄在檔案著錄元素中的描述性識別元素(用<did>表示)中的子元素。例如,在第3高層次元素中的<did>元素中的庫房元素和來源元素等表示的信息會被組件層次元素(用<c01>表示)繼承。其他<did>元素中的子元素在組件層次元素中將會被經(jīng)常用到以便于在低一級層次上著錄更加新或者更加詳細(xì)的內(nèi)容,具體有:標(biāo)目,摘要,容器,數(shù)字化檔案物件,數(shù)字化檔案物件組,附注,載體著錄,載體出處,單元日期,單元識別,單元題名元素。第二步,著錄全宗等級結(jié)構(gòu)。完成第一步后,只是對于一份全宗著錄了一個大概的提要清單,要想全部地反映整個全宗的層層等級結(jié)構(gòu),還必須完成第二步著錄工作。具體是:將第2個從屬組件著錄元素的類型屬性值設(shè)置為深入詳細(xì)型,這樣就可以反映出容器的清單。容器清單中的每個系列、子系列、文件、項目的等級制結(jié)構(gòu)都通過組件元素的永無窮盡的層層嵌套反映出來。在這里,每低一層次的元素在網(wǎng)頁上顯示的時候都能夠繼承上一層次的著錄信息,這樣就避免了重復(fù)著錄。EAD就是依據(jù)XML(擴(kuò)展性標(biāo)識語言)標(biāo)準(zhǔn)設(shè)計的標(biāo)記語言,當(dāng)瀏覽器依據(jù)XML標(biāo)準(zhǔn)設(shè)計后,瀏覽器就能正確地反映出這樣復(fù)雜的檔案文件的等級結(jié)構(gòu),而這正是我們夢寐以求的東西。
    5 輔助描述性數(shù)據(jù)元素和其他描述性數(shù)據(jù)元素
  在檔案著錄元素和從屬組件著錄元素中還有兩個重要的元素分別是輔助描述性數(shù)據(jù)元素和其他描述性數(shù)據(jù)元素。
  5.1 輔助描述性數(shù)據(jù)元素
  輔助描述性數(shù)據(jù)元素是用來提供輔助的描述性信息,以便于用戶利用在檢索工具中有特征的資料。這包括附加的資料檢索工具(例如,索引,文件規(guī)劃和其他檢索工具),也包括與檢索工具著錄中有些資料相關(guān)的或者相分離的資料的清單或著錄。此元素主要包含以下一些子元素:書目、文件規(guī)劃、索引、附注、其他檢索工具、段落、相關(guān)資料、相分離的資料元素。而書目元素之下又包含3個子元素:檔案參照、書目參照、擴(kuò)展的參照元素。
  5.2 其他描述性數(shù)據(jù)元素
  其他描述性數(shù)據(jù)元素是一個特殊的元素,它是用來標(biāo)識無法著錄在其他EAD類目中的任何信息,主要是用在將舊的紙質(zhì)檢索工具轉(zhuǎn)換為新的電子檢索工具的時候(即,在回溯轉(zhuǎn)換時候)。此外,令人感到高興的是,1999年初,由美國全國人文科學(xué)捐贈組織部分資助的(美國傳統(tǒng)虛擬檔案館計劃)和加州大學(xué)校長辦公室部分資助的《加州大學(xué)EAD計劃》都采用于同一份由4所美國大學(xué)(杜克大學(xué)、斯坦福大學(xué)、哈佛大學(xué)、加州大學(xué))聯(lián)合起草的《EAD回溯轉(zhuǎn)換準(zhǔn)則》,此《準(zhǔn)則》共57頁,是EAD的一個重要補(bǔ)充,也具有極大的研究價值。
    6 規(guī)范檢索標(biāo)目元素
  以上是對檢索工具的

主要部分進(jìn)行編碼著錄,這些編碼著錄工作無疑都是為了便于用戶檢索。但是,用戶往往也可能檢索一些存在于檢索工具中的字符串,例如,名稱,個人名稱,團(tuán)體名稱,家族名稱,地理名稱,職業(yè),功能,形式和類型術(shù)語,主題,題名。EAD針對上述這些字符串規(guī)定了相應(yīng)的元素,它們分別是:名稱、個人名稱、團(tuán)體名稱、家族名稱、地理名稱、職業(yè)、功能、形式和類型術(shù)語、主題、題名元素。所有這些元素都允許使用屬性值來限定這些元素的內(nèi)容,例如,個人名稱到底是作者、編者、還是攝影師,必須用屬性值加以說明;使用的規(guī)范專業(yè)詞匯是否符合國會圖書館主題詞表、國會圖書館名稱規(guī)范檔、藝術(shù)和建筑敘詞表、職業(yè)題名詞典等等,也必須用屬性值加以說明。EAD規(guī)定必須將上述這些元素都放在規(guī)范檢索標(biāo)目元素之下,而規(guī)范檢索標(biāo)目元素可以根據(jù)具體檔案文件內(nèi)容的著錄需要放在檔案著錄元素或者從屬組件著錄元素之下,也可以放在段落元素或者單元題名元素之下,這樣放置是為了便于用戶對這些元素進(jìn)行自由地檢索。實(shí)際上,這些元素是與聯(lián)機(jī)目錄中的馬克記錄的主要款目標(biāo)目字段(1XX)、主題附加款目標(biāo)目字段(6XX)、附加款目標(biāo)目字段(7XX)相對應(yīng)的。這種對應(yīng)有利于計算機(jī)根據(jù)EAD記錄按照轉(zhuǎn)換程序自動生成馬克記錄。總之,這些元素中的內(nèi)容經(jīng)過規(guī)范化后將更加有利于用戶檢索信息,也將提高用戶的查準(zhǔn)率和查全率。
    7 指針、參照和鏈接等元素
  在編碼著錄時,當(dāng)只需要指出單向的鏈接時,可以使用以下這些元素:檔案參照、書目參照、數(shù)字化檔案物件、擴(kuò)展的指針、擴(kuò)展的參照、指針、參照元素。當(dāng)需要著錄多個方向的鏈接時,可以使用以下這些元素;數(shù)字化物件出處、擴(kuò)展的指針出處、擴(kuò)展的參照出處、指針出處、參照出處元素。這些出處信息都被放置在數(shù)字化檔案物件組元素、或者是指針組元素、或者是鏈接組元素中。所有以上這些鏈接元素都可以放置在段落元素中或者是EAD記錄結(jié)構(gòu)中的任何地方,目的是為了便于EAD記錄可以隨處地在記錄的任何地方顯示超文本和超媒體。這樣就為檢索工具在聯(lián)機(jī)環(huán)境下動態(tài)的顯示記錄及其超鏈接(準(zhǔn)確地說是鏈接到其他電子檢索工具)鋪平了道路。
    8 表格元素
  在EAD記錄中,表示表格除了在從屬組件著錄元素中針對此元素附加一個類型屬性值后可以通過幾種不同的表格形式來體現(xiàn)等級制結(jié)構(gòu)以外,在許多情況下,可以通過字體的變換來顯示表格內(nèi)容。但是,檢索工具常常包含了大量以表格形式出現(xiàn)的文本或者信息,例如,在自傳中的多欄目的年代表、高度結(jié)構(gòu)化的文件規(guī)劃、其他輔助描述性數(shù)據(jù)元素。因此,為了達(dá)到再現(xiàn)真實(shí)的檔案表格的效果,通常在某一些復(fù)雜文件的EAD標(biāo)記語言中嵌入一個表格結(jié)構(gòu)。通過對列、行、單元格的限定就可以描述一個表格。
  美國EAD編碼著錄技術(shù)自正式發(fā)布至今已經(jīng)4年多了,國內(nèi)僅僅發(fā)表了幾篇關(guān)于EAD的介紹性文章,至今沒有一篇詳細(xì)論述EAD技術(shù)內(nèi)幕的論文。究其原因,主要是由于研究人員受到英語語言知識、計算機(jī)技術(shù)知識、檔案編目知識、物力、財力等諸多客觀條件限制,無法開展對這項新技術(shù)的理論研究和應(yīng)用研究。雖然在研究EAD的道路上困難重重,然而只要我們一起努力、齊心協(xié)力,就一定能夠?qū)⒀芯窟M(jìn)行到底。本文行將結(jié)束,但是筆者深信大家對EAD的研究不會終止。


【解讀美國數(shù)字檔案館的核心技術(shù)】相關(guān)文章:

綜合性檔案館館藏檔案數(shù)字化鑒定探討08-05

無線遠(yuǎn)程監(jiān)控控系統(tǒng)的核心技術(shù)研究08-06

證券投資 基金評估體系的核心技術(shù)構(gòu)造與實(shí)例08-07

參觀檔案館02-21

互聯(lián)網(wǎng)搜索:核心技術(shù)與商業(yè)模式主宰沉浮08-05

解讀 及規(guī)定08-05

解讀父親08-16

M系列新一代數(shù)據(jù)采集產(chǎn)品核心技術(shù)08-06

美國的作文02-02