- 相關(guān)推薦
網(wǎng)絡(luò)信息資源組織研究進展
【內(nèi)容提要】主要從用于組織網(wǎng)絡(luò)信息資源的搜索引擎、虛擬圖書館、文獻分類法、主題法、窗口方式等方面全面總結(jié)與回顧20世紀(jì)90年代以來網(wǎng)絡(luò)信息資源組織的理論與實踐。【摘 要 題】信息資源建設(shè)
【關(guān) 鍵 詞】網(wǎng)絡(luò)信息資源組織/網(wǎng)絡(luò)信息資源整序/研究進展
筆者通過普查大量國內(nèi)外期刊論文及有關(guān)出版物、分析相關(guān)網(wǎng)站,進而總結(jié)與回顧20世紀(jì)90年代以來網(wǎng)絡(luò)信息資源組織的理論與實踐,以期有助于優(yōu)化其網(wǎng)絡(luò)信息資源組織與揭示方法,促進該領(lǐng)域研究的蓬勃開展。本文著重總結(jié)網(wǎng)絡(luò)信息資源組織的研究進展,有關(guān)其揭示方法將在另文總結(jié)。
1 用于組織網(wǎng)絡(luò)信息的搜索引擎方式
。1)關(guān)于搜索引擎組織方式。
對于搜索引擎而言,網(wǎng)絡(luò)信息組織采用主題樹和數(shù)據(jù)庫兩種方式,也有稱使用語詞組織知識和使用分類法組織知識。所謂主題樹組織方式,就是將信息資源按照某種事先確定的概念體系,分門別類地逐層加以組織,用戶通過瀏覽的方式層層遍歷,直到找到所需的信息線索,再通過信息線索聯(lián)接到相應(yīng)的網(wǎng)絡(luò)信息資源,F(xiàn)有的提供目錄分類式(或稱主題指南、列表瀏覽)查詢功能的搜索引擎就采用這種方法組織信息。而數(shù)據(jù)庫組織方式,就是將所有已獲得的網(wǎng)絡(luò)信息資源以固定的記錄格式存儲,用戶通過關(guān)鍵詞及其組配查詢,就可找到所需要的信息線索(即相關(guān)站點鏈接),并通過信息線索直接連接到相應(yīng)的網(wǎng)絡(luò)信息資源。
(2)關(guān)于搜索引擎的比較研究。
、偎阉饕娴男阅鼙容^研究。早期研究大量集中在概要性介紹方面。殷雪松、徐斌分別介紹了12個大陸地區(qū)的中文搜索引擎網(wǎng)易、天網(wǎng)、華好網(wǎng)景、搜狐、四通方利、常青藤、北極星、悠游、搜索客、司南、我是野虎、若比鄰等,港臺地區(qū)茉莉之窗、哇塞、蕃薯藤等和5個國外的中文搜索引擎Yahoo雅虎中文、AltaVista(中文版)、Globepage(中文版)、華頁指南、中文查尋。
王忠、周士波分別介紹了獨立搜索引擎Altavista、Hotbot、Infoseek、Excite、Webcrawler、元搜索引擎Cyber411、Dogpile、Highway61、Inference Find、Mamma、Profusion、Savvy search、All4 one和網(wǎng)絡(luò)英文搜索引擎Webcompass、Copernic98,并對6種主要搜索引擎的基本查尋、高級查尋、限定查尋、結(jié)果排序、結(jié)果輸出等檢索性能進行比較分析。
隨著研究的不斷深入,研究重點轉(zhuǎn)入到了搜索引擎性能的比較上。孫麗等選取了北極星、常青藤、搜狐、中經(jīng)網(wǎng)信息導(dǎo)航、網(wǎng)現(xiàn)引擎5個中文搜索引擎,從數(shù)據(jù)庫類型、規(guī)模、庫更新頻率、抓取方式、日抓取頁面數(shù)、抓取深度、<Meta>tag、顯示方式、信息排序依據(jù)、信息描述質(zhì)量、界面友好程度、用戶歡迎程度等分析它們的優(yōu)劣。徐建華等從數(shù)據(jù)庫規(guī)模、信息采集方式、標(biāo)引內(nèi)容、檢索功能、結(jié)果顯示格式、結(jié)果排序規(guī)則、數(shù)據(jù)庫更新頻率等7個方面對Altavista、Excite、Go、Hotbot、Lycos、Yahoo這6個搜索引擎逐一進行分析。
張燕,惠佳穎就10個檢索提問,從檢索功能(布爾檢索、鄰近檢索、截詞檢索等)、查準(zhǔn)率、用戶負(fù)擔(dān)、輸出方式對搜索引擎Google和Ask Jeeves進行詳細(xì)比較,測試結(jié)果顯示Google在查準(zhǔn)率以及輸出方式上明顯優(yōu)于Ask Jeeves,在檢索功能及用戶負(fù)擔(dān)上兩者各有特色。
、陉P(guān)于搜索引擎的質(zhì)量評價指標(biāo)。搜索引擎評價指標(biāo)多種多樣。1973年Lancaster和Fayen提出了6條關(guān)于信息檢索系統(tǒng)效果評價指標(biāo):即覆蓋范圍、查全率、查準(zhǔn)率、響應(yīng)時間、用戶負(fù)擔(dān)及檢索結(jié)果輸出格式。這一評價指標(biāo)影響甚廣,許多學(xué)者在其基礎(chǔ)上進行細(xì)化與擴充,提出搜索引擎質(zhì)量評價標(biāo)準(zhǔn)。
儲荷婷提出5條標(biāo)準(zhǔn):A.索引構(gòu)成(取決于標(biāo)引數(shù)量、標(biāo)引范圍、索引詞抽取法和索引更新頻率);B.檢索功能;C.檢索效果(由查全率、查準(zhǔn)率和檢索時間衡量);D.檢索結(jié)果顯示(顯示內(nèi)容、顯示數(shù)量以及是否按相關(guān)性排序);E.用戶所需努力(從用戶界面和幫助介紹材料)。
孫麗等提出的評價體系:A.數(shù)據(jù)庫指標(biāo)(數(shù)據(jù)庫大小、類型、更新頻率和信息抓取方式等);B.檢索結(jié)果輸出格式;C.檢索性能完善程度(類目檢索、關(guān)鍵詞檢索、短語檢索、截詞檢索、布爾檢索、概念檢索、自然語言檢索、指定字段檢索、包含或排除檢索等);D.響應(yīng)時間;E.查全率;F.查準(zhǔn)率;G.用戶負(fù)擔(dān)。
曾民族提出評價指標(biāo):A.數(shù)據(jù)庫規(guī)模和內(nèi)容(覆蓋范圍、索引組成、更新周期);B.索引方法(自動索引、人工索引、用戶登錄);C.檢索功能(布爾查找、復(fù)雜布爾操作、相鄰或相鄰查詢、截詞查找、字段查找、概念檢索、詞語加權(quán)、詞語限定、中斷退出、上下文關(guān)鍵詞等);D.檢索結(jié)果(相關(guān)性排序、顯示內(nèi)容、輸出數(shù)量選擇、顯示格式選擇);E.用戶界面(幫助文件、數(shù)據(jù)庫和檢索功能說明、查詢舉例);G.查準(zhǔn)率及響應(yīng)時間。
曹東等從檢準(zhǔn)率和檢全率出發(fā),提出搜索引擎的評價指標(biāo):A.收集網(wǎng)絡(luò)站點數(shù)目的廣泛性;B.搜索結(jié)果的滿意度;C.數(shù)據(jù)庫更新的頻度和時效性;D.使用的便利性;E.目錄設(shè)置的合理性和分類的深度及廣度;G.內(nèi)碼轉(zhuǎn)換的準(zhǔn)確性。
賀亞鋒就7個有代表性的主題進行測試,提出的評估準(zhǔn)則有:A.命中率——查詢主題的網(wǎng)頁反應(yīng);B.檢準(zhǔn)率——首10個網(wǎng)頁中切合主題的網(wǎng)頁數(shù)目的比率;C.重復(fù)出現(xiàn)率——首10個網(wǎng)頁中重復(fù)網(wǎng)頁數(shù)目的比率(鏡象點除外);D.不切題比率——相對于檢準(zhǔn)率。
尚克聰、楊立英提出的評價指標(biāo)體系:A.數(shù)據(jù)庫(從收錄范圍的明確性、收錄相關(guān)內(nèi)容的全面性及更新速度評價);B.檢索軟件,從智能化程度(由人—機接口、檢索過程、檢索結(jié)果輸出、檢索結(jié)果的反饋等指標(biāo)衡量)、提供相關(guān)鏈接的程度、響應(yīng)時間、提供各種檢索途徑;C.檢索效率(綜合使用查準(zhǔn)率和查全率考察)。
黃如花提出的評價指標(biāo):A.收錄范圍(地域范圍、語言范圍、資源類型范圍、專業(yè)范圍);B.分類(分類方式、分類級次、交叉顯示、類名是否規(guī)范、各類的內(nèi)容說明);C.檢索功能與效果(完善的檢索手段、范圍限制的功能、滿足網(wǎng)上動態(tài)信息檢索的要求、對檢索結(jié)果的處理等,查準(zhǔn)率、查全率、搜索條件頻率、響應(yīng)速度);D.結(jié)果處理;E.頁面組織;F.其它功能與服務(wù)。
可見,數(shù)據(jù)庫、檢索功能、查準(zhǔn)率、用戶負(fù)擔(dān)和檢索結(jié)果輸出方式是目前評價搜索引擎較普遍采用的基本指標(biāo)。
。3)搜索引擎分類體系研究。
目前,一些大型搜索引擎普遍建立了指南型分類系統(tǒng),對其分類體系進行研究逐步受到重視。陳樹年在《搜索引擎及網(wǎng)絡(luò)信息資源的分類組織》一文論述了綜合性搜索引擎具備的功能;對網(wǎng)絡(luò)信息進行組織使用的語言;網(wǎng)絡(luò)
信息的組織模式;中文搜索引擎與傳統(tǒng)分類法的比較;建構(gòu)網(wǎng)上知識分類體系的原則和技術(shù)等,可稱為這方面研究的一篇力作。
馬張華、張宇萌認(rèn)為網(wǎng)絡(luò)分類體系與傳統(tǒng)的文獻分類體系的不同點在于:①重視以事物為中心設(shè)置類目;②類目收錄的對象范圍寬泛;③采用多重列類、重復(fù)反映方式揭示類目;排列方式簡便;④直接以語詞組織信息;⑤結(jié)合屏幕顯示分類體系;⑥修訂迅速。其不足是:類目設(shè)置缺乏規(guī)律性;類目歸屬存在不合理現(xiàn)象;同位類排列不能揭示相關(guān)性;橫向關(guān)系揭示上存在不一致;部分類名不確切;分類規(guī)則有待完善等。馬張華還對分類搜索引擎的類目體系進行了較為全面的研究,深入到類目結(jié)構(gòu)的編制依據(jù)、大類結(jié)構(gòu)、類目體系的特點等,并探討了存在的問題。搜索引擎分類體系應(yīng)遵守基本的邏輯規(guī)則,解決好類目的排列問題及橫向類目的處理問題。研究者還對某一具體搜索引擎的信息組織方式進行了探討。如,對Yahoo、搜狐等搜索引擎分類體系進行研究。
(4)搜索引擎功能的完善。
網(wǎng)絡(luò)信息分類體系類目設(shè)置缺乏科學(xué)性、邏輯性,知識領(lǐng)域不全,知識體系不嚴(yán)密,分類標(biāo)準(zhǔn)、引用次序缺乏規(guī)律性。關(guān)鍵詞式搜索引擎多為非控關(guān)鍵詞索引,其檢準(zhǔn)率低。人們逐漸認(rèn)識到搜索引擎應(yīng)該以完善的情報檢索語言原理為基礎(chǔ)。曹東等提出:要運用分類檢索語言的原理與方法;加強因特網(wǎng)信息資源分類表和電子化敘詞表的理論研究,對自然語言實施控制機制;建立后控詞表等情報檢索語言的原理與方法來完善搜索引擎功能。
目前理想的網(wǎng)絡(luò)信息資源組織模式應(yīng)當(dāng)是分類主題一體化。其組成為:①一個結(jié)構(gòu)簡明的知識分類體系,通過對信息的系統(tǒng)分類,實現(xiàn)對信息知識領(lǐng)域的宏觀控制;②一個智能化的控制詞表,實施對作者語言與用戶語言的控制與轉(zhuǎn)換;③建立分類體系與控制詞表的系統(tǒng)聯(lián)系,將標(biāo)引語言納入分類體系,實現(xiàn)自然語言檢索和類與語詞的組配檢索。
2 虛擬圖書館(專題指引庫)
虛擬圖書館是因特網(wǎng)上組織信息資源的一種有效而又經(jīng)濟的形式。具體說來,虛擬圖書館就是根據(jù)特定的目標(biāo),選定信息資源的學(xué)科領(lǐng)域,對有關(guān)的網(wǎng)站網(wǎng)頁進行搜索和收集,加以鑒定核實,并對核實后的網(wǎng)址進行合理組織,使之能夠提供檢索、瀏覽和鏈接的信息集合。與搜索引擎的主要區(qū)別在于,它屬于專題性和學(xué)科專業(yè)性的,系統(tǒng)性和易用性強。虛擬圖書館對網(wǎng)絡(luò)資源組織是優(yōu)越于搜索引擎的關(guān)鍵環(huán)節(jié)。該環(huán)節(jié)由專業(yè)圖書館員把關(guān),在自動系統(tǒng)的協(xié)助下,利用某種分類法和主題詞表,對收集來的原始資源進行描述和組織,改善了搜索引擎采用自然語言標(biāo)引的根本缺點。這方面實踐和研究集中在:
。1)重點學(xué)科導(dǎo)航庫建設(shè)。
研究者主要對導(dǎo)航庫建設(shè)、更新與維護的技術(shù)與方法以及存在問題進行研究。重點學(xué)科導(dǎo)航庫以學(xué)科為單元對因特網(wǎng)的相關(guān)學(xué)術(shù)資源進行搜集、評價、分類、組織的序化整理,并對其進行簡要的內(nèi)容揭示,建立分類目錄式資源組織體系、動態(tài)鏈接的學(xué)科資源數(shù)據(jù)庫的檢索平臺發(fā)布于網(wǎng)上,為用戶提供網(wǎng)絡(luò)學(xué)科信息資源導(dǎo)引的檢索線索的導(dǎo)航系統(tǒng)。我國“211工程高等教育文獻保障體系”(CALIS)提出構(gòu)建重點學(xué)科導(dǎo)航庫系統(tǒng),建議其內(nèi)容可分為7項:研究機構(gòu);相關(guān)電子出版物、電子文獻等;相關(guān)國際會議預(yù)告;其它相關(guān)機構(gòu)信息介紹;本學(xué)科與行業(yè)的相關(guān)標(biāo)準(zhǔn)、規(guī)范、協(xié)議等;主要新產(chǎn)品與市場;新成果、新創(chuàng)造與發(fā)明、專利等。規(guī)定各子項目必須有分類瀏覽功能,以主題樹瀏覽方式組織信息。
。2)專業(yè)網(wǎng)絡(luò)資源導(dǎo)航庫建設(shè)。
所謂指引庫是指所建立的數(shù)據(jù)庫中,從物理上講并不存儲各種實際的信息資源,但對其進行訪問卻可以檢索到有關(guān)數(shù)據(jù)庫的實際資源,即指引用戶到特定的地址獲取信息。其原理與方法是把因特網(wǎng)上與某一或某些主題相關(guān)的節(jié)點進行集中,按方便用戶檢索的原則,向用戶提供這些資源的分布情況,指引用戶查找指引庫中的信息。指引庫采用主題樹方式組織資源。研究者們探討了專業(yè)網(wǎng)絡(luò)導(dǎo)航庫建設(shè)中專業(yè)網(wǎng)絡(luò)信息資源收集的手段與方法、導(dǎo)航庫的構(gòu)成、更新與維護問題。
。3)熱門站點鏈接或相關(guān)站點推薦。
這是因持網(wǎng)上被廣泛使用的最簡單、最直接的信息組織與開發(fā)利用模式。
3 文獻分類法在網(wǎng)絡(luò)信息資源組織中的應(yīng)用研究
。1)傳統(tǒng)文獻分類法改進研究。
國內(nèi)外學(xué)者就圖書館分類法特性、具體分類法與搜索引擎分類體系比較(類目涵蓋范圍、揭示深度、類表結(jié)構(gòu)和功能)進行研究。認(rèn)為傳統(tǒng)分類法知識系統(tǒng)性和標(biāo)識語言的通用性以及族性檢索能力和擴檢、縮檢功能,是其它情報檢索語言所不具備的。它在網(wǎng)絡(luò)中的應(yīng)用主要表現(xiàn):①用于聯(lián)機瀏覽檢索;②用于非文本信息的組織;③用于超文本系統(tǒng)的管理;④作為網(wǎng)絡(luò)信息組織的通用工具;⑤促進分類主題一體化。
基于網(wǎng)絡(luò)信息資源組織用的傳統(tǒng)分類法,應(yīng)從以下幾個方面進行改造:①多維揭示;②適當(dāng)降低分類難度(增加直觀性、透明性);③提高分類法類目標(biāo)題語詞的表達(dá)性和現(xiàn)時性,選擇、積累、增添終端用戶檢索時自然語詞,及時反映網(wǎng)絡(luò)資源建設(shè)和利用中的新主題:④重視分面分類思想和方法;⑤擴展同主題法即主題詞表的聯(lián)系;⑥粗分類原則,采用分面分析方法、建立強大的參照系統(tǒng)、加強標(biāo)引深度,打破傳統(tǒng)的線性資源組織方式,走分類主題一體化道路;⑦分類法應(yīng)當(dāng)解決機讀化和網(wǎng)絡(luò)化、兼容性和國際通用性:分類—主題—自然語言一體化;⑧充分利用新技術(shù)、新方法(超文本技術(shù)、分面分析方法)改造原有的分類法,提高分類法描述網(wǎng)上信息主題的能力。
(2)文獻分類法用于網(wǎng)絡(luò)信息資源組織研究。
以文獻分類法為工具的網(wǎng)絡(luò)資源檢索服務(wù)系統(tǒng),從學(xué)科角度揭示網(wǎng)絡(luò)信息,成為組織網(wǎng)上學(xué)術(shù)性知識內(nèi)容的主要應(yīng)用模式。國外在這方面的理論與實踐均走在我國的前列。早在1994年10月23~25日,在美國伊利諾伊大學(xué)的第36屆阿勒頓研究會上,與會者圍繞電子時代圖書館分類法的新角色與新地位這一主題進行研討;歐洲科研與教育信息服務(wù)發(fā)展計劃DESIRE(Development of a European Service for Information on Research and Education)在“因特網(wǎng)資源描述與發(fā)現(xiàn)”的專題研究報告(RE1004,1997年8月)中,全面介紹、總結(jié)了分類法在因特網(wǎng)資源組織中的應(yīng)用情況:17個網(wǎng)上服務(wù)系統(tǒng)使用DDC組織資源,5個使用UC,5個使用LCC。
1997年,Nacy J.Williamson對38個使用分類法組織資源的網(wǎng)站進行調(diào)查,記錄每一網(wǎng)站所使用分類法名稱、聯(lián)機分類法索引展示形式、主題樹的特點、類目使用級次、分類法的變通、結(jié)果顯示方式以及應(yīng)用上的特點,并選取9個網(wǎng)站(其中使用DDC、UDC、LCC各3個)以及一些未采用分類法組織資源的網(wǎng)站,對藝術(shù)、歷史、健康和旅游方面的信息進行檢索,用以分析與確定運用分類法的特點、趨勢和存在問題。結(jié)果顯示:絕大多數(shù)網(wǎng)站僅使用一至二級類目,二級或三級以上不采用
分類方式,而以字母或其它的順序。最引人注目的實驗是:使用DDC的CYBERDEWEY,使用LC的WWW Virtual Library和早期使用UDC的BUBL's。研究表明,分類法能夠提供組織網(wǎng)絡(luò)資源框架。
Gerry McKiernan對分類法用于組織網(wǎng)絡(luò)資源進行全面研究,報道了分類法應(yīng)用于主題網(wǎng)關(guān)(subject Gateways)的情況。使用UDC的有:① Directory of Networked Resources:UDC “Shelfmstk”O(jiān)rder(NISS Information Gateway);②GERHARD:German Harvest Automated Retrieval and Directory;③Informazioni Classificate per Discipline;④Tampereen Yliopiston Virtuaikirjasto:Aiheet UDK—Jar jestyksessa;⑤ WWW Subject Tree of WAIS Database (Nordic WAIS/World Wide Web Project)。使用LCC的有:①Cooperative Onlice Resource Catalog(CORC);② CyberStacks;③ICRC:Internet Collegiate Reference Collection;④On—Line Books Page:Call Numbers/Subjects;⑤Ready Reference Using the Internet;⑥Scout Report Signpost;⑦Web Resources Arranged by the Library of Congress Classification System。
DDC是在因特網(wǎng)資源組織中應(yīng)用最廣的分類法。Hamid Saeed and Abdus Sattar Chaudry在 Gerry McKiernan報道運用DDC組織網(wǎng)絡(luò)資源的19家網(wǎng)站基礎(chǔ)上增加了5家,共有24家網(wǎng)站應(yīng)用DDC:①ADAM:Art,Design,Architecture & Media Information Gateway;②Blue Web' n Browse by Subject Area;③Browse LINK by DDC (BUBL);④Canadian Information by Subject (National Library of Canada);⑤Cataloguer's Virtual Reference Shelf;⑥Co—operative Online Resource Catalog (CORC);⑦CyberDewey;⑧Internet Public Library Online Texts Collection;⑨The Internet Resource (Napier University );⑩Mt.Laurel Hartford School's Library Without Walls;(11)Net Sites by the Numbers (Tempe Public Library);(12) New Athenaeum:Internet Resource Guide Developed by Libraries;(13)PICK:Quality Internet Resources in Library and Information Science;(14) Science Net:S
ubject (Toronto Public Library,已終止使用);(15)SORT:School's Online Resources for Teachers:Browse;(16)xmITree:Directory of Content;(17)WWlib Browse Interface;(18)DewPoint;(19) Iowa Virtual Library;(20)Dewey Browse;(21) Dewey Decimal Home Page;(22)The Mathematical Atlas;(23)Webrary;(24)United States Embassy, Israel。
Hamid Saeed and Abdus Sattar Chaudry對每個網(wǎng)站現(xiàn)狀、受控詞匯、檢索選擇、主題范圍及類目級次進行了調(diào)查。結(jié)果近50%的網(wǎng)站只局限于使用一級類目;顯示標(biāo)記符號與類名,其類名未作修改,內(nèi)涵不好理解;絕大多數(shù)網(wǎng)站僅提供瀏覽功能,不具備語詞檢索能力。盡管如此,目前的實驗及研究結(jié)果顯示,DDC作為網(wǎng)絡(luò)環(huán)境下的瀏覽工具已經(jīng)取得了令人鼓舞的成績。
馬張華對文獻分類法在網(wǎng)絡(luò)資源組織中的應(yīng)用進行總結(jié),認(rèn)為其特點在于:收入資源大多經(jīng)過精選;對類目進行必要調(diào)整;對類目體系的深度進行控制;加強類下說明;多種檢索途徑界面;顯示形式、處理層次多樣、編制方式多樣。這是我國在此領(lǐng)域研究的最早的一篇文獻。
我國有學(xué)者提出,在虛擬圖書館中,為了使文獻資源分類一致,可結(jié)合網(wǎng)站的特點,使用圖書分類法,如,用《中國圖書館分類法》將這些網(wǎng)址進行分類管理,使其有序化。
(3)建立我國網(wǎng)絡(luò)信息資源分類法研究。
現(xiàn)有眾多的中文搜索引擎均采用各自分類體系組織網(wǎng)絡(luò)資源,用戶必須熟悉不同的分類體系才能較快地檢索信息,這樣給用戶帶來極大不便。專家們提出,要建立網(wǎng)絡(luò)信息分類法,提供網(wǎng)絡(luò)資源用的統(tǒng)一分類體系。陳樹年提出建立網(wǎng)上信息的知識分類系統(tǒng)的基本結(jié)構(gòu)與編制方法:有一個涵蓋各知識領(lǐng)域、結(jié)構(gòu)清晰、層次簡明、能滿足網(wǎng)上信息組織需要的分類體系;采用等級結(jié)構(gòu)展示知識的系統(tǒng)聯(lián)系,構(gòu)成枝干分類的主題樹或脈絡(luò)清晰的地圖;應(yīng)采用對用戶最有利的排列次序等并提出了中文信息分類大綱。在《文獻分類學(xué)》一書中,他從知識分類體系的構(gòu)建、類目的劃分與設(shè)置、類目交叉關(guān)系的處理、類目與信息的排列、類目注釋和說明、用戶界面等對網(wǎng)絡(luò)分類法的編制進行了詳細(xì)討論。
鄧均華提出要編制我國數(shù)字化分類法,應(yīng)以我國信息組織推薦標(biāo)準(zhǔn)《中圖法》為藍(lán)本,綜合國內(nèi)外優(yōu)秀的分類法及現(xiàn)代各種搜索引擎分類體系的長處,充分利用超文本技術(shù)的特征來表現(xiàn)分類法的體系特點。
卜書慶提出從數(shù)字信息資源詞頻統(tǒng)計出發(fā),從國際通用數(shù)據(jù)交換格式的研制出發(fā),從最終用戶檢索需求出發(fā),從適應(yīng)新技術(shù)環(huán)境出發(fā)的主要思路,改造中國傳統(tǒng)文獻分類法主題法《中國分類主題詞表》,用于組織數(shù)字信息資源。
4 主題法在網(wǎng)絡(luò)信息資源組織中的應(yīng)用研究
近年來,國內(nèi)外的一些學(xué)者及研究機構(gòu)已認(rèn)識到主題法在網(wǎng)絡(luò)信息組織中的重要作用,在這方面的研究主要集中在:
。1)關(guān)鍵詞法的應(yīng)用。由于關(guān)鍵詞法具備:①在標(biāo)引時不必查表,選詞、標(biāo)引速度快,成本低;②不依賴專職標(biāo)引人員,可由作者或機器自動標(biāo)引;③不存在人為性或滯后性,能及時應(yīng)用最新的提法以及最新詞匯等優(yōu)點,因而,目前由搜索引擎軟件自動建立的網(wǎng)絡(luò)信息資源索引數(shù)據(jù)庫所支持的就是關(guān)鍵詞檢索。但是,由于關(guān)鍵詞法未進行同義詞及反義詞控制,未能揭示詞間關(guān)系,這種關(guān)鍵詞檢索的致命缺點就是檢準(zhǔn)率太低。人們提出網(wǎng)絡(luò)信息檢索應(yīng)導(dǎo)入受控語言機制,使用后控詞表即“標(biāo)引不控制+檢索控制”模式是改進關(guān)鍵詞法性能的比較有效的措施之一。
。2)主題詞表的應(yīng)用。少數(shù)搜索引擎中提供主題詞檢索方式,在用戶界面上,可直接瀏覽主題詞表,從中選中主題詞,作為搜索引擎的檢索提問。用戶可以在檢索界面中修改檢索提問,也可返回到主題詞表界面重新選擇主題詞。其共同的特征是:詞表內(nèi)超文本導(dǎo)航。
(3)標(biāo)題詞表的應(yīng)用。標(biāo)題詞表在網(wǎng)絡(luò)信息組織中的應(yīng)用可以分為兩種情況:①檢索前使用。即通過標(biāo)題詞表規(guī)范用戶的檢索表達(dá)式。用戶可以首先在網(wǎng)絡(luò)信息組織工具提供的詞表中檢索到標(biāo)準(zhǔn)標(biāo)題詞及相關(guān)聯(lián)的詞匯。以該詞作為檢索詞,點擊表中超鏈接即可得到檢索結(jié)果。②檢索后使用。即在給出用戶所用檢索表達(dá)式,得出檢索結(jié)果的同時,提供相關(guān)詞作為用戶進一步檢索的線索,用戶可自由進行擴檢和縮檢,從而提高檢索效率。
5 窗口(專題)方式組織網(wǎng)絡(luò)資源
即提供檢索窗口,進行多元檢索(主題詞、著者、機構(gòu)、地區(qū)等),用戶只要在窗口輸入查找信息的相關(guān)的詞(或詞之間的組配提問式),即可找到所需信息線索(相關(guān)站點的鏈接)或資料。如,《中國學(xué)術(shù)期刊網(wǎng)》采取了這種方式。
【參考文獻】
1 張俊.略論網(wǎng)絡(luò)信息資源的組織.圖書情報知識,1998(2):32~35
2 董慧,余傳明.基于Internet的信息組織研究.情報學(xué)報,2001,20(1):54~60
3 殷雪松,徐斌.漫談中文搜索工具.情報理論與實踐,1999,22(2):130~133
4 王忠,周士波.Internet英文搜索引擎評價.圖書情報工作,1999(4):33~37
5 孫麗,陳通寶,喬曉東.網(wǎng)上中文檢索工具的比較研究.情報學(xué)報,1999,18(3):225~234
6 徐建華,伍憲,胡燕菘.國外六個著名搜索引擎的特征和評析.現(xiàn)代圖書情報檢索技術(shù),2001(1):48~51
7 張燕,惠佳穎.網(wǎng)絡(luò)搜索引擎評價.現(xiàn)代圖書情報技術(shù),2001(4):34~36,58
8 儲荷婷.國際互聯(lián)網(wǎng)檢索工具:特點、比較和發(fā)展方向.大學(xué)圖書館學(xué)報,1997,15(3):6~11,14
9 曾民族.網(wǎng)絡(luò)信息檢索現(xiàn)狀和性能評價.情報學(xué)報,1997,16(2):90~99
10 曹東,韓全惜,莊軍.運用情報檢索語言理論與方法完善搜索引擎的功能.情報理論與實踐,2000,23(1):58~61
11 賀亞鋒.Web資源虛擬圖書館與搜索引擎的比較研究.情報學(xué)報,2000,19(6):574~577
12 尚克聰,楊立英.網(wǎng)絡(luò)環(huán)境下情報檢索
系統(tǒng)性能評價研究.圖書情報工作,2002(1):68~71
13 黃如華.網(wǎng)絡(luò)信息的檢索與利用.武漢:武漢大學(xué)出版社,2002
14 陳樹年.搜索引擎及網(wǎng)絡(luò)信息資源的分類組織.圖書情報工作,2000(4):31~37
15 馬張華,張宇萌.指南型網(wǎng)絡(luò)分類體系初探.大學(xué)圖書館學(xué)報,2000(3):22~25
16 馬張華.分類搜索引擎類目體系研究.圖書情報工作,2001(2):36~40
17 陳笑輝,范曉虹.Yahoo的分類體系結(jié)構(gòu)及原理探微.圖書情報工作,1999(9)
18 黃建年.網(wǎng)絡(luò)信息分類淺議.情報學(xué)報,1999,18(6):514~518
19 張莉揚.Yahoo的信息組織方式及其在數(shù)字圖書館信息資源建設(shè)中的應(yīng)用.圖書情報知識,2001(3):48~50
20 陳光祚.論“圖書情報學(xué)虛擬圖書館”的建設(shè).中國圖書館學(xué)報,2000(1):19~23
21 賀亞鋒,張穎.Web資源虛擬圖書館研究.大學(xué)圖書館學(xué)報,2000(5):31~34
22 徐佳寧,卞麗.我國高!熬W(wǎng)絡(luò)資源學(xué)科導(dǎo)航系統(tǒng)”建設(shè)現(xiàn)狀調(diào)查分析.大學(xué)圖書館學(xué)報,2001(3):56~59
23 樓宏青.高校重點學(xué)科導(dǎo)航庫建設(shè)探析.大學(xué)圖書館學(xué)報,2001(4):30~33
24 陳梅華.探索網(wǎng)絡(luò)信息資源建設(shè)的關(guān)鍵技術(shù).情報學(xué)報,1997,16(2):104~108
25 隋利玲,郭瑜.Internet上專業(yè)性網(wǎng)絡(luò)資源導(dǎo)航庫的建設(shè).現(xiàn)代圖書情報技術(shù),1997(2)
26 劉靜.建立Internet電子專業(yè)網(wǎng)絡(luò)資源導(dǎo)航庫的構(gòu)想.圖書與情報工作,1998(1):6~9
27 司莉.因特網(wǎng)上的圖書館虛擬文庫建設(shè).圖書情報知識,1999(1):51~53
28 王德英,季穎斐,周蓉.學(xué)科信息導(dǎo)航系統(tǒng)開發(fā)初探.圖書館雜志,2002,21(3):41~43
29 洪漪,梁樹柏.分類法在信息網(wǎng)絡(luò)中的應(yīng)用.情報學(xué)報,1998,17(1):19~22
30 管計鎖,梁勝利.網(wǎng)絡(luò)信息分類體系與傳統(tǒng)分類法的比較研究.四川圖書館學(xué)報,2001(1):71~74
31 柳曉春,左少凝.傳統(tǒng)圖書館分類法的網(wǎng)絡(luò)適用性研究.情報科學(xué),2001,19(12):1270~1271,1322
32 黃曉倩.網(wǎng)絡(luò)環(huán)境下分類法改進初探.圖書館建設(shè),2000(2):40~42
33 包冬梅.檢索語言應(yīng)用于INTERNET信息資源組織之前景分析.圖書館雜志,2001(6):8~10
34 P.A. Cochrane. New Roles for Classification in Libraries and Information Network. Catalog & Classification Quarterly,1996,21 (2):1~2
35 T. Koch. The Role of Classification Schemes in Internet Resource Description and Discovery. http://www.ub. lu. se/desire/radar/reports/D3.2.3/class-v10. html [2002—07—27]
36 Nacy J. Williamson. Knowledge Structures and the Internet. In Knowledge Organization for Information Retrieval. Proceeding of the 6[th] International Study Conference on the Classification Research. The Hague:FID,1997:23~27
37 Gerry McKiernan. Beyond Bookmarks:Schemes for Organizing the Web. http://www.public.iastate.edu/~CYBERSTACKS/CTW. htm[2002—07—27]
38 Hamid Saeed,Abdus Satter Chaudry. Potential of Bibliographic Tools to Organize Knowledge on the Internet:The Use of Dewey Decimal Classification Scheme for Organizing Web-based Inform
ation resources. Knowledge Organization,2001,28(1):17~26
39 馬張華.文獻分類法在網(wǎng)絡(luò)資源組織中的應(yīng)用.圖書情報工作,1999(12):24~29
40 秦明,吳家玲.目錄方法在因特網(wǎng)信息資源管理中的應(yīng)用.圖書情報知識,2000(1):48~49
41 俞君立,陳樹年.文獻分類學(xué).武漢:武漢大學(xué)出版社,2001
42 卜書慶.試論數(shù)字信息資源的組織方法.國家圖書館學(xué)刊,2001(4):46~49
43 鄧均華.數(shù)字圖書館與數(shù)字分類法.中國圖書館學(xué)報,2001(4):76~77
44 楊濤.主題法在網(wǎng)絡(luò)信息組織中的應(yīng)用.圖書館建設(shè),2002(1):50~52
45 邱君瑞,耿亦兵.主題詞表在網(wǎng)絡(luò)檢索系統(tǒng)中的高水平運用調(diào)查分析.圖書館雜志,2001(11):20~22
46 王亞軍,張和芬.面向用戶的圖書館網(wǎng)絡(luò)信息資源組織與服務(wù).情報資料工作,2001(5):47~49
【網(wǎng)絡(luò)信息資源組織研究進展】相關(guān)文章:
網(wǎng)絡(luò)環(huán)境下書目信息資源共享的思考08-05
基于網(wǎng)絡(luò)的社科信息資源分布及檢索策略研究08-05
社會科學(xué)信息資源網(wǎng)絡(luò)的構(gòu)建08-05
網(wǎng)絡(luò)環(huán)境下云南地方文獻信息資源建設(shè)08-09
論網(wǎng)絡(luò)化圖書館的信息資源建設(shè)08-06