- 相關(guān)推薦
基于因特網(wǎng)的個性化信息服務(wù)研究
【內(nèi)容提要】個性化信息服務(wù),是針對不同用戶采用不同服務(wù)策略和方式提供不同信息內(nèi)容的服務(wù)。它具有以用戶為中心、對用戶需求進行挖掘、靈活多樣和主動將信息推送給用戶的特點。其類型有:個性化內(nèi)容定制服務(wù);個性化信息檢索定制服務(wù);個性化界面定制服務(wù)。用戶個性化需求可通過用戶訪問記錄挖掘、Bookmark和Agent獲取。個性化信息服務(wù)模型,可采用信息A gent自主學(xué)習(xí)法、信息過濾法、基于多Multi-Agent ……隨著因特網(wǎng)的飛速發(fā)展,網(wǎng)上信息資源迅猛增長,現(xiàn)有的搜索引擎如YAHOO等越來越難以滿足用戶獲取信息的需要。這些搜索引擎在服務(wù)中,一方面忽略用戶的個性化要求,另一方面不能提供主動信息服務(wù),使因特網(wǎng)上的海量信息和用戶對信息的有限獲取能力形成了強烈的反差,使得因特網(wǎng)上信息的獲取和利用面臨著嚴重的效率和質(zhì)量問題。有效解決這些問題的辦法,就是利用新技術(shù)提高用戶獲取信息的能力,使信息服務(wù)更加符合用戶自己的需要,概括地說,就是建立面向用戶的個性化服務(wù)機制。
1 個性化信息服務(wù)的定義與特點
1.1 個性化信息服務(wù)的概念
個性化信息服務(wù)是網(wǎng)絡(luò)信息服務(wù)發(fā)展的重要方向,已經(jīng)引起國內(nèi)外許多專家學(xué)者的研究興趣,因而近兩年這方面的研究成果較多。但何謂個性化信息服務(wù)?個性化信息服務(wù)應(yīng)包括哪些內(nèi)容?如何實現(xiàn)個性化信息服務(wù)等問題,現(xiàn)在還沒有統(tǒng)一的科學(xué)認識。所以在一些文獻里,又將個性化信息服務(wù)稱之為個性化服務(wù)、個性化定制服務(wù)、個性化信息搜索服務(wù)、個性化信息推薦服務(wù)、個性化信息提醒服務(wù)和個性化信息代理服務(wù)等等。下面是一些具有一定代表性的觀點。
。1)個性化信息服務(wù)是根據(jù)客戶的特性提供具有針對性的信息內(nèi)容和系統(tǒng)功能[1]。
。2)個性化信息服務(wù)就是將用戶感興趣的信息主動提交給用戶[2]。
。3)個性化信息服務(wù)是基于信息用戶的信息使用行為、習(xí)慣、偏好和特點,來向用戶提供滿足其各種個性化需求的一種服務(wù)[3]。
(4)所謂個性化信息服務(wù),是指能夠滿足用戶的個人信息需求的一種服務(wù),在某一特定的網(wǎng)上功能和服務(wù)方式中,自己設(shè)定網(wǎng)上信息來源方式、表現(xiàn)形式、特定網(wǎng)上功能及其它網(wǎng)上服務(wù)方式等,而主動地向用戶提供可能需要的信息服務(wù)[4]。
(5)所謂個性化信息服務(wù),首先它應(yīng)該是一種能滿足用戶的個體信息需求的服務(wù),即根據(jù)用戶提出的明確要求,或通過對用戶個性、習(xí)慣的分析而主動向用戶提供其可能需要的信息和服務(wù);其次它應(yīng)該是一種培養(yǎng)個性,引導(dǎo)信息需求的服務(wù),以此促進信息業(yè)的多樣化和多元化發(fā)展”[5]。
。6)個性化信息代理就是一個能夠理解用戶真正需求的智能Agent。所謂個性是指Agent行為中所表現(xiàn)的一致的、穩(wěn)定的、可信的、典型的特征和態(tài)度集;個性可以表示為有序的目標(biāo)集和對于目標(biāo)的規(guī)劃的偏好程度[6]。
筆者認為,個性化信息服務(wù),就是針對不同用戶采用不同的服務(wù)策略和方式,提供不同的信息內(nèi)容的服務(wù)。
1.2 個性化信息服務(wù)的特點
綜上所述,個性化信息服務(wù)的根本就是尊重用戶(或者說以用戶為中心),研究用戶的行為、興趣、愛好和習(xí)慣,為用戶搜索、組織、選擇、推薦更具針對性的信息服務(wù)。通過對個性化信息服務(wù)特點的了解和掌握,可以使我們的服務(wù)更具針對性,從而提高用戶對信息服務(wù)的滿意度。具體地說,個性化信息服務(wù)具有以下特點:
。1)以用戶為中心。所有的服務(wù)必須以方便用戶、滿足用戶需求為前提。
(2)允許用戶充分表達個性化需求,能夠?qū)τ脩粜枨笮袨檫M行挖掘。信息服務(wù)的系統(tǒng)不僅要提供友好界面,而且要方便用戶交互,方便用戶描述自己的需求,方便用戶反饋對服務(wù)結(jié)果的評價。要能夠了解用戶的個人需求、習(xí)慣、愛好和興趣,為其提供“量身定制”的個性化信息服務(wù)。
。3)服務(wù)方式更加靈活、多樣。不僅要為用戶提供更加準(zhǔn)確的信息,而且還要能夠按照用戶指定的方式進行服務(wù),如滿足用戶對信息的顯示方式、提供結(jié)果的方式(紙質(zhì)、電子版、網(wǎng)絡(luò)版、電子郵件等)的要求,對服務(wù)時間的要求,對服務(wù)地點的要求等。
(4)能夠主動將用戶所需信息推送給用戶。
2 個性化信息服務(wù)的類型
在個性化信息服務(wù)系統(tǒng)中,用戶可以根據(jù)自己的需要,選擇不同的信息資源;依據(jù)自己的習(xí)慣,指定信息的顯示方式,如對信息檢索結(jié)果的不同的元數(shù)據(jù)排序。對于一般用戶可能更關(guān)心需求的主題,希望將論文的題名放在顯著的位置,而對于一個專家,他可能更關(guān)注學(xué)科內(nèi)某些專家的研究成果,希望將著者姓名放在最顯著的位置等等。就現(xiàn)階段的環(huán)境條件而言,個性化信息服務(wù)至少應(yīng)包括個性化內(nèi)容定制服務(wù)、個性化信息檢索定制服務(wù)、個性化界面定制服務(wù)和個性化信息推薦服務(wù)四個方面。
2.1 個性化內(nèi)容定制服務(wù)
個性化定制服務(wù)是有效獲取用戶需求信息的方法之一。它通過用戶定制獲取用戶的個性化信息,從而理解用戶的需求,為用戶提供更為準(zhǔn)確的信息服務(wù),提高用戶的滿意度。同時通過與用戶的直接或間接的溝通,改善與用戶的關(guān)系,增加用戶的忠誠度[7]。
在個性化內(nèi)容定制服務(wù)中,用戶可以根據(jù)自己的興趣和需求定制信息。定制的內(nèi)容包括信息資源、界面和服務(wù)等等。個性化信息定制服務(wù)系統(tǒng)通常提供一些信息資源,讓用戶選擇(定制)。例如在數(shù)字圖書館中,人們可以選擇數(shù)據(jù)庫資源、電子期刊、電子圖書、相關(guān)網(wǎng)站、學(xué)科導(dǎo)航、搜索引擎等等。也有一些系統(tǒng)讓用戶指定資源地址,系統(tǒng)提供有關(guān)的更新通知等服務(wù)(這是一種簡單的主動信息服務(wù)方式,系統(tǒng)能夠及時主動將有關(guān)資源的更新信息推送給用戶,提醒用戶及時利用)。
另外,如安全與隱私保護也是個性化信息定制服務(wù)中需要注意的重要問題。安全包括用戶私人信息的安全和系統(tǒng)管理的安全。隱私保護也是用戶關(guān)心的問題,一旦用戶的個人信息被泄露,用戶就會失去對我們的信任,而遠離我們的服務(wù),隱私保護需要制定完善的隱私保護政策,提供隱私政策公示,并提供用戶隱私公開的工具和運用保證隱私不外泄的保護技術(shù)等。
2.2 個性化信息檢索定制服務(wù)
在數(shù)據(jù)庫檢索或網(wǎng)上信息的查詢中,不同的用戶由于其擁有的檢索知識和所處的領(lǐng)域不同,往往其習(xí)慣也不同。初學(xué)者一般習(xí)慣用簡單檢索,專業(yè)人員習(xí)慣用高級檢索。另外,不同用戶可能用不同的詞匯表達同一專業(yè)概念,不同用戶對檢索結(jié)果的選取原則和排序方法也可能不同。諸如此類,正是用戶個性化的顯著表現(xiàn)。因此,檢索定制需要充分支持用戶在檢索策略、檢索方法和檢索結(jié)果處理上的個性化。根據(jù)初步分析,檢索定制可包括[8]:
。1)個人檢索模板定制。用戶可根據(jù)個人需要對所需信息的專業(yè)(用分類號或主題詞、關(guān)鍵詞確認)、應(yīng)用目的(用文獻類型區(qū)別,例如期刊論文、專利、會議文獻等)、深度、語言、地域、數(shù)量、時域等進行定制,從而內(nèi)在地表達自己相對穩(wěn)定的檢索限制條件。用戶在每次檢索時也可以選擇“屏蔽”(Over write)模板條件,靈活表達特殊要求。
。2)檢索工具定制(選擇數(shù)據(jù)庫檢索系統(tǒng)和搜索引擎)。已納入資源定制。
(3)檢索式表示方式定制;用戶可自定義默認檢索方式是簡單或復(fù)雜方式,自定義布爾檢索式中“與”、“或”、“非”的表示符號,系統(tǒng)還可為用戶記錄最近的特定數(shù)量的檢索式,供用戶選擇使用。
(4)個人詞表定制。可寫入用戶自定義的常用詞匯的自定義規(guī)范詞、通用限制詞(檢索時對所有檢索式均加上此檢索詞)、特殊限制詞(對某一個或幾個詞使用的限制詞)、以及同義詞和近義詞;當(dāng)該用戶使用這些常用詞匯時,系統(tǒng)可根據(jù)個人詞表調(diào)用相應(yīng)詞匯優(yōu)化檢索,或彈出相應(yīng)詞匯供用戶選擇使用。
(5)檢索結(jié)果處理定制。可對檢索結(jié)果的相關(guān)度計算標(biāo)準(zhǔn)、輸出格式、排序方式、重復(fù)記錄整合方式、分類組織、下載格式、傳送地址等進行定制。
。6)檢索歷史分析定制。用戶可要求系統(tǒng)動態(tài)追蹤其檢索過程,提取最常用的檢索詞和檢索式,最經(jīng)常選擇的數(shù)據(jù)庫、期刊、網(wǎng)站等資源,最經(jīng)常排除的資源,相近用戶最常用的檢索詞、檢索式、數(shù)據(jù)庫、期刊及網(wǎng)站等(但必須掩蔽“相近用戶”實際身份)。當(dāng)然,這種追蹤必須事先得到用戶的授權(quán)(包括是否同意作為“相近用戶”被分析的授權(quán)),同時必須安全地保護這些歷史數(shù)據(jù),這些歷史數(shù)據(jù)可用來自動修改用戶的有關(guān)定制信息(例如定題選報記錄)。
2.3 個性化界面定制服務(wù)
個性化界面定制服務(wù)是讓用戶根據(jù)自己的愛好選擇桌面的顯示方式,它包括界面的結(jié)構(gòu)布局,顯示顏色和顯示內(nèi)容的排列方式等。例如在一些網(wǎng)站中,讓用戶輸入自己的個人信息,然后生成“我的主頁”,“我的搜索引擎”,“我的圖書館”等等這類服務(wù)都屬于個性化界面定制服務(wù)。
2.4 個性化信息推薦服務(wù)
通過網(wǎng)絡(luò)信息的挖掘,了解用戶的需求和興趣,為用戶提供個性化的實時信息推薦服務(wù),也是因特網(wǎng)服務(wù)的一個發(fā)展方向。面向單個用戶的實時個性化推薦服務(wù)有4種方法[9]:
(1)在Cache內(nèi)的協(xié)作推薦。
(2)利用聚類方法實現(xiàn)實時個性化推薦。
(3)利用分類方法實現(xiàn)實時個性化推薦。
。4)利用協(xié)作推薦的方法實現(xiàn)實時個性化推薦。
3 用戶個性化需求的獲取方法
對用戶需求、興趣、愛好的了解和獲取是個性化信息服務(wù)具備針對性的關(guān)鍵,而對用戶網(wǎng)絡(luò)信息需求的分析、獲取和管理是保證個性化信息服務(wù)實施的基礎(chǔ)。對用戶需求的獲取。目前主要有兩大類方法:一類是通過人,機交互模式獲取用戶的信息需求。這類方法的優(yōu)點是可以準(zhǔn)確地獲得用戶的需求信息,也是目前絕大多數(shù)檢索系統(tǒng)所采用的方法。缺點是主動性差。對于以信息拉取技術(shù)為核心的信息服務(wù)系統(tǒng),系統(tǒng)一般提供一個與用戶進行實時交互的檢索界面,讓用戶表達需求。對于以信息推送技術(shù)為核心的信息服務(wù)系統(tǒng),系統(tǒng)會提供給用戶一個表達信息需求的定制表單。用戶可以十分詳細地填寫自己的個性化需求信息。另一類是通過對用戶訪問記錄的挖掘,獲取用戶的需求、興趣和愛好等。這種方法的主動性強,一般用于個性化主動信息服分系統(tǒng)中,對用戶需求行為的挖掘,目前有三種方法:一是通過Cookie logs挖掘;二是通過Bookmark進行網(wǎng)絡(luò)信息過濾;三是利用智能Agent跟蹤用戶信息行為。
3.1 用戶訪問記錄的挖掘
網(wǎng)絡(luò)用戶訪問記錄的挖掘主要是從Web的訪問記錄中抽取具有意義的模式。Web中的每個服務(wù)器都保留了用戶的訪問日志(Web access log)等記錄,保存了有關(guān)用戶訪問和交互的信息。分析這些數(shù)據(jù)可以用來了解用戶的需求行為,為用戶提供個性化的服務(wù)。目前Web使用記錄挖掘技術(shù)和工具可以分為兩大類:訪問模式的追蹤和個性化的使用記錄的追蹤。一般的訪問模式追蹤通過分析使用記錄來了解用戶的訪問模式和傾向,以改進站點的組織結(jié)構(gòu);而個性化的使用記錄追蹤則傾向于分析個別用戶的偏好,其目的是根據(jù)不同用戶的訪問模式,為用戶提供個性化的定制服務(wù)[10]。
用戶訪問挖掘針對用戶對Web的訪問記錄,利用路徑分析、分類聚類、關(guān)聯(lián)規(guī)則和序列模式的發(fā)現(xiàn)等方法進行分析,尋找其中蘊涵的用戶知識和模式。Web訪問信息挖掘的數(shù)據(jù)對象主要是日志數(shù)據(jù)。當(dāng)用戶訪問Web服務(wù)器時,服務(wù)器方將會產(chǎn)生三種類型的日志文件:Server logs,Error logs和Cookie logs,記錄用戶的訪問情況[11]。
Cookie是由互聯(lián)網(wǎng)服務(wù)器產(chǎn)生的記號并由客戶端持有,用于識別用戶和用戶的會話。通過Cookie分析,獲取用戶個性化需求、興趣和愛好,目前還是一種較為有效的方法。但由于Cookie存儲在客戶計算機上,使用中會由于各種原因?qū)е翪ookie內(nèi)容失真,因而通過對Cookie的挖掘獲取用戶的個性化需求,也有一定的局限性。
3.2 利用Bookmark(書簽)獲取用戶的個性化需求
當(dāng)用戶在因特網(wǎng)上用瀏覽器瀏覽主頁時,經(jīng)常會遇到自己需要的和喜歡的站點和主頁,只要點一下瀏覽器的Bookmark菜單,就能將當(dāng)前的站點存入Bookmark中。下次訪問時,只要從Bookmark中取出即可使用。用戶可以對Bookmark進行多級管理,不同的目錄反映用戶不同的興趣,這給對用戶需求的分析提供了依據(jù)。
利用用戶在瀏覽器上存儲的Bookmark獲得用戶信息需求是一種有效的方法。在Bookmark中存儲的信息往往是用戶最關(guān)心的,需要記錄下來以便以后再讀。Bookmark結(jié)構(gòu)化的信息存儲更能夠確切地表達用戶需求。我們可以利用用戶對文章的評價來表達用戶的信息需求。對存入Bookmark的某一推薦目錄的文章,可以認為是用戶喜歡的文章,作為學(xué)習(xí)中的正例;在其他目錄的文章,或是經(jīng)過推薦沒有被選中的文章將作為學(xué)習(xí)的反例。根據(jù)向量空間法將正反例表示成向量,就可以利用機器學(xué)習(xí)的方法對新文章進行推薦[12]。
利用Bookmark進行信息過濾有很多優(yōu)勢。用戶可以導(dǎo)入自己已有的Bookmark文件或直接在瀏覽網(wǎng)絡(luò)時通過客戶端軟件加入的新書簽,并且可以對其進行各種編輯操作。用戶可以明確地對文章的內(nèi)容與自己的需求是否一致作出評價,通過反饋信息將使信息推薦更為準(zhǔn)確。用戶可以靈活地設(shè)置推薦的范圍,系統(tǒng)對用戶信息的推薦信息直接并入Bookmark結(jié)構(gòu)中,完全符合用戶的習(xí)慣。另外,系統(tǒng)使瀏覽器的Bookmark功能實現(xiàn)網(wǎng)絡(luò)化,即利用網(wǎng)絡(luò)服務(wù)器存儲用戶的Bookmark信息,這樣,可以使用戶在任何地方、各種平臺上擁有一致的Bookmark信息。
3.3 利用智能Agent獲取用戶個性化需求
監(jiān)視用戶的信息查詢過程的方法能自動獲得用戶的信息需求。其方法是在用戶的終端上運行一個監(jiān)視的信息代理(agent)。信息代理將用戶在web瀏覽時的相關(guān)信息不斷傳送給遠端的服務(wù)器.服務(wù)器將信息進行整理、組織,并從中分析出用戶的信息偏好。
4 個性化信息服務(wù)模型的構(gòu)建
要實現(xiàn)個性化信息服務(wù),系統(tǒng)必須具備兩方面的能力:一是構(gòu)建個
性化信息Agent模型,即將個性化信息從全局信息空間中分離出來;二是構(gòu)建用戶Agent模型,即跟蹤用戶行為,學(xué)習(xí)、記憶用戶興趣,通過描述用戶的興趣特征來建立個性化用戶模型。此外,還需要有功能強大的網(wǎng)絡(luò)信息搜索能力和友好的用戶界面,這既是構(gòu)建信息Agent和用戶Agent的基礎(chǔ),也是實現(xiàn)個性化信息服務(wù)的保障。
4.1 個性化信息模型的構(gòu)建方法
信息Agent具有多種特性,從不同的特性角度出發(fā),可以用不同的方法來構(gòu)建個性化信息模型。這里主要介紹三種常用的方法[13]。
(1)信息Agent的自主學(xué)習(xí)方法。個性化服務(wù)的對象是一個個具體的用戶,因而建立個性化信息模型時,信息Agent必須對用戶感興趣的信息類型有所了解,并以此作為信息模型構(gòu)建的基準(zhǔn),通過不斷的學(xué)習(xí)積累形成一個有規(guī)模的模型。信息Agem可以直接探求用戶的信息興趣和愛好,也可以從用戶信息檢索和利用行為中提取這個基準(zhǔn),然后由Agent執(zhí)行一定的算法,將這些信息轉(zhuǎn)化為知識存入用戶信息模型中。信息Agent有兩種不同的學(xué)習(xí)方法:一是關(guān)鍵詞學(xué)習(xí)。這種學(xué)習(xí)方法是首先對搜索來的信息進行處理,將信息中的關(guān)鍵詞按出現(xiàn)頻率、出現(xiàn)位置提取出來,根據(jù)關(guān)鍵詞的頻率來確定唯一表征信息體的關(guān)鍵詞,將具有相同表征關(guān)鍵詞的信息聚類,并存入相應(yīng)的個性化信息模型中。采用關(guān)鍵詞學(xué)習(xí)方法提高了建立多個個性化信息模型的效率。二是字典學(xué)習(xí)。這是一種對相似概念的學(xué)習(xí)。在這種學(xué)習(xí)方法中,信息Agent為個性化信息模型提供的每個基準(zhǔn)關(guān)鍵詞創(chuàng)建一個字典,字典根據(jù)關(guān)鍵詞的權(quán)值來確定其權(quán)限:搜索權(quán)和學(xué)習(xí)權(quán)。一個信息單元是否被學(xué)習(xí)首先得看其關(guān)鍵詞的權(quán)值是否達到搜索權(quán)所規(guī)定的權(quán)值,否則首輪即被模型所淘汰。即使是過了搜索關(guān),也只有當(dāng)關(guān)鍵字的權(quán)值達到學(xué)習(xí)權(quán)時,該關(guān)鍵字才能被納入字典用來表征個性化信息模型。信息Agent通過不斷的學(xué)習(xí),并在學(xué)習(xí)中修改字典,最終可得到一個關(guān)鍵字的相對穩(wěn)定的字典。
。2)信息過濾的方法,信息過濾系統(tǒng)是根據(jù)用戶的信息需求對動態(tài)信息流進行過濾,把滿足用戶需求的信息傳送給用戶,可以提高獲取信息的效率。信息過濾也是構(gòu)建個性化信息模型的有效方法,它根據(jù)一定的標(biāo)準(zhǔn)將那些不相關(guān)的信息濾掉,僅保存與用戶需求相關(guān)的信息。信息Agent根據(jù)自己的關(guān)鍵詞域,提取幾個權(quán)重比較大的關(guān)鍵詞作為過濾的標(biāo)準(zhǔn)(E-profile),每個E-profile描述著一個方面的信息需求。E-profile是否標(biāo)準(zhǔn).可在實踐中被檢驗:那些對信息需求描述不準(zhǔn)確的E-profile個體在競爭中將被淘汰。反之則形成越來越大的規(guī)模,構(gòu)成一個內(nèi)容充實的個性化信息模型。常用的信息過濾方法有兩種:基于關(guān)鍵詞向量的過濾方法和基于文獻集的信息過濾方法。基于關(guān)鍵詞向量的信息過濾方法是一種相似過濾方法。其思想是比較表征信息單元的關(guān)鍵詞與信息Agent給出標(biāo)準(zhǔn)關(guān)鍵詞之間的相似性,只有當(dāng)相似性達到一定的度,該信息單元才被保留下來。確立關(guān)鍵詞的相似度是這種過濾方法的核心。在此我們將信息單元的關(guān)鍵詞與標(biāo)準(zhǔn)關(guān)鍵詞都看作向量,其相似度就是這兩個向量夾角的余弦值。
(3)基于多Multi-Agent System的合作方法。網(wǎng)絡(luò)個性化服務(wù)不是面向單一用戶的個性化服務(wù),服務(wù)于每個用戶的信息Agent之間并不是孤立的關(guān)系,它們通過相互合作構(gòu)成一個MAS。MAS的合作求解能力遠遠超過單個Agent,這是MAS產(chǎn)生的最直接的原因。通過MAS的合作,使每個用戶擁有一個或多個Agent,這些Agent推薦的信息在內(nèi)容上都有相關(guān)性,克服了單個信息Agent功能不強的缺陷。多Agent之間的合作是通過多Agent協(xié)商協(xié)議來完成的。協(xié)商協(xié)議是MAS實現(xiàn)協(xié)同、協(xié)作、沖突消解和矛盾處理的關(guān)鍵環(huán)節(jié)。在MAS中,協(xié)商協(xié)議被描述成四元組:{目標(biāo)Agent,源Agent,消息名,消息內(nèi)容},這種四元組形式通過嵌套使用來擴大合作的范圍。信息Agent之間一旦達成合作協(xié)議,多個信息Agent的個性化信息模型就構(gòu)成一個邏輯體,每個信息Agent就將自己和伙伴Agent的信息文檔推薦給相關(guān)用戶,以充實用戶信息需求的內(nèi)容。
4.2 用戶模型的構(gòu)建方法
建立用戶模型是實現(xiàn)個性化服務(wù)的另一個重要方面。用戶模型是實現(xiàn)個性化服務(wù)的起點,用戶模型不僅是個性化信息模型的構(gòu)建依據(jù),又是實現(xiàn)個性化服務(wù)的目標(biāo),個性化信息最終將被推向具有相應(yīng)興趣的用戶。用戶模型實際上就是對某一用戶行為、興趣傾向的描述,以確立他所需信息服務(wù)的類型。
在對用戶的信息服務(wù)中,用戶所處的領(lǐng)域不同,使用的信息服務(wù)系統(tǒng)不同,獲取用戶信息的方法不同,建模的方法也不同。通常情況下,通過與用戶交互,獲取用戶信息來建立模型較為簡單,較易實現(xiàn)。利用智能的方法,通過對用戶需求行為(如用戶瀏覽器中的cookies文件,用戶的bookmark文件等)的分析,挖掘用戶的需求、興趣和愛好來建立模型較復(fù)雜,技術(shù)上也較難實現(xiàn)。這方面的研究還有待深入。對于隱式建模方法,用戶模型的建設(shè)過程主要有四步[14]:
(1)內(nèi)容向量。內(nèi)容向量是一個表示信息內(nèi)容的向量,可以被用于向量空間模型成對的匹配。內(nèi)容向量來源于初始用戶的活動記錄(以往信息利用行為),或用戶的反饋等。一旦建立,就僅僅改變其權(quán)值就可以了。
(2)一列當(dāng)前活動的上下文(或用戶以往信息行為的文檔)。初始內(nèi)容向量每個元素對應(yīng)一些上下文。以后隨用戶的不同活動,每個用戶的上下文就發(fā)生改變。
(3)一列當(dāng)前活動的特征。
。4)一個用戶關(guān)鍵詞的集合。每一個關(guān)鍵詞都有一定的權(quán)值,用于表征它對該用戶的實際重要性。在用戶反饋之后,關(guān)鍵詞被動態(tài)插入、修改或刪除。
用戶模型建立后,對其更新也要遵循一定的規(guī)則。通常是根據(jù)用戶的反饋信息相應(yīng)地更新用戶模型的不同部分。
個性化服務(wù)的關(guān)鍵是用戶需求信息的獲取。真正的用戶動態(tài)需求信息的獲取,必須利用智能代理技術(shù)。在這方面的研究,雖然取得了一定的成果,但距離實際應(yīng)用或用戶的要求還有較大的差距。
【參考文獻】
1 薛菘.基于web數(shù)據(jù)庫平臺的圖書館個性化服務(wù):MyLi brary.圖書情報工作,2002(8)
2,13 張玉峰等.基于Agent的個性化信息服務(wù)模型研究.情報學(xué)報,2001,20(5)
3 史田華.因特網(wǎng)個性化信息服務(wù).情報資料工作,2002(1)
4 王悅.新信息環(huán)境下圖書館的個性化信息服務(wù)芻議.圖書情報工作,2002(8)
5 盧共平.數(shù)字圖書館的個性化信息服務(wù).圖書情報工作,2002(8)
6 馬獻明等.個性化網(wǎng)上信息代理技術(shù)的研究概述.廣西師范大學(xué)學(xué)報,2000,18(3)
7 黃曉斌.網(wǎng)絡(luò)文獻的知識發(fā)現(xiàn)研究.武漢大學(xué)博士學(xué)位論文,2002
8,10 張曉林等.基于Web的個性化信息服務(wù)機制.現(xiàn)代圖書情報技術(shù),2001(1)
9,11 田捷.數(shù)字圖書館技術(shù)與應(yīng)用.北京:科學(xué)出版社,2002
12 盧增祥等.利用Bookmark服務(wù)進行網(wǎng)絡(luò)信息過濾.軟件學(xué)報,2000,11(4)
14 高文.數(shù)字圖書館——原理與技術(shù)實現(xiàn).北京:清華大學(xué)出版社,2000
【基于因特網(wǎng)的個性化信息服務(wù)研究】相關(guān)文章:
WebQuests:因特網(wǎng)環(huán)境下的研究性學(xué)習(xí)08-07
基于網(wǎng)絡(luò)環(huán)境下的信息技術(shù)課程教學(xué)的探討與研究08-17
因特網(wǎng)與教育——論因特網(wǎng)對教育之利弊08-17
因特網(wǎng)與教育——論因特網(wǎng)對教育之利弊08-11
走進因特網(wǎng)的教案08-16
基于汽車空調(diào)實訓(xùn)教學(xué)的研究08-18