- 相關(guān)推薦
服務(wù)器備份問題的探討及在視頻領(lǐng)域內(nèi)的應(yīng)用
服務(wù)器備份問題的探討及在視頻領(lǐng)域內(nèi)的應(yīng)用
2001中南地區(qū)廣播電視技術(shù)討論會(huì)技術(shù)論文一等獎(jiǎng)計(jì)算機(jī)及其相關(guān)技術(shù)進(jìn)入視頻領(lǐng)域已經(jīng)成為了一個(gè)不爭(zhēng)的事實(shí)。以電視臺(tái)為例,非線性節(jié)目制作網(wǎng)絡(luò)和硬盤播出系統(tǒng)已經(jīng)開始全面占領(lǐng)節(jié)目的制作和播出部分。數(shù)字化和網(wǎng)絡(luò)化也被公認(rèn)為是視頻領(lǐng)域的未來。
無論是在非線性節(jié)目制作網(wǎng)絡(luò)或是在硬盤播出網(wǎng)絡(luò)中,服務(wù)器都是整個(gè)工作系統(tǒng)的核心。服務(wù)器不能正常的工作將會(huì)導(dǎo)致網(wǎng)絡(luò)系統(tǒng)的功能紊亂甚至導(dǎo)致整個(gè)網(wǎng)絡(luò)的崩潰。能否長(zhǎng)時(shí)間安全穩(wěn)定的工作是衡量一個(gè)視頻網(wǎng)絡(luò)是否具有實(shí)用性的重要指標(biāo)。尤其在硬盤播出系統(tǒng)中,任何類型的服務(wù)器故障引發(fā)的系統(tǒng)失效都會(huì)導(dǎo)致播出事故,這是絕對(duì)不能允許的。所以,對(duì)服務(wù)器進(jìn)行備份工作,在主服務(wù)器出現(xiàn)故障時(shí)自動(dòng)接替工作,并且使這個(gè)過程相對(duì)于用戶"透明",以保證任何情況下系統(tǒng)功能都不會(huì)失效就顯得非常重要了。
我們可以以下面的制作播出一體化網(wǎng)絡(luò)(圖-1)來說明對(duì)服務(wù)器備份的重要性:
在圖-1所示網(wǎng)絡(luò)中,服務(wù)器管理資源的共享和分配。在播出系統(tǒng)中,視頻播出服務(wù)器更是直接進(jìn)行播出的工作,所以一定要保證服務(wù)器所謂的"零故障率"。因此,要對(duì)服務(wù)器部分進(jìn)行備份,使得任何情況下服務(wù)器部分都能夠正常的工作。我們可以將服務(wù)器單元分為兩個(gè)部分:
1. 主服務(wù)器
正常時(shí)提供系統(tǒng)服務(wù)的主機(jī)。運(yùn)行包括與網(wǎng)絡(luò)相關(guān)聯(lián)的管理和應(yīng)用等所有的服務(wù)。
2. 備份服務(wù)器
當(dāng)運(yùn)行服務(wù)器提供的服務(wù)已不可用時(shí),自動(dòng)接替運(yùn)行服務(wù)器的工作而不用重新起動(dòng)系統(tǒng),而當(dāng)運(yùn)行服務(wù)器恢復(fù)正常后,按照使用者的設(shè)定以自動(dòng)或手動(dòng)方式將服務(wù)切換到運(yùn)行服務(wù)上運(yùn)行。
我們可以將圖-1所示網(wǎng)絡(luò)改造如下(圖-2):
在圖-2所示的網(wǎng)絡(luò)結(jié)構(gòu)中,當(dāng)視頻服務(wù)器或播出服務(wù)器出現(xiàn)故障時(shí),其備份服務(wù)器都可以自動(dòng)接替其正在進(jìn)行的工作,從而保證系統(tǒng)的正常運(yùn)行。
我們可以通過以下方式實(shí)現(xiàn)服務(wù)器的備份工作:
服務(wù)器備份的工作模式
在討論服務(wù)器備份的工作模式之前,我們必須明白所謂的服務(wù)器備份究竟意味著什么。我們以下圖說明一下備份的含義。
假設(shè)我們有一項(xiàng)應(yīng)用任務(wù)A正在主服務(wù)器上運(yùn)行,同時(shí)設(shè)有一個(gè)備份服務(wù)器,在主服務(wù)器出現(xiàn)故障時(shí)接替主服務(wù)器的工作。我們定時(shí)保存任務(wù)A的運(yùn)行狀態(tài),包括保存任務(wù)A的指令狀態(tài)和數(shù)據(jù)狀態(tài),我們將定時(shí)保存紀(jì)錄的現(xiàn)場(chǎng)稱為現(xiàn)場(chǎng)1,現(xiàn)場(chǎng)2……現(xiàn)場(chǎng)n,現(xiàn)場(chǎng)n+1…..,如圖所示
我們保存的這些現(xiàn)場(chǎng)是為了當(dāng)應(yīng)用任務(wù)A所工作的服務(wù)器出現(xiàn)故障,或者當(dāng)任務(wù)A本身出現(xiàn)錯(cuò)誤時(shí)使備份服務(wù)器可以接替主服務(wù)器正在進(jìn)行的工作。
我們假設(shè)主服務(wù)器系統(tǒng)在現(xiàn)場(chǎng)n已被保存,現(xiàn)場(chǎng)n+1尚未被保存的時(shí)候發(fā)生故障。如圖
當(dāng)故障發(fā)生,系統(tǒng)探測(cè)到主服務(wù)器已經(jīng)不能夠正常工作后即通知備份服務(wù)器接替主服務(wù)器的工作。備份服務(wù)器調(diào)出保存的現(xiàn)場(chǎng)n,使得我們可以在備份系統(tǒng)上啟動(dòng)應(yīng)用任務(wù)A并接替主服務(wù)器繼續(xù)進(jìn)行工作。
但是必須注意的是,我們不可能從錯(cuò)誤發(fā)生的那一點(diǎn)上開始使用備份系統(tǒng)恢復(fù)工作。我們必須回到狀態(tài)n,并從狀態(tài)n開始繼續(xù)進(jìn)行應(yīng)用任務(wù)A的工作。
基于上面所述的情況,不同類型的用戶所使用的備份系統(tǒng)在對(duì)保存的現(xiàn)場(chǎng)n和現(xiàn)場(chǎng)n+1之間的時(shí)間間隔的要求也有所不同。例如對(duì)于非線性節(jié)目制作網(wǎng)絡(luò)系統(tǒng),我們看重的是編輯現(xiàn)場(chǎng)和數(shù)據(jù)的保存,以便在網(wǎng)絡(luò)出現(xiàn)故障后可以對(duì)編輯現(xiàn)場(chǎng)進(jìn)行恢復(fù),待故障排除后繼續(xù)進(jìn)行尚未完成的編輯工作并保證數(shù)據(jù)的完整性。在這種情況下,我們?cè)O(shè)定的保存現(xiàn)場(chǎng)n和n+1之間的間隔就不需要很短,我們即使以秒為單位進(jìn)行現(xiàn)場(chǎng)的保存,每隔一秒或幾秒對(duì)現(xiàn)場(chǎng)進(jìn)行一次保存,也是用戶完全可以容忍的。而對(duì)于硬盤播出系統(tǒng),我們要求從備份服務(wù)器對(duì)主服務(wù)器系統(tǒng)故障的檢測(cè)到接替主服務(wù)器進(jìn)行工作的時(shí)間周期不能大于人眼所能察覺的范圍,即最佳狀態(tài)應(yīng)是不超過一幀。這樣就要求在設(shè)計(jì)硬盤播出服務(wù)器方案時(shí)保存現(xiàn)場(chǎng)n與n+1之間的間隔必須以滿足上面所述的要求作為設(shè)計(jì)依據(jù)。實(shí)際上更安全的辦法是令整個(gè)備份系統(tǒng)運(yùn)行在Active/Active工作模式下,并且主服務(wù)器和備份服務(wù)器同時(shí)運(yùn)行同一個(gè)任務(wù),一但備份服務(wù)器檢測(cè)到主服務(wù)器出現(xiàn)故障便接替主服務(wù)器在整個(gè)系統(tǒng)中的地位。我們將在后面的部分詳細(xì)討論這種工作模式。
不同類型及要求的備份服務(wù)器系統(tǒng)可以分為以下的幾種工作模式:
1. Active/Standby工作模式
Active/Standby 即激活/備用工作模式。它的特點(diǎn)是兩臺(tái)服務(wù)器處于不同的工作狀態(tài)。主服務(wù)器處于處理狀態(tài),備份服務(wù)器處于備用狀態(tài),以防主服務(wù)器上發(fā)生故障影響整個(gè)網(wǎng)絡(luò)運(yùn)行。備用服務(wù)器可以是規(guī)模較小、性能稍低的服務(wù)器,但是,當(dāng)主服務(wù)器出現(xiàn)故障時(shí),它必須具有保證網(wǎng)絡(luò)功能的處理能力。例如,假設(shè)服務(wù)器一是主"激活"節(jié)點(diǎn),服務(wù)器二是次"備用"節(jié)點(diǎn)。如果服務(wù)器一節(jié)點(diǎn)發(fā)生故障了,它的被保護(hù)資源由服務(wù)器二節(jié)點(diǎn)來恢復(fù)。當(dāng)服務(wù)器一節(jié)點(diǎn)恢復(fù)后, 資源可以被服務(wù)器一節(jié)點(diǎn)重新獲得。然而,當(dāng)服務(wù)器二節(jié)點(diǎn)出現(xiàn)故障時(shí),服務(wù)器二節(jié)點(diǎn)上并沒有需要被服務(wù)器一節(jié)點(diǎn)恢復(fù)的資源。
如圖-3所示,應(yīng)用A在處于Active狀態(tài)的服務(wù)器一上運(yùn)行,當(dāng)服務(wù)器一出現(xiàn)故障時(shí),處于Standby狀態(tài)的服務(wù)器二接替服務(wù)器一運(yùn)行應(yīng)用A。
2. Active/Active工作模式
Active/Active工作模式即激活/備用工作模式。它的特點(diǎn)是兩臺(tái)服務(wù)器節(jié)點(diǎn)均同時(shí)處于工作狀態(tài),同時(shí)處理不同的應(yīng)用。這就要求兩臺(tái)服務(wù)器應(yīng)該具有相等或相近的處理能力。
如圖-4所示,當(dāng)系統(tǒng)正常工作時(shí),兩個(gè)服務(wù)器節(jié)點(diǎn)都處于激活狀態(tài),但是它們也可分別作為其對(duì)應(yīng)節(jié)點(diǎn)上的資源和資源層次的從屬節(jié)點(diǎn)。
我們可以假設(shè)在系統(tǒng)中有兩個(gè)應(yīng)用:應(yīng)用A和應(yīng)用B在同時(shí)運(yùn)行。我們可以令應(yīng)用A在服務(wù)器一上運(yùn)行,處于激活狀態(tài),可以令應(yīng)用B在服務(wù)器二上運(yùn)行,也處于激活狀態(tài)。應(yīng)用A從硬盤陣列的區(qū)域a讀取所需的數(shù)據(jù),應(yīng)用B從硬盤陣列的區(qū)域b讀取所需的數(shù)據(jù),同時(shí)為系統(tǒng)提供服務(wù)。當(dāng)服務(wù)器一節(jié)點(diǎn)出現(xiàn)故障時(shí),服務(wù)器二節(jié)點(diǎn)啟動(dòng)應(yīng)用B以接替服務(wù)器一的工作,同時(shí)從硬盤陣列中的區(qū)域b中讀取所需的數(shù)據(jù)。這樣的工作方式可以使兩臺(tái)服務(wù)器都可以得到充分的利用,我們甚至可以
利用兩臺(tái)服務(wù)器節(jié)點(diǎn)分別為兩個(gè)不同性質(zhì)的工作單元進(jìn)行服務(wù)。當(dāng)其中的一個(gè)工作單元的服務(wù)器出現(xiàn)故障的時(shí)候,另一個(gè)工作單元可以分配出一些系統(tǒng)資源以承擔(dān)出現(xiàn)故障服務(wù)器的處理工作,直到出現(xiàn)故障被排除。如我們可以將圖-2所示網(wǎng)絡(luò)結(jié)構(gòu)中的備份視頻服務(wù)器設(shè)置成為流媒體播出服務(wù)器。在網(wǎng)絡(luò)系統(tǒng)正常工作的狀態(tài)下,備份視頻服務(wù)器運(yùn)行Internet 視頻流播放功能,并且可以為作為代理服務(wù)器為網(wǎng)絡(luò)提供Web服務(wù)等Internet服務(wù)。當(dāng)主視頻服務(wù)器出現(xiàn)故障時(shí),備用視頻服務(wù)器便分出一些或讓出全部的系統(tǒng)資源,運(yùn)行主服務(wù)器上所提供的服務(wù),保證網(wǎng)絡(luò)系統(tǒng)的正常工作。我們也可以采用另外一種工作方式,即上面所說過的主服務(wù)器和備份服務(wù)器同時(shí)運(yùn)行同一任務(wù)。在像硬盤播出這種可預(yù)置的、并執(zhí)行針對(duì)同一任務(wù)的事先設(shè)定程序,并且在程序運(yùn)行過程中可保證其過程不會(huì)發(fā)生不同變化的任務(wù)就非常適合這種工作方式。
除了以上兩種服務(wù)器備份工作模式外,我們還可以采用超過兩個(gè)服務(wù)器的服務(wù)器集群工作模式和服務(wù)器各自擁有獨(dú)立硬盤陣列鏡像工作方式。我們下面將分別討論。
3 . N-Way(N=3,N=4…… N=16)工作模式
N-Way工作模式即集群工作模式是配置Active/Active工作模式或Active/Standby工作模式的一個(gè)有三到十六個(gè)服務(wù)器的擴(kuò)展。服務(wù)器三被配置為服務(wù)器一和服務(wù)器二的備份。而且,服務(wù)器三可以被配置為除了服務(wù)器一和服務(wù)器二的其他服務(wù)器做備份。當(dāng)任何一個(gè)服務(wù)器發(fā)生故障時(shí),被保護(hù)的應(yīng)用程序被從該服務(wù)器上轉(zhuǎn)到備用的服務(wù)器上。如圖-5所示。
在N-WAY工作模式中,可以配置Cascading Recovery (層疊恢復(fù))工作模式。當(dāng)主節(jié)點(diǎn)發(fā)生故障時(shí),層疊恢復(fù)允許多個(gè)從屬節(jié)點(diǎn)被按照一定的優(yōu)先級(jí)次序恢復(fù)一個(gè)資源或?qū)哟。?duì)于在一對(duì)節(jié)點(diǎn)上的資源恢復(fù),如果節(jié)點(diǎn)服務(wù)器一發(fā)生故障了,資源將會(huì)失效切換到節(jié)點(diǎn)服務(wù)器二上;如果節(jié)點(diǎn)服務(wù)器二再發(fā)生故障而服務(wù)器一仍然不可用,資源將會(huì)失效切換到節(jié)點(diǎn)服務(wù)器三上。多個(gè)從屬節(jié)點(diǎn)被指定一個(gè)恢復(fù)優(yōu)先級(jí)序列。在上面的例子中,節(jié)點(diǎn)服務(wù)器一有最高的優(yōu)先級(jí),節(jié)點(diǎn)服務(wù)器二有第二優(yōu)先級(jí),而節(jié)點(diǎn)服務(wù)器三有最低優(yōu)先級(jí)。系統(tǒng)可以按優(yōu)先級(jí)次序測(cè)驗(yàn)節(jié)點(diǎn)來決定在失效切換時(shí)哪一個(gè)服務(wù)器將進(jìn)行工作。
4. 鏡像工作方式
鏡像工作方式的特點(diǎn)是每個(gè)服務(wù)器都有獨(dú)自的硬盤陣列,且指定特定的卷互為鏡像,如圖6所示。一個(gè)服務(wù)器被指定為主服務(wù)器,另一個(gè)為從服務(wù)器。當(dāng)主服務(wù)器或所屬于主服務(wù)器的硬盤陣列出現(xiàn)故障后,從服務(wù)器自動(dòng)接替主服務(wù)器的工作。
在這種工作方式下,客戶只能對(duì)主服務(wù)器上的鏡像卷進(jìn)行讀或?qū)。從服?wù)器上相應(yīng)的卷被鎖定以防對(duì)數(shù)據(jù)的存取,除非在主服務(wù)器上檢測(cè)到故障狀態(tài)。這是鏡像工作方式要考慮到的一個(gè)重要問題,因?yàn)閿?shù)據(jù)的完整性是一個(gè)非常重要的因素。
在卷鏡像建立后,主服務(wù)器和從服務(wù)器上的驅(qū)動(dòng)器已經(jīng)同步,并且兩個(gè)服務(wù)器都已啟動(dòng)運(yùn)行,就必須注意以下機(jī)制:
最初的鏡像建立后,系統(tǒng)禁止所有用戶存取從鏡像卷,不允許對(duì)從服務(wù)器上的鏡像卷讀和寫。主服務(wù)器鏡像則可以進(jìn)行讀和寫操作。
無論何時(shí)主服務(wù)器收到一個(gè)寫請(qǐng)求,系統(tǒng)首先決定這個(gè)請(qǐng)求是否針對(duì)某個(gè)鏡像卷。如果不是,寫操作可以完全正常的完成。如果主服務(wù)器寫請(qǐng)求是針對(duì)鏡像卷的,那么請(qǐng)求首先被送到從鏡像卷去。從系統(tǒng)在自己的鏡像卷上執(zhí)行寫請(qǐng)求后,向主系統(tǒng)發(fā)送寫回狀態(tài)。主服務(wù)器在收到這個(gè)寫回狀態(tài)前不做任何寫操作。
當(dāng)從系統(tǒng)返回一個(gè)成功狀態(tài)時(shí),主系統(tǒng)在自己的鏡像卷執(zhí)行寫操作,并返回到請(qǐng)求方。如果從系統(tǒng)執(zhí)行鏡像卷寫操作時(shí)發(fā)生錯(cuò)誤,那么從系統(tǒng)上的寫操作將被中止,主系統(tǒng)結(jié)束自己的鏡像卷寫請(qǐng)求,鏡像狀態(tài)從正常變?yōu)橹兄埂?/p>
在這種工作模式下,也可以將主從服務(wù)器設(shè)置為Active/Active的方式,即在不同服務(wù)器各自的硬盤陣列上設(shè)置不同的鏡像卷。并根據(jù)工作的需要將服務(wù)器一節(jié)點(diǎn)設(shè)置為某些應(yīng)用的主服務(wù)器,將服務(wù)器二節(jié)點(diǎn)設(shè)置為這些應(yīng)用的從服務(wù)器,同時(shí)將服務(wù)器二節(jié)點(diǎn)設(shè)置為其余應(yīng)用的主服務(wù)器,服務(wù)器一設(shè)置為從服務(wù)器,并且在硬盤陣列上設(shè)置不同的鏡像卷。根據(jù)不同的應(yīng)用區(qū)別主從服務(wù)器,運(yùn)行鏡像服務(wù)器的機(jī)制,就可以實(shí)現(xiàn)Active/Active的工作方式。我們也可以在硬盤播出上采用這種方式,將需要播出的節(jié)目素材鏡像倒備份服務(wù)器的硬盤陣列上,在主服務(wù)器進(jìn)行播出的同時(shí)備份服務(wù)器進(jìn)行同樣的工作,當(dāng)主服務(wù)器出現(xiàn)故障試立刻可以接替主服務(wù)器的工作。事實(shí)上現(xiàn)在國(guó)內(nèi)廠商開發(fā)出來的硬盤播出系統(tǒng)很多都采用這種工作模式。但需要指出的時(shí),這是一種造價(jià)昂貴的配置方式,用戶必須考慮到對(duì)安全的要求及經(jīng)濟(jì)忍受能力的平衡。
服務(wù)器備份的具體實(shí)現(xiàn)方法
上面我們了解了服務(wù)器被份的幾種工作模式,下面我們將討論實(shí)現(xiàn)服務(wù)器備份的具體的要求和方法。
一個(gè)完善的服務(wù)器備份系統(tǒng)應(yīng)該具備以下幾點(diǎn)要求:
1. 系統(tǒng)設(shè)置應(yīng)該做到真正的數(shù)據(jù)與硬件無關(guān)。
2. 全自動(dòng)的備份數(shù)據(jù),包括系統(tǒng)控制數(shù)據(jù)和應(yīng)用數(shù)據(jù)。
3. 對(duì)被損壞數(shù)據(jù)的自動(dòng)恢復(fù),包括業(yè)務(wù)人員可容易地自動(dòng)恢復(fù)文件的誤刪除
維護(hù)人員可以自動(dòng)恢復(fù)損壞的整個(gè)系統(tǒng)。
4. 系統(tǒng)切換時(shí)間短,即在主服務(wù)器出現(xiàn)故障時(shí),備份服務(wù)器能夠迅速的接替其工作。
5. 系統(tǒng)切換時(shí)應(yīng)對(duì)應(yīng)用程序無影響,用戶應(yīng)該察覺不到系統(tǒng)的切換,即所謂的"熱備份"。
6. 對(duì)歷史數(shù)據(jù)進(jìn)行完整的歸檔管理。
7. 擁有高效率,一個(gè)完善的系統(tǒng)不應(yīng)該因?yàn)閭浞莘⻊?wù)器的引入而影響其工作性能。
以上是對(duì)一個(gè)完善的服務(wù)器備份系統(tǒng)的基本要求。當(dāng)然每個(gè)用戶都有著自己的工作環(huán)境,對(duì)備份系統(tǒng)的工作要求也各不相同,如在視頻領(lǐng)域內(nèi)應(yīng)用的服務(wù)器,就對(duì)系統(tǒng)的切換時(shí)間和對(duì)應(yīng)用程序的影響要求的高一些,而在某些其它的領(lǐng)域(如證券交易系統(tǒng))則將保證數(shù)據(jù)的完整性放在第一位。有些用戶需要與主服務(wù)器配置完全一樣的服務(wù)器做系統(tǒng)備份,以保證整個(gè)系統(tǒng)的高效率運(yùn)行,而有些用戶為了提高性能價(jià)格比只需要配置稍低或過時(shí)閑置的服務(wù)器做備份。
無論那種服務(wù)器備份方案,其工作原理都是一樣的,我們下面將詳細(xì)討論。
首先,服務(wù)器被份體系不受操作系統(tǒng)的限制。有些廠商開發(fā)的視頻服務(wù)器使用UNIX服務(wù)器,有些廠商使用的是Windows NT 服務(wù)器,還有一些采用其它服務(wù)器如使用Novell服務(wù)器或Linux服務(wù)器的廠商。在這些服務(wù)器體系上都可以建立備份系統(tǒng)。
備份系統(tǒng)的基本原理是在兩臺(tái)或多臺(tái)服務(wù)器之間建立連接,利用軟件控制服務(wù)器的主從關(guān)系,因此在不同的操作平臺(tái)上可以安裝不同的控制軟件。例如Vinca公司提供的服務(wù)器備份解決方案Co-standby Server就是一個(gè)純軟件產(chǎn)品,可以分別建立基于Novell、Windows NT、OS/2等服務(wù)器平臺(tái)上的備份解決方案。而其它很多廠商開發(fā)的解決方案如LifeKeeper、Cluster也有基于系統(tǒng)平臺(tái)的多種版本。
在服務(wù)器之間建立連接的手段有很多種,一般可以采用RS-232 通信端口(Communications port )或者TCP/IP的連接。我們以運(yùn)行在Active/Standby工作模式下的備份服務(wù)器系統(tǒng)進(jìn)行說明。
如圖-7所示。服務(wù)器一為主服務(wù)器,處于Active狀態(tài),服務(wù)器二位備份服務(wù)器,處于Standby狀態(tài)。兩個(gè)服務(wù)器都通過銅纜或者SCSI接口與大容量硬盤陣列連接,服務(wù)器之間通過RS232和TCP/IP進(jìn)行連接。
在系統(tǒng)正常工作狀態(tài)下,應(yīng)用A運(yùn)行于服務(wù)器一上,從硬盤陣列的區(qū)域a讀取或?qū)懭霐?shù)據(jù)。服務(wù)器二通過連接向服務(wù)器一發(fā)送周期性的檢測(cè)信號(hào)并從服務(wù)器一接收應(yīng)答信號(hào)。
服務(wù)器二如果能夠接收到服務(wù)器一正常工作的響應(yīng)信號(hào),則認(rèn)為服務(wù)器一工作正常,則服務(wù)器二仍處于Standby狀態(tài)。
如果服務(wù)器二不能從服務(wù)器一收到應(yīng)答信號(hào)或者收到錯(cuò)誤的應(yīng)答信號(hào),則服務(wù)器二認(rèn)為服務(wù)器一已經(jīng)失去正常工作的能力。服務(wù)器二從Standby狀態(tài)轉(zhuǎn)為Active狀態(tài),從硬盤陣列中的區(qū)域a讀取應(yīng)用A的狀態(tài)數(shù)據(jù)并開始運(yùn)行應(yīng)用A,同時(shí)禁止服務(wù)器一訪問區(qū)域a。從而接替服務(wù)器一在系統(tǒng)中的主服務(wù)器地位。當(dāng)服務(wù)器一恢復(fù)正常工作時(shí),服務(wù)器二將工作交還給服務(wù)器一并恢復(fù)Standby狀態(tài)。
交還應(yīng)用的方法有兩種:一種是手動(dòng)交還,即管理員排除服務(wù)器一的故障后,手動(dòng)將工作切換給主服務(wù)器,并將備份服務(wù)器恢復(fù)到Standby狀態(tài)。另一種是自動(dòng)恢復(fù),即在備份服務(wù)器接替主服務(wù)器工作后繼續(xù)向主服務(wù)器發(fā)送檢測(cè)信號(hào),一旦收到表示主服務(wù)器已經(jīng)正常的應(yīng)答信號(hào),就采用與接替主服務(wù)器工作的相同方式將工作交還給主服務(wù)器并恢復(fù)為Standby狀態(tài)。
在實(shí)際工作過程中,必須注意以下幾個(gè)問題:
1. 檢測(cè)的準(zhǔn)確性
由于檢測(cè)信號(hào)的出錯(cuò)或者服務(wù)器之間連接的故障可能會(huì)導(dǎo)致備份服務(wù)器接收不到主服務(wù)器發(fā)回的正常響應(yīng)信號(hào),從而備份服務(wù)器認(rèn)為主服務(wù)器已經(jīng)無法正常運(yùn)行,就會(huì)導(dǎo)致系統(tǒng)進(jìn)行不必要的切換。
為了防止這種情況的發(fā)生,我們可以采用兩種手段:設(shè)置多種檢測(cè)應(yīng)答信號(hào)和服務(wù)器間的多路連接。我們可以設(shè)定不同的檢測(cè)及應(yīng)答信號(hào),當(dāng)所有的檢測(cè)信號(hào)均無正常應(yīng)答時(shí),備份服務(wù)器才認(rèn)定主服務(wù)器已經(jīng)無法正常工作,從而接手主服務(wù)器的工作。我們也可以在服務(wù)器之間建立不同的硬件連接,如同時(shí)建立基于RS232和TCP/IP的連接,同時(shí)發(fā)送檢測(cè)信號(hào),當(dāng)所有的通路都得不到正常的應(yīng)答信號(hào)后,備份服務(wù)器才認(rèn)為主服務(wù)器已經(jīng)無法進(jìn)行正常的工作,接替主服務(wù)器的工作。當(dāng)然最合理的方式是同時(shí)采用這兩種方法,在多路連接上同時(shí)傳送不同的檢測(cè)應(yīng)答信號(hào)。不過采用這種方法時(shí)必須要考慮的系統(tǒng)的資源開銷問題。
2. 檢測(cè)信號(hào)的發(fā)送周期
檢測(cè)信號(hào)發(fā)送周期的長(zhǎng)短取決于用戶對(duì)備份系統(tǒng)的啟動(dòng)響應(yīng)速度的要求。如果用戶認(rèn)為數(shù)據(jù)完整的重要性要遠(yuǎn)大于備份系統(tǒng)開始運(yùn)行的響應(yīng)速度的重要性,那么就可以令檢測(cè)信號(hào)的發(fā)送周期適當(dāng)?shù)拈L(zhǎng)一些,從而保證備份系統(tǒng)啟動(dòng)時(shí)數(shù)據(jù)可以被完整的保存。如果用戶認(rèn)為整個(gè)系統(tǒng)的工作不能中斷甚至不能出現(xiàn)一定量的延時(shí),那么檢測(cè)信號(hào)的發(fā)射周期及和從確認(rèn)主服務(wù)器無法正常工作到啟動(dòng)備份服務(wù)器接替主服務(wù)器工作的響應(yīng)周期一定要小于系統(tǒng)所能夠忍受的最大時(shí)間。硬盤播出系統(tǒng)就是一個(gè)最簡(jiǎn)單的例子。硬盤播出服務(wù)器的備份啟動(dòng)時(shí)間一定要小于人眼的可察覺的最小范圍,并由此確定檢測(cè)信號(hào)的發(fā)送周期。
3. 檢測(cè)主服務(wù)器系統(tǒng)失效的方法
利用檢測(cè)應(yīng)答信號(hào)來確定主服務(wù)器系統(tǒng)是否失效的方法有很多,大致可分為檢測(cè)系統(tǒng)硬件和檢測(cè)數(shù)據(jù)兩種。我們可以通過發(fā)送檢測(cè)信號(hào)檢測(cè)主服務(wù)器的系統(tǒng)硬件,如總線或CPU的工作狀態(tài),從而確定主服務(wù)器是否正常工作。我們也可以通過檢測(cè)主服務(wù)器內(nèi)存的數(shù)據(jù)狀態(tài),I/O端口的數(shù)據(jù)流動(dòng)情況來判斷主服務(wù)器系統(tǒng)是否出現(xiàn)數(shù)據(jù)錯(cuò)誤。我們可以在主服務(wù)器上安裝檢測(cè)軟件,把檢測(cè)結(jié)果直接發(fā)給備份服務(wù)器,也可以利用主服務(wù)器自身的系統(tǒng)檢測(cè)來確定主服務(wù)器的工作狀態(tài)是否正常。
4. 主從服務(wù)器的設(shè)置
主從服務(wù)器的設(shè)置是否一致也取決于用戶對(duì)具體工作的不同要求。如果用戶側(cè)重于數(shù)據(jù)的保存,如在辦公網(wǎng)絡(luò)系統(tǒng)中,我們可以采用一個(gè)配置稍低的服務(wù)器作為主服務(wù)器的備份。在主服務(wù)器出現(xiàn)故障后,啟動(dòng)備用服務(wù)器接替其工作,保存數(shù)據(jù)并降低整個(gè)網(wǎng)絡(luò)的性能,直到主服務(wù)器的故障被排除。但是有些系統(tǒng)是不能降低其性能的,例如硬盤播出服務(wù)器,就應(yīng)該采用相同配置的主服務(wù)器和備份服務(wù)器。我們建議在硬盤播出系統(tǒng)中才用鏡像的Active/Active工作模式,采用兩個(gè)互為鏡像的硬盤存儲(chǔ)陣列,在兩個(gè)服務(wù)器上同時(shí)運(yùn)行節(jié)目播出的應(yīng)用以保證節(jié)目的安全播出。
無論主從服務(wù)器的設(shè)置是否一致,處于實(shí)際工作的考慮,都應(yīng)該采用相同的操作系統(tǒng)。
以上我們介紹的采用共用硬盤陣列的Active/Standby工作模式下的備份服務(wù)器系統(tǒng)的工作原理、實(shí)現(xiàn)手段和一些需要注意得問題,這些方面也同樣適用于采用其它存儲(chǔ)方式和其它工作模式的服務(wù)器備份系統(tǒng)。
總結(jié)
服務(wù)器備份系統(tǒng)是整個(gè)網(wǎng)絡(luò)安全的一個(gè)組成部分,同時(shí)也是極重要的一個(gè)組成部分,只有在服務(wù)器能夠正常穩(wěn)定工作的前提下,網(wǎng)絡(luò)才有安全和效率可言。隨著視頻領(lǐng)域全面數(shù)字化和網(wǎng)絡(luò)化時(shí)代的到來,每個(gè)電視工程技術(shù)人員在依然緊密的依托在傳統(tǒng)電視技術(shù)的同時(shí),全新到幾乎近似陌生的,在不久前尚屬于IT領(lǐng)域的各種新技術(shù)新觀點(diǎn)紛至沓來。是否能做到不至于眼花繚亂,正是本文希望與各位同行共勉的愿望。
【服務(wù)器備份問題的探討及在視頻領(lǐng)域內(nèi)的應(yīng)用】相關(guān)文章:
轉(zhuǎn)碼技術(shù)在視頻領(lǐng)域內(nèi)的應(yīng)用分析08-06
服務(wù)器集群技術(shù)及其在視頻網(wǎng)絡(luò)中的應(yīng)用08-06
探討重復(fù)數(shù)據(jù)刪除技術(shù)在中央電臺(tái)媒資備份存儲(chǔ)系統(tǒng)中應(yīng)用08-17
對(duì)“債轉(zhuǎn)股”有關(guān)問題的探討08-07
“留置盤問”問題探討08-05
數(shù)據(jù)雙向流動(dòng)技術(shù)在電視技術(shù)領(lǐng)域內(nèi)的應(yīng)用分析08-06
探討稅收籌劃相關(guān)問題08-18