- 相關(guān)推薦
DSP—數(shù)字化音頻領(lǐng)域的未來
DSP—數(shù)字化音頻領(lǐng)域的未來
`2000中南地區(qū)省級(jí)電視臺(tái)技術(shù)協(xié)會(huì)技術(shù)論文二等獎(jiǎng)《西部廣播電視》2000年第9期發(fā)表
隨著數(shù)字信號(hào)處理技術(shù)的日益推進(jìn), IT領(lǐng)域的科技成果越來越普遍的應(yīng)用于視音頻領(lǐng)域并大大的推動(dòng)了視音頻科技的進(jìn)步,其中DSP(Digital Signal Processor即數(shù)字信號(hào)處理器)在音頻領(lǐng)域內(nèi)的應(yīng)用就是一個(gè)很好的例子。
傳統(tǒng)的模擬視音頻產(chǎn)品如今逐漸退出,采用數(shù)字化技術(shù)極其相應(yīng)產(chǎn)品已呈不可抵擋的趨勢(shì)。數(shù)字化的視音頻產(chǎn)品必將涉及將類比信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)后加以傳輸?shù)膯栴}。而在這種轉(zhuǎn)換的過程中需要做大量的數(shù)學(xué)運(yùn)算,因此必須選擇運(yùn)算快速的微處理器才能完成實(shí)時(shí)(real-time)的數(shù)位信號(hào)處理。而市面上的微處理有成百上千種,各有其特色及對(duì)應(yīng)的應(yīng)用場(chǎng)合,DSP以其特有的優(yōu)勢(shì)更加適合于完成上述任務(wù)。以下就從微處理器的硬件基本架構(gòu),來說明DSP與傳統(tǒng)微處理器間的差異及其本身的優(yōu)勢(shì)。
DSP的優(yōu)勢(shì)
要了解DSP的優(yōu)勢(shì),就必須明白DSP與傳統(tǒng)微處理器在硬件基本架構(gòu)上的不同。
Von Neumann與Harvard基本架構(gòu)
所有的微處理器都是由幾個(gè)基本的模塊所組成:運(yùn)算器以完成數(shù)學(xué)運(yùn)算、存儲(chǔ)器和解碼器以完成類比信號(hào)與數(shù)位信號(hào)間的轉(zhuǎn)換。在程序中,在每一周期必須告知微處理器要做些什么。因此微處理器必須從儲(chǔ)存程序的存儲(chǔ)體取得控制指令與一些數(shù)據(jù)而加以運(yùn)算。但是對(duì)于所有的微處理器并不是使用相同的方法,一般來說可分成Von Neumann與Harvard二種基本架構(gòu),同時(shí)又有取其二者優(yōu)點(diǎn)而衍生出多種的混合改良架構(gòu),在增加存儲(chǔ)器與周邊裝置后,就成為能作為數(shù)字信號(hào)處理應(yīng)用的微處理控制器。
Von Neumann結(jié)構(gòu)成為電腦發(fā)展上的標(biāo)準(zhǔn)已超過40年,基本結(jié)構(gòu)是非常簡(jiǎn)潔,程序與數(shù)據(jù)二者能夠存儲(chǔ)在同一存儲(chǔ)映射空間(memory-mapped space),這種結(jié)構(gòu)的形成是基于大多數(shù)一般用途的程序要求,如x86系列。而其缺點(diǎn)是僅有一條總線來共享數(shù)據(jù)和程序地址,因此同一時(shí)間僅有一數(shù)據(jù)存儲(chǔ)單元或是程序存儲(chǔ)單元能被進(jìn)行存取操作。
能在讀取執(zhí)行程序的同時(shí)訪問數(shù)據(jù)存儲(chǔ)空間是有效加快數(shù)據(jù)處理的重要方法,Harvard結(jié)構(gòu)具有分離程序和數(shù)據(jù)的存儲(chǔ)空間,兩根總線分別處理不同的地址單元,以確保數(shù)據(jù)和程序能同時(shí)并行的存取,以增加處理速度。這種分離的總線架構(gòu)可將程序執(zhí)行分成尋址、解碼、讀取、執(zhí)行四個(gè)工作階段,每一指令必須4個(gè)指令周期才能完成,并且同一時(shí)間可以有4個(gè)指令進(jìn)入微處理器內(nèi)處理,當(dāng)在第4個(gè)指令周期后,每一指令周期就有一個(gè)指令執(zhí)行,此時(shí)程式是以最高的效率的執(zhí)行。但需要指出的是,當(dāng)執(zhí)行選擇指令如跳躍或比較指令時(shí),由于必須等到指令執(zhí)行產(chǎn)生的結(jié)果后,才知道要跳躍的位置與下一個(gè)指令,在此之前所輸入的指令會(huì)變的無效,而必須重新輸入新的指令,因此會(huì)產(chǎn)生所謂的選擇延時(shí)或選擇等待等現(xiàn)象,使得程式執(zhí)行效率大幅降低至與Von Neumann結(jié)構(gòu)差不多,所以一般當(dāng)程序需要大量的比較或跳躍語句的場(chǎng)合,如人機(jī)交互的介面(這是絕大多數(shù)PC機(jī)用戶的主要操作方式)等,Harvard架構(gòu)并不會(huì)比Von Neumann結(jié)構(gòu)有更好的性能。
毫無疑問,程序執(zhí)行速度的增加的同時(shí)硬件的成本也相應(yīng)的增加,分離的數(shù)據(jù)存儲(chǔ)空間和程序存儲(chǔ)空間就需要兩個(gè)不同的數(shù)據(jù)尋址和與程序?qū)ぶ返挠布涌。因此能發(fā)現(xiàn)在價(jià)格與性能間取得折衷的方法,才算是一個(gè)較佳的解決方案, 于是產(chǎn)生了Modified Harvard架構(gòu),這種架構(gòu)僅有一個(gè)外部總線(以減少接口數(shù)),同時(shí)有程序與數(shù)據(jù)兩個(gè)內(nèi)部總線,可以減少成本并維持顧客對(duì)運(yùn)算速度的要求。
由此可見,在個(gè)人電腦這樣需要大量的選擇跳躍語句進(jìn)行人機(jī)交互的處理器還是選擇Von Neumann架構(gòu)(即傳統(tǒng)的CPU 如x86、Pentium等)更加的合理,而在數(shù)字視音頻領(lǐng)域進(jìn)行數(shù)字信號(hào)的傳輸處理,并不需要大量的選擇語句時(shí), Harvard架構(gòu)及Modified Harvard架構(gòu)就顯得更加的適合。
DSP的Modified Harvard架構(gòu)
DSP是屬于Modified Harvard架構(gòu),即它具有兩條內(nèi)部總線,一個(gè)是數(shù)據(jù)總線,一個(gè)是程序總線;而傳統(tǒng)的微處理器內(nèi)部只有一條總線供數(shù)據(jù)傳輸與程序執(zhí)行使用; 從上面我們已經(jīng)看到Modified Harvard架構(gòu)在大量數(shù)學(xué)運(yùn)算方面有著強(qiáng)大的優(yōu)勢(shì),在DSP內(nèi)部具有硬件乘法器,大量的寄存器,目前最快的可在一個(gè)指令周期內(nèi)完成32bit乘32bit的指令,而傳統(tǒng)的微處理器運(yùn)算系以微代碼來執(zhí)行,遇到乘法運(yùn)算指令時(shí)就得消耗掉好幾個(gè)指令周期,加上傳統(tǒng)的微處理器中的寄存器較少,不得不經(jīng)常從外部?jī)?chǔ)存器傳輸數(shù)據(jù)來進(jìn)行運(yùn)算,而DSP指令具備重新執(zhí)行功能,因此在數(shù)學(xué)運(yùn)算速度超越一般傳統(tǒng)的微處理器。
例如當(dāng)執(zhí)行循環(huán)控制語句時(shí),傳統(tǒng)的CPU會(huì)以某一暫存器當(dāng)初始循環(huán)數(shù)index,然后以比較跳躍的方式來達(dá)到循環(huán)控制的目的,此時(shí)程序會(huì)重復(fù)做比較運(yùn)算直至index為0;而DSP內(nèi)建硬體repeat count指令來直接對(duì)硬件決定下一個(gè)循環(huán)指令的執(zhí)行次數(shù),如此可大量減少程式的執(zhí)行時(shí)間。
又如在做數(shù)字信號(hào)處理時(shí)最常出現(xiàn)乘加的運(yùn)算(如ax+y),DSP針對(duì)此項(xiàng)需求而特別設(shè)計(jì)了一個(gè)硬件的MAC unit,使得在一個(gè)指令周期內(nèi)即可完成乘加的運(yùn)算,若再配合repeat指令,便可以將乘加運(yùn)算的速度大大提高。同時(shí)因?yàn)镈SP有分離的程序與數(shù)據(jù)的總線,所以一條指令能同時(shí)定址訪問程序和數(shù)據(jù)的存儲(chǔ)單元,完成兩個(gè)變量的運(yùn)算。必須注意a為一維常量放在程序存儲(chǔ)單元,而X為一維變量放在數(shù)據(jù)存儲(chǔ)單元;若系數(shù)a會(huì)隨程序運(yùn)算而變動(dòng)時(shí),DSP內(nèi)建一小塊Dual-Access RAM (DARAM)的存儲(chǔ)區(qū)域,可由程序?qū)⒋藚^(qū)域設(shè)定為程序存儲(chǔ)區(qū)域或數(shù)據(jù)存儲(chǔ)區(qū)域,利用此存儲(chǔ)區(qū)域可完成可變系數(shù)的計(jì)算。
歸納起來DSP具備有以下的特點(diǎn):(1)內(nèi)建乘法累加器;(2)指令管線化;(3)多總線與存儲(chǔ)空間;(4)循環(huán)尋址與位重新尋址;(5)零負(fù)荷循環(huán)運(yùn)算;(6)晶片內(nèi)含存儲(chǔ)體與存儲(chǔ)體介面。
DSP在音頻領(lǐng)域的應(yīng)用
由于不存在線形放大電路非理想傳輸函數(shù)所造成的失真缺點(diǎn),運(yùn)算速度又比傳統(tǒng)微處理器快,DSP已普遍應(yīng)用于視音頻領(lǐng)域的合成、辨識(shí)與編碼;由于對(duì)硬盤存儲(chǔ)容量的要求日益提高,使得對(duì)VCM(VOICE COIL MOTOR)的定位精度的要求也越來越嚴(yán)謹(jǐn),DSP IC已成為高容量硬盤機(jī)的核心元件;DSP還廣泛應(yīng)用在DAT、DLT等磁帶機(jī)上,用以控制轉(zhuǎn)速與磁頭讀寫位置;應(yīng)用于全球定位系統(tǒng)(GPS)的接收機(jī)之相關(guān)器(CORRELATOR)上,提供計(jì)算衛(wèi)星所發(fā)射的射頻信號(hào)至接收器距離的功能。圖象處理的離散余弦變換(DCT)應(yīng)用;電視信號(hào)的抗多經(jīng)干擾(Ghost Cancellation) 。至于對(duì)模糊失真控制(Fuzzy Control)的大量浮點(diǎn)運(yùn)算,能達(dá)到即時(shí)要求,更是得心應(yīng)手。
下面將著重介紹一下DSP在音頻信號(hào)上的各種應(yīng)用
在音頻訊號(hào)處理方面的應(yīng)用,包括如下重點(diǎn):
- 主動(dòng)噪聲控制(Active Noise Cancellation)
- 語音訊號(hào)處理(Speech Signal Processing)
- 音樂訊號(hào)處理(Audio Processing)
主動(dòng)噪聲控制
傳統(tǒng)的被動(dòng)式隔音方法,單純以隔音材料阻隔噪聲,對(duì)中、低頻噪音源產(chǎn)生的噪聲幾乎無阻隔能力,因此必須以厚重的隔音材料方能產(chǎn)生效果。主動(dòng)噪聲控制是以電子閉回路控制的方法,產(chǎn)生和原始噪聲反相的聲音,以抵消原噪聲(如圖-1)。其優(yōu)點(diǎn)在于它對(duì)于抑制低頻噪聲極為有效。其應(yīng)用上的限制在于它無法控制中高頻段的噪聲(1.5K赫茲以上)
在通訊的各個(gè)環(huán)節(jié),都可能產(chǎn)生惱人的噪聲,其綜合的影響,便是降低通訊效率、成功率。主動(dòng)噪聲控制技術(shù)能在很多層面提高信噪比,且和傳統(tǒng)簡(jiǎn)單的濾波器相比,它能動(dòng)態(tài)地適應(yīng)各種狀況,過去濾波器所無法處理的不確定噪聲也可相當(dāng)程度地克服。
語音訊號(hào)處理
雖然目前許多資料已由數(shù)位編碼后,經(jīng)原有的語音通訊通道收發(fā)。但語音仍然穩(wěn)占所有通訊含量的第一位。對(duì)語音訊號(hào)的處理的需求,近年來呈現(xiàn)指數(shù)增長(zhǎng)。語音技術(shù)可分為如下四項(xiàng):語音增強(qiáng)(Speech Enhancement),語音辨識(shí)(Speech Recognition) ,語音編解碼(Speech Coding/Decoding),回聲抑制(Echo Suppression)。語音增強(qiáng)
在語音信號(hào)的獲取手段上,各種拾音器(麥克風(fēng))皆有其不同的頻響、方向性、穩(wěn)定性、拾取機(jī)制,多個(gè)不同特性的麥克風(fēng)組合陣列更可滿足使用者在各種頻段對(duì)訊號(hào)的多種不同要求(如圖-2),在滿足噪聲控制的任務(wù)下所取得的對(duì)電聲系統(tǒng)的有效把握,使我們能滿足各種用戶系統(tǒng)對(duì)信號(hào)拾取的要求。
圖-2
在信號(hào)處理上,針對(duì)應(yīng)用場(chǎng)合、背景噪聲特性、語音清晰度對(duì)可允許的語音失真的相對(duì)要求等 ,我們可制定不同的方案,以滿足任務(wù)需求。例如,語音識(shí)別軟體對(duì)語音信號(hào)的要求,就有別于人耳對(duì)語音信號(hào)的要求,因此,在完成通訊時(shí),和在完成語音識(shí)別任務(wù)時(shí),需使用不同的程序。針對(duì)不同任務(wù)研發(fā)機(jī)構(gòu)若不能對(duì)語音特性具備全面的了解與把握,是無法在這上面取得真正優(yōu)化的結(jié)果。
此外,DSP技術(shù)在高速執(zhí)行單通道信號(hào)的檢波,多通道信號(hào)的對(duì)比,其速度可以做到讓使用者無法感到時(shí)間有延遲,在感覺上完全是實(shí)時(shí)工作的效果。
語音辨識(shí)
語音識(shí)別系統(tǒng)的核心,應(yīng)具有硬件要求少,自含時(shí)間矯正,和能量矯正的特點(diǎn)。目前已實(shí)際應(yīng)用的為小辭匯量(200字)系統(tǒng)的獨(dú)立語音識(shí)別,中辭匯量(1800字)的核心亦完成。在自動(dòng)語音識(shí)別的發(fā)展方向上,將集中於發(fā)展語音控制技術(shù),而非語音輸入技術(shù)。重點(diǎn)在于首次識(shí)別的準(zhǔn)確率,而非混合語意的輔助識(shí)別。
語音編、解碼
由于在DSP具有語音處理上的強(qiáng)大功能,因此才有可能在語音編碼的設(shè)計(jì)、使用上,偏重使用壓縮比較高的“編碼激勵(lì)線性預(yù)測(cè)”(CELP)型算法。目前使用的開放標(biāo)準(zhǔn)為ITU的G.723.1,這種算法廣泛使用于IP的編解碼上,具有6.3Kbps和5.3Kbps兩種傳輸率,語音品質(zhì)高,抗噪聲能力和計(jì)算負(fù)荷適中。可提供用戶使用於各種平臺(tái)上。同時(shí),專屬的2.4Kbps的語音編碼算法也在開發(fā)中,預(yù)計(jì)該算法將在語音品質(zhì)、抗噪聲能力、語音壓縮比、計(jì)算負(fù)荷、計(jì)算延時(shí)上取得更好的平衡。因以硬體性能不斷的提升,會(huì)適配較大的計(jì)算量的編碼方式,根據(jù)信息論的原理,若在不降低確定的信號(hào)指標(biāo)的條件下,如果采用高的壓縮比方式則必然相對(duì)的應(yīng)用大運(yùn)算量的編解碼方式,以在高壓縮比的情況下取得較好的音頻性能。
回聲抑制
在長(zhǎng)距離通訊及活動(dòng)通訊中,經(jīng)常會(huì)被回聲所困擾。無論是線性回聲,或是音響回聲,當(dāng)延時(shí)超過0.5秒 ,都會(huì)在接收端清晰的收到。針對(duì)這兩種現(xiàn)象,各有適用的回聲抑制算法;贒SP的算法穩(wěn)定、簡(jiǎn)潔,不但抑制響應(yīng)速度快,而且對(duì)Double Talk、Near-End-Speech及靜音狀態(tài),皆能保持降噪性能。同時(shí)因?yàn)榫性回聲時(shí)間延遲可在1毫秒到900毫秒的大范圍內(nèi)變動(dòng),同樣有基于DSP專屬的算法來克服這種變異性對(duì)系統(tǒng)帶來的額外負(fù)荷(在傳統(tǒng)的回聲抑制系統(tǒng)中,300毫秒的延時(shí)意味者系統(tǒng)性能價(jià)格比的急劇劣化)。而這些算法的源代碼亦能應(yīng)用在各種通訊平臺(tái)上,解決長(zhǎng)程通訊各環(huán)節(jié)所產(chǎn)生的問題。
音樂訊號(hào)處理
自從數(shù)字化的音樂規(guī)范開始流行后,因數(shù)字信號(hào)處理所附帶的彈性因素,已在影音訊號(hào)的儲(chǔ)存 、傳送、播放上,產(chǎn)生了許多開放規(guī)范和專屬規(guī)范。對(duì)使用者而言,它們帶來的效果,除了更耐久更廉價(jià)的儲(chǔ)存媒介、更多元化的接收管道外,也包括更絢麗的視聽效果。但在終端獲得和原始影音信號(hào)源相當(dāng)?shù)挠耙粜Ч,到目前為止都仍然是昂貴且不見得有效的。為了實(shí)現(xiàn)所謂的“環(huán)場(chǎng)音效”,目前已有諸如Dolby Surround、Dolby ProLogic、AC-3 、THX等各式開放規(guī)范,也有商品化的解碼晶片。但整個(gè)環(huán)節(jié)中最弱的一環(huán),是在由揚(yáng)聲系統(tǒng)到人耳的這一段。這一段的傳遞函數(shù)因不同的聽音者,不同的聽音環(huán)境而隨機(jī)的改變,甚至差異極大。原始錄音工程師的心血,在這一段經(jīng)常被糟蹋無遺。而且和傳統(tǒng)音響系統(tǒng)相同,這個(gè)性能最不容易把握的環(huán)節(jié),往往也是投資昂貴的一個(gè)環(huán)節(jié)。
針對(duì)這一環(huán)節(jié),DSP提出的解決方案。是獨(dú)立于上述開放規(guī)范之外,來建立一個(gè)近似環(huán)場(chǎng)音效系統(tǒng),在信號(hào)后期處理階段,則以更人性化的雙聲道,來模擬上述規(guī)范所要求的四加一或五加一聲道的要求,并
且以DSP動(dòng)態(tài)的 補(bǔ)償聲場(chǎng)的變異,基本上可以做到使用一個(gè)低成本基于DSP技術(shù)的系統(tǒng)去替代昂貴的非DSP的高檔系統(tǒng),完整還原原始錄音效果。(如圖-3)
總結(jié)
DSP以其強(qiáng)大的運(yùn)算能力及優(yōu)良的性能價(jià)格比已經(jīng)成為越來越多的數(shù)字化視音頻設(shè)備的核心構(gòu)件,隨著科技的進(jìn)步,DSP技術(shù)的日益完善,相信DSP的未來就是數(shù)字化音頻領(lǐng)域的未來。
【DSP—數(shù)字化音頻領(lǐng)域的未來】相關(guān)文章:
定點(diǎn)dsp與浮點(diǎn)dsp的比較08-06
定點(diǎn)DSP的準(zhǔn)確計(jì)時(shí)08-06
增強(qiáng)并口EPP與DSP接口的設(shè)計(jì)增強(qiáng)并口EPP與DSP接口的設(shè)計(jì)08-06
視音頻素材的編碼轉(zhuǎn)換08-06
基于DSP的自動(dòng)對(duì)焦系統(tǒng)08-06
DSP接口效率的分析與提高08-06
DSP與慢速設(shè)備接口的實(shí)現(xiàn)08-06