- 相關(guān)推薦
基于FPGA實(shí)現(xiàn)FIR濾波器的研究
摘要:針對(duì)在FPGA中實(shí)現(xiàn)FIR濾波器的關(guān)鍵--乘法運(yùn)算的高效實(shí)現(xiàn)進(jìn)行了研究,給了了將乘法化為查表的DA算法,并采用這一算法設(shè)計(jì)了FIR濾波器。通過FPGA仿零點(diǎn)驗(yàn)證,證明了這一方法是可行和高效的,其實(shí)現(xiàn)的濾波器的性能優(yōu)于用DSP和傳統(tǒng)方法實(shí)現(xiàn)FIR濾波器。最后介紹整數(shù)的CSD表示和還處于研究階段的根據(jù)FPGA實(shí)現(xiàn)的要求改進(jìn)的最優(yōu)表示。關(guān)鍵詞:FPGA DA FIR濾波器 CSD
數(shù)字濾波器是語音與圖像處理、模式識(shí)別、雷達(dá)信號(hào)處理、頻譜分析等應(yīng)用中的一種基本的處理部件,它能滿足波器對(duì)幅度和相位特性的嚴(yán)格要求,避免模擬乙波器所無法克服的電壓漂移、溫度漂移和噪聲等問題。有限沖激響應(yīng)(FIR)濾波器能在設(shè)計(jì)任意幅頻特性的同時(shí)保證嚴(yán)格的線性相位特性。
目前FIR濾波器的實(shí)現(xiàn)方法有三種:利用單片通用數(shù)字濾波器集成電路、DSP器件和可編程邏輯器件實(shí)現(xiàn)。單片通用數(shù)字濾波器使用方便,但由于字長(zhǎng)和階數(shù)的規(guī)格較少,不能完全滿足實(shí)際需要。使用DSP器件實(shí)現(xiàn)雖然簡(jiǎn)單,但由于程序順序執(zhí)行,執(zhí)行速度必然不快。FPGA有著規(guī)整的內(nèi)部邏輯陣列和豐富的連線資源,特別適合于數(shù)字信號(hào)處理任務(wù),相對(duì)于串行運(yùn)算為主導(dǎo)的通用DSP芯片來說,其并行性和可擴(kuò)展性更好。但長(zhǎng)期以來,F(xiàn)PGA一直被用于系統(tǒng)邏輯或時(shí)序控制上,很少有信號(hào)處理方面的應(yīng)用,其原因主要是因?yàn)樵贔PGA中缺乏實(shí)現(xiàn)乘法運(yùn)算的有效結(jié)構(gòu),F(xiàn)在這個(gè)問題得到了解決,使FPGA在數(shù)字信號(hào)處理方面有了長(zhǎng)足的發(fā)展。
圖1
1 分布式運(yùn)算原理
分布式算法(DA)早在1973年就已經(jīng)被Croisier提出來了,但是直到FPGA出現(xiàn)以后,才被廣泛地應(yīng)用在FPGA中計(jì)算乘積和。
一個(gè)線性時(shí)不變網(wǎng)絡(luò)的輸出可以用下式表示:
(范文先生網(wǎng)www.gymyzhishaji.com收集整理)
=c[0]x[0]+c[1]x[1]+…+c[N-1]x[N-1]
假設(shè)系數(shù)c[n]是已知常數(shù),x[n]是變量,在有符號(hào)DA系統(tǒng)中假設(shè)變量x[n]的表達(dá)式如下:
式中,xb[n]表示z[叫的第b位,而x[n]也就是x的第n次采樣。于是,內(nèi)積y可以表示為:
重新分別求和(也就是分布式算法的由來),其結(jié)果如下:
從(1)式可以發(fā)現(xiàn),分布式算法是一種以實(shí)現(xiàn)乘加運(yùn)算為目的的運(yùn)算方法。它與傳統(tǒng)算法實(shí)現(xiàn)乘加運(yùn)算的不同在于執(zhí)行部分積運(yùn)算的先后順序不同。分布式算法在實(shí)現(xiàn)乘加功能時(shí),是通過將各輸入數(shù)據(jù)的每一對(duì)應(yīng)位產(chǎn)生的部分積預(yù)先進(jìn)行相加形成相應(yīng)的部分積,然后再對(duì)各個(gè)部分積累加形成最終結(jié)果的,而傳統(tǒng)算法是等到所有乘積已經(jīng)產(chǎn)生之后再來相加完成乘加運(yùn)算的。與傳統(tǒng)串行算法相比,分布式算法可極大地減少硬件電路的規(guī)模,提高電路的執(zhí)行速度。它的實(shí)現(xiàn)框圖如圖1(虛線為流水線寄存器)所示。
圖2
2 用分布式原理實(shí)現(xiàn)FIR濾波器
2.1 串行方式
當(dāng)系統(tǒng)對(duì)速度的要求不高時(shí),可以采用串行的設(shè)計(jì)方法,即采用一個(gè)DA表、一個(gè)并行累加器和少量的寄存器就可以了。
在用LUT實(shí)現(xiàn)串行分布式算法的時(shí)候,假設(shè)系數(shù)為8位,則DA表的規(guī)模為2N×8位?梢钥吹饺绻轭^系數(shù)N過多,則DA表的規(guī)模將十分龐大。這是因?yàn)長(zhǎng)UT的規(guī)模隨著地址空間的變化(也就是N的增加)而呈指數(shù)增加。例如EPFl0K20包含1152個(gè)LC,而一個(gè)27×7位的表就需要394個(gè)LC。當(dāng)N過大時(shí),一個(gè)FPGA器件就不夠用了。
為了減小規(guī)模,可以利用部分表計(jì)算,然后將結(jié)果相加。假定長(zhǎng)度為L(zhǎng)N的內(nèi)積為:
將和分配到L個(gè)獨(dú)立的N階并行DA的LUT之中結(jié)果如下:
如圖2所示,實(shí)現(xiàn)一個(gè)4N的DA設(shè)計(jì)需要3個(gè)次輔助加法器。表格的規(guī)模從一個(gè)2 N×B位的LUT降到4個(gè)2 N×B的位表。
如果再加上流水線寄存器,由于EPFl0K20每個(gè)LC后面都跟有一個(gè)寄存器,所以并沒有增加電路規(guī)模,而速度卻得到了提高。
2.2 并行方式
采用并行方式的好處是處理速度得到了提高。由于數(shù)據(jù)是并行輸入,所以計(jì)算速度要比串行方式快,但它的代價(jià)是硬件規(guī)模更大了。下面舉出全并行的例子。
設(shè) sum[0]=c[0]x0+[0]+c[1]x0[1]+…+c[N-1]x0[N-1]
sum[B-1]=c[B-1]xB-1[0]+c[1]xB-1[1]+…c[N-1]+xB-1[N-1]
可將(1)式改寫成如下形式
y=sum[0]+sum[1]2 1+sum[2] 2+…+sum[B-1]2 B-1 (2)
利用式(2)可得一種直觀的加法器樹,如圖3所示。
雖然硬件規(guī)模加大了,但是如果把系數(shù)的個(gè)數(shù)限制在4個(gè)或8個(gè),再加上流水線寄存器,這個(gè)代價(jià)還是值得的。而且每張表都是相同的,不用為每個(gè)采樣都設(shè)計(jì)一張表,減小了設(shè)計(jì)量。
DA算法的主要特點(diǎn),是巧妙地利用ROM查找表將固定系數(shù)的MAC運(yùn)算轉(zhuǎn)化為查表操作,其運(yùn)算速度不隨系數(shù)和輸入數(shù)據(jù)位數(shù)的增加而降低,而且相對(duì)直接實(shí)現(xiàn)乘法器而言在硬件規(guī)模上得到了極大的改善。利用ALTERA的FLEXl0K實(shí)現(xiàn)的16階8位系數(shù)的并行FIR濾波器,其時(shí)鐘頻率可以達(dá)到101MHz,而實(shí)現(xiàn)的16階8位系數(shù)的串行FIR濾波器,其時(shí)鐘頻率可以達(dá)到63MHz,每9個(gè)時(shí)鐘周期可完成一次計(jì)算。但是其系數(shù)是傳統(tǒng)二進(jìn)制的,造成了很大的冗余(對(duì)于用逐位相加法實(shí)現(xiàn)的乘法器,當(dāng)系數(shù)有一位為零時(shí)不用相加,零位越多,冗余越大),而且查找表的大小隨著濾波器階數(shù)的增加成指數(shù)增加,雖然可以采用將大查找表分解為小查找表,但是無法從根本上解決這一問題,這些都是DA方法的缺點(diǎn)。后面將對(duì)FIR濾波器實(shí)現(xiàn)給出新的設(shè)計(jì)方法,進(jìn)一步降低邏輯資源的消耗。
3 CSD碼及最優(yōu)化方法
一個(gè)整數(shù)X與另一整數(shù)Y的乘積的二進(jìn)制表示可以寫成:
對(duì)于標(biāo)準(zhǔn)二進(jìn)制,由于sn=0時(shí)的對(duì)應(yīng)項(xiàng)Y2n并不參與累加運(yùn)算,所以可以用另一種表示方法使非零元素的數(shù)量降低,從而使加法器的數(shù)目減少,降低硬件規(guī)模。有符號(hào)數(shù)字量(SD)有三重值{0,-1,+1},如果任意兩個(gè)非零位均不相鄰,即為標(biāo)準(zhǔn)有符號(hào)數(shù)字量(CSD)。
可以證明CSD表示對(duì)給定數(shù)是唯一的并且是最少非零位的。CSD表示相對(duì)于標(biāo)準(zhǔn)二進(jìn)制表示的改進(jìn)在于引入了負(fù)的符號(hào)位,從而降低了非零位個(gè)數(shù),大大降低了邏輯資源的占用(大約平均降低33%的邏輯資源)。
當(dāng)用硬件實(shí)現(xiàn)時(shí),常常限制系數(shù)位數(shù),即每個(gè)系數(shù)與N個(gè)正(負(fù))2的冪次之和近似。標(biāo)準(zhǔn)二進(jìn)制數(shù)在整數(shù)軸上是緊密和均勻分布的,而CSD碼是非均勻分布的,其對(duì)實(shí)系數(shù)的量化誤差比標(biāo)準(zhǔn)二進(jìn)制大,雖然增加N可以減小量化誤差,但是會(huì)增大邏輯資源的消耗;而且CSD表示無法應(yīng)用流水線結(jié)構(gòu),從而降低處理速度。
還可采用優(yōu)化的方法將系數(shù)先拆分成幾個(gè)因子,再實(shí)現(xiàn)具體因子。這就是最優(yōu)化的代碼。例如對(duì)系數(shù)93,93=10111012=1100101CSD。用最優(yōu)化法,系數(shù)93可以表示成93=3·31,每個(gè)因子需要一個(gè)加法器,如圖4所示。
圖4
從圖中可以看出,CSD碼需要三個(gè)加法器
,而最優(yōu)法只需要兩個(gè)加法器;CSD碼的重要缺陷在于每一級(jí)加法都需要初節(jié)點(diǎn)參與,而最優(yōu)表示僅依賴上一級(jí)加法的結(jié)果,因此也就更適合流水線處理。Dempster等人提出了需要1到4個(gè)加法器的所有可能配置表。利用這張表,就可以合成成本在0與4個(gè)加法器之間的所有8位二進(jìn)制整數(shù)。
本文首先給出了一種巧妙利用FPGA的查找表,將乘法轉(zhuǎn)化為查找表運(yùn)算的DA算法,并用ALTERA的FLEXlOK器件分別實(shí)現(xiàn)了一個(gè)8位16階的串行與并行FIR濾波器,系統(tǒng)頻率分別達(dá)到63MHz與101MHz,采樣速度分別達(dá)到7MSPS與101MSPS。而DSP實(shí)現(xiàn)的FIR濾波器只能達(dá)到5MSPS,明顯低于FPGA。用傳統(tǒng)的位串行方法實(shí)現(xiàn)的一個(gè)8階8位FIR濾波器,也只能達(dá)到5MSPS,明顯低于串行式DA方法;接著,針對(duì)系數(shù)的二進(jìn)制表示非零位不是最少(即實(shí)現(xiàn)系數(shù)乘法的加法器不是最少)的問題,介紹了整數(shù)的CSD表示以及最優(yōu)表示,它們可以用較小的代價(jià)和與加法器級(jí)數(shù)無關(guān)的處理速度實(shí)現(xiàn)整數(shù)乘法運(yùn)算,能比DA方法用更少的邏輯資源實(shí)現(xiàn)FIR濾波器。這些算法都不同于傳統(tǒng)的設(shè)計(jì)觀念,為基于FPGA的DSP設(shè)計(jì)提出了新的思路,必將在高速FIR濾波器設(shè)計(jì)、高速FFT設(shè)計(jì)中得到廣泛的應(yīng)用。隨著FPCA集成規(guī)模的不斷提高,許多復(fù)雜的數(shù)學(xué)運(yùn)算已經(jīng)可以用FPCA來實(shí)現(xiàn),利用單片F(xiàn)PGA實(shí)現(xiàn)系統(tǒng)的設(shè)想即將變?yōu)楝F(xiàn)實(shí)。
【基于FPGA實(shí)現(xiàn)FIR濾波器的研究】相關(guān)文章:
基于FPGA流水線分布式算法的FIR濾波器的實(shí)現(xiàn)08-06
FIR數(shù)字濾波器分布式算法的原理及FPGA實(shí)現(xiàn)08-06
基于流水線技術(shù)的并行高效FIR濾波器設(shè)計(jì)08-06
基于FPGA的電子穩(wěn)像平臺(tái)的研究08-06
基于FPGA的核物理實(shí)驗(yàn)定標(biāo)器的設(shè)計(jì)與實(shí)現(xiàn)08-06