## 基于 FPGA 的数字化正交解调接收机最优设计

邱兆坤 马 云 王 伟 陈曾平 (国防科技大学 ATR 国家重点实验室 长沙 410073)

**摘 要** 结合抽取滤波器的多项滤波结构,在一定条件下,推导出了一种含抽取正交解调接收机最优结构设计方法。 在 FPGA 乘法器资源相同的条件下,采用最优结构设计的接收机内部 FIR 滤波器阶数比直接实现形式高了近 4 倍。 最后给出了设计实例。

关键词 正交解调, FPGA, 多项滤波

中图分类号: TN957.5, TN911.72 文献标识码: A 文章编号: 1009-5896(2006)01-0041-04

# Optimization Design of Digital Quadrature Demodulation Receiver Based on FPGA

Qiu Zhao-kun Ma Yun Wang Wei Chen Zeng-ping

(ATR Lab, National Univ. of Defense Technology, Changsha 410073, China)

**Abstract** Under certain conditions, combining the polyphase filtering structure of decimation filter, put forward an optimum design method of quadrature demodulation receiver, which owns decimation structure. With the same number of multipliers in FPGA, the order of FIR filter in receiver with above optimum structure is nearly 4 times than it implemented in direct way. Finally the design instance is given.

Key words Quadrature demodulation, FPGA, Polyphase filtering

#### 1 引言

正交检波可以保留回波信号的幅度和相位信息,在雷 达、声纳和通信等领域都有着广泛的应用。模拟正交接收机 将输入的中频带通信号分别与正交的两路本振信号相乘,然 后通过低通滤波滤除倍频分量,得到I、Q两路正交基带信号。 其本振、混频、低通滤波均采用模拟技术实现,数字化在I、 Q基带信号生成之后进行。由于模拟器件的一致性和稳定性 都较差,因此,所获得的两路正交通道很难在大的动态范围 内保持高度的幅度一致性和相位正交性,两路输出信号的相 位误差一般只能做到 2°~3°,幅度误差约为 0.5 dB<sup>[1]</sup>。近年来, 随着高性能A/D转换器件、大规模FPGA器件及高速DSP芯片 的不断涌现,直接中频采样及数字相干检波技术得到了广泛 的应用。其工作原理与模拟接收机一样,只是A/D转换是在 中频完成,本振、混频、低通滤波均采用数字技术实现,如 图1所示。数字技术的应用很好地解决了模拟接收机通道间 幅相不平衡问题,使得I、Q通道在幅度一致性和相位正交性 上具有更高精度。 在直接中频数字化接收机中,采样频率 一般都远大于信号带宽 B 的 2 倍。但根据Niquist准则,对频 率范围为[-B/2,B/2]的基带信号采样,采样频率只需大于B 即可。因此,可以对图1所示结构中低通滤波输出的信号进 行抽取,如图2所示。抽取因子D的选择要根据采样频率、 信号带宽及后续信号处理的能力来定。



在图 2 的结构中,数字滤波有两种实现形式,即FIR滤 波器和IIR滤波器,由于FIR滤波器相对于IIR滤波器有很多优 点,如线性相位、稳定性等,且设计相对成熟,因此多采用 FIR滤波器实现滤波<sup>[2,3]</sup>。随着FPGA技术的不断发展,特别是 内部集成硬件乘法器后,由FPGA实现FIR滤波器变得更加容 易。因此,FPGA芯片可以很好地应用于数字化正交接收机 中。但现有FPGA器件内部所集成的乘法器资源都 很有限,采用直接形式实现的 FIR 滤波器阶数很低,一般难 以满足系统指标的要求。因此,如何在乘法器资源有限的情 况下设计高性能的 FIR 滤波器将是采用 FPGA 技术设计数字 化接收机的关键所在。本文将针对这一问题进行深入研究。 其中第2节结合抽取滤波器的多项滤波结构形式给出了含抽 取正交解调接收机的优化设计;第3节分析了中频信号频率  $f_0$ 、采样频率  $f_s$ 和抽取因子 D 三者的关系,在一定的条件 下,给出了含抽取正交解调接收机的最优结构设计;第4节 介绍了采用这一结构的设计实例及其应用;最后总结全文。

#### 2 含抽取正交解调的多项滤波结构

含抽取正交解调接收机在图 2 所示的直接实现形式中, 低通滤波在抽取之前完成,这无疑提高了对处理速度的要求。设低通滤波器 h(n) 的阶数为 N,为了进行实时处理, 则要求在每一个采样间隔 T<sub>s</sub> 内完成 N 次乘加运算,每秒钟 需完成的乘加运算为

$$S_1 = Nf_s$$
 MPS (乘加次数/秒) (1)

设 FPGA 内部乘法器有  $N_M$  个,用这有限个乘法器实现 I、Q 通道的混频和低通滤波,则可实现的 FIR 滤波器最高阶数为

$$N_1 = \left\lfloor \frac{N_M}{2} \right\rfloor - 1 \tag{2}$$

式中[x]表示下取整。这种直接形式由 FPGA 实现时,为了 能够实时处理,则 FPGA 的工作频率不能低于采样频率 f<sub>s</sub>。 可以看出,直接实现形式不仅不能降低处理速度,也不能节 省硬件乘法器的开销。

抽取滤波的一种高效实现形式是采用多项滤波结构进行设计<sup>[2,3]</sup>,实现结构如图 3 所示。其中  $e_0(n) \sim e_{D-1}(n) \gg h(n)$ 的多项分支,系数可由下式获得

$$e_k(n) = h(nD + k) \tag{3}$$

式中k = 0,1,...,D-1,在多项滤波结构中,每一个分支滤波器 $e_k(n)$ 的阶数为N/D,且在D倍抽取之后实现,数据输入速率也降低了D倍。因此,抽取滤波过程每秒钟需完成的乘加运算为

$$S_2 = N f_s / D^2 = S_1 / D^2$$
 (4)

与直接实现形式相比,速度降为1/D<sup>2</sup>,这对由软件编程实现 滤波是非常有利的。将图2中的抽取和滤波部分采用多项滤 波结构实现,得到图4所示的形式。

采用图 4 的结构利用 FPGA 设计数字化正交接收机时, 若 FIR 滤波器在 FPGA 内部由 *D* 个多项分支并行实现,则相 同数目的乘法器可实现的 FIR 滤波器阶数和直接实现形式相 同,但 FPGA 工作频率可降为直接实现形式的 1/*D*。这在采 样频率 *f*<sub>s</sub> 很高时,显然是很有意义的。



多项滤波结构

在图 4 的结构中, 混频后的序列是进行抽取后再输入到 每一个多项分支中去, 因此在同一个采样周期 *T<sub>s</sub>* 内只有一个 分支滤波器进行运算。这样在采样频率 *f<sub>s</sub>* 不是很高时, 硬件 处理速度完全可以满足要求, 而 FPGA 内部乘法器资源有限 的情况下, 可将一组乘法器重复使用, 通过系数配置的方式 实现不同的多项分支滤波器。这对在乘法器资源有限的情况 下实现高性能的 FIR 滤波器是非常有意义的。 *N<sub>M</sub>* 个乘法器 在图 4 的结构中, 乘法器复用时可实现的 FIR 滤波器最高阶 数可达

$$N_2 = D\left(\left\lfloor \frac{N_M}{2} \right\rfloor - 1\right) = D \cdot N_1 \tag{5}$$

是直接实现形式的 D 倍。或者说实现相同阶数 FIR 滤波器所 需的乘法器仅为直接型结构的 1/D。乘法器复用在 FPGA 内 部实现是很方便的,只需在每一个时钟周期的上升沿通过一 个选通器将分支滤波器的系数进行重加载即可。

由于乘法器资源的复用,此时 FPGA 的工作频率必须是 多项分支并行实现时的 D 倍,即 FPGA 的工作频率需等于采 样频率,这和直接实现时的工作频率相同。

#### 3 含抽取正交解调的最优结构

在图 4 所示的结构中, 混频后的两路信号需经过完全 相同的两个低通滤波器得到基带 I、Q 信号,即必须实现复 滤波。倘若能将混频运算移到抽取滤波之后进行,则可避免 复滤波, I、Q 两通道只需一个抽取滤波器即可实现,这样 乘法器资源可节约一半。下面分析采样频率 f<sub>s</sub>,本振信号频 率 f<sub>0</sub>及抽取因子 D 的关系,从中寻求一种将混频乘法运算 移到抽取滤波后的有效途径。

设本振初始相位为零,数字化的本振信号记为  
$$L(n) = e^{j(2\pi m)}$$

式中

$$=f_0/f_s \tag{7}$$

(6)

为本振信号频率  $f_0$ 和采样频率  $f_s$ 之比。若r可表示为 r = p/q (8)

其中 p,q 为正整数, 且 p,q 互质, 即 r 为有理数, 则 L(n) 为

(10)

周期信号:

$$L(n) = L(n + kq)$$
 (9)  
式中 k 为整数。若抽取因子恰好满足

式中c=1,2,...,则混频运算相当于对每一个多项分支滤波器的输入信号乘以一个常数。I 通道每一个多项分支将分别乘以 Re[<math>L(0)],Re[L(1)],...,Re[L(D-1)];Q 通道每一个多项分支将分别乘以 Im[L(0)],Im[L(1)],...,Im[L(D-1)],其中 Re[x]表示x的实部, Im[x]表示x的虚部。根据线性时不变系统性质,滤波前乘以一个常数等价于滤波之后乘以一个常数,因此可将混频运算移到抽取滤波器后进行。由此得到一种最优的实现形式,如图 5 所示。

D = cq



### 图 5 正交接收机的最优结构

与图 4 所示的结构相比,这种结构除了利用了抽取滤波的多项滤波结构外,还避免了复滤波,因此在乘法器资源有限的情况下,可以实现更高阶数的 FIR 滤波器。若采样频率 *f<sub>s</sub>* 很高,多项分支并行设计,则可实现的 FIR 滤波器最高阶数为

$$N_3 = N_M - 2D \tag{11}$$

此时 FPGA 只需工作在  $f_s/D$  的频率上。若 FPGA 工作频率 可以满足速度要求,将乘法器资源复用,则可实现的 FIR 滤 波器最高阶数为

$$N_{\rm opt} = D(N_M - 2) = 2D \cdot N_1$$
 (12)

与直接实现形式相比提高了 2D 倍。或者说,实现相同阶数 FIR 滤波器乘法器占用仅为直接形式的 1/(2D)。此时 FPGA 的工作频率为 f<sub>s</sub> 和直接实现形式相同。因此,在乘法器资源一定的情况下,从如何实现更高性能的 FIR 滤波器角度考虑,图 5 所示的结构是最优结构。

下面对3种实现结构下FPGA的工作频率和所能实现的 FIR 滤波器最高阶数做一总结。

#### 4 设计实例

以上对采用FPGA技术实现数字化正交解调接收机的各 种结构做了分析,得出了一定条件下的最优实现结构。下面 给出工程应用中采用这一结构设计接收机的实例。某雷达中 频信号带宽 B = 5 MHz,中心频率  $f_0 = 30$  MHz。采样频率取 为  $f_s = 40$  MHz,这样的频率满足带通信号采样定理<sup>[4]</sup>。为了 减轻后续信号处理的负担,进行 D=4 的抽取。设计中采用 Xilinx公司Virtex-II系列的XC2V-1000 FPGA芯片<sup>[5]</sup>,该芯片 的最高工作频率可达400MHz,对本系统来说完全满足速度 要求。但其内部乘法器仅有40个,采用直接实现形式时FIR 滤波器最多可以设计 19 阶,而系统指标要求FIR滤波器需达 64 阶才能满足要求。显然,直接实现形式不能满足设计指标。 由上文分析知,本系统中,信号中心频率 fo,采样频率 f。和 抽取因子 D 分别满足式(7)和式(10),因此可以采用最优结构 设计,这样可实现的FIR滤波器最高阶数为 152 阶,完全满 足系统设计指标要求。实际上,在本系统中,采用多项滤波 结构实现的FIR滤波器也可达到76阶,能满足系统指标。但 I,Q通道分别进行滤波会引入一定的截断误差,对通道间幅 相一致性会带来不利影响。而图 5 所示的最优结构可避免这 一截断误差的影响。且此时FPGA的工作频率为40MHz,这 一频率对XC2V-1000芯片来说不算高。

值得注意的一点是,  $f_0 = 30$ MHz,  $f_s = 40$ MHz, 本振 初始相位取为零,则数字本振信号即为 0,1,-1 等特殊值, 有

 $\operatorname{Re}[L(0)], \operatorname{Re}[L(1)], \operatorname{Re}[L(2)], \operatorname{Re}[L(3)] = 1, 0, -1, 0$  (13)

Im[L(0)], Im[L(1)], Im[L(2)], Im[L(3)] = 0, -1, 0, 1 (14)
这样,图5所示结构中每一个分支滤波器后面的乘法运算就
可省去,而由非常简单的逻辑电路实现。在这种情况下,所
实现的FIR滤波器的阶数提高为 DN<sub>M</sub>。

本文设计的接收机已成功应用于某雷达系统中。设计是 以 高 可 靠 性 的 CPCI(Compact Peripheral Component Interconnect)构架<sup>[6]</sup>工控机为平台,内插4块解调板同时工作, 每一块解调板处理两路信号,共可处理8路中频信号。应用

表1 各种实现结构的对比

|              | 直接结构                                              | 多项滤波结构                                              | 多项滤波结构*                                                         | 最优结构          | 最优结构*         |
|--------------|---------------------------------------------------|-----------------------------------------------------|-----------------------------------------------------------------|---------------|---------------|
| 所实现 FIR 最高阶数 | $\left\lfloor \frac{N_{_M}}{2} \right\rfloor - 1$ | $\left\lfloor \frac{N_{_{M}}}{2} \right\rfloor - 1$ | $D\left(\left\lfloor \frac{N_{_M}}{2} \right\rfloor - 1\right)$ | $N_{_M} - 2D$ | $D(N_{_M}-2)$ |
| FPGA 工作频率    | $f_{s}$                                           | $f_s/D$                                             | $f_s$                                                           | $f_s/D$       | $f_{s}$       |

\*乘法器资源复用的情况

软件以 Windows2000 操作系统为平台 , 主要完成对接收机 工作参数的加载、更新及对解调结果的显示和存储等工作。 实际电路如图 6 所示。



图 6 基于最优结构的设计实例

在设计中,为了获得大的动态范围,中频采样选用 14 位A/D芯片。解调结果通过CPCI总线保存到磁盘阵列中,供 事后分析处理。为了保证解调结果的实时不丢失存储,总线 控制芯片选用了AMCC公司的S5933 控制器<sup>[7]</sup>。这款总线控 制芯片工作在FIFO方式下,支持PCI(Peripheral Component Interconnect)总线的猝发传输方式,实测最快速度达到了 96MB/s(兆字节/秒),满足系统存储速度的要求。

### 5 结束语

本文结合实际工程应用,针对如何在乘法器资源有限的 情况下设计高性能的 FIR 滤波器这一具体问题进行了深入研 究。分析得知当信号中心频率  $f_0$ 、采样频率  $f_s$ 和抽取因子 D满足  $f_0/f_s = p/q$ , D = cq时,可以得到一种最优设计结构。 在 FPGA 内嵌乘法器数目一定的情况下,采用最优结构设计的 FIR 滤波器最高阶数为直接实现形式的 2D 倍。采用这一结构设计的数字化正交解调接收机已成功应用于某雷达系统。

#### 参考文献

- HO K C, CHAN Y T, INKOL R. A digital quadrature demodulation system. *IEEE Trans. on AES*, 1996: 1218 – 1227.
- [2] 杨小牛等.软件无线电原理与应用.北京:电子工业出版社, 2001,第2章.
- [3] 孔宗德. 多抽样率信号处理. 北京:清华大学出版社, 1996, 第4章.
- [4] 杨福生,戴先中.带通信号的采样定理.信号处理,1986,2(1):
   58-61.
- [5] Xilinx 公司 Data Sheet, 2003, http://www.xilinx.com.
- [6] Shanley T, Anderson D著, 刘晖等译. PCI系统结构(第四版). 北 京:电子工业出版, 2000,第 28章.
- [7] S5933 PCI Controller Data Book, AMCC 公司, 1997.
- 邱兆坤: 男,1977年生,博士生,研究方向为目标识别、数据采 集及数字化接收机技术.
- 马云: 男,1976年生,博士生,研究方向为自适应光学信号处 理、数字化接收机技术.
- 王 伟: 男,1970年生,博士,副教授,研究方向为电子对抗、 雷达信号处理等.
- 陈曾平: 男,1968年生,教授,博士生导师,感兴趣研究方向为 目标识别、自适应信号处理等.