第2章 信号基础

2.1 什么是信号

第1章说雷达能从回波里读出目标信息。真实接收机最先拿到的,是一段随时间起伏的电压曲线;距离、速度和检测结果都要从这条曲线继续算出来。

这一章先学会读这条曲线:振幅和频率怎么描述,频谱怎么看,采样会丢掉什么信息,为什么雷达数据常写成复数 I/Q。

信号与正弦波

雷达接收机记录下来的电压曲线,就是一段信号。温度计读数是一个数,但温度随时间变化的记录就是信号。信号的共同点是:值在持续变化,变化本身携带信息。

工程里最常用的信号形式是正弦波。先看最简单的写法:

$$ s(t) = A \sin(2\pi f t) $$

公式里有两个参数:振幅 $A$ 和频率 $f$。其中 $2\pi$ 来自“一个完整周期对应 $2\pi$ 弧度”,所以 $2\pi f t$ 表示 $t$ 秒内走过的总相位。

振幅 $A$ 描述信号的强弱,即波形偏离零点的最大距离,单位通常是伏特(V)。在同样条件下,振幅越大,信号通常越强。

频率 $f$ 描述信号每秒完整起伏的次数,单位是赫兹(Hz)。频率的倒数是周期 $T = 1/f$,表示完成一次完整起伏所需的时间。

图2.1 画出了 2 Hz、5 Hz、10 Hz 三条正弦波。2 Hz 的波形在 1 秒内只完成两次起伏,周期 $T = 0.5$ s,波形舒缓。10 Hz 在同样的 1 秒里挤进 10 次起伏,波形密得多。频率越高,同一段时间里“塞进去”的振动次数越多。

图2.1 三种频率的正弦波
图2.1 三种频率的正弦波

频率与波长

电磁波在空间传播时,相邻两个波峰之间的距离叫波长 $\lambda$,它和频率的关系是:

$$ \lambda = \frac{c}{f} $$

$c \approx 3\times10^8$ m/s 是光速。频率描述每秒振动多少次,波长描述空间中相邻波峰相距多远;频率越高,波长越短。图2.2 画的就是这个空间距离。

图2.2 电磁波波长示意图
图2.2 电磁波波长示意图

波长后面会出现在速度公式里。目标运动时,回波频率会产生轻微偏移,雷达可以用这个频率差测量速度。

复合信号

真实回波很少是单一的正弦波,常会混着多个频率成分。先用三个正弦波看一个简化例子。

图2.3 把 3 Hz(振幅 1.0)、7 Hz(振幅 0.6)、15 Hz(振幅 0.3)三个正弦波画在一起。三条细线是各自的分量,红色粗线是它们相加后的复合信号。复合信号忽高忽低,仅凭肉眼几乎猜不出它由三个频率合成。

图2.3 三个正弦波及其叠加
图2.3 三个正弦波及其叠加

雷达回波可以先按一条随时间变化的信号来读:振幅、频率和波长是最基本的读法。

2.2 时域与频域

同一个信号可以用两种方式描述。

时域是最熟悉的视角:横轴是时间,纵轴是信号的值。心电图、录音波形、示波器屏幕上的曲线,都是时域表示。

频域换了一个角度:横轴是频率,纵轴是该频率成分的强度。它显示信号里有哪些频率,各占多大比重。

选择哪种视角,取决于你想回答什么问题。如果想知道某一刻电压是多少,看时域;如果想知道信号里混着哪些频率,看频域。

时域与频域

下面这张四宫格图把时域和频域的对应关系摆在一起。

图2.4 时域与频域的对应关系
图2.4 时域与频域的对应关系

先看上面一行。左上是三条分量各自的时域波形,颜色不同,节奏不同,这一步还分得清楚。右上是它们相加后的复合信号,杂乱无章。

再看下面一行。左下是单独一个 3 Hz 正弦波的频域:能量主要集中在 3 Hz 附近,高度对应振幅 1.0。实际 FFT 处理有限长数据时,主频率附近可能会有一些扩展,但最显眼的主峰仍在 3 Hz 附近。

右下是复合信号的频域:三根竖线分别立在 3、7、15 Hz 的位置,高度正好是 1.0、0.6、0.3。时域里那条杂乱的波形,到了频域里结构就暴露出来了。

傅里叶变换与FFT

从时域波形计算出频域频谱,用的工具叫傅里叶变换(Fourier Transform)。反过来,从频谱还原时域波形,叫傅里叶逆变换。

傅里叶变换有点像棱镜分光:白光看起来是一种颜色,分开后能看到不同颜色成分;一段波形看起来杂乱,变换后能看到不同频率成分。

实际计算中用的是离散版本,叫快速傅里叶变换(FFT,Fast Fourier Transform)。FFT 输出的是一组复数结果,每个结果对应一个频率格子(bin)。画频谱图时,通常取这些结果的幅度,表示对应频率成分的强度。

FFT 本身只给出“第 0 个、第 1 个、第 2 个……”这样的格子编号。要把编号换成实际频率,需要知道采样率和点数。

假设采样率是 $f_s$,FFT 点数是 $N$。如果没有额外补零,$N$ 个采样点对应的观测时间是:

$$ T_{\text{obs}} = \frac{N}{f_s} $$

比如采样率是 1000 Hz,取了 1000 个点,观测时间就是 1 秒。观测时间越长,频率格子越细;相邻两个 bin 的频率间隔是:

$$ \Delta f = \frac{f_s}{N} $$

在这个例子里,$\Delta f = 1000/1000 = 1$ Hz。第 $k$ 个 bin 对应的频率就是 $k \cdot \Delta f$。FFT 图的横轴需要由采样率和点数解释出来。

图2.5 FFT bin 与频率轴
图2.5 FFT bin 与频率轴

图2.5 把时域采样和频域 bin 的对应关系放在一起。左边是一串采样点,右边是 FFT 后的频率 bin。只要采样率和点数确定,频率轴就能按 $\Delta f=f_s/N$ 标出来。

频率分辨率

前面说的 $\Delta f$ 是频率格子的间隔。读频谱时还会问另一个更实际的问题:两根靠得很近的真实谱线,能不能分开看见?这个能力通常叫频率分辨率,主要由观测时间 $T_{\text{obs}}$ 决定:

$$ \Delta f_{\text{res}} \approx \frac{1}{T_{\text{obs}}} $$

观测 1 秒,大约能分辨 1 Hz 的差异;观测 0.1 秒,大约只能分辨 10 Hz 的差异。观测时间越长,能分辨的频率间距越小。

零填充(zero-padding)可以让 FFT 输出更多点,让 bin 间隔变小,频谱图看起来更细腻;但它不能把两根本来分不开的真实频率分量分开。真实的频率分辨能力主要由观测时间决定。

图2.6 观测时间、零填充与频率分辨率
图2.6 观测时间、零填充与频率分辨率

图2.6 中,前两行观测时间相同,零填充只让频谱曲线更细;第三行观测时间变长后,两个靠近的频率峰才分开。

时域看电压随时间变,频域看频率成分;FFT 是把采样数据换到频域里的常用工具。

2.3 采样定理

前面讨论的正弦波、叠加、频谱,都是在“连续时间”的框架下说的:信号在每一个时刻都有值。但计算机没法处理连续信号。计算机只能存数字,存一个就是一个,存不了无穷多个。

要让计算机处理信号,必须把连续信号变成一串离散的数值——这个过程叫采样

采样率与奈奎斯特频率

采样就是每隔固定时间取一个点,记录下那一刻的信号值,其余时刻全部丢弃。问题是:丢了那么多信息,还能还原出原来的信号吗?

每秒取多少个点,就是采样率 $f_s$,单位 Hz。采样率越高,还原越准确,但存储和传输都有成本。那最低需要多高?

假设信号最高频率是 10 Hz,意味着它每秒最多完成 10 次完整起伏。要捕捉这个起伏,至少要在每个周期内采样两次;采样点不一定恰好落在波峰或波谷,但采样率必须足够高。所以采样率至少要 20 Hz。

采样定理(也叫奈奎斯特-香农定理)把这个要求写成:

$$ f_s > 2 f_{\max} $$

$f_{\max}$ 是信号中包含的最高频率分量。在理想带限条件下,采样率只要严格大于最高频率的两倍,信号就能被完整还原。真实系统还要考虑噪声、滤波器滚降和采样时钟误差,所以工程上通常会留余量。

$f_s / 2$ 这个分界线有个专门的名字,叫奈奎斯特频率。采样率 1000 Hz 对应的奈奎斯特频率就是 500 Hz,意味着这个采样率最多能正确捕捉 500 Hz 以下的信号成分。

图2.7 采样频率与奈奎斯特频率边界
图2.7 采样频率与奈奎斯特频率边界

图2.7 把这个条件画在频率轴上。绿色区域表示在当前采样率下可以无歧义表示的频率范围;超过 $f_s/2$ 的成分会折叠回来,采样后表现出的频率就不再是原来的真实频率。

采样与混叠

图2.8 对一个 10 Hz 正弦波做了三种采样率的实验。灰色线是原始信号,橙色圆点是采样点,蓝色虚线是从采样点重建出来的波形。

图2.8 采样定理与混叠演示
图2.8 采样定理与混叠演示

第一行,40 Hz 采样($f_s = 4f$)。远超奈奎斯特条件,橙色采样点足够密,蓝色重建波形和灰色原始信号几乎完全重合。

第二行,20 Hz 采样($f_s = 2f$)。刚好踩在临界线上。这个例子里,采样点恰好每次都落在正弦波的零点上,重建出来的是一条零线。这是采样起点与信号相位刚好对齐的特殊情况;问题在于 $f_s=2f$ 没有余量,实际系统不能依赖这个边界条件。所以这里按严格条件写成 $f_s>2f_{\max}$,工程上还会继续留余量。

第三行,12 Hz 采样($f_s < 2f$)。采样率低于奈奎斯特要求,发生了混叠(aliasing):看蓝色虚线,重建出来的波形不再是 10 Hz,而变成了一个缓慢起伏的 2 Hz 低频信号。原始的高频信号被“伪装”成了一个不存在的低频信号。

为什么会变成 2 Hz?在这个例子里,信号频率落在 $f_s/2$ 到 $f_s$ 之间,混叠后的表观频率可以用下面的折叠关系计算:

$$ f_{\text{alias}} = f_s - f_{\text{signal}} = 12 - 10 = 2\,\text{Hz} $$

更高的频率会经过多次折叠,但直觉一样:超过奈奎斯特频率的成分会被折回到低频区。

混叠一旦发生就无法挽回。你没办法从已有的采样数据中分辨出那个 2 Hz 到底是“真的 2 Hz 信号”还是“10 Hz 被混叠下来的假象”。这就是为什么采样率必须满足奈奎斯特条件,采样前也常要用滤波器先挡掉过高的频率成分。

ADC采样数据

雷达接收机里有一个关键器件叫模数转换器(ADC,Analog-to-Digital Converter),它的工作就是对回波信号做采样——把连续的模拟电压变成离散的数字序列,交给后续的数字信号处理器。

图2.9 ADC 将连续电压变成数字序列
图2.9 ADC 将连续电压变成数字序列

图2.9 只画 ADC 在本节里的作用:左边是连续变化的模拟电压,中间的 ADC 按固定采样率取点并量化,右边变成一串数字。后面的 FFT、滤波、检测,处理的都是这些数字。

ADC 的采样率直接影响雷达能处理多大带宽的信号。如果等效带宽是 50 MHz,采样率通常至少要在 100 MHz 以上,并配合前端滤波和下变频设计。采样率越高,ADC 往往越贵,功耗也越大,所以工程上要做好平衡。

采样定理给出一条底线:超过奈奎斯特频率的成分会折回低频区,混叠之后很难再分辨来源。

2.4 复数、相位与 I/Q 数据

前面几节讨论的正弦波都是实数信号:振幅可以是正,可以是负,但都是实数。雷达信号处理里还会遇到复数数据。

为什么需要复数?关键在相位。

相位信息

如果把正弦波的“起点”也写进公式,可以写成:

$$ s(t) = A \sin(2\pi f t + \varphi) $$

这里多出来的 $\varphi$ 就是相位。相位描述的是正弦波的“起点”或者说“转到哪里”。两个频率相同、振幅相同的正弦波,如果起点不同,波形就会错开。

图2.10 同频同幅信号的相位差
图2.10 同频同幅信号的相位差

图2.10 中两条曲线频率和振幅都一样,只是起点错开了。相位就是用来记录这种错开的量。

相位在雷达里很重要。后面讲速度测量时会看到,运动目标会让回波的相位随时间旋转,旋转的快慢对应目标的速度。如果只记录振幅,相位信息就丢了,速度也就测不出来。

复数与I/Q分量

复数可以同时记录幅度和相位。一个复数样本可以写成:

$$ s = I + jQ $$

$I$ 和 $Q$ 是两个实数,$j$ 是虚数单位。$I$ 叫同相分量(In-phase),$Q$ 叫正交分量(Quadrature)。两个实数合起来,构成一个复数样本。

这个复数也可以画在平面上。横轴放 $I$,纵轴放 $Q$,样本就对应平面上的一个点,或者从原点指向这个点的一根箭头。

图2.11 I/Q 与复数相位
图2.11 I/Q 与复数相位

图2.11 中,蓝色箭头的长度表示幅度,箭头相对横轴转过的角度表示相位。$I$ 和 $Q$ 是同一个复数样本的两个坐标,不能当成两条互不相干的普通曲线来理解。

先看一个具体数值。假设某个回波采样点的 I/Q 值是 $I=3$、$Q=4$,它对应的复数就是

$$ s = 3 + j4 $$

在雷达数据里,$I=3$、$Q=4$ 描述的是同一个回波采样点。由这两个数可以算出幅度 $A=\sqrt{3^2+4^2}=5$,相位 $\varphi=\operatorname{atan2}(4,3)\approx 53^\circ$。如果只保存幅度 5,$3+j4$ 和 $3-j4$ 都只剩下“强度一样”;保留下 I/Q,后续处理才能区分它们的相位方向。速度估计、相干积累等处理,正是要用到这种相位差别。

从 $I$、$Q$ 算幅度,用的是勾股定理:

$$ A = \sqrt{I^2 + Q^2} $$

相位通常用 $\operatorname{atan2}(Q,I)$ 计算,它能区分不同象限。也可以把同一个样本写成极坐标形式:

$$ s = A e^{j\varphi} $$

$A$ 是幅度,$\varphi$ 是相位。直角坐标形式 $I+jQ$ 和极坐标形式 $Ae^{j\varphi}$ 只是同一个复数的两种写法。

I/Q数据来源

雷达接收机通常会输出 I/Q 两路数据。这里的正交解调可以先只看结果:接收机用两路相差 90° 的参考信号分别处理同一个回波,一路得到 $I$,另一路得到 $Q$。

这一节不展开混频器和低通滤波器的电路细节,只需要记住:I/Q 来自接收机的解调与采样链路,用来保留回波的幅度和相位。

I/Q 是雷达数据里很常见的保存方式。一个复数样本可以同时记幅度和相位,后续距离处理、速度处理和匹配滤波都会用到。

I/Q 样本用两个数保存幅度和相位,相位会在后面的速度处理里派上用场。

2.5 小练习

这一节把本章的几个基本概念放到题目里过一遍:频率与周期、频谱读数、混叠判断、频率分辨率,以及 I/Q 样本的幅度和相位。

频率与周期

一个正弦信号的周期是 $T = 0.02$ s,它的频率是多少?

解析: 由 $f = 1/T$ 可得

$$ f = \frac{1}{0.02} = 50\,\text{Hz} $$

频谱读数

某信号的频谱图上有两根谱线:一根在 100 Hz 处,高度 3 V;另一根在 250 Hz 处,高度 1 V。

(a)写出这个信号的时域表达式(忽略相位)。

(b)如果要对这个信号采样,采样率至少要多高?

解析: 频谱中的每一根谱线都对应一个正弦分量,因此时域信号可以写成

$$ s(t) = 3\sin(2\pi \cdot 100 \cdot t) + 1\sin(2\pi \cdot 250 \cdot t) $$

这个信号的最高频率分量是 250 Hz。根据采样定理,采样率必须满足

$$ f_s > 2f_{\max} = 2 \times 250 = 500\,\text{Hz} $$

因此采样率至少要大于 500 Hz。

混叠判断

你用 800 Hz 的采样率对一个信号采样。信号里包含三个频率分量:100 Hz、300 Hz、500 Hz。哪些分量会发生混叠?混叠后会表现为什么频率?

解析: 800 Hz 采样率对应的奈奎斯特频率为

$$ \frac{f_s}{2} = 400\,\text{Hz} $$

因此,100 Hz 和 300 Hz 都低于 400 Hz,不会发生混叠;500 Hz 高于 400 Hz,会发生混叠。混叠后的表观频率为

$$ f_{\text{alias}} = f_s - f_{\text{signal}} = 800 - 500 = 300\,\text{Hz} $$

也就是说,500 Hz 分量会折叠到 300 Hz 处,并和原本就存在的 300 Hz 分量重合。

频率分辨率

雷达对一个目标连续观测了 0.05 秒。目标回波中可能包含两个多普勒频率分量:1000 Hz 和 1015 Hz。这两个分量在频谱上能分开吗?如果不能,至少需要观测多长时间?

解析: 频率分辨率近似为

$$ \Delta f = \frac{1}{T_{\text{obs}}} $$

代入观测时间 $T_{\text{obs}} = 0.05$ s,得到

$$ \Delta f = \frac{1}{0.05} = 20\,\text{Hz} $$

而两个频率分量只相差 15 Hz,小于 20 Hz,因此在当前观测时间下分不开。

如果要把 15 Hz 的差别分辨出来,就需要满足

$$ T_{\text{obs}} \ge \frac{1}{15} \approx 0.067\,\text{s} $$

也就是至少需要大约 67 ms 的观测时间。

I/Q幅度与相位

某个复数采样点为 $s = 3 + j4$。它的幅度是多少?相位大约是多少?

解析: 幅度为

$$ A = \sqrt{I^2 + Q^2} = \sqrt{3^2 + 4^2} = 5 $$

相位为

$$ \varphi = \operatorname{atan2}(4,3) \approx 53.1^\circ \approx 0.93\,\text{rad} $$

这个样本可以理解成 I/Q 平面上一根长度为 5、相对 I 轴转过约 $53.1^\circ$ 的箭头。