上海交通大学学报, 2024, 58(4): 481-491 doi: 10.16183/j.cnki.jsjtu.2022.426

电子信息与电气工程

基于多流ConvNeXt网络和马氏距离度量的未知信号增量识别

肖易寒1, 刘序斌1, 于祥祯2, 赵忠凯,1

1.哈尔滨工程大学 先进船舶通信与信息技术工业和信息化部重点实验室,哈尔滨 150000

2.上海无线电设备研究所,上海 201100

Unknown Signal Incremental Recognition Based on Multi-Flow ConvNeXt Network and Mahalanobis Distance Metric

XIAO Yihan1, LIU Xubin1, YU Xiangzhen2, ZHAO Zhongkai,1

1. Key Laboratory of Advanced Marine Communication and Information Technology of the Ministry of Industry and Information Technology, Harbin Engineering University, Harbin 150000, China

2. Shanghai Radio Equipment Research Institute, Shanghai 201100, China

通讯作者: 赵忠凯,副教授;E-mail:zhaozhongkai@hrbeu.edu.cn.

责任编辑: 王一凡

收稿日期: 2022-10-28   修回日期: 2022-12-24   接受日期: 2022-12-30  

基金资助: 国防科技基础加强计划(2019-JCJQ-ZD-067-00)

Received: 2022-10-28   Revised: 2022-12-24   Accepted: 2022-12-30  

作者简介 About authors

肖易寒(1980-),博士,从事基于机器学习的雷达信号识别研究.

摘要

为解决现阶段基于深度学习网络的信号识别技术无法实现未知信号增量识别的问题,提出了基于多流ConvNeXt网络和马氏距离度量(MDM)相结合的未知信号增量识别方法.首先,利用改进的多流ConvNeXt网络提取信号的属性特征;其次,使用马氏距离度量判决方法进行未知信号检测进而实现已知信号和未知信号的二分类;最后,该方法根据不断增加的未知信号对模型的参数进行自动更新,使模型具备了自我进化的能力,进而可以识别出不断增加的新的未知信号类别,实现对未知信号的增量识别.仿真实验结果表明,该方法对未知信号的平均识别率达到97%以上.

关键词: 未知信号; 多流ConvNeXt网络; 马氏距离度量; 增量识别

Abstract

In order to solve the problem that the signal recognition technology based on deep learning network cannot currently realize the incremental recognition of unknown signals, a method for incremental recognition of such unknown signals, based on the combination of the multi-flow ConvNeXt network and Mahalanobis distance metric (MDM) is proposed. First, the improved multi-flow ConvNeXt network is used to extract the attribute features of signals. Then, the MDM judgement method is used to detect unknown signals, and apply the binary classification for known and unknown signals. Finally, the parameters of the model is automatically updated according to the increasing number of unknown signals. In such way, the model has the ability of self-evolution, and it has the ability to recognize incrementally more types of unknown signals.The simulation results show that the average recognition rate of unknown signals is more than 97%.

Keywords: unknown signal; multi-flow ConvNeXt network; Mahalanobis distance metric; incremental recognition

PDF (1969KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

肖易寒, 刘序斌, 于祥祯, 赵忠凯. 基于多流ConvNeXt网络和马氏距离度量的未知信号增量识别[J]. 上海交通大学学报, 2024, 58(4): 481-491 doi:10.16183/j.cnki.jsjtu.2022.426

XIAO Yihan, LIU Xubin, YU Xiangzhen, ZHAO Zhongkai. Unknown Signal Incremental Recognition Based on Multi-Flow ConvNeXt Network and Mahalanobis Distance Metric[J]. Journal of Shanghai Jiaotong University, 2024, 58(4): 481-491 doi:10.16183/j.cnki.jsjtu.2022.426

在现代化电子战场中,对截获到的目标雷达调制信号实现精确识别,是雷达侦察技术有效实施的关键一环,具有十分重要的作用.随着深度学习理论的快速发展,其在人脸识别[1]、目标检测[2]和自然语言处理[3]领域取得重大突破,用深度学习的方法解决调制信号识别问题也成为一个研究热点.文献[4]中提出一种首先使用残差网络进行去噪,然后基于Inception-v4网络进行特征提取的调制信号识别方法,在 -10 dB 信噪比下,识别率仍然可以达到90%以上.文献[5]中提出基于双通道卷积神经网络的雷达信号脉内调制方式识别方法,在信噪比为 -10 dB 时,整体识别准确率能达到95%以上.文献[6]中利用迁移学习和特征融合的识别方法实现雷达调制信号的准确识别.文献[7]中提出双卷积神经网络串联的网络结构,当雷达信号调制参数不固定时,依然可以进行分类识别,信噪比为0 dB时,识别率在95%以上.文献[8]中利用卷积神经网络和长短时记忆网络分别提取信号的空间特征与时间特征,并进行特征融合与分类,识别率达到91%.文献[9]中将信号的高阶积累量作为深度置信网络的输入,实现了4ASK、BPSK、QPSK、2FSK和4FSK共5种信号的分类,信噪比为0 dB时,识别率能够达到95%以上.文献[10]中在卷积神经网络中引入了信号失真校正模块,有效提高了信号识别率.文献[11]中利用稀疏自编码器进行无监督学习,然后通过softmax分类器实现对信号的分类.

随着深度学习的发展,逐渐应用于未知信号类别(未经过网络训练的信号类别)识别领域,未知信号的有效识别在军事领域和民用领域都发挥着重要作用.在战场环境中,对敌方的通信系统进行监听和干扰需要识别出敌方信号的调制方式,若敌方采用新的调制方式的信号进行通信时,我方需要识别出该未知调制类型的信号,才能进一步分析和估计该信号的各个参数,从而采取相应的侦察和反侦察措施.在民用通信中,通信管理部门需要完成识别信号、识别干扰以及监测频谱等任务,不仅需要监视合法电台是否符合自身的标准工作参数,更重要的是识别非法电台的源头.文献[12]中提出一种基于引入中心损失函数、交叉熵损失函数以及重构损失函数共3种损失函数的SR2CNN网络实现未知信号识别.文献[13]中利用开集识别分类重构学习网络(Classification-Reconstruction learning for Open-Set Recognition, CROSR)对提取到的特征进行了重构,保留了能够辨别出已知类别和未知类别的有用信息,使经过训练的网络可以从输入数据中识别出未知类别.文献[14]中提出一种改进的无监督异常值检测自编码器来进行未知信号检测.文献[15]中通过改变已知信号类别的类属性和未知信号类别的类属性,用二元分类器实现未知信号的识别.然而,现阶段大部分基于深度学习的未知信号识别方法只考虑到如何对未知信号进行识别,却没有兼顾到对已知信号的识别,以及无法判断检测出的未知信号有几种类别.

因此,本文提出基于多流ConvNeXt网络[16]和马氏距离度量(MDM)[17]结合(ConvNeXt-MDM)的未知信号增量识别方法.首先,为了使已知信号的属性特征与未知信号的属性特征有较大的差异性以及不同类别信号属性特征的区分度更加显著,采用多流ConvNeXt网络对信号进行特征提取.其次,针对闭集识别网络无法正确识别未知信号类别的问题,引入基于异常值检测思想的距离度量判决方法,通过对提取的属性特征进行距离度量判决将信号分成已知信号和未知信号两大类别.最后,针对现有的大部分未知信号识别模型只检测出了未知信号,却无法判断检测出未知信号有几种类别的问题,引入增量学习的思想,使识别模型能够根据增加的新的未知类别信号更新模型参数,使识别模型具备自我进化的能力,实现未知信号类型的增量识别.

在实际应用方面,面对日益复杂的电磁环境,对设备的小型化、智能化提出了更高的要求.本文使用的识别网络具有深度可分离卷积结构,降低了网络参数量,能够部署在更加小型化的识别设备上;并且,本文提出的识别方法能够实现未知信号的增量识别,避免了识别设备重复训练历史数据,提高了学习新数据的时效性,更适合部署在移动设备上以适应复杂的电磁环境.

1 识别算法

1.1 未知信号增量识别算法整体结构

本文提出的未知信号增量识别方法整体结构如图1所示,分为4个模块,分别是“信号属性特征提取”模块、“已知信号与未知信号二分类”模块、“已知信号识别”模块和“未知信号增量识别”模块.

图1

图1   本文方法结构框图

Fig.1   Structure block of the method proposed


首先,使用多流ConvNeXt网络提取信号的属性特征;其次通过引入异常值检测思想的马氏距离度量判决方法对属性特征进行距离度量判决,实现已知信号和未知信号的二分类;再次,当信号被判决为未知信号时,将已知信号发送到只由全连接层组成的闭集识别网络中进行闭集识别;最后,当信号被判决为未知信号时,则通过距离度量判决方法对检测出的未知信号进行增量识别.

1.2 改进的多流ConvNeXt网络

ConvNeXt网络是Facebook人工智能研究院 (Facebook AI Research,FAIR)在2022年提出的一种纯卷积神经网络.ConvNeXt以ResNet[18]网络为基础,借鉴了Swim-Transform[19]网络及Transformer架构中的各种先进方法,同时也借鉴了其他一些优化神经网络的先进思想,在训练方法、宏观设计和微观设计等方面进行改进.其中具体包括引入深度可分离卷积(Depthwise Separable Convolution)来提升模型的计算速度, 使用逆瓶颈层结构(Inverted Bottleneck)有效避免了信息流失,用层标准化(Layer Normalization, LN)层替换批标准化(Batch Normalization, BN)层来解决BN在样本量过少的时候归一化统计量偏差过大的问题并使用更少的归一化层,使用GELU激活函数代替ReLU激活函数并减少激活函数的数量、使用AdamW优化器、改变区块(block)比例以及改变卷积核尺寸大小及通道数目等.ConvNeXt网络集上述设计思想于一体,在多个计算机视觉基准上有效提高了准确性和可扩展性,达到了目前纯卷积模型的极限.

已知信号与未知信号的属性特征有较大差别时,可以提高二分类的准确率.尺寸不同的卷积核能够提取到的感受野的特征不同,从而丰富网络提取的特征类型,使网络提取到的属性特征类间距离更大,类内距离更小,进而使不同类别信号属性特征的区分度更加显著,有利于提高信号的识别率.更重要的是,随着网络宽度的增加,网络对特征局部信息变化的适应能力也随之增强,使已知信号的属性特征与未知信号的属性特征之间有了较大的差异性.因此用多尺度卷积并行处理的方式改进ConvNeXt网络,形成多流ConvNeXt网络,网络结构如图2所示.图中:h表示输入数据尺寸的高度;w表示输入数据尺寸的宽度;dim表示维度;Conv2d表示二维卷积操作;s表示卷积操作的步长;p表示卷积操作填充的大小;Layer Scale表示对数据进行缩放;Drop Path表示正则化;Concat表示将不同卷积操作的输出进行合并;Downsample表示下采样操作;Linear表示全连接层.通过多流ConvNeXt网络基本单元进行多次的特征提取后,再对提取的特征进行下采样操作以此降低特征尺寸和调节特征通道数,最终得到理想的特征.

图2

图2   多流ConvNeXt网络结构

Fig.2   Structure of multi-flow ConvNeXt network


从多流ConvNeXt网络结构可以看出,网络全局平均池化层(Global Average Pooling)的输出经过全连接层获得256维的属性特征.通过第1次距离度量判决实现信号的二分类后,当信号被判决为未知信号时,将该信号的256维属性特征进行第2次距离度量判决;当信号被判决为已知信号时,则将该信号的256维属性特征直接送入下一层的全连接层进行闭集识别.

1.3 距离度量算法

在做异常点检测时一般需要估算不同样本之间的相似性度量,通常采用的方法是计算样本间的距离,距离度量在图像分类[20]、行人再识别[21]、聚类[22]等方面都有着很好的应用,已经成为深度学习领域的研究热点之一.在距离度量方面,马氏距离度量常用于计算两种样本之间的相似度,马氏距离修正了欧氏距离中各个维度尺度不一致的问题.更重要的是,马氏距离能够考虑到数据维度之间的联系,能够从属性特征中提取到更丰富的信息,因此采取马氏距离进行距离度量判决.

使用距离度量算法识别未知信号需要进行两次距离度量判决.第1次距离度量判决针对闭集识别网络无法正确识别未知信号类别的问题,引入异常值检测的思想,通过对提取的属性特征进行判决将输入的信号分成已知信号和未知信号两大类别,然后根据已知信号和未知信号的特点采取针对性的识别方法,提高了识别模型的灵活性.

在第1次距离度量判决中首先要计算出输入信号τ的属性特征F(τ)与每类已知类型信号属性特征中心的马氏距离:

d(F(τ), Sk)=(F(τ)-Sk)TΦk-1(F(τ)-Sk)

式中:k=1, 2, …, M,M为已知信号的类别数量;Φk为第k类已知信号的协方差矩阵;Sk为第k类信号的属性特征中心,

Sk=i=1nδ(yi=k)F(xi)i=1nδ(yi=k)

n为全部训练样本的数量;δ为单位脉冲函数;yi为第i个样本的标签;F(xi)为第i个样本的属性特征.然后从M个马氏距离中选择出最小的距离d1=min(d(F(τ), Sk)),若d1的值小于事先设置好的距离度量阈值则将输入的信号判决为已知信号,否则将其判决为未知信号.

为了使模型能够识别出不断增加的新的未知信号类别,在第2次距离度量判决中引入了增量学习的思想,不断更新属性特征中心以此来实现未知信号的增量识别.例如,当输入的信号被判决为未知信号时,若在这之前已经识别出两种未知信号类型,接下来则需要计算出该输入信号的属性特征与两种未知信号属性特征中心的距离,并取出两个距离中最小的一个距离,若该距离大于事先设置好的距离度量阈值,则将其判决为第3种未知信号.

两次距离度量判决成功的关键在于两个距离度量阈值的设置,根据3σ准则,将第1次距离度量阈值设置为

η1=3α1p

式中:p为输入样本的个数;α1为第1次距离度量阈值系数,其最优值根据下文的实验仿真结果确定.经过第1次距离度量检测出未知信号后,第2次距离度量不再是计算测试信号的属性特征与M种已知信号的属性中心之间的距离d(F(τ), Sk),而是需要计算F(τ)与未知信号的属性特征中心之间的距离d(F(τ), Su),Su为第u类未知信号的属性特征中心.为了获取第2次距离度量阈值,需要先计算出F(τ)与每类已知类型信号属性特征中心Sk的平均距离dave,根据以往的距离判决经验,在前文中所提到的d1dave对第2次距离度量阈值的设置有十分重要的参考意义并且应该尽量使第2次距离度量阈值大于d1但不能大于dave.根据仿真实验结果确定,当第2次距离度量阈值设置在d1dave之间时,对检测出的未知信号进行增量识别有着很高的正确率.因此将第2次距离度量阈值设置为

η2=d1+α2dave1+α2
${{d}_{\text{ave}}}=\frac{1}{M}\overset{M}{\mathop{\underset{k=1}{\mathop \sum }\,}}\,d(F(\tau ),{{S}_{k}})$

式中:α2为第2次距离度量阈值系数.通过调节α2的值来调整距离度量阈值η2,但始终使η2介于d1dave之间.

1.4 识别算法流程

本文提出的未知信号增量识别算法的详细结构和具体流程分别如图3图4所示.首先使用多流ConvNeXt网络提取调制信号属性特征,其次通过第1次马氏距离度量检测出未知信号,最后通过第2次马氏距离度量对检测出的未知信号进行增量识别.

图3

图3   基于多流ConvNeXt-MDM的未知信号识别模型

Fig.3   Unknown signal recognition model based on multi-flow ConvNeXt-MDM


图4

图4   未知信号识别流程

Fig.4   Process of unknown signal identification


算法详细流程如下.

步骤1 使用多流ConvNeXt网络对输入的调制信号τ进行特征提取,得到属性特征F(τ).

步骤2 分别计算F(τ)与M种已知信号属性特征中心Sk的马氏距离d(F(τ), Sk),并从M个马氏距离中选择出最小的一个d1.

步骤3 进行第1次马氏距离度量判决,若d1大于判决阈值η1,则将输入信号τ判定为未知信号,否则将输入信号τ判定为已知信号.

步骤4 当输入信号τ被判定为已知信号时,将输入信号τ输入训练好的网络中输出对应的已知信号类别.当输入信号τ被判定为未知信号时,进行第2次马氏距离度量识别,分别计算F(τ)与u种未知信号属性特征中心Su的马氏距离d(F(τ), Su),并从u个马氏距离中选择出最小的一个d2.

步骤5d2小于判决阈值η2,则将输入信号τ判定为在测试阶段已被检测到的未知信号,并将输入信号τ识别为yτ=arg minu(d(F(τ), Su)),否则将输入信号τ识别为新的未知信号yτ=Ru+1,并将Ru更新为Ru=Ru+1.其中Ru为已经被检测出的未知信号类别的种类数量.

在未知信号增量识别的过程中,若第1次从输入信号中检测出未知信号,则不需要对该未知信号进行增量识别,可以直接将其判决成未知信号1,并将其属性特征作为未知信号1的属性特征中心.直到第2次从输入信号中检测出未知信号,此时需要对该信号进行增量识别,首先对该信号进行第2次距离度量判决,即计算该信号的属性特征与未知信号1的属性特征中心之间的距离.若该距离小于第2次距离度量阈值,则将该信号判决为未知信号1并更新未知信号1的属性特征中心;若该距离大于第2次距离度量阈值,则将该未知信号判决为新的未知信号,即未知信号2;以此类推,直到识别出所有的未知信号类别.

2 仿真结果与分析

2.1 实验条件和数据处理

实验软硬件环境配置如表1所示.

表1   实验软硬件环境

Tab.1  Software and hardware environment of experiment

配置型号参数
处理器及内存Intel(R) Xeon(R)
Silver 4110
2.1 GHz
32 GB内存
操作系统Ubuntu 18.04.164位
显卡NVIDIA Tesla T415 GB显存
语言Python3.7.9
框架Pytorch1.7.1
运算平台CUDA10.1

新窗口打开| 下载CSV


本文所用的数据集是来自于文献[23]中公开的RML2016.10a数据集, 该数据集包含8PSK、AM-DSB、AM-SSB、BPSK、CPFSK、GFSK、PAM4、QAM16、QAM64、QPSK、WBFM共11种调制信号,每种调制信号有 20 000 个样本.数据集信噪比以2 dB间隔从 -20 dB 到18 dB上近似均匀分布,一共20种信噪比,即每种调制信号的一种信噪比的样本为 1 000 个.RML2016.10a数据集由同相分量和正交分量两路数据组成,维数为2×128,2对应同相分量和正交分量这两路信号,128对应128个采样点,因此数据集中全部的样本数量为 220 000 个,每个样本的维数为2×128.数据集中的信号样本是在衰落、多径和加性高斯白噪声等信道条件下使用真实的语音和文本信号获得的,因此接近真实的场景数据.

因为本文的研究目标是未知调制信号识别,所以要尽量排除噪声的影响,选择16 dB和18 dB信噪比最高的共 22 000 个样本作为本文仿真实验所用的数据集.选取8PSK、AM-DSB、BPSK、CPFSK、PAM4、QAM16、QAM64、QPSK、WBFM共9种调制信号共18 000个样本作为已知调制信号,选取GFSK、AM-SSB两种调制信号共 4 000 个样本作为未知调制信号.同时,从已知调制信号中的每一类中各随机选取80%共 14 400 个样本作为训练数据集,剩下的20%与从未知调制信号的每一类中随机选取出的20%加一起共 4 400 个样本作为测试数据集.即训练数据集由9种已知信号组成,每种信号包含 1 600 个样本,共 14 400 个样本;测试数据由9种经过网络训练过的已知信号和2种未经过网络训练过的未知信号组成,每种信号包含400个样本,共 4 400 个样本.

2.2 识别效果分析

在本文中,从输入的测试样本中正确检测出未知信号是信号识别的前提.未知信号检测可等价于二分类问题,如表2所示,将已知信号视为正样本P(Positive),未知信号视为负样本N(Negative).其中,TP(True Positive)表示真实的已知信号被正确预测为已知信号的数量;FN(False Negative)表示真实的已知信号被错误预测为未知信号的数量;FP(False Positive)表示真实的未知信号被错误预测为已知信号的数量;TN(True Negative)表示真实的未知信号被正确预测为未知信号的数量.

表2   二分类混淆矩阵

Tab.2  Dichotomous confusion matrix

类别预测的已知信号预测的未知信号
真实的已知信号TPFN
真实的未知信号FPTN

新窗口打开| 下载CSV


TPTN是负相关的.本文提出的多流ConvNeXt-MDM方法在不同的第1次距离度量阈值系数下的二分类结果如图5所示,其中横坐标为第1次距离度量阈值系数,纵坐标为信号二分类的识别率,已知信号的识别率RTK (True Known Rate)和未知信号的识别率RTU (True Unknown Rate)的计算表达式如下:

RTK=TPTP+FN
RTU=TNTN+FP

图5

图5   不同距离度量阈值系数下的识别结果

Fig.5   Recognition results at different distance metric threshold coefficients


图5可知,第1次距离度量阈值越大,RTK越大,RTU越小,越容易将未知信号误判为已知信号;第1次距离度量阈值越小,RTK越小,RTU越大,越容易将已知信号误判为未知信号.

不同第1次距离度量阈值下的二分类实验结果具体数值如表3所示.为了兼顾已知信号的识别率和未知信号的识别率,第1次距离度量阈值系数取值为0.66时,RTK的值和RTU的值均为97%以上,分别为97.2%和98.9%,这说明本文提出的方法能够以较高的准确率实现已知信号和未知信号的二分类.

表3   二分类实验结果

Tab.3  Experiment results of two classification

α1TPFNTNFPRTKRTU
0.0003 600800001
0.332 66493679820.7400.998
0.663 50010079190.9720.989
1.003 564365042960.9900.630

新窗口打开| 下载CSV


第1次距离度量检测出未知信号后,通过第2次距离度量对检测出的未知信号进行增量识别,最终实验识别结果如表4所示.本文提出的方法对已知信号和未知信号都有较高的识别率.其中AM-SSB信号与GFSK信号是没有在网络中训练过的信号类别,是未知信号.在此强调本次实验中对已知信号和未知信号的定义:已知信号类别在训练阶段被送入网络中训练,未知信号类别未曾被网络训练过,只在测试阶段与已知信号一同送入被已知信号训练好网络中进行识别,更重要的是已知信号的类别与未知信号的类别没有交集.

表4   识别结果

Tab.4  Identification results

实际信号预测信号识别率/%
8PSKAM-DSBBPSKCPFSKPAM4QAM16QAM64QPSKWBFM未知信号
8PSK385010010101296.3
AM-DSB02130000001672053.3
BPSK203740000202293.5
CPFSK00039400000698.5
PAM400003910000997.8
QAM168000034223202585.5
QAM643000031339102684.8
QPSK001000238601196.5
WBFM0570000003241981.0
AM-SSB00000010039999.8
GFSK00000000839298.0

新窗口打开| 下载CSV


表4可知,在已知信号中,WBFM信号与AM-DSB信号的识别率尤其低,致使已知信号的平均识别率较低,造成WBFM信号与AM-DSB信号识别率过低的主要原因是WBFM信号与AM-DSB信号之间的混淆.此外,从表4中还能够看出,导致已知信号识别率较低的另一个重要原因是有一部分已知信号在第1次距离度量判决时被误识别为未知信号.增加第1次距离度量阈值系数可有效降低将已知信号错误判定为未知信号的概率,进而提高已知信号识别率,但增加第1次距离度量阈值系数会增加未知信号错误判定为已知信号的概率,致使未知信号的识别率降低.因此获得较高的未知信号的识别率需要牺牲一定的已知信号的识别率.

对检测出的未知信号进行增量识别,结果如表5所示.本次实验的测试集数据共包含两种类别的未知信号,却识别出6种未知信号类别,这是由于第2次距离度量阈值设置的过低而造成的.根据1.3节中关于第2次距离度量判决过程的具体描述可知,若第2次距离度量阈值设置过高,会导致将检测出的未知信号全部识别为同一种未知信号,降低未知信号的平均识别率;若第2次距离度量阈值设置过低,则会导致识别出类别更多的未知信号,同样会降低未知信号的平均识别率.

表5   未知信号识别结果

Tab.5  Identification results of unknown signal

实际信号预测信号
未知1未知2未知3未知4未知5未知6
8PSK431301
AM-DSB1050230
BPSK283720
CPFSK033000
PAM4035100
QAM16796210
QAM641612241
QPSK018020
WBFM0130321
AM-SSB39530010
GFSK23861210

新窗口打开| 下载CSV


经过实验论证,当第2次距离度量阈值系数设置为1.02时,模型对未知信号的识别结果如表5所示,此时模型对两种未知信号类别的识别率分别为98.75%和96.50%.

2.3 识别性能对比

本文使用多卷积并行处理方法改进ConvNeXt网络,形成多流ConvNeXt网络,使用该网络提取的属性特征进行距离度量判决可以更加准确地检测出未知信号.为了对其进行验证,用改进之前的网络和改进之后的网络分别对输入信号进行属性特征提取,对两种网络提取的属性特征进行第1次马氏距离度量判决,实现已知信号和未知信号的二分类.二分类效果可由RTKRFK (False Known Rate)绘制成图6所示的受试者工作特征(Receiver Operating Characteristic,ROC)曲线表示,其中RFK表示真实的未知信号被错误预测为已知信号的概率,其计算公式如下:

RFK=FPFP+TN

图6

图6   两种二分类方法下的ROC曲线

Fig.6   ROC curves of two dichotomous methods


图6中可以看出,利用多卷积并行处理改进的ConvNeXt网络提取的属性特征进行二分类的ROC曲线有更高的曲线下面积(Area Under Curve,AUC)值,即使用本文提出的多流ConvNeXt网络可以更加准确地检测出未知信号.

利用多流ConvNeXt-MDM网络对信号进行特征提取,能够使已知信号属性特征与未知信号属性特征之间产生较大的差异性,也可以使不同类别信号的属性特征有较大的区分度,这不仅有利于未知信号的检测,更有利于未知信号的增量识别.为了验证多流ConvNeXt-MDM网络的有效性,本文分别利用SR2CNN网络[12]、MobileNetV3网络[24]和 Inception-v4 网络[25]对信号进行特征提取,对提取到的属性特征进行第1次距离度量判决,并将检测出的已知信号进行闭集识别,最终得到的未知信号检测结果和已知信号的识别结果如表6所示.

表6   识别性能对比

Tab.6  Comparison of identification performance

识别参数
类型
识别率/%
本文算法SR2CNNInception-v4MobileNetV3
8PSK96.385.585.787.5
AM-DSB53.373.565.072.3
BPSK93.595.594.588.5
CPFSK98.699.087.089.8
PAM497.894.585.287.0
QAM1685.549.371.736.5
QAM6484.844.072.344.5
QPSK96.590.589.091.2
WBFM81.032.066.122.5
平均识别率87.573.779.668.8
RTK97.295.992.991.4
RTU98.899.597.892.6

新窗口打开| 下载CSV


为了保证在第2次距离度量判决中对检测出的未知信号进行增量识别的准确率,需要在第1次距离度量判决中尽量提高RTU的值,因此第1次距离度量阈值系数设置的不宜过大,才能降低未知信号被误判决为已知信号的概率.同时为了保证已知信号的识别率,第1次距离度量阈值系数设置的也不宜过小,而使RTK的值过低.经过实验结果确定,将4种模型的第1次距离度量阈值系数分别设置为0.66(多流ConvNeXt-MDM网络)、0.56(SR2CNN网络)、0.34(Inception-v4网络)和0.3(MobileNetV3网络)时,在进行第1次距离度量判决后,得到的RTKRTU值都在90%以上.由表6可以看出,RTK在90%以上的情况下,本文提出的算法对已知信号的平均识别率最高,达到了87.5%,验证了多流ConvNeXt网络对信号进行特征提取的有效性.

为了进一步验证本文识别模型对检测出的未知信号进行增量识别的有效性,将上述4种识别模型检测出的未知信号的属性特征进行第2次距离度量判决.本文使用的数据集含有两种未知信号类别,由1.4节中对识别流程的具体介绍可知,若第2次距离度量阈值过小,容易将相同类别的未知信号误判决成多种不同类别的未知信号,造成识别模型最终识别出的未知信号类别远大于两种.相反,若第2次距离度量阈值过大,容易将不同类别的未知信号误判决为同一种信号.

第2次距离度量判决后,未知信号增量识别的结果如图7所示.其中横坐标表示第2次距离度量阈值系数,纵坐标表示未知信号的平均识别率.由图7可以看出,随着第2次距离度量阈值系数的增加,4种识别模型对未知信号的平均识别率首先增加,然后在增加到一定的值后保持在了稳定状态.

图7

图7   不同算法下的未知信号平均识别率

Fig.7   Average recognition rate of unknown signal of different algorithms


通过与SR2CNN网络、MobileNetV3网络和Inception-v4网络进行对比,发现本文提出的多流ConvNeXt网络的在阈值系数大于0.6以后,识别效果最好.这是因为用多流ConvNeXt网络提取的相同未知信号类别属性特征聚集度更高,不同未知信号类别属性特征中心之间的距离更大,当度量阈值过小,与该未知信号类别的属性特征中心过近,造成信号的误判,随着度量阈值的系数增加,尤其是大于0.6以后,判决的准确率迅速提高,对未知信号的平均识别率达到97%以上.验证了多流ConvNeXt网络对信号进行特征提取的优越性,也进一步验证了本文提出的多流ConvNeXt-MDM未知信号增量识别方法的有效性.

然而,通过上述实验结果和分析可以看出,只有取得较高的RTK值与RTU值时,已知信号的闭集识别和未知信号的增量识别才能取得较高的准确率.此外,RTKRTU是负相关的,导致已知信号和未知信号的识别率也是负相关的.当第1次距离度量阈值设置较低时可以提高未知信号的识别率,但会降低已知信号的识别率;反之亦然,当第1次距离度量阈值设置较高时可以提高已知信号的识别率,但会降低未知信号的识别率.因此,度量阈值设置的不合理会直接导致识别结果出错.

3 结语

针对现有的信号识别方法无法对类别不断增加的未知信号进行有效识别的问题,提出了基于多流ConvNeXt-MDM的方法实现了未知信号的增量识别.首先,在ConvNeXt网络基础上引入多尺度卷积并行处理的思想,形成多流ConvNeXt网络,提高了网络在未知信号识别方面的特征提取能力.其次,利用引入异常值检测思想的马氏距离度量判决检测出未知信号,实现了已知信号和未知信号的二分类.最后,为了使模型能够识别出不断增加的不同的未知信号类别,在距离度量判决中加入了增量学习的思想,使识别模型能够根据增加的新的未知类别信号更新出专门识别该类未知信号的模型参数,使识别模型具备自我进化的能力,从而可以识别出不断增加的新的未知信号类别.实验结果表明,该方法能够将已知信号维持在较高识别率的前提下,对未知信号的平均识别率依然达到97%以上,具备良好的未知识别效果,并在复杂的电磁环境中使识别设备更加小型化、智能化,为未知信号识别提供了新的方案.

参考文献

KAMENCAY P, BENCO M, MIZDOS T, et al.

A new method for face recognition using convolutional neural network

[J]. Advances in Electrical and Electronic Engineering, 2017, 15(4): 663-672.

[本文引用: 1]

TIAN Y, YANG G, WANG Z, et al.

Apple detection during different growth stages in orchards using the improved YOLO-V3 model

[J]. Computers and Electronics in Agriculture, 2019, 157: 417-426.

DOI:10.1016/j.compag.2019.01.012      URL     [本文引用: 1]

KANG Y, CAI Z, TAN C W, et al.

Natural language processing (NLP) in management research: A literature review

[J]. Journal of Management Analytics, 2020, 7(2): 139-172.

DOI:10.1080/23270012.2020.1756939      URL     [本文引用: 1]

肖易寒, 王亮, 郭玉霞.

基于去噪卷积神经网络的雷达信号调制类型识别

[J]. 电子与信息学报, 2021, 43(8): 2300-2307.

[本文引用: 1]

XIAO Yihan, WANG Liang, GUO Yuxia.

Radar signal modulation type recognition based on denoising convolutional neural network

[J]. Journal of Electronics & Information Technology, 2021, 43(8): 2300-2307.

[本文引用: 1]

全大英, 陈赟, 唐泽雨, .

基于双通道卷积神经网络的雷达信号识别

[J]. 上海交通大学学报, 2022, 56(7): 877-885.

DOI:10.16183/j.cnki.jsjtu.2021.209      [本文引用: 1]

为解决在低信噪比下特征提取困难、雷达信号识别率低的问题,提出了一种基于Choi-Williams分布(CWD)和多重同步压缩变换(MSST)的双通道卷积神经网络模型.模型通过对雷达信号进行CWD和MSST时频分析,分别获取二维时频图像并进行预处理,然后送入双通道卷积神经网络进行深度特征提取,最后将两路通道获取的特征进行融合,通过卷积神经网络分类器实现对雷达信号的分类识别.仿真结果表明:在信噪比为 -10 dB时,所提模型整体识别准确率能达到96%以上,其在低信噪比下表现优异.

QUAN Daying, CHEN Yun, TANG Zeyu, et al.

Radar signal recognition based on dual channel convolutional neural network

[J]. Journal of Shanghai Jiao Tong University, 2022, 56(7): 877-885.

[本文引用: 1]

XIAO Y H, LIU W J, GAO L.

Radar signal recognition based on transfer learning and feature fusion

[J]. Mobile Networks and Applications, 2020, 25(4): 1563-1571.

DOI:10.1007/s11036-019-01360-1      [本文引用: 1]

金丽洁, 武亚涛.

基于双CNN的雷达信号调制类型识别方法

[J]. 空天防御, 2022, 5(1): 66-70.

[本文引用: 1]

JIN Lijie, WU Yatao.

Radar signal modulation type recognition based on double CNN

[J]. Air & Space Defense, 2022, 5(1): 66-70.

[本文引用: 1]

郭业才, 姚文强.

基于信噪比分类网络的调制信号分类识别算法

[J]. 电子与信息学报, 2022, 44(10): 3507-3515.

[本文引用: 1]

GUO Yecai, YAO Wenqiang.

Modulation signal classification and recognition algorithm based on signal to noise ratio classification network

[J]. Journal of Electronics & Information Technology, 2022, 44(10): 3507-3515.

[本文引用: 1]

GUO Y, ZHANG Y, MA H.

Modulation recognition of digital signals based on deep belief network

[J]. IOP Conference Series: Materials Science and Engineering, 2019, 563: 052009.

DOI:10.1088/1757-899X/563/5/052009      [本文引用: 1]

A modulation pattern recognition method for digital modulation signals, 4ASK, BPSK, QPSK, 2FSK and 4FSK digital modulation signals, which is based on deep learning model of deep belief network is proposed. The modulation signal is pre-processed and its high order cumulants are calculated as input training features. Solutions to the problem that the same high Modulation signals are generated in different SNR environments. Using the semi-supervised learning characteristics of deep confidence network, data sets are obtained to train the parameters of deep Confidence network layer by layer for feature extraction and recognition of modulation modes. The simulation results show that the recognition rate of this method is ideal.

YASHASHWI K, SETHI A, CHAPORKAR P.

A learnable distortion correction module for modulation recognition

[J]. IEEE Wireless Communications Letters, 2018, 8(1): 77-80.

DOI:10.1109/LWC.2018.2855749      URL     [本文引用: 1]

AFAN A, FAN Y, SHU L.

Automatic modulation classification of digital modulation signals with stacked autoencoders

[J]. Digital Signal Processing, 2017, 71: 108-116.

DOI:10.1016/j.dsp.2017.09.005      URL     [本文引用: 1]

DONG Y, JIANG X, ZHOU H, et al.

SR2CNN: Zero-shot learning for signal recognition

[J]. IEEE Transactions on Signal Processing, 2021, 69: 2316-2329.

DOI:10.1109/TSP.2021.3070186      URL     [本文引用: 2]

YOSHIHASHI R, SHAO W, KAWAKAMI R, et al.

Classification-reconstruction learning for open-set recognition

[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach, USA: IEEE, 2019: 4016-4025.

[本文引用: 1]

CHENG Z, WANG S, ZHANG P, et al.

Improved autoencoder for unsupervised anomaly detection

[J]. International Journal of Intelligent Systems, 2021, 36(12): 7103-7125.

DOI:10.1002/int.v36.12      URL     [本文引用: 1]

YUE Z, WANG T, SUN Q, et al.

Counterfactual zero-shot and open-set visual recognition

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Beijing, China: IEEE, 2021: 15404-15414.

[本文引用: 1]

LIU Z, MAO H, WU C Y, et al.

A ConvNet for the 2020s

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. New Orleans, USA: IEEE, 2022: 11966-11976.

[本文引用: 1]

MAHALANOBIS P C.

Mahalanobis distance

[J]. Proceedings National Institute of Science of India, 1936, 49(2): 234-256.

[本文引用: 1]

HE K M, ZHANG X M, REN S Q, et al.

Deep residual learning for image recognition

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Las Vegas, USA: IEEE, 2016: 770-778.

[本文引用: 1]

LIU Z, LIN Y, CAO Y, et al.

Swin transformer: Hierarchical vision transformer using shifted windows

[C]// Proceedings of the IEEE International Conference on Computer Vision. Beijing, China: IEEE, 2021: 10012-10022.

[本文引用: 1]

MA L, YANG X, TAO D.

Person re-identification over camera networks using multi-task distance metric learning

[J]. IEEE Transactions on Image Processing, 2014, 23(8): 3656-3670.

DOI:10.1109/TIP.2014.2331755      PMID:24956368      [本文引用: 1]

Person reidentification in a camera network is a valuable yet challenging problem to solve. Existing methods learn a common Mahalanobis distance metric by using the data collected from different cameras and then exploit the learned metric for identifying people in the images. However, the cameras in a camera network have different settings and the recorded images are seriously affected by variability in illumination conditions, camera viewing angles, and background clutter. Using a common metric to conduct person reidentification tasks on different camera pairs overlooks the differences in camera settings; however, it is very time-consuming to label people manually in images from surveillance videos. For example, in most existing person reidentification data sets, only one image of a person is collected from each of only two cameras; therefore, directly learning a unique Mahalanobis distance metric for each camera pair is susceptible to over-fitting by using insufficiently labeled data. In this paper, we reformulate person reidentification in a camera network as a multitask distance metric learning problem. The proposed method designs multiple Mahalanobis distance metrics to cope with the complicated conditions that exist in typical camera networks. We address the fact that these Mahalanobis distance metrics are different but related, and learned by adding joint regularization to alleviate over-fitting. Furthermore, by extending, we present a novel multitask maximally collapsing metric learning (MtMCML) model for person reidentification in a camera network. Experimental results demonstrate that formulating person reidentification over camera networks as multitask distance metric learning problem can improve performance, and our proposed MtMCML works substantially better than other current state-of-the-art person reidentification methods.

LUO Y, LIU T, TAO D, et al.

Decomposition-based transfer distance metric learning for image classification

[J]. IEEE Transactions on Image Processing, 2014, 23(9): 3789-3801.

DOI:10.1109/TIP.2014.2332398      PMID:24968169      [本文引用: 1]

Distance metric learning (DML) is a critical factor for image analysis and pattern recognition. To learn a robust distance metric for a target task, we need abundant side information (i.e., the similarity/dissimilarity pairwise constraints over the labeled data), which is usually unavailable in practice due to the high labeling cost. This paper considers the transfer learning setting by exploiting the large quantity of side information from certain related, but different source tasks to help with target metric learning (with only a little side information). The state-of-the-art metric learning algorithms usually fail in this setting because the data distributions of the source task and target task are often quite different. We address this problem by assuming that the target distance metric lies in the space spanned by the eigenvectors of the source metrics (or other randomly generated bases). The target metric is represented as a combination of the base metrics, which are computed using the decomposed components of the source metrics (or simply a set of random bases); we call the proposed method, decomposition-based transfer DML (DTDML). In particular, DTDML learns a sparse combination of the base metrics to construct the target metric by forcing the target metric to be close to an integration of the source metrics. The main advantage of the proposed method compared with existing transfer metric learning approaches is that we directly learn the base metric coefficients instead of the target metric. To this end, far fewer variables need to be learned. We therefore obtain more reliable solutions given the limited side information and the optimization tends to be faster. Experiments on the popular handwritten image (digit, letter) classification and challenge natural image annotation tasks demonstrate the effectiveness of the proposed method.

KALINTHA W, ONO S, NUMAO M, et al.

Kernelized evolutionary distance metric learning for semi-supervised clustering

[J]. Intelligent Data Analysis, 2019, 23(6): 1271-1297.

DOI:10.3233/IDA-184283      URL     [本文引用: 1]

O’SHEA T J, CORGAN J, CLANCY T C.

Convolutional radio modulation recognition networks

[C]// International Conference on Engineering Applications of Neural Networks. Aberdeen, UK: Springer International Publishing, 2016: 213-226.

[本文引用: 1]

HOWARD A, SANDLER M, CHU G, et al.

Searching for mobilenetv3

[C]// Proceedings of the IEEE/CVF International Conference on Computer Vision. Seoul, South Korea: IEEE, 2019: 1314-1324.

[本文引用: 1]

SZEGEDY C, IOFFE S, VANHOUCKE V, et al.

Inception-v4, Inception-ResNet and the impact of residual connections on learning

[C]// Thirty-First AAAI Conference on Artificial Intelligence. San Francisco, USA: AAAI, 2017: 4278-4284.

[本文引用: 1]

/