Please wait a minute...

期刊目录

    2025年, 第30卷, 第5期
    刊出日期:2025-09-26
    上一期   

    全选选: 隐藏/显示图片
    非视域成像技术研究进展
    2025 (5):  833-854.  doi: 10.1007/s12204-023-2686-8
    摘要 ( 28 )   PDF(2547KB) ( 7 )  
    非视域成像通过分析中继面上携带隐藏场景信息的漫反射光来恢复拐角处的隐藏物体。由于其在自动驾驶、国防、医学成像和灾后救援等领域具有巨大的应用潜力,近年来,非视域成像技术引起了国内外学者的极大关注。非视域成像相关研究主要集中在成像系统、正向模型和重建算法等方面。本文较为系统地总结了现有主动和被动场景下的非视域成像技术,并分析了非视域成像技术面临的挑战和未来发展方向。
    参考文献 | 相关文章 | 计量指标
    基于语义动态超图卷积的三维手姿态估计
    2025 (5):  855-865.  doi: 10.1007/s12204-024-2697-0
    摘要 ( 23 )   PDF(1581KB) ( 1 )  
    由于手的自遮挡和高自由度变化,基于单张RGB图像进行3D手姿态估计是一个极具挑战性的问题。图卷积网络利用图描述手关节之间的结构关系,在一定程度上可以提高3D手姿态回归的准确性,然而,图卷积神经网络不能有效描述非相邻手部关节点间的关系。近来,广受关注的超图卷积网络能够通过超边描述节点之间的多元高维关系。因此,本文提出了一种基于超图卷积网络的手三维姿态估计框架,能够更好提取相邻和非相邻手关节之间的关联关系。为了克服预定义超图结构的缺点,提出了一种动态超图卷积网络(DHGCN),其中超边是基于手部关节特征相似性动态构建的。为了更好地探索节点之间的局部语义关系,提出了一种语义动态超图卷积(SDHGCN)。该方法在公开的基准数据集上进行了评估。本文在两个公开的基准数据集STB、RHD上评估了所提出的方法。定性定量的实验结果均表明,相较于图卷积网络,超图卷积网络更适用于手部姿态估计任务,与现有方法的对比实验表明本文所提出的网络框架达到了主流水平。
    参考文献 | 相关文章 | 计量指标
    基于多特征提取方法的多场景烟雾检测
    2025 (5):  866-879.  doi: 10.1007/s12204-023-2680-1
    摘要 ( 24 )   PDF(1129KB) ( 10 )  
    针对烟雾在不同场景下形状多变、半透明烟雾难以定位检测以及烟雾尺度多变等问题,本研究提出一种基于多特征提取方法的多场景烟雾检测算法。首先,将YOLOv5s骨干网络中特征提取的卷积模块替换为不对称卷积块(ACB)重参数卷积,提高了对不同形状烟雾的检测效果。接着,通过在骨干网络深层引入坐标注意力(CA)机制机制以进一步提高对半透明烟雾的定位能力。最后,使用特征金字塔卷积模块代替模型中特征金字塔的标准卷积模块进一步提高了模型对不同尺度烟雾的检测能力。实验结果证明本文所提出模型在多场景烟雾检测上的可行性和优越性。
    参考文献 | 相关文章 | 计量指标
    面向交通流量预测的多尺度动态超图卷积网络
    2025 (5):  880-888.  doi: 10.1007/s12204-023-2682-z
    摘要 ( 17 )   PDF(665KB) ( 0 )  
    本文关注交通流量预测问题,旨在基于历史交通数据预测未来的交通状况。通常情况下,通过利用时空图神经网络建模交通数据之间复杂的时空相关性来解决这一问题。尽管这些方法在性能上有所提升,但往往存在以下限制:这些方法难以建模节点之间的高阶相关性;这些方法忽视了不同尺度下节点之间的相互作用。为了解决这些问题,本文提出了面向交通流量预测的多尺度动态超图卷积网络(MSDHGCN)。提出的MSDHGCN能够有效地建模多个时间尺度上节点之间的动态高阶关系,从而增强交通预测的能力。在两个真实数据集上的实验证明了所提出方法的有效性。
    参考文献 | 相关文章 | 计量指标
    基于多尺度融合和自适应标签相关性的多标签图像分类模型
    2025 (5):  889-898.  doi: 10.1007/s12204-023-2688-6
    摘要 ( 20 )   PDF(866KB) ( 2 )  
    目前多标签图像分类的研究主要集中于探索标签之间的相关性,以提高多标签图像的分类精度。但是,现有的方法中,标签相关性是依据数据的统计信息计算的,这种标签相关性是全局且依赖于数据集,并不适合所有样本,并且在提取图像特征过程中,图像中的小物体特性信息易丢失导致小物体的分类准确率低。为此,提出一种基于多尺度融合和自适应标签相关性的多标签图像分类模型,主要思路为:首先将多个尺度的特征图融合以增强小物体的特征信息,并通过标签语义的指导将融合特征图分解为各个类别的特征向量,然后利用图注意力模块中的自注意力机制自适应地挖掘图像中类别之间的相关性,并提出一个注意力正则化损失。该模型在VOC 2007 和 MS COCO 2014 两个公开数据集上的平均精度均值(mAP)分别达到了95.6%和83.6%,并且大部分指标都优于现有的最新方法。
    参考文献 | 相关文章 | 计量指标
    基于多注意力机制的轻量化人体姿态估计
    2025 (5):  899-910.  doi: 10.1007/s12204-023-2691-y
    摘要 ( 17 )   PDF(917KB) ( 0 )  
    人体姿态估计因其广泛的应用场景而受到研究界的关注,然而现有的网络结构通常结构复杂计算量大,并且在特征融合过程中存在特征丢失问题。针对上述问题,提出一个轻量化的基于多重注意力机制的人体姿态估计网络LMANet。在高分辨率网络的基础上利用深度可分离卷积对瓶颈块进行轻量化处理,能够大幅度减少网络参数量;之后引入多重注意力机制提高模型预测精度,在网络初始阶段加入通道注意力模块增强局部跨通道的信息交互;在多尺度特征融合阶段引入空间注意力机制,通过空间交叉感知模块减少特征提取过程中空间信息损失。在COCO2017数据集和MPII数据集上的实验结果表明,LMANet能够在较少的参数量和计算量的情况下保证较高的预测精确度;相较于高分辨率网络HRNet,网络的参数量和计算复杂度分别减少67%和73%。
    参考文献 | 相关文章 | 计量指标
    具有视觉伪装性的人脸识别对抗性图案生成方法
    2025 (5):  911-922.  doi: 10.1007/s12204-023-2692-x
    摘要 ( 19 )   PDF(1670KB) ( 1 )  
    深度神经网络,特别是人脸识别模型,已经被证明容易受到对抗性样本的影响。然而,现有的针对人脸识别系统的攻击方法要么无法攻击黑盒模型,要么不通用,部署过程繁琐;要么缺乏伪装,容易被人眼检测到。在本文中,我们提出了一种用于人脸识别的对抗性图案生成方法,并通过将图案粘贴在护目镜的边框来实现通用的黑盒攻击。为了实现视觉伪装,使用了生成对抗性网络(Generative Adversarial Network,GAN)。增加了 GAN 生成网络的规模,以平衡隐蔽性和对抗性之间的性能冲突,使用基于 VGG19 的感知损失函数来约束颜色风格并增强 GAN 的学习能力,并使用细粒度的元学习对抗性攻击策略进行黑盒攻击。与现有技术相比,充分的可视化结果表明,本文提出的方法可以生成具有伪装和对抗特性的样本。同时,大量的定量实验表明,生成的样本对黑盒模型的攻击成功率很高。
    参考文献 | 相关文章 | 计量指标
    基于改进CLRNet的铁轨线检测算法
    2025 (5):  923-934.  doi: 10.1007/s12204-023-2683-y
    摘要 ( 17 )   PDF(2173KB) ( 1 )  
    在轨道交通智慧驾驶中,可靠的障碍物检测系统是列车安全的重要保障,其中对铁轨区域的检测直接影响系统辨别危险目标的准确性。铁轨线与车道线在图像中都呈现为细长线条状,但是轨道场景的环境更复杂,铁轨线的颜色更难以与背景区分。相较而言,目前已经有许多基于深度学习的车道线检测算法,铁轨线检测却缺乏公开的数据集以及针对性的深度学习检测算法。为此本文构建了一个铁轨图像数据集RailwayLine并对铁轨线进行标注用于检测模型的训练和测试。该数据集包含单轨道、多轨道、直轨、弯轨、交叉 、遮挡、模糊和不同光照条件等丰富的铁轨图像;针对目前缺少基于深度学习的铁轨线检测算法的问题,我们改进了在车道线方面性能优异的CLRNet算法,提出了铁轨线检测算法CLRNet-R;针对铁轨线在成像中线条细长,所占像素少,难以从复杂背景中区分的问题,我们引入注意力机制,提升全局特征提取能力,并增加语义分割头,利用铁轨二值概率增强铁轨线区域的特征;针对原CLRNet算法识别弯轨性能差、输出线条不光滑的问题,我们改进了原框架中线条交并比计算的权重分配,并提出两种基于局部斜率的损失,优化模型局部采样点的训练约束,提升模型对弯轨的拟合性能,获取光滑、稳定的铁轨线检测结果。本文通过实验证明,与其他主流的车道线检测算法相比,所提出的算法在铁轨线检测任务中具有更好的性能。
    参考文献 | 相关文章 | 计量指标
    MAGPNet: 基于多域注意力引导的红外弱小目标检测网络
    2025 (5):  935-951.  doi: 10.1007/s12204-024-2694-3
    摘要 ( 19 )   PDF(1860KB) ( 1 )  
    为了克服对红外暗弱小目标特征提取不足和先验信息缺乏的障碍,提出了一个多域注意力引导金字塔网络(MAGPNet)。具体来说,设计了三个模块,以确保小目标的显著特征能够在多尺度特征图中被获取和保留。为了提高网络对不同尺寸目标的适应性,设计了具有感受野注意力分支的核聚合注意(KAA)块,并使用注意机制在不同感知范围下加权特征图。基于对人类视觉系统的研究,进一步提出了自适应局部对比度测量(ALCM)模块,以增强红外小目标的局部特征。借助这个参数化组件,可以实现多尺度对比度显著性图的信息聚合。最后,为了充分利用不同尺度特征图中的空间和通道域内的信息,提出了混合空间-通道(MSC)注意力引导融合模块,以实现高质量的融合效果,同时确保小目标特征能够在深层保留。公开数据集上的实验证明,提出的MAGPNet在交并比(IoU)、精度、召回率和F-measure等性能指标上优于其他最先进方法。此外,还进行了具体的消融研究,以验证网络中每个组件的有效性。
    参考文献 | 相关文章 | 计量指标
    基于异步事件流超图网络的运动目标识别方法
    2025 (5):  952-961.  doi: 10.1007/s12204-024-2699-y
    摘要 ( 17 )   PDF(961KB) ( 0 )  
    与传统相机的采样方式不同,事件相机可以捕捉异步的事件流数据,其中每个事件由编码像素位置、触发事件和亮度的极性变化表示。本文针对传统相机在处理高动态复杂场景时的局限性问题,提出了一种基于异步事件流超图网络的运动目标步态识别新方法。具体来说, 本文先使用事件相机感知运动目标,采集高时间、空间分辨率的异步事件流数据。与堆叠事件帧的处理方法不同,本文结合超图网络模型进行学习,将异步事件数据编码成超图结构,充分挖掘事件数据的高阶相关性,并设计混合卷积的超图神经网络进行训练,在超图注意力机制和残差结构的优化下实现更高效、更准确的运动目标识别。实验结果表明,所提出的超图结构在处理高动态数据时性能更为优越,在公开的运动目标识别(如步态识别)数据集上具有前沿的效果。
    参考文献 | 相关文章 | 计量指标
    基于CEEMDAN 和 GRU的停车位预测
    2025 (5):  962-975.  doi: 10.1007/s12204-023-2672-1
    摘要 ( 17 )   PDF(1617KB) ( 7 )  
    剩余停车位的精准预测对于优化停车资源利用率、改善交通状况起着至关重要的作用。然而,以往的研究大多基于停车本身的历史数据或影响停车预测的众多因素进行模型建模,增加了数据的复杂性和运行模型所花费的时间,导致模型与极值点的拟合度较差。针对这一问题,提出一种基于完全自适应噪声集合经验模态分解(CEEMDAN)和门循环单元(GRU)模型的混合预测模型来预测停车剩余位数。在该模型中,CEEMDAN作为序列平滑分解模块,可以逐步分解不同尺度的时间序列波动或趋势,生成一系列具有不同特征尺度的本征模态函数(IMF)。然后,通过保留原始数据的大部分信息,主成分分析(PCA)减少了分解的IMF序列维度,消除了冗余信息,提高了预测响应速度。之后,高级抽象特征输入GRU网络,基于深度学习框架Keras完成网络的搭建、测试、预测。利用立体停车场采集的真实停车数据集验证了所提模型的有效性。实验结果表明,本文提出的模型在预测准确性方面优于基准模型,即更低的测试误差。CEEMDAN-PCA-GRU模型最接近真实的停车时间序列。因此,该方法在停车位预测方面比其他模型更有效。
    参考文献 | 相关文章 | 计量指标
    使用区块位置洗牌的 JPEG 图像加密快速攻击算法
    2025 (5):  976-987.  doi: 10.1007/s12204-023-2676-x
    摘要 ( 15 )   PDF(2974KB) ( 0 )  
    对于传统的JPEG图像加密,区块位置洗牌可以达到更好的加密效果并且可以抵抗非零计数攻击。但是区块位置洗牌并不改变8×8子块内非零系数的个数。针对这个缺陷,提出了一种基于块间洗牌和非零量化离散余弦变换系数攻击的 JPEG 图像加密的快速攻击算法。该算法通过设计的明文图像检测一张图像的像素值,分析加密前后图像块位置映射关系。然后通过逆映射得到图像块的初步攻击结果,最后根据初步攻击结果中每个8×8块中的非零系数个数生成算法的最终攻击结果。在设计的明文中,每个8×8块的位置都与其非零离散余弦变换系数的个数相关。经过验证,在不了解加密算法和密钥的情况下,可以在较短时间内获得原始图像的主要内容。
    参考文献 | 相关文章 | 计量指标
    使用课程学习的动态布料折叠
    2025 (5):  988-997.  doi: 10.1007/s12204-024-2710-7
    摘要 ( 12 )   PDF(959KB) ( 0 )  
    本文提出了一种新颖的算法,利用强化学习和课程学习方法来训练机械臂操作布料。当前的布料操作算法严重依赖于预定义的动作基元和对布料动力学的假设,需要大量人类的先验知识。为了避免这种限制,提出了一种半稀疏的奖励函数,并结合折叠精度和课程计划,加速训练并改善策略稳定性。通过在StableBaselines3框架中实现,并使用SAC算法智能体在我们实现的物理仿真虚拟环境训练来验证所提出的方法。与传统的领域适应技术相比,结果表明了课程学习方案的优点,突显了我们的方法在推进机器人布料操作任务方面的潜力。
    参考文献 | 相关文章 | 计量指标
    基于非抽样双树-复小波变换与模糊聚类的声呐图像去噪技术
    2025 (5):  998-1008.  doi: 10.1007/s12204-023-2662-3
    摘要 ( 17 )   PDF(2202KB) ( 0 )  
    由成像声呐设备通过接收物体回波生成声呐图像常伴随严重的斑点噪声,导致图像失真、信息丢失等。常用光学去噪方法去除声呐图像中斑点噪声效果不佳,会降低图像视觉效果。为解决上述不足,提出了一种基于模糊聚类与非抽样双树复小波变换的声呐图像去噪方法。该方法在分解图像时提供完美的平移不变性和改进的方向选择特性,将噪声和边缘在高频系数中表现更丰富;模糊聚类能够根据斑点噪声的幅值特性,实现噪声与有效信息的分离,保留有效信息,实现了去除噪声的目标;同时通过双边滤波平滑低频系数,提高图像视觉效果。为了验证算法的有效性,进行了多组消融实验,并使用不同方差的斑点声呐图像进行了评估,与现有的变换域中去斑方法相比。实验结果表明:该方法能够有效地改善图像质量;处理后的图像视觉效果得到提升,尤其是在噪声严重的情况下,去噪性能依然拥有较好的效果。
    参考文献 | 相关文章 | 计量指标
    CenterLineFormer:基于单车载相机的车道中心线生成方法
    2025 (5):  1009-1017.  doi: 10.1007/s12204-024-2696-1
    摘要 ( 18 )   PDF(1395KB) ( 0 )  
    随着自动驾驶系统的迅速发展,车载感知算法对道路结构信息的需求激增。作为高精度地图中的道路结构层元素之一,车道中心线对于运动预测和决策规划等下游任务至关重要。考虑到车道中心线的复杂拓扑结构和重叠问题,以前的研究很少探讨车道中心线的生成问题。而基于深度学习的众包地图生成方法往往需要启发式后处理来生成车道中心线的道路结构信息。本文提出了一种基于深度注意力网络的端到端的车道中心线生成方法,CenterLineFormer,以单目车载相机作为传感器,生成鸟瞰图空间中表征道路驾驶态势的车道中心线结构图。提出了一种基于动态投影的可变性交叉注意力机制,该机制通过特征空间转换生成稠密的鸟瞰图空间特征图。可以描述不同中心线之间的连接关系,并为下游算法(例如规划和控制)生成矢量化的车道中心线结构图,避免后处理过程。实验表明,提出的方法在自动驾驶公开数据集上的表现优于现有算法,并且可以在夜间驾驶和复杂的交通路口场景中生成更准确的车道中心线结构图。
    参考文献 | 相关文章 | 计量指标
    图卷积网络与Stacking集成学习相结合的堆芯自给能中子探测器故障识别方法
    2025 (5):  1018-1027.  doi: 10.1007/s12204-023-2684-x
    摘要 ( 16 )   PDF(1454KB) ( 0 )  
    自给能中子探测器(self-powered neutron detector,SPND)作为监测反应堆运行状况和安全裕度的重要传感设备,其健康状态直接影响堆芯安全运行。为实现SPND故障识别的准确性和可靠性,提出一种图卷积网络与Stacking集成学习相结合的SPND故障识别方法。利用图卷积网络(graph convolutional network,GCN)抽取堆内不同位置SPND之间的空间邻域信息,实现SPND电流信号的非线性拟合以获得残差;在此基础上,建立多个机器学习算法融合的Stacking集成学习模型以充分提取残差序列的时变动态特征,实现对SPND正常、漂移、偏置、精度下降和完全失效5种运行状态的识别。算例分析表明,相较于单一模型,GCN-Stacking模型具有融合各基学习器多样化和差异化的优势,使得故障识别效果更稳定与可靠,且在反应堆不同功率下,依然具有较高的故障识别准确度。
    参考文献 | 相关文章 | 计量指标
    CenterRCNN:基于中心关键点区域候选网络的两阶段无锚框目标检测
    2025 (5):  1028-1036.  doi: 10.1007/s12204-023-2667-y
    摘要 ( 16 )   PDF(1904KB) ( 0 )  
    经典的两阶段目标检测算法,例如快速区域卷积神经网络(Faster RCNN),由于区域提议网络(RPN)中密集锚框机制引起的低速度和锚框超参数敏感性问题而受到影响。最近,无锚框方法CenterNet通过其中心感知和分类对象展示有效性。然而,由于多个二进制分类器引起的混淆类之间的假阳问题使CenterNet仍然不够准确。我们引入了一个两阶段网络CenterRCNN来利用两者的优势并克服缺点。我们提出CenterRPN作为第一阶段,以将中心关键点思想纳入RPN中感知前景对象,并替换基于密集锚框的RPN。然后,候选框通过RCNN检测头的多分类器进行分类,该分类器更加关注混淆类之间的差异,并仅输出其中最大概率的一个。总之,CenterRPN可以消除Faster RCNN中基于密集锚框的RPN的缺点,并且多分类器的分类能力优于CenterNet中的多个二进制分类器。实验表明:CenterRCNN准确性优于两种基本算法,并且与Faster RCNN相比速度有所提高。
    参考文献 | 相关文章 | 计量指标
    CSC-YOLO:一种铜板带表面缺陷检测的图像识别模型
    2025 (5):  1037-1049.  doi: 10.1007/s12204-024-2723-2
    摘要 ( 20 )   PDF(1137KB) ( 2 )  
    为了满足工业生产中对铜板带产品表面缺陷进行准确识别的要求,提出了一种基于机器视觉的铜板带表面缺陷检测模型:CSC-YOLO。该模型以YOLOv4-tiny为基准网络,首先,在基准网络中引入K-means聚类,得到符合自建数据集的锚框;其次,在骨干网络中引入了跨特征的融合CRFM模块,通过融合上下文语义信息,解决困难目标识别问题;第三,在PANet网络中引入SPP-E模块加强特征提取;第四,为了防止通道信息的丢失,引入轻量化CBAM注意力机制提升网络的性能;最后,针对表面缺陷的尺寸特性,通过添加调节因子对损失函数进行修正,改善模型性能。CSC-YOLO在自建的铜板带表面缺陷数据集上进行了测试,实验结果表明:模型mAP可达到93.58%,与基准网络相比提升了3.37%,准确率与召回率均有提高,FPS虽然与基准网络相比有所下降,但也达到了104,CSC-YOLO兼顾了铜板带生产的实时性要求。在与Faster RCNN、SSD300、YOLOv3、YOLOv4、Resnet50-YOLOv4、YOLOv5s、YOLOv7等算法进行的对比实验表明,该算法在保持较高检测精度的同时,获得了较快的计算速度。
    参考文献 | 相关文章 | 计量指标
    面向太阳能电池复杂缺陷检测的新型多步深度学习方法
    2025 (5):  1050-1064.  doi: 10.1007/s12204-023-2670-3
    摘要 ( 20 )   PDF(2212KB) ( 2 )  
    太阳能电池片的缺陷变化大且种类多,部分缺陷样本难以获取或者尺度较小,存在小样本与小目标的问题,为太阳能电池片缺陷检测带来了挑战。为了解决这一问题,本文提出了一种多阶段的太阳能电池复杂缺陷检测方法。首先提取电致发光图像中的单块细胞板进行逐块检测,再通过StyleGAN2-ada进行GAN数据增强,扩充小样本缺陷数量,最后在混合数据集上通过改进后的YOLOv5进行训练。通过实验证明该方法得到的模型面对小样本、小目标的缺陷表现更加优秀,最后结果召回率达到了99.7%,相较于未改进前提高了3.9%,同时精确率与平均精度均值也分别提高了3.4%、3.5%。并且实验表明,使用混合数据集训练与改进网络的方式可以提高模型的检测效果,两者共用有效地提高了网络对于太阳能电池缺陷的检测性能。
    参考文献 | 相关文章 | 计量指标
    基于ALBERT的中国诗酒文化命名实体识别
    2025 (5):  1065-1072.  doi: 10.1007/s12204-023-2675-y
    摘要 ( 20 )   PDF(513KB) ( 1 )  
    中国诗酒文化中文命名实体识别任务是构建该领域知识图谱与问答系统的关键步骤;针对中国诗酒文化实体长短不一,以及现阶段命名实体识别模型训练成本高的特点,本研究提出一种轻量级BERT-双向长短期记忆网络-注意力机制-条件随机场(ALBERT-BILSTM-Att-CRF)的中国诗酒文化深度识别方法。该方法首先通过ALBERT模块获得字符级别的语义信息,然后由BILSTM模块抽取其高维特征,由Attention层对原始词向量和学习后的文本向量进行加权,最后在CRF模块预测出真实的标签(包括:诗词题目,作者,时间,体裁和类型五类)序列。通过对中国诗酒文化相关数据集进行实验,结果表明:该方法的效果高于现有的主流模型,可以高效提取中国诗酒文化中的重要实体信息,是一种针对长短不一诗歌类命名实体识别的有效方法。
    参考文献 | 相关文章 | 计量指标