专题
计算机辅助设计与图形学
Selected papers from 全国计算机辅助设计与图形学学术会议 (CCF CAD/CG)and International Conference on Computer-Aided Design and Computer Graphics (CAD/Graphics)
默认
最新文章
浏览次数
Please wait a minute...
选择:
导出引用
EndNote
Ris
BibTeX
显示/隐藏图片
Select
1.
使用课程学习的动态布料折叠
LI Mingyang, BAO Hujun, HUANG Jin
J Shanghai Jiaotong Univ Sci 2025, 30 (
5
): 988-997. DOI:
10.1007/s12204-024-2710-7
摘要
(
29
)
PDF(pc)
(959KB)(
9
)
可视化
收藏
本文提出了一种新颖的算法,利用强化学习和课程学习方法来训练机械臂操作布料。当前的布料操作算法严重依赖于预定义的动作基元和对布料动力学的假设,需要大量人类的先验知识。为了避免这种限制,提出了一种半稀疏的奖励函数,并结合折叠精度和课程计划,加速训练并改善策略稳定性。通过在StableBaselines3框架中实现,并使用SAC算法智能体在我们实现的物理仿真虚拟环境训练来验证所提出的方法。与传统的领域适应技术相比,结果表明了课程学习方案的优点,突显了我们的方法在推进机器人布料操作任务方面的潜力。
参考文献
|
相关文章
|
多维度评价
|
评论
(
0
)
Select
2.
基于语义动态超图卷积的三维手姿态估计
WU Yalei, LI Jinghua, KONG Dehui, LI Qianxing, YIN Baocai
J Shanghai Jiaotong Univ Sci 2025, 30 (
5
): 855-865. DOI:
10.1007/s12204-024-2697-0
摘要
(
44
)
PDF(pc)
(1581KB)(
16
)
可视化
收藏
由于手的自遮挡和高自由度变化,基于单张RGB图像进行3D手姿态估计是一个极具挑战性的问题。图卷积网络利用图描述手关节之间的结构关系,在一定程度上可以提高3D手姿态回归的准确性,然而,图卷积神经网络不能有效描述非相邻手部关节点间的关系。近来,广受关注的超图卷积网络能够通过超边描述节点之间的多元高维关系。因此,本文提出了一种基于超图卷积网络的手三维姿态估计框架,能够更好提取相邻和非相邻手关节之间的关联关系。为了克服预定义超图结构的缺点,提出了一种动态超图卷积网络(DHGCN),其中超边是基于手部关节特征相似性动态构建的。为了更好地探索节点之间的局部语义关系,提出了一种语义动态超图卷积(SDHGCN)。该方法在公开的基准数据集上进行了评估。本文在两个公开的基准数据集STB、RHD上评估了所提出的方法。定性定量的实验结果均表明,相较于图卷积网络,超图卷积网络更适用于手部姿态估计任务,与现有方法的对比实验表明本文所提出的网络框架达到了主流水平。
参考文献
|
相关文章
|
多维度评价
|
评论
(
0
)
Select
3.
基于异步事件流超图网络的运动目标识别方法
YU Nannan, WANG Chaoyi, QIAO Yu, WANG Yuxin, ZHENG Chenglin, ZHANG Qiang, YANG Xin
J Shanghai Jiaotong Univ Sci 2025, 30 (
5
): 952-961. DOI:
10.1007/s12204-024-2699-y
摘要
(
32
)
PDF(pc)
(961KB)(
13
)
可视化
收藏
与传统相机的采样方式不同,事件相机可以捕捉异步的事件流数据,其中每个事件由编码像素位置、触发事件和亮度的极性变化表示。本文针对传统相机在处理高动态复杂场景时的局限性问题,提出了一种基于异步事件流超图网络的运动目标步态识别新方法。具体来说, 本文先使用事件相机感知运动目标,采集高时间、空间分辨率的异步事件流数据。与堆叠事件帧的处理方法不同,本文结合超图网络模型进行学习,将异步事件数据编码成超图结构,充分挖掘事件数据的高阶相关性,并设计混合卷积的超图神经网络进行训练,在超图注意力机制和残差结构的优化下实现更高效、更准确的运动目标识别。实验结果表明,所提出的超图结构在处理高动态数据时性能更为优越,在公开的运动目标识别(如步态识别)数据集上具有前沿的效果。
参考文献
|
相关文章
|
多维度评价
|
评论
(
0
)
Select
4.
非视域成像技术研究进展
LIU Mengge, LIU Hao, HE Xin, JIN Shaohui, CHEN Pengyun, XU Mingliang
J Shanghai Jiaotong Univ Sci 2025, 30 (
5
): 833-854. DOI:
10.1007/s12204-023-2686-8
摘要
(
57
)
PDF(pc)
(2547KB)(
29
)
可视化
收藏
非视域成像通过分析中继面上携带隐藏场景信息的漫反射光来恢复拐角处的隐藏物体。由于其在自动驾驶、国防、医学成像和灾后救援等领域具有巨大的应用潜力,近年来,非视域成像技术引起了国内外学者的极大关注。非视域成像相关研究主要集中在成像系统、正向模型和重建算法等方面。本文较为系统地总结了现有主动和被动场景下的非视域成像技术,并分析了非视域成像技术面临的挑战和未来发展方向。
参考文献
|
相关文章
|
多维度评价
|
评论
(
0
)
Select
5.
基于多特征提取方法的多场景烟雾检测
SHAO Yanli, YING Yong, CHEN Xi, DONG Siyu, WEI Dan
J Shanghai Jiaotong Univ Sci 2025, 30 (
5
): 866-879. DOI:
10.1007/s12204-023-2680-1
摘要
(
45
)
PDF(pc)
(1129KB)(
26
)
可视化
收藏
针对烟雾在不同场景下形状多变、半透明烟雾难以定位检测以及烟雾尺度多变等问题,本研究提出一种基于多特征提取方法的多场景烟雾检测算法。首先,将YOLOv5s骨干网络中特征提取的卷积模块替换为不对称卷积块(ACB)重参数卷积,提高了对不同形状烟雾的检测效果。接着,通过在骨干网络深层引入坐标注意力(CA)机制机制以进一步提高对半透明烟雾的定位能力。最后,使用特征金字塔卷积模块代替模型中特征金字塔的标准卷积模块进一步提高了模型对不同尺度烟雾的检测能力。实验结果证明本文所提出模型在多场景烟雾检测上的可行性和优越性。
参考文献
|
相关文章
|
多维度评价
|
评论
(
0
)
Select
6.
面向交通流量预测的多尺度动态超图卷积网络
DONG Zhaoxian, YU Shuo, SHEN Yanming
J Shanghai Jiaotong Univ Sci 2025, 30 (
5
): 880-888. DOI:
10.1007/s12204-023-2682-z
摘要
(
31
)
PDF(pc)
(665KB)(
14
)
可视化
收藏
本文关注交通流量预测问题,旨在基于历史交通数据预测未来的交通状况。通常情况下,通过利用时空图神经网络建模交通数据之间复杂的时空相关性来解决这一问题。尽管这些方法在性能上有所提升,但往往存在以下限制:这些方法难以建模节点之间的高阶相关性;这些方法忽视了不同尺度下节点之间的相互作用。为了解决这些问题,本文提出了面向交通流量预测的多尺度动态超图卷积网络(MSDHGCN)。提出的MSDHGCN能够有效地建模多个时间尺度上节点之间的动态高阶关系,从而增强交通预测的能力。在两个真实数据集上的实验证明了所提出方法的有效性。
参考文献
|
相关文章
|
多维度评价
|
评论
(
0
)
Select
7.
基于多尺度融合和自适应标签相关性的多标签图像分类模型
YE Jihua, JIANG Lu, XIAO Shunjie, ZONG Yi, JIANG Aiwen
J Shanghai Jiaotong Univ Sci 2025, 30 (
5
): 889-898. DOI:
10.1007/s12204-023-2688-6
摘要
(
41
)
PDF(pc)
(866KB)(
16
)
可视化
收藏
目前多标签图像分类的研究主要集中于探索标签之间的相关性,以提高多标签图像的分类精度。但是,现有的方法中,标签相关性是依据数据的统计信息计算的,这种标签相关性是全局且依赖于数据集,并不适合所有样本,并且在提取图像特征过程中,图像中的小物体特性信息易丢失导致小物体的分类准确率低。为此,提出一种基于多尺度融合和自适应标签相关性的多标签图像分类模型,主要思路为:首先将多个尺度的特征图融合以增强小物体的特征信息,并通过标签语义的指导将融合特征图分解为各个类别的特征向量,然后利用图注意力模块中的自注意力机制自适应地挖掘图像中类别之间的相关性,并提出一个注意力正则化损失。该模型在VOC 2007 和 MS COCO 2014 两个公开数据集上的平均精度均值(mAP)分别达到了95.6%和83.6%,并且大部分指标都优于现有的最新方法。
参考文献
|
相关文章
|
多维度评价
|
评论
(
0
)
Select
8.
基于多注意力机制的轻量化人体姿态估计
LIN Xiao, LU Meichen, GAO Mufeng, LI Yan
J Shanghai Jiaotong Univ Sci 2025, 30 (
5
): 899-910. DOI:
10.1007/s12204-023-2691-y
摘要
(
34
)
PDF(pc)
(917KB)(
14
)
可视化
收藏
人体姿态估计因其广泛的应用场景而受到研究界的关注,然而现有的网络结构通常结构复杂计算量大,并且在特征融合过程中存在特征丢失问题。针对上述问题,提出一个轻量化的基于多重注意力机制的人体姿态估计网络LMANet。在高分辨率网络的基础上利用深度可分离卷积对瓶颈块进行轻量化处理,能够大幅度减少网络参数量;之后引入多重注意力机制提高模型预测精度,在网络初始阶段加入通道注意力模块增强局部跨通道的信息交互;在多尺度特征融合阶段引入空间注意力机制,通过空间交叉感知模块减少特征提取过程中空间信息损失。在COCO2017数据集和MPII数据集上的实验结果表明,LMANet能够在较少的参数量和计算量的情况下保证较高的预测精确度;相较于高分辨率网络HRNet,网络的参数量和计算复杂度分别减少67%和73%。
参考文献
|
相关文章
|
多维度评价
|
评论
(
0
)
Select
9.
具有视觉伪装性的人脸识别对抗性图案生成方法
BAO Qirui, MEI Haiyang, WEI Huilin, L Zheng, WANG Yuxin, YANG Xin
J Shanghai Jiaotong Univ Sci 2025, 30 (
5
): 911-922. DOI:
10.1007/s12204-023-2692-x
摘要
(
37
)
PDF(pc)
(1670KB)(
12
)
可视化
收藏
深度神经网络,特别是人脸识别模型,已经被证明容易受到对抗性样本的影响。然而,现有的针对人脸识别系统的攻击方法要么无法攻击黑盒模型,要么不通用,部署过程繁琐;要么缺乏伪装,容易被人眼检测到。在本文中,我们提出了一种用于人脸识别的对抗性图案生成方法,并通过将图案粘贴在护目镜的边框来实现通用的黑盒攻击。为了实现视觉伪装,使用了生成对抗性网络(Generative Adversarial Network,GAN)。增加了 GAN 生成网络的规模,以平衡隐蔽性和对抗性之间的性能冲突,使用基于 VGG19 的感知损失函数来约束颜色风格并增强 GAN 的学习能力,并使用细粒度的元学习对抗性攻击策略进行黑盒攻击。与现有技术相比,充分的可视化结果表明,本文提出的方法可以生成具有伪装和对抗特性的样本。同时,大量的定量实验表明,生成的样本对黑盒模型的攻击成功率很高。
参考文献
|
相关文章
|
多维度评价
|
评论
(
0
)
Select
10.
基于改进CLRNet的铁轨线检测算法
ZHOU Bowei, XING Guanyu, LIU Yanli
J Shanghai Jiaotong Univ Sci 2025, 30 (
5
): 923-934. DOI:
10.1007/s12204-023-2683-y
摘要
(
31
)
PDF(pc)
(2173KB)(
13
)
可视化
收藏
在轨道交通智慧驾驶中,可靠的障碍物检测系统是列车安全的重要保障,其中对铁轨区域的检测直接影响系统辨别危险目标的准确性。铁轨线与车道线在图像中都呈现为细长线条状,但是轨道场景的环境更复杂,铁轨线的颜色更难以与背景区分。相较而言,目前已经有许多基于深度学习的车道线检测算法,铁轨线检测却缺乏公开的数据集以及针对性的深度学习检测算法。为此本文构建了一个铁轨图像数据集RailwayLine并对铁轨线进行标注用于检测模型的训练和测试。该数据集包含单轨道、多轨道、直轨、弯轨、交叉 、遮挡、模糊和不同光照条件等丰富的铁轨图像;针对目前缺少基于深度学习的铁轨线检测算法的问题,我们改进了在车道线方面性能优异的CLRNet算法,提出了铁轨线检测算法CLRNet-R;针对铁轨线在成像中线条细长,所占像素少,难以从复杂背景中区分的问题,我们引入注意力机制,提升全局特征提取能力,并增加语义分割头,利用铁轨二值概率增强铁轨线区域的特征;针对原CLRNet算法识别弯轨性能差、输出线条不光滑的问题,我们改进了原框架中线条交并比计算的权重分配,并提出两种基于局部斜率的损失,优化模型局部采样点的训练约束,提升模型对弯轨的拟合性能,获取光滑、稳定的铁轨线检测结果。本文通过实验证明,与其他主流的车道线检测算法相比,所提出的算法在铁轨线检测任务中具有更好的性能。
参考文献
|
相关文章
|
多维度评价
|
评论
(
0
)