Multimodal Feature Fusion for Ship CAD Model Retrieval Technology
摘要: 本文提出了一种多模态特征融合的船舶CAD(Computer-Aided Design)模型检索方法,旨在解决传统船舶CAD模型检索中单一模态表达能力有限的问题——三维几何特征难以捕捉语义信息、文本描述无法表达精确几何结构、图像特征受视角和光照变化影响显著。该方法通过参考Context-I2W网络将参考图像映射为伪词标记,并融合CAD模型的BOM(Bill of Materials)信息和网格几何特征;设计基于WR(Weighted Residual)矩阵的多模态特征融合框架,将图像、文本和三维几何特征在语义空间对齐;构建组合查询机制,通过计算组合嵌入与候选模型特征的相似度进行匹配检索。实验在包含204个船舶多模态样本的数据集上验证,结果表明该方法在船体结构、舾装件和管系布置三类典型部件检索任务上平均mAP(Mean Average Precision)达到83.5%,较现有零样本方法提升16.7%,ROC(Receiver Operating Characteristic)曲线下面积达到0.818,在无需标注数据的情况下实现了优秀的检索性能。
中图分类号: