面向多天气退化图像恢复的自注意力扩散模型

doi:10.16183/j.cnki.jsjtu.2023.043

[1]

高涛, 文渊博, 陈婷, 等.

基于窗口自注意力网络的单图像去雨算法

[J]. 上海交通大学学报, 2023, 57(5): 613-623.

DOI:10.16183/j.cnki.jsjtu.2022.032 [本文引用: 1]

单图像去雨研究旨在利用退化的雨图恢复出无雨图像,而现有的基于深度学习的去雨算法未能有效地利用雨图的全局性信息,导致去雨后的图像损失部分细节和结构信息.针对此问题,提出一种基于窗口自注意力网络 (Swin Transformer) 的单图像去雨算法.该算法网络主要包括浅层特征提取模块和深度特征提取网络两部分.前者利用上下文信息聚合输入来适应雨痕分布的多样性,进而提取雨图的浅层特征.后者利用Swin Transformer捕获全局性信息和像素点间的长距离依赖关系,并结合残差卷积和密集连接强化特征学习,最后通过全局残差卷积输出去雨图像.此外,提出一种同时约束图像边缘和区域相似性的综合损失函数来进一步提高去雨图像的质量.实验表明,与目前单图像去雨表现优秀的算法MSPFN、 MPRNet相比,该算法使去雨图像的峰值信噪比提高0.19 dB和2.17 dB,结构相似性提高3.433%和1.412%,同时网络模型参数量下降84.59%和34.53%,前向传播平均耗时减少21.25%和26.67%.

GAO

Tao

, WEN

Yuanbo

, CHEN

Ting

, et al.

A single image deraining algorithm based on Swin Transformer

[J]. Journal of Shanghai Jiao Tong University, 2023, 57(5): 613-623.

[本文引用: 1]

[2]

黄鹤, 胡凯益, 李战一, 等.

融合MCAP和GRTV正则化的无人机航拍建筑物图像去雾方法

[J]. 上海交通大学学报, 2023, 57(3): 613-623.

[本文引用: 1]

HUANG

He

, HU

Kaiyi

, LI

Zhanyi

, et al.

An image dehazing method for UAV aerial photography to buildings combining MCAP and GRTV regularization

[J]. Journal of Shanghai Jiao Tong University, 2023, 57(3): 613-623.

[本文引用: 1]

[3]

LI

R

, ROBBY

T T

, LOONG-FAH

C

.

All in one bad weather removal using architectural search

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle, WA, USA: IEEE, 2020: 3175-3185.

[本文引用: 6]

[4]

VALANARASU

J M J

, YASARLA

R

, PATEL

V M

.

Transweather: Transformer-based restoration of images degraded by adverse weather conditions

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. NewOrleans, LA, USA: IEEE, 2022: 2353-2363.

[本文引用: 6]

[5]

GOODFELLOW

I

, POUGET-ABADIE

J

, MIRZA

M

, et al.

Generative adversarial networks

[J]. Communications of the ACM, 2020, 63(11): 139-144.

[本文引用: 1]

[6]

KINGMA

D P

, WELLING

M

.

Auto-encoding variational bayes

[DB/OL]. (2013-12-20)[2023-02-06]. https://arxiv.org/abs/1312.6114.

URL [本文引用: 1]

[7]

HO

J

, JAIN

A

, ABBEEL

P

.

Denoising diffusion probabilistic models

[J]. Advances in Neural Information Processing Systems, 2020, 33: 6840-6851.

[本文引用: 2]

[8]

DHARIWAL

P

, NICHOL

A

.

Diffusion models beat gans on image synthesis

[J]. Advances in Neural Information Processing Systems, 2021, 34: 8780-8794.

[本文引用: 2]

[9]

PEEBLES

W

, XIE

S

.

Scalable diffusion models with Transformers

[DB/OL]. (2022-12-19)[2023-02-06]. https://arxiv.org/abs/2212.09748.

URL [本文引用: 2]

[10]

WANG

Z

, CUN

X

, BAO

J

, et al.

Uformer: A general u-shaped transformer for image restoration

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. NewOrleans, LA, USA: IEEE, 2022: 17683-17693.

[本文引用: 5]

[11]

ZAMIR

S W

, ARORA

A

, KHAN

S

, et al.

Restormer: Efficient transformer for high-resolution image restoration

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. NewOrleans, LA, USA: IEEE, 2022: 5728-5739.

[本文引用: 8]

[12]

YAO

T

, LI

Y

, PAN

Y

, et al.

Dual vision transformer

[DB/OL]. (2022-07-11) [2023-02-06]. https://arxiv.org/abs/2207.04976.

URL [本文引用: 1]

[13]

CHEN

L

, CHU

X

, ZHANG

X

, et al.

Simple baselines for image restoration

[C]// Proceedings of the European Conference on Computer Vision. Tel Aviv, Israel: Springer, 2022: 17-33.

[本文引用: 2]

[14]

LIU

Y F

, JAW

D W

, HUANG

S C

, et al.

DesnowNet: Context-aware deep network for snow removal

[J]. IEEE Transactions on Image Processing, 2018, 27(6): 3064-3073.

[本文引用: 5]

[15]

鲍先富, 强赞霞, 杨关.

功能解耦和谱特征融合的雪霾消除模型

[J]. 计算机工程与应用, 2023, 59(13): 211-219.

DOI:10.3778/j.issn.1002-8331.2203-0566 [本文引用: 1]

针对车载相机受雪花、雾霾影响，导致采集图像出现雪花遮挡和雾霾面纱效应问题，基于图像边缘纹理和图像色彩分离重建的思想，提出功能解耦、双重监督的雪霾消除网络。所提算法通过对图像边缘纹理和色彩信息进行分离重建，将雪霾消除任务解耦为背景纹理修复与色彩重建两个子任务，并用双生成对抗网络分别进行边缘纹理和色彩特征的协同重建。算法在SRRS-6000数据集上进行消融测试，验证了双重监督对网络加速收敛的有效性和噪声消除的显著效果，模型在Snow100K-S、Snow100K-M、Snow100K-L、I&O-Haze数据集上进行测试，峰值信噪比（peak signal to noise ratio，PSNR）和结构相似性（structural similarity，SSIM）分别达到33.29?dB和0.94、32.8?dB和0.931?6、30.13?dB和0.93、25.88?dB和0.82。实验结果表明，通过对图像去噪任务进行解耦和双重监督，取得了高效的雪花、雾霾消除效果，增强了无人驾驶辅助系统在复杂天气条件下的适应性。

BAO

Xianfu

, QIANG

Zanxia

, YANG

Guan

.

Generative adverbial network for function decoupling and edge feature fusion for snow and haze elimination

[J]. Computer Engineering & Applications, 2023, 59(13):211-219.

[本文引用: 1]

[16]

柴国强, 王大为, 芦宾, 等.

基于注意机制的轻量化稠密连接网络单幅图像去雨

[J]. 北京航空航天大学学报, 2022, 48(11): 2186-2192.

[本文引用: 1]

CHAI

Guoqiang

, WANG

Dawei

, LU

Bin

, et al.

Lightweight densely connected network based on attention mechanism for single-image deraining

[J]. Journal of Beijing University of Aeronautics & Astronautics, 2022, 48(11): 2186-2192.

[本文引用: 1]

[17]

QIAN

R

, TAN

R T

, YANG

W

, et al.

Attentive generative adversarial network for raindrop removal from a single image

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, UT, USA: IEEE, 2018: 2482-2491.

[本文引用: 4]

[18]

CHEN

H

, WANG

Y

, GUO

T

, et al.

Pre-trained image processing transformer

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Kuala Lumpur, Malaysia: IEEE, 2021: 12299-12310.

[本文引用: 1]

[19]

LI

B

, LIU

X

, HU

P

, et al.

All-in-one image restoration for unknown corruption

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. NewOrleans, LA, USA: IEEE, 2022: 17452-17462.

[本文引用: 1]

[20]

LI

R

, CHEONG

L F

, TAN

R T

.

Heavy rain image restoration: Integrating physics model and conditional adversarial learning

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach, CA, USA: IEEE, 2019: 1633-1642.

[本文引用: 3]

[21]

LI

S

, ARAUJO

I B

, REN

W

, et al.

Single image deraining: A comprehensive benchmark analysis

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach, CA, USA: IEEE, 2019: 3838-3847.

[本文引用: 1]

[22]

LI

X

, WU

J

, LIN

Z

, et al.

Recurrent squeeze-and-excitation context aggregation net for single image deraining

[C]// Proceedings of the European Conference on Computer Vision. Salty Lake City, UT, USA: Springer, 2018: 254-269.

[本文引用: 1]

[23]

WANG

T

, YANG

X

, XU

K

, et al.

Spatial attentive single-image deraining with a high quality real rain dataset

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach, CA, USA: IEEE, 2019: 12270-12279.

[本文引用: 1]

[24]

CHEN

W

, FANG

H

, DING

J

, et al.

JSTASR: Joint size and transparency-aware snow removal algorithm based on modified partial convolution and veiling effect removal

[C]// Proceedings of the European Conference on Computer Vision. Glasgow, UK: Springer, 2020: 754-770.

[本文引用: 1]

[25]

LIANG

J

, CAO

J

, SUN

G

, et al.

Swinir: Image restoration using swin transformer

[C]// Proceedings of the IEEE/CVF International Conference on Computer Vision. Montreal, canada: IEEE, 2021: 1833-1844.

[本文引用: 3]

[26]

ZHANG

K

, LI

R

, YU

Y

, et al.

Deep dense multi-scale network for snow removal using semantic and depth priors

[J]. IEEE Transactions on Image Processing, 2021, 30: 7419-7431.

[本文引用: 1]

[27]

ZHU

J Y

, PARK

T

, ISOLA

P

, et al.

Unpaired image-to-image translation using cycle-consistent adversarial networks

[C]// Proceedings of the IEEE International Conference on Computer Vision. Venice, Italy: IEEE, 2017: 2223-2232.

[本文引用: 1]

[28]

ISOLA

P

, ZHU

J Y

, ZHOU

T

, et al.

Image-to-image translation with conditional adversarial networks

[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Venice, Italy: IEEE, 2017: 1125-1134.

[本文引用: 2]

[29]

JIANG

K

, WANG

Z

, YI

P

, et al.

Rain-free and residue hand-in-hand: A progressive coupled network for real-time image deraining

[J]. IEEE Transactions on Image Processing, 2021, 30: 7404-7418.

[本文引用: 1]

[30]

ZAMIR

S W

, ARORA

A

, KHAN

S

, et al.

Multi-stage progressive image restoration

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Kuala Lumpur, Malaysia: IEEE, 2021: 14821-14831.

[本文引用: 1]

[31]

LIU

X

, SUGANUMA

M

, SUN

Z

, et al.

Dual residual networks leveraging the potential of paired operations for image restoration

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Long Beach, CA, USA: IEEE, 2019: 7007-7016.

[本文引用: 1]

[32]

QUAN

Y

, DENG

S

, CHEN

Y

, et al.

Deep learning for seeing through window with raindrops

[C]// Proceedings of the IEEE/CVF International Conference on Computer Vision. Seoul Korea: IEEE, 2019: 2463-2471.

[本文引用: 1]

[33]

QUAN

R

, YU

X

, LIANG

Y

, et al.

Removing raindrops and rain streaks in one go

[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Kuala Lumpur, Malaysia: IEEE, 2021: 9147-9156.

[本文引用: 1]

[34]

XIAO

J

, FU

X

, LIU

A

, et al.

Image de-raining transformer

[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2022: 1-18.

[本文引用: 1]

基于窗口自注意力网络的单图像去雨算法

1

2023

... 雨、雪等恶劣天气下采集的图片会发生严重退化,进而影响后续的语义分割、目标检测等^[1-2]计算机视觉算法的表现.现有多数基于深度学习的算法仅能去除单一天气,对于不同的退化无法直接迁移扩展.因此,多天气退化图像恢复凭借其仅需一次训练便可同时去除多种天气退化的优势而逐渐受到关注.例如,Li等^[3]利用多天气编码器和单输出解码器的结构首次提出多天气退化图像恢复网络All-in-One.Valanarasu等^[4]将任务查询向量引入视觉Transformer (Vision Transformer, ViT) 模型来得到干净背景图像. ...

A single image deraining algorithm based on Swin Transformer

1

2023

... 雨、雪等恶劣天气下采集的图片会发生严重退化,进而影响后续的语义分割、目标检测等^[1-2]计算机视觉算法的表现.现有多数基于深度学习的算法仅能去除单一天气,对于不同的退化无法直接迁移扩展.因此,多天气退化图像恢复凭借其仅需一次训练便可同时去除多种天气退化的优势而逐渐受到关注.例如,Li等^[3]利用多天气编码器和单输出解码器的结构首次提出多天气退化图像恢复网络All-in-One.Valanarasu等^[4]将任务查询向量引入视觉Transformer (Vision Transformer, ViT) 模型来得到干净背景图像. ...

融合MCAP和GRTV正则化的无人机航拍建筑物图像去雾方法

1

2023

... 雨、雪等恶劣天气下采集的图片会发生严重退化,进而影响后续的语义分割、目标检测等^[1-2]计算机视觉算法的表现.现有多数基于深度学习的算法仅能去除单一天气,对于不同的退化无法直接迁移扩展.因此,多天气退化图像恢复凭借其仅需一次训练便可同时去除多种天气退化的优势而逐渐受到关注.例如,Li等^[3]利用多天气编码器和单输出解码器的结构首次提出多天气退化图像恢复网络All-in-One.Valanarasu等^[4]将任务查询向量引入视觉Transformer (Vision Transformer, ViT) 模型来得到干净背景图像. ...

An image dehazing method for UAV aerial photography to buildings combining MCAP and GRTV regularization

1

2023

... 雨、雪等恶劣天气下采集的图片会发生严重退化,进而影响后续的语义分割、目标检测等^[1-2]计算机视觉算法的表现.现有多数基于深度学习的算法仅能去除单一天气,对于不同的退化无法直接迁移扩展.因此,多天气退化图像恢复凭借其仅需一次训练便可同时去除多种天气退化的优势而逐渐受到关注.例如,Li等^[3]利用多天气编码器和单输出解码器的结构首次提出多天气退化图像恢复网络All-in-One.Valanarasu等^[4]将任务查询向量引入视觉Transformer (Vision Transformer, ViT) 模型来得到干净背景图像. ...

All in one bad weather removal using architectural search

6

2020

... 雨、雪等恶劣天气下采集的图片会发生严重退化,进而影响后续的语义分割、目标检测等^[1-2]计算机视觉算法的表现.现有多数基于深度学习的算法仅能去除单一天气,对于不同的退化无法直接迁移扩展.因此,多天气退化图像恢复凭借其仅需一次训练便可同时去除多种天气退化的优势而逐渐受到关注.例如,Li等^[3]利用多天气编码器和单输出解码器的结构首次提出多天气退化图像恢复网络All-in-One.Valanarasu等^[4]将任务查询向量引入视觉Transformer (Vision Transformer, ViT) 模型来得到干净背景图像. ...

... 如图1所示,目前用于天气退化图像恢复的算法可以分为3类,即专一型、统一型和同一型.其中,专一型^{[14⇓⇓-17]}为不同任务设计专门的网络结构,模型架构与参数均不相同;统一型^[10-11]为不同任务设计统一的网络结构,模型架构一致但参数不相同;同一型^{[3-4,18 -19]}根据不同天气退化的相似特点设计同一的多天气退化图像恢复网络,在同时存在多种天气退化因素的数据集上训练, 对于不同天气退化图像恢复任务模型的架构和参数相同. ...

... Allweather:根据文献[3]将Snow100K^[14]、Out-door Rain^[20]和Raindrop^[17]数据集组合而成,其包括18 069对图像用来训练多天气退化图像恢复算法. ...

... 为了验证本文算法的有效性,实验对比本文算法AWIR-TDM与近期表现良好的统一型图像恢复方法Uformer^[10]、Restormer^[11]和多天气退化图像恢复方法All-in-One^[3]、TransWeather^[4]在数据集Allweather上经过一次训练后分别在雪、雨雾和雨滴测试数据集上的表现.选取常用的有监督图像质量评价指标峰值信噪比 (peak signal noise ratio, PSNR) 和结构相似性 (structural similarity, SSIM) 进行定量对比.峰值信噪比的计算公式如下: ...

... Quantitative comparison of different methods in all-in-one weather-degraded image restoration tasks

Tab.2

方法	源	Snow100K-L PSNR/SSIM	Snow100K-M PSNR/SSIM	Snow100K-S PSNR/SSIM	Test1 PSNR/SSIM	Raindrop-A PSNR/SSIM
Uformer^[10]	CVPR 2022	26.24/0.8680	32.11/0.9316	34.00/0.9445	16.32/0.7565	30.33/0.9335
Restormer^[11]	CVPR 2022	$\underset{=}{29.57}$ / $\underset{=}{0.9106}$	$\underset{=}{33.71}$ / $\underset{=}{0.9490}$	$\underset{=}{35.43}$ / $\underset{=}{0.9583}$	$\underset{=}{29.81}$ / $\underset{=}{0.9208}$	$\underset{=}{31.10}$ / $\underset{=}{0.9337}$
All-in-One^[3]	CVPR 2020	28.14/0.8901	30.96/0.9290	32.63/0.9392	25.87/ $\underline{0.8996}$	$\underline{31.35}$ / $\underline{0.9299}$
TransWeather^[4]	CVPR 2022	$\underline{29.15}$ / $\underline{0.8930}$	$\underline{32.02}$ / $\underline{0.9343}$	$\underline{32.98}$ / $\underline{0.9447}$	$\underline{28.61}$ /0.8893	30.21/0.9179
AWIR-TDM		31.69/0.9240	35.47/0.9565	37.16/0.9642	31.68/0.9347	32.33/0.9429

不同算法所得恢复图像的视觉对比如图5~7所示,分别为退化图像经过去雨滴、去雨雾和去雪后所得的恢复图像.在图5中,相比其他算法,AWIR-TDM方法能够有效去除较大雨滴并得到与无退化图像接近的结果.如第1行对比图像中Uformer和All-in-One未能去除雨滴,Restormer和TransWeather所得恢复图像中仍存在明显痕迹,而本文算法能够彻底去除雨滴.在图6去雨雾视觉对比中,所有算法均能有效去除雨水痕迹,但相比本文算法,其他算法无法有效恢复图像的细节信息.如第1行对比图像中,本文算法能够得到清晰的指示牌字符,而其他算法所得字符已经无法辨认.特别地,发现Uformer处理雨雾图像时未能去除图像边缘的雨雾.在图7第一行对比图像中,本文算法能够有效去除上衣口袋上的雪痕迹,而Uformer、All-in-One和TransWeather的结果中出现明显残留.尽管Restormer的结果中没有明显的雪痕迹,但却得不到清晰的细节纹理,而本文算法得到的纹理更接近真实背景图像. ...

... Quantitative comparison of different methods on natural weather-degraded image dataset

Tab.6

方法	Snow NIQE/SSEQ/NIMA	RainMist NIQE/SSEQ/NIMA	RainStreak NIQE/SSEQ/NIMA	Raindrop NIQE/SSEQ/NIMA
Uformer^[10]	3.395/28.31/2.644	4.021/26.88/3.289	3.771/27.19/3.376	4.792/34.06/4.260
Restormer^[11]	3.267/27.90/2.570	3.912/ $\underline{24.30}$ / $\underline{3.874}$	$\underline{3.694}$ /26.47/ $\underline{3.480}$	4.658/ $\underline{30.72}$ / $\underline{4.317}$
All-in-One^[3]	3.561/29.62/2.384	4.253/25.20/3.419	3.895/27.03/3.352	$\underline{5.000}$ /38.94/4.073
TransWeather^[4]	3.020/ $\underline{27.78}$ / $\underline{2.793}$	$\underline{3.791}$ /24.62/3.700	3.765/27.11/3.282	4.702/31.81/4.213
AWIR-TDM	$\underline{3.134}$ /27.62/2.980	3.752/24.23/3.965	3.636/ $\underline{26.75}$ /3.491	4.647/30.46/4.328

此外,不同算法所得的自然天气退化图像恢复视觉对比如图8所示.其中,在处理第1~3幅雨滴图像时,AWIR-TDM能有效去除雨滴痕迹,同时得到更符合视觉感知特点的纹理特征.如第1行对比图像中,All-in-One所得结果中除天空部分残留的雨滴外其他雨滴被彻底去除,但树枝原有纹理被破坏,从而导致视觉效果较差.在处理第4~6幅雨图时,本文算法有效去除退化图像中的雨水痕迹,而其他算法所得结果中均存在明显的雨痕残留.如第5行对比图像中,Uformer、Restormer等算法均无法去除肩膀处的雨痕.第7、8幅退化图像为雪图,其中第7幅图中由于雪的运动出现大量雪痕,第8幅图中存在大小不一的雪花颗粒,本文算法均有效去除雪痕和雪花,而其他算法无法适应不同的雪特点.如最后一行对比图像中,All-in-One和TransWeather等算法无法同时去除多样的雪花颗粒. ...

Transweather: Transformer-based restoration of images degraded by adverse weather conditions

6

2022

... 雨、雪等恶劣天气下采集的图片会发生严重退化,进而影响后续的语义分割、目标检测等^[1-2]计算机视觉算法的表现.现有多数基于深度学习的算法仅能去除单一天气,对于不同的退化无法直接迁移扩展.因此,多天气退化图像恢复凭借其仅需一次训练便可同时去除多种天气退化的优势而逐渐受到关注.例如,Li等^[3]利用多天气编码器和单输出解码器的结构首次提出多天气退化图像恢复网络All-in-One.Valanarasu等^[4]将任务查询向量引入视觉Transformer (Vision Transformer, ViT) 模型来得到干净背景图像. ...

... 如图1所示,目前用于天气退化图像恢复的算法可以分为3类,即专一型、统一型和同一型.其中,专一型^{[14⇓⇓-17]}为不同任务设计专门的网络结构,模型架构与参数均不相同;统一型^[10-11]为不同任务设计统一的网络结构,模型架构一致但参数不相同;同一型^{[3-4,18 -19]}根据不同天气退化的相似特点设计同一的多天气退化图像恢复网络,在同时存在多种天气退化因素的数据集上训练, 对于不同天气退化图像恢复任务模型的架构和参数相同. ...

... 为了验证本文算法的有效性,实验对比本文算法AWIR-TDM与近期表现良好的统一型图像恢复方法Uformer^[10]、Restormer^[11]和多天气退化图像恢复方法All-in-One^[3]、TransWeather^[4]在数据集Allweather上经过一次训练后分别在雪、雨雾和雨滴测试数据集上的表现.选取常用的有监督图像质量评价指标峰值信噪比 (peak signal noise ratio, PSNR) 和结构相似性 (structural similarity, SSIM) 进行定量对比.峰值信噪比的计算公式如下: ...

... Quantitative comparison of different methods in all-in-one weather-degraded image restoration tasks

Tab.2

方法	源	Snow100K-L PSNR/SSIM	Snow100K-M PSNR/SSIM	Snow100K-S PSNR/SSIM	Test1 PSNR/SSIM	Raindrop-A PSNR/SSIM
Uformer^[10]	CVPR 2022	26.24/0.8680	32.11/0.9316	34.00/0.9445	16.32/0.7565	30.33/0.9335
Restormer^[11]	CVPR 2022	$\underset{=}{29.57}$ / $\underset{=}{0.9106}$	$\underset{=}{33.71}$ / $\underset{=}{0.9490}$	$\underset{=}{35.43}$ / $\underset{=}{0.9583}$	$\underset{=}{29.81}$ / $\underset{=}{0.9208}$	$\underset{=}{31.10}$ / $\underset{=}{0.9337}$
All-in-One^[3]	CVPR 2020	28.14/0.8901	30.96/0.9290	32.63/0.9392	25.87/ $\underline{0.8996}$	$\underline{31.35}$ / $\underline{0.9299}$
TransWeather^[4]	CVPR 2022	$\underline{29.15}$ / $\underline{0.8930}$	$\underline{32.02}$ / $\underline{0.9343}$	$\underline{32.98}$ / $\underline{0.9447}$	$\underline{28.61}$ /0.8893	30.21/0.9179
AWIR-TDM		31.69/0.9240	35.47/0.9565	37.16/0.9642	31.68/0.9347	32.33/0.9429

不同算法所得恢复图像的视觉对比如图5~7所示,分别为退化图像经过去雨滴、去雨雾和去雪后所得的恢复图像.在图5中,相比其他算法,AWIR-TDM方法能够有效去除较大雨滴并得到与无退化图像接近的结果.如第1行对比图像中Uformer和All-in-One未能去除雨滴,Restormer和TransWeather所得恢复图像中仍存在明显痕迹,而本文算法能够彻底去除雨滴.在图6去雨雾视觉对比中,所有算法均能有效去除雨水痕迹,但相比本文算法,其他算法无法有效恢复图像的细节信息.如第1行对比图像中,本文算法能够得到清晰的指示牌字符,而其他算法所得字符已经无法辨认.特别地,发现Uformer处理雨雾图像时未能去除图像边缘的雨雾.在图7第一行对比图像中,本文算法能够有效去除上衣口袋上的雪痕迹,而Uformer、All-in-One和TransWeather的结果中出现明显残留.尽管Restormer的结果中没有明显的雪痕迹,但却得不到清晰的细节纹理,而本文算法得到的纹理更接近真实背景图像. ...

... Quantitative comparison of different methods on Snow100K dataset

Tab.3

方法	源	Snow100K-L PSNR/SSIM	Snow100K-M PSNR/SSIM	Snow100K-S PSNR/SSIM	平均指标 PSNR/SSIM
RESCAN^[22]	ECCV 2018	26.08/0.8108	29.95/0.8860	31.51/0.9032	29.28/0.8667
SPANet^[23]	CVPR 2019	23.70/0.7930	28.06/0.8680	29.92/0.8260	27.23/0.8290
DesnowNet^[14]	TIP 2018	27.17/ $\underline{0.8983}$	30.87/0.9409	32.33/0.9500	30.12/ $\underline{0.9300}$
JSTASR^[24]	ECCV 2020	25.32/0.8076	29.11/0.8843	31.40/0.9012	28.61/0.8644
SwinIR^[25]	CVPR 2021	28.18/0.8800	31.42/0.9284	33.96/ $\underline{0.9567}$	31.19/0.9217
DDMSNet^[26]	TIP 2021	28.85/0.8772	32.89/0.9330	34.34/0.9445	32.03/0.9182
TransWeather^[4]	CVPR 2022	$\underline{29.21}$ /0.8947	$\underline{33.41}$ / $\underline{0.9416}$	$\underline{34.92}$ /0.9543	$\underline{32.51}$ /0.9279
AWIR-TDM		30.64/0.9193	35.26/0.9472	37.05/0.9680	34.32/0.9448

10.16183/j.cnki.jsjtu.2023.043.T0004

表4

不同算法在雨雾数据集Test1上的定量对比 ...

... Quantitative comparison of different methods on natural weather-degraded image dataset

Tab.6

方法	Snow NIQE/SSEQ/NIMA	RainMist NIQE/SSEQ/NIMA	RainStreak NIQE/SSEQ/NIMA	Raindrop NIQE/SSEQ/NIMA
Uformer^[10]	3.395/28.31/2.644	4.021/26.88/3.289	3.771/27.19/3.376	4.792/34.06/4.260
Restormer^[11]	3.267/27.90/2.570	3.912/ $\underline{24.30}$ / $\underline{3.874}$	$\underline{3.694}$ /26.47/ $\underline{3.480}$	4.658/ $\underline{30.72}$ / $\underline{4.317}$
All-in-One^[3]	3.561/29.62/2.384	4.253/25.20/3.419	3.895/27.03/3.352	$\underline{5.000}$ /38.94/4.073
TransWeather^[4]	3.020/ $\underline{27.78}$ / $\underline{2.793}$	$\underline{3.791}$ /24.62/3.700	3.765/27.11/3.282	4.702/31.81/4.213
AWIR-TDM	$\underline{3.134}$ /27.62/2.980	3.752/24.23/3.965	3.636/ $\underline{26.75}$ /3.491	4.647/30.46/4.328

此外,不同算法所得的自然天气退化图像恢复视觉对比如图8所示.其中,在处理第1~3幅雨滴图像时,AWIR-TDM能有效去除雨滴痕迹,同时得到更符合视觉感知特点的纹理特征.如第1行对比图像中,All-in-One所得结果中除天空部分残留的雨滴外其他雨滴被彻底去除,但树枝原有纹理被破坏,从而导致视觉效果较差.在处理第4~6幅雨图时,本文算法有效去除退化图像中的雨水痕迹,而其他算法所得结果中均存在明显的雨痕残留.如第5行对比图像中,Uformer、Restormer等算法均无法去除肩膀处的雨痕.第7、8幅退化图像为雪图,其中第7幅图中由于雪的运动出现大量雪痕,第8幅图中存在大小不一的雪花颗粒,本文算法均有效去除雪痕和雪花,而其他算法无法适应不同的雪特点.如最后一行对比图像中,All-in-One和TransWeather等算法无法同时去除多样的雪花颗粒. ...

Generative adversarial networks

1

2020

... 图像生成模型具有强大的表征能力和丰富的解空间,自出现起便在图像生成领域表现出显著优势,如生成对抗网络 (generative adversarial network, GAN)^[5]、变分自编码器 (variational auto-encoder, VAE)^[6].其中,GAN利用对抗训练来提高视觉保真度,但存在训练不稳定、模式崩溃和图像伪影等问题;VAE通过最大化证据下界来优化数据的对数似然性,但平衡问题和变量崩溃现象限制其实际生成表现.近年来,去噪扩散概率模型 (denoising diffusion probability model, DDPM)^[7]在多个下游计算机视觉任务上表现出巨大优势.DDPM的主要原理为先连续添加高斯噪声来破坏原始数据,再进行反向采样来恢复图像.基于此,提出一种用于多天气退化图像恢复的自注意力扩散模型 (Transformer-based diffusion model for All-in-One weather-degraded image restoration, AWIR-TDM),以退化图像作为条件来引导反向采样. ...

Auto-encoding variational bayes

1

... 图像生成模型具有强大的表征能力和丰富的解空间,自出现起便在图像生成领域表现出显著优势,如生成对抗网络 (generative adversarial network, GAN)^[5]、变分自编码器 (variational auto-encoder, VAE)^[6].其中,GAN利用对抗训练来提高视觉保真度,但存在训练不稳定、模式崩溃和图像伪影等问题;VAE通过最大化证据下界来优化数据的对数似然性,但平衡问题和变量崩溃现象限制其实际生成表现.近年来,去噪扩散概率模型 (denoising diffusion probability model, DDPM)^[7]在多个下游计算机视觉任务上表现出巨大优势.DDPM的主要原理为先连续添加高斯噪声来破坏原始数据,再进行反向采样来恢复图像.基于此,提出一种用于多天气退化图像恢复的自注意力扩散模型 (Transformer-based diffusion model for All-in-One weather-degraded image restoration, AWIR-TDM),以退化图像作为条件来引导反向采样. ...

Denoising diffusion probabilistic models

2

2020

... 图像生成模型具有强大的表征能力和丰富的解空间,自出现起便在图像生成领域表现出显著优势,如生成对抗网络 (generative adversarial network, GAN)^[5]、变分自编码器 (variational auto-encoder, VAE)^[6].其中,GAN利用对抗训练来提高视觉保真度,但存在训练不稳定、模式崩溃和图像伪影等问题;VAE通过最大化证据下界来优化数据的对数似然性,但平衡问题和变量崩溃现象限制其实际生成表现.近年来,去噪扩散概率模型 (denoising diffusion probability model, DDPM)^[7]在多个下游计算机视觉任务上表现出巨大优势.DDPM的主要原理为先连续添加高斯噪声来破坏原始数据,再进行反向采样来恢复图像.基于此,提出一种用于多天气退化图像恢复的自注意力扩散模型 (Transformer-based diffusion model for All-in-One weather-degraded image restoration, AWIR-TDM),以退化图像作为条件来引导反向采样. ...

... 目前,基于DDPM的计算机视觉算法^[7-8]在噪声估计网络部分均采用类似U-Net的卷积网络结构.然而,Peebles等^[9]的工作表明,采用ViT的类条件扩散模型可以取得相比于常用U-Net架构更好的图像生成表现.但是,ViT中自注意力 (self-attention, SA) 的计算负担与输入特征分辨率呈平方关系,无法直接应用于高分辨率的多天气图像恢复任务.对此,Wang等^[10]基于Swin Transformer提出用于多种图像恢复任务的统一型图像恢复算法Uformer,在分割的窗口中分别计算自注意力来减少计算负担;Zamir等^[11]利用转置自注意力 (transposed self-attention, TSA) 强化特征学习,即将原自注意力的表征从空间维度转移到通道维度,在去雨、去噪等任务上取得良好表现.然而,以上方法未依据自注意力的内积特点来进一步优化自注意力的表征,导致其训练和推理均需要大量时间.于DDPM而言,本身训练和采样均需要大量时间,如果在噪声估计网络部分直接使用计算负担巨大的ViT会加剧对硬件环境的要求.同时,文献[12]中表明自注意力和TSA具有接近的表现.因此,提出一种次空间转置自注意力噪声估计网络 (subspace transposed Transformer for noise estimation, NE-STT). NE-STT先将输入特征映射到次空间,再利用TSA构成次空间转置自注意力 (subspace transposed self-attention, STSA) 来强化特征学习并显著减少计算负担.同时,STSA不需要将输入特征分割为多个不重叠的窗口,而是直接从输入特征得到分辨率水平较低的查询向量Q和键向量K来进一步计算自注意力,相比Swin Transformer分割窗口更符合自注意力机制提取特征全局信息的初衷.同时,文献[11]和文献[13]中的工作表明,门控机制能够有效提高ViT中前馈网络 (feed-forward network, FFN) 的非线性表征能力从而提升视觉自注意力网络ViT的整体表现.基于此,提出双分组门控前馈网络 (dual grouped gated feed-forward network, DGGFFN),其在ViT中前馈网络FFN的深度可分离卷积后采用双分组门控机制来提高非线性表征能力. ...

Diffusion models beat gans on image synthesis

2

2021

... 目前,基于DDPM的计算机视觉算法^[7-8]在噪声估计网络部分均采用类似U-Net的卷积网络结构.然而,Peebles等^[9]的工作表明,采用ViT的类条件扩散模型可以取得相比于常用U-Net架构更好的图像生成表现.但是,ViT中自注意力 (self-attention, SA) 的计算负担与输入特征分辨率呈平方关系,无法直接应用于高分辨率的多天气图像恢复任务.对此,Wang等^[10]基于Swin Transformer提出用于多种图像恢复任务的统一型图像恢复算法Uformer,在分割的窗口中分别计算自注意力来减少计算负担;Zamir等^[11]利用转置自注意力 (transposed self-attention, TSA) 强化特征学习,即将原自注意力的表征从空间维度转移到通道维度,在去雨、去噪等任务上取得良好表现.然而,以上方法未依据自注意力的内积特点来进一步优化自注意力的表征,导致其训练和推理均需要大量时间.于DDPM而言,本身训练和采样均需要大量时间,如果在噪声估计网络部分直接使用计算负担巨大的ViT会加剧对硬件环境的要求.同时,文献[12]中表明自注意力和TSA具有接近的表现.因此,提出一种次空间转置自注意力噪声估计网络 (subspace transposed Transformer for noise estimation, NE-STT). NE-STT先将输入特征映射到次空间,再利用TSA构成次空间转置自注意力 (subspace transposed self-attention, STSA) 来强化特征学习并显著减少计算负担.同时,STSA不需要将输入特征分割为多个不重叠的窗口,而是直接从输入特征得到分辨率水平较低的查询向量Q和键向量K来进一步计算自注意力,相比Swin Transformer分割窗口更符合自注意力机制提取特征全局信息的初衷.同时,文献[11]和文献[13]中的工作表明,门控机制能够有效提高ViT中前馈网络 (feed-forward network, FFN) 的非线性表征能力从而提升视觉自注意力网络ViT的整体表现.基于此,提出双分组门控前馈网络 (dual grouped gated feed-forward network, DGGFFN),其在ViT中前馈网络FFN的深度可分离卷积后采用双分组门控机制来提高非线性表征能力. ...

... 式中:

$\hat{x}$

即作为条件的天气退化图像.此时x_t_-1~p_θ(x_t_-1|x_t,

$\hat{x}$

),根据文献[8]中的条件反向采样过程为 ...

Scalable diffusion models with Transformers

2

... 目前,基于DDPM的计算机视觉算法^[7-8]在噪声估计网络部分均采用类似U-Net的卷积网络结构.然而,Peebles等^[9]的工作表明,采用ViT的类条件扩散模型可以取得相比于常用U-Net架构更好的图像生成表现.但是,ViT中自注意力 (self-attention, SA) 的计算负担与输入特征分辨率呈平方关系,无法直接应用于高分辨率的多天气图像恢复任务.对此,Wang等^[10]基于Swin Transformer提出用于多种图像恢复任务的统一型图像恢复算法Uformer,在分割的窗口中分别计算自注意力来减少计算负担;Zamir等^[11]利用转置自注意力 (transposed self-attention, TSA) 强化特征学习,即将原自注意力的表征从空间维度转移到通道维度,在去雨、去噪等任务上取得良好表现.然而,以上方法未依据自注意力的内积特点来进一步优化自注意力的表征,导致其训练和推理均需要大量时间.于DDPM而言,本身训练和采样均需要大量时间,如果在噪声估计网络部分直接使用计算负担巨大的ViT会加剧对硬件环境的要求.同时,文献[12]中表明自注意力和TSA具有接近的表现.因此,提出一种次空间转置自注意力噪声估计网络 (subspace transposed Transformer for noise estimation, NE-STT). NE-STT先将输入特征映射到次空间,再利用TSA构成次空间转置自注意力 (subspace transposed self-attention, STSA) 来强化特征学习并显著减少计算负担.同时,STSA不需要将输入特征分割为多个不重叠的窗口,而是直接从输入特征得到分辨率水平较低的查询向量Q和键向量K来进一步计算自注意力,相比Swin Transformer分割窗口更符合自注意力机制提取特征全局信息的初衷.同时,文献[11]和文献[13]中的工作表明,门控机制能够有效提高ViT中前馈网络 (feed-forward network, FFN) 的非线性表征能力从而提升视觉自注意力网络ViT的整体表现.基于此,提出双分组门控前馈网络 (dual grouped gated feed-forward network, DGGFFN),其在ViT中前馈网络FFN的深度可分离卷积后采用双分组门控机制来提高非线性表征能力. ...

... 在目前基于去噪扩散概率模型DDPM的图像恢复任务中,噪声估计网络NE-Net均采用以卷积神经网络CNN为核心的U-Net架构.文献[9]中表明视觉自注意力网络ViT的全局特性或架构设计相比CNN在建模特征依赖上更具优势.然而,ViT中自注意力巨大的计算负担和扩散模型本身更长的反向采样时间限制了其在多天气退化图像恢复任务AIR上的实际应用.为此,提出计算负担更小且噪声估计表现更好的NE-STT,如图4所示. ...

Uformer: A general u-shaped transformer for image restoration

5

2022

... 目前,基于DDPM的计算机视觉算法^[7-8]在噪声估计网络部分均采用类似U-Net的卷积网络结构.然而,Peebles等^[9]的工作表明,采用ViT的类条件扩散模型可以取得相比于常用U-Net架构更好的图像生成表现.但是,ViT中自注意力 (self-attention, SA) 的计算负担与输入特征分辨率呈平方关系,无法直接应用于高分辨率的多天气图像恢复任务.对此,Wang等^[10]基于Swin Transformer提出用于多种图像恢复任务的统一型图像恢复算法Uformer,在分割的窗口中分别计算自注意力来减少计算负担;Zamir等^[11]利用转置自注意力 (transposed self-attention, TSA) 强化特征学习,即将原自注意力的表征从空间维度转移到通道维度,在去雨、去噪等任务上取得良好表现.然而,以上方法未依据自注意力的内积特点来进一步优化自注意力的表征,导致其训练和推理均需要大量时间.于DDPM而言,本身训练和采样均需要大量时间,如果在噪声估计网络部分直接使用计算负担巨大的ViT会加剧对硬件环境的要求.同时,文献[12]中表明自注意力和TSA具有接近的表现.因此,提出一种次空间转置自注意力噪声估计网络 (subspace transposed Transformer for noise estimation, NE-STT). NE-STT先将输入特征映射到次空间,再利用TSA构成次空间转置自注意力 (subspace transposed self-attention, STSA) 来强化特征学习并显著减少计算负担.同时,STSA不需要将输入特征分割为多个不重叠的窗口,而是直接从输入特征得到分辨率水平较低的查询向量Q和键向量K来进一步计算自注意力,相比Swin Transformer分割窗口更符合自注意力机制提取特征全局信息的初衷.同时,文献[11]和文献[13]中的工作表明,门控机制能够有效提高ViT中前馈网络 (feed-forward network, FFN) 的非线性表征能力从而提升视觉自注意力网络ViT的整体表现.基于此,提出双分组门控前馈网络 (dual grouped gated feed-forward network, DGGFFN),其在ViT中前馈网络FFN的深度可分离卷积后采用双分组门控机制来提高非线性表征能力. ...

... 如图1所示,目前用于天气退化图像恢复的算法可以分为3类,即专一型、统一型和同一型.其中,专一型^{[14⇓⇓-17]}为不同任务设计专门的网络结构,模型架构与参数均不相同;统一型^[10-11]为不同任务设计统一的网络结构,模型架构一致但参数不相同;同一型^{[3-4,18 -19]}根据不同天气退化的相似特点设计同一的多天气退化图像恢复网络,在同时存在多种天气退化因素的数据集上训练, 对于不同天气退化图像恢复任务模型的架构和参数相同. ...

... 为了验证本文算法的有效性,实验对比本文算法AWIR-TDM与近期表现良好的统一型图像恢复方法Uformer^[10]、Restormer^[11]和多天气退化图像恢复方法All-in-One^[3]、TransWeather^[4]在数据集Allweather上经过一次训练后分别在雪、雨雾和雨滴测试数据集上的表现.选取常用的有监督图像质量评价指标峰值信噪比 (peak signal noise ratio, PSNR) 和结构相似性 (structural similarity, SSIM) 进行定量对比.峰值信噪比的计算公式如下: ...

... Quantitative comparison of different methods in all-in-one weather-degraded image restoration tasks

Tab.2

方法	源	Snow100K-L PSNR/SSIM	Snow100K-M PSNR/SSIM	Snow100K-S PSNR/SSIM	Test1 PSNR/SSIM	Raindrop-A PSNR/SSIM
Uformer^[10]	CVPR 2022	26.24/0.8680	32.11/0.9316	34.00/0.9445	16.32/0.7565	30.33/0.9335
Restormer^[11]	CVPR 2022	$\underset{=}{29.57}$ / $\underset{=}{0.9106}$	$\underset{=}{33.71}$ / $\underset{=}{0.9490}$	$\underset{=}{35.43}$ / $\underset{=}{0.9583}$	$\underset{=}{29.81}$ / $\underset{=}{0.9208}$	$\underset{=}{31.10}$ / $\underset{=}{0.9337}$
All-in-One^[3]	CVPR 2020	28.14/0.8901	30.96/0.9290	32.63/0.9392	25.87/ $\underline{0.8996}$	$\underline{31.35}$ / $\underline{0.9299}$
TransWeather^[4]	CVPR 2022	$\underline{29.15}$ / $\underline{0.8930}$	$\underline{32.02}$ / $\underline{0.9343}$	$\underline{32.98}$ / $\underline{0.9447}$	$\underline{28.61}$ /0.8893	30.21/0.9179
AWIR-TDM		31.69/0.9240	35.47/0.9565	37.16/0.9642	31.68/0.9347	32.33/0.9429

不同算法所得恢复图像的视觉对比如图5~7所示,分别为退化图像经过去雨滴、去雨雾和去雪后所得的恢复图像.在图5中,相比其他算法,AWIR-TDM方法能够有效去除较大雨滴并得到与无退化图像接近的结果.如第1行对比图像中Uformer和All-in-One未能去除雨滴,Restormer和TransWeather所得恢复图像中仍存在明显痕迹,而本文算法能够彻底去除雨滴.在图6去雨雾视觉对比中,所有算法均能有效去除雨水痕迹,但相比本文算法,其他算法无法有效恢复图像的细节信息.如第1行对比图像中,本文算法能够得到清晰的指示牌字符,而其他算法所得字符已经无法辨认.特别地,发现Uformer处理雨雾图像时未能去除图像边缘的雨雾.在图7第一行对比图像中,本文算法能够有效去除上衣口袋上的雪痕迹,而Uformer、All-in-One和TransWeather的结果中出现明显残留.尽管Restormer的结果中没有明显的雪痕迹,但却得不到清晰的细节纹理,而本文算法得到的纹理更接近真实背景图像. ...

... Quantitative comparison of different methods on natural weather-degraded image dataset

Tab.6

方法	Snow NIQE/SSEQ/NIMA	RainMist NIQE/SSEQ/NIMA	RainStreak NIQE/SSEQ/NIMA	Raindrop NIQE/SSEQ/NIMA
Uformer^[10]	3.395/28.31/2.644	4.021/26.88/3.289	3.771/27.19/3.376	4.792/34.06/4.260
Restormer^[11]	3.267/27.90/2.570	3.912/ $\underline{24.30}$ / $\underline{3.874}$	$\underline{3.694}$ /26.47/ $\underline{3.480}$	4.658/ $\underline{30.72}$ / $\underline{4.317}$
All-in-One^[3]	3.561/29.62/2.384	4.253/25.20/3.419	3.895/27.03/3.352	$\underline{5.000}$ /38.94/4.073
TransWeather^[4]	3.020/ $\underline{27.78}$ / $\underline{2.793}$	$\underline{3.791}$ /24.62/3.700	3.765/27.11/3.282	4.702/31.81/4.213
AWIR-TDM	$\underline{3.134}$ /27.62/2.980	3.752/24.23/3.965	3.636/ $\underline{26.75}$ /3.491	4.647/30.46/4.328

此外,不同算法所得的自然天气退化图像恢复视觉对比如图8所示.其中,在处理第1~3幅雨滴图像时,AWIR-TDM能有效去除雨滴痕迹,同时得到更符合视觉感知特点的纹理特征.如第1行对比图像中,All-in-One所得结果中除天空部分残留的雨滴外其他雨滴被彻底去除,但树枝原有纹理被破坏,从而导致视觉效果较差.在处理第4~6幅雨图时,本文算法有效去除退化图像中的雨水痕迹,而其他算法所得结果中均存在明显的雨痕残留.如第5行对比图像中,Uformer、Restormer等算法均无法去除肩膀处的雨痕.第7、8幅退化图像为雪图,其中第7幅图中由于雪的运动出现大量雪痕,第8幅图中存在大小不一的雪花颗粒,本文算法均有效去除雪痕和雪花,而其他算法无法适应不同的雪特点.如最后一行对比图像中,All-in-One和TransWeather等算法无法同时去除多样的雪花颗粒. ...

Restormer: Efficient transformer for high-resolution image restoration

8

2022

... 目前,基于DDPM的计算机视觉算法^[7-8]在噪声估计网络部分均采用类似U-Net的卷积网络结构.然而,Peebles等^[9]的工作表明,采用ViT的类条件扩散模型可以取得相比于常用U-Net架构更好的图像生成表现.但是,ViT中自注意力 (self-attention, SA) 的计算负担与输入特征分辨率呈平方关系,无法直接应用于高分辨率的多天气图像恢复任务.对此,Wang等^[10]基于Swin Transformer提出用于多种图像恢复任务的统一型图像恢复算法Uformer,在分割的窗口中分别计算自注意力来减少计算负担;Zamir等^[11]利用转置自注意力 (transposed self-attention, TSA) 强化特征学习,即将原自注意力的表征从空间维度转移到通道维度,在去雨、去噪等任务上取得良好表现.然而,以上方法未依据自注意力的内积特点来进一步优化自注意力的表征,导致其训练和推理均需要大量时间.于DDPM而言,本身训练和采样均需要大量时间,如果在噪声估计网络部分直接使用计算负担巨大的ViT会加剧对硬件环境的要求.同时,文献[12]中表明自注意力和TSA具有接近的表现.因此,提出一种次空间转置自注意力噪声估计网络 (subspace transposed Transformer for noise estimation, NE-STT). NE-STT先将输入特征映射到次空间,再利用TSA构成次空间转置自注意力 (subspace transposed self-attention, STSA) 来强化特征学习并显著减少计算负担.同时,STSA不需要将输入特征分割为多个不重叠的窗口,而是直接从输入特征得到分辨率水平较低的查询向量Q和键向量K来进一步计算自注意力,相比Swin Transformer分割窗口更符合自注意力机制提取特征全局信息的初衷.同时,文献[11]和文献[13]中的工作表明,门控机制能够有效提高ViT中前馈网络 (feed-forward network, FFN) 的非线性表征能力从而提升视觉自注意力网络ViT的整体表现.基于此,提出双分组门控前馈网络 (dual grouped gated feed-forward network, DGGFFN),其在ViT中前馈网络FFN的深度可分离卷积后采用双分组门控机制来提高非线性表征能力. ...

... 来进一步计算自注意力,相比Swin Transformer分割窗口更符合自注意力机制提取特征全局信息的初衷.同时,文献[11]和文献[13]中的工作表明,门控机制能够有效提高ViT中前馈网络 (feed-forward network, FFN) 的非线性表征能力从而提升视觉自注意力网络ViT的整体表现.基于此,提出双分组门控前馈网络 (dual grouped gated feed-forward network, DGGFFN),其在ViT中前馈网络FFN的深度可分离卷积后采用双分组门控机制来提高非线性表征能力. ...

... 如图1所示,目前用于天气退化图像恢复的算法可以分为3类,即专一型、统一型和同一型.其中,专一型^{[14⇓⇓-17]}为不同任务设计专门的网络结构,模型架构与参数均不相同;统一型^[10-11]为不同任务设计统一的网络结构,模型架构一致但参数不相同;同一型^{[3-4,18 -19]}根据不同天气退化的相似特点设计同一的多天气退化图像恢复网络,在同时存在多种天气退化因素的数据集上训练, 对于不同天气退化图像恢复任务模型的架构和参数相同. ...

... 此外,Zamir等^[11]和Chen等^[13]的研究表明,在视觉自注意力网络ViT的前馈网络FFN中采用门控机制可以进一步提升其非线性表达能力.受其启发,提出双分组门控前馈网络DGGFFN,其在FFN中深度可分离卷积层后利用双分组门控机制来强化特征学习.具体而言,DGGFFN将深度可分离卷积所得特征按照通道维度分为两组,再对两组特征分别利用另一组特征进行门控增强,最后将所得结果相加得到门控输出.双分组门控机制可以公式化为 ...

... 为了验证本文算法的有效性,实验对比本文算法AWIR-TDM与近期表现良好的统一型图像恢复方法Uformer^[10]、Restormer^[11]和多天气退化图像恢复方法All-in-One^[3]、TransWeather^[4]在数据集Allweather上经过一次训练后分别在雪、雨雾和雨滴测试数据集上的表现.选取常用的有监督图像质量评价指标峰值信噪比 (peak signal noise ratio, PSNR) 和结构相似性 (structural similarity, SSIM) 进行定量对比.峰值信噪比的计算公式如下: ...

... Quantitative comparison of different methods in all-in-one weather-degraded image restoration tasks

Tab.2

方法	源	Snow100K-L PSNR/SSIM	Snow100K-M PSNR/SSIM	Snow100K-S PSNR/SSIM	Test1 PSNR/SSIM	Raindrop-A PSNR/SSIM
Uformer^[10]	CVPR 2022	26.24/0.8680	32.11/0.9316	34.00/0.9445	16.32/0.7565	30.33/0.9335
Restormer^[11]	CVPR 2022	$\underset{=}{29.57}$ / $\underset{=}{0.9106}$	$\underset{=}{33.71}$ / $\underset{=}{0.9490}$	$\underset{=}{35.43}$ / $\underset{=}{0.9583}$	$\underset{=}{29.81}$ / $\underset{=}{0.9208}$	$\underset{=}{31.10}$ / $\underset{=}{0.9337}$
All-in-One^[3]	CVPR 2020	28.14/0.8901	30.96/0.9290	32.63/0.9392	25.87/ $\underline{0.8996}$	$\underline{31.35}$ / $\underline{0.9299}$
TransWeather^[4]	CVPR 2022	$\underline{29.15}$ / $\underline{0.8930}$	$\underline{32.02}$ / $\underline{0.9343}$	$\underline{32.98}$ / $\underline{0.9447}$	$\underline{28.61}$ /0.8893	30.21/0.9179
AWIR-TDM		31.69/0.9240	35.47/0.9565	37.16/0.9642	31.68/0.9347	32.33/0.9429

不同算法所得恢复图像的视觉对比如图5~7所示,分别为退化图像经过去雨滴、去雨雾和去雪后所得的恢复图像.在图5中,相比其他算法,AWIR-TDM方法能够有效去除较大雨滴并得到与无退化图像接近的结果.如第1行对比图像中Uformer和All-in-One未能去除雨滴,Restormer和TransWeather所得恢复图像中仍存在明显痕迹,而本文算法能够彻底去除雨滴.在图6去雨雾视觉对比中,所有算法均能有效去除雨水痕迹,但相比本文算法,其他算法无法有效恢复图像的细节信息.如第1行对比图像中,本文算法能够得到清晰的指示牌字符,而其他算法所得字符已经无法辨认.特别地,发现Uformer处理雨雾图像时未能去除图像边缘的雨雾.在图7第一行对比图像中,本文算法能够有效去除上衣口袋上的雪痕迹,而Uformer、All-in-One和TransWeather的结果中出现明显残留.尽管Restormer的结果中没有明显的雪痕迹,但却得不到清晰的细节纹理,而本文算法得到的纹理更接近真实背景图像. ...

... Quantitative comparison of different methods on Test1 dataset

Tab.4

方法	源	Test1
方法	源	PSNR/SSIM
CycleGAN^[27]	ICCV 2017	17.62/0.6560
pix2pix^[28]	CVPR 2017	19.09/0.7100
HRGAN^[20]	CVPR 2019	21.56/0.8550
SwinIR^[25]	CVPR 2021	23.23/0.8685
PCNet^[29]	TIP 2021	26.19/0.9015
MPRNet^[30]	CVPR 2021	28.03/0.9192
Restormer^[11]	CVPR 2022	$\underline{28.44}$ / $\underline{0.9263}$
AWIR-TDM		29.13/0.9428

10.16183/j.cnki.jsjtu.2023.043.T0005

表5

不同算法在雨滴数据集Raindrop-A上的定量对比 ...

... Quantitative comparison of different methods on natural weather-degraded image dataset

Tab.6

方法	Snow NIQE/SSEQ/NIMA	RainMist NIQE/SSEQ/NIMA	RainStreak NIQE/SSEQ/NIMA	Raindrop NIQE/SSEQ/NIMA
Uformer^[10]	3.395/28.31/2.644	4.021/26.88/3.289	3.771/27.19/3.376	4.792/34.06/4.260
Restormer^[11]	3.267/27.90/2.570	3.912/ $\underline{24.30}$ / $\underline{3.874}$	$\underline{3.694}$ /26.47/ $\underline{3.480}$	4.658/ $\underline{30.72}$ / $\underline{4.317}$
All-in-One^[3]	3.561/29.62/2.384	4.253/25.20/3.419	3.895/27.03/3.352	$\underline{5.000}$ /38.94/4.073
TransWeather^[4]	3.020/ $\underline{27.78}$ / $\underline{2.793}$	$\underline{3.791}$ /24.62/3.700	3.765/27.11/3.282	4.702/31.81/4.213
AWIR-TDM	$\underline{3.134}$ /27.62/2.980	3.752/24.23/3.965	3.636/ $\underline{26.75}$ /3.491	4.647/30.46/4.328

此外,不同算法所得的自然天气退化图像恢复视觉对比如图8所示.其中,在处理第1~3幅雨滴图像时,AWIR-TDM能有效去除雨滴痕迹,同时得到更符合视觉感知特点的纹理特征.如第1行对比图像中,All-in-One所得结果中除天空部分残留的雨滴外其他雨滴被彻底去除,但树枝原有纹理被破坏,从而导致视觉效果较差.在处理第4~6幅雨图时,本文算法有效去除退化图像中的雨水痕迹,而其他算法所得结果中均存在明显的雨痕残留.如第5行对比图像中,Uformer、Restormer等算法均无法去除肩膀处的雨痕.第7、8幅退化图像为雪图,其中第7幅图中由于雪的运动出现大量雪痕,第8幅图中存在大小不一的雪花颗粒,本文算法均有效去除雪痕和雪花,而其他算法无法适应不同的雪特点.如最后一行对比图像中,All-in-One和TransWeather等算法无法同时去除多样的雪花颗粒. ...

Dual vision transformer

1

... 目前,基于DDPM的计算机视觉算法^[7-8]在噪声估计网络部分均采用类似U-Net的卷积网络结构.然而,Peebles等^[9]的工作表明,采用ViT的类条件扩散模型可以取得相比于常用U-Net架构更好的图像生成表现.但是,ViT中自注意力 (self-attention, SA) 的计算负担与输入特征分辨率呈平方关系,无法直接应用于高分辨率的多天气图像恢复任务.对此,Wang等^[10]基于Swin Transformer提出用于多种图像恢复任务的统一型图像恢复算法Uformer,在分割的窗口中分别计算自注意力来减少计算负担;Zamir等^[11]利用转置自注意力 (transposed self-attention, TSA) 强化特征学习,即将原自注意力的表征从空间维度转移到通道维度,在去雨、去噪等任务上取得良好表现.然而,以上方法未依据自注意力的内积特点来进一步优化自注意力的表征,导致其训练和推理均需要大量时间.于DDPM而言,本身训练和采样均需要大量时间,如果在噪声估计网络部分直接使用计算负担巨大的ViT会加剧对硬件环境的要求.同时,文献[12]中表明自注意力和TSA具有接近的表现.因此,提出一种次空间转置自注意力噪声估计网络 (subspace transposed Transformer for noise estimation, NE-STT). NE-STT先将输入特征映射到次空间,再利用TSA构成次空间转置自注意力 (subspace transposed self-attention, STSA) 来强化特征学习并显著减少计算负担.同时,STSA不需要将输入特征分割为多个不重叠的窗口,而是直接从输入特征得到分辨率水平较低的查询向量Q和键向量K来进一步计算自注意力,相比Swin Transformer分割窗口更符合自注意力机制提取特征全局信息的初衷.同时,文献[11]和文献[13]中的工作表明,门控机制能够有效提高ViT中前馈网络 (feed-forward network, FFN) 的非线性表征能力从而提升视觉自注意力网络ViT的整体表现.基于此,提出双分组门控前馈网络 (dual grouped gated feed-forward network, DGGFFN),其在ViT中前馈网络FFN的深度可分离卷积后采用双分组门控机制来提高非线性表征能力. ...

Simple baselines for image restoration

2

2022

... 目前,基于DDPM的计算机视觉算法^[7-8]在噪声估计网络部分均采用类似U-Net的卷积网络结构.然而,Peebles等^[9]的工作表明,采用ViT的类条件扩散模型可以取得相比于常用U-Net架构更好的图像生成表现.但是,ViT中自注意力 (self-attention, SA) 的计算负担与输入特征分辨率呈平方关系,无法直接应用于高分辨率的多天气图像恢复任务.对此,Wang等^[10]基于Swin Transformer提出用于多种图像恢复任务的统一型图像恢复算法Uformer,在分割的窗口中分别计算自注意力来减少计算负担;Zamir等^[11]利用转置自注意力 (transposed self-attention, TSA) 强化特征学习,即将原自注意力的表征从空间维度转移到通道维度,在去雨、去噪等任务上取得良好表现.然而,以上方法未依据自注意力的内积特点来进一步优化自注意力的表征,导致其训练和推理均需要大量时间.于DDPM而言,本身训练和采样均需要大量时间,如果在噪声估计网络部分直接使用计算负担巨大的ViT会加剧对硬件环境的要求.同时,文献[12]中表明自注意力和TSA具有接近的表现.因此,提出一种次空间转置自注意力噪声估计网络 (subspace transposed Transformer for noise estimation, NE-STT). NE-STT先将输入特征映射到次空间,再利用TSA构成次空间转置自注意力 (subspace transposed self-attention, STSA) 来强化特征学习并显著减少计算负担.同时,STSA不需要将输入特征分割为多个不重叠的窗口,而是直接从输入特征得到分辨率水平较低的查询向量Q和键向量K来进一步计算自注意力,相比Swin Transformer分割窗口更符合自注意力机制提取特征全局信息的初衷.同时,文献[11]和文献[13]中的工作表明,门控机制能够有效提高ViT中前馈网络 (feed-forward network, FFN) 的非线性表征能力从而提升视觉自注意力网络ViT的整体表现.基于此,提出双分组门控前馈网络 (dual grouped gated feed-forward network, DGGFFN),其在ViT中前馈网络FFN的深度可分离卷积后采用双分组门控机制来提高非线性表征能力. ...

... 此外,Zamir等^[11]和Chen等^[13]的研究表明,在视觉自注意力网络ViT的前馈网络FFN中采用门控机制可以进一步提升其非线性表达能力.受其启发,提出双分组门控前馈网络DGGFFN,其在FFN中深度可分离卷积层后利用双分组门控机制来强化特征学习.具体而言,DGGFFN将深度可分离卷积所得特征按照通道维度分为两组,再对两组特征分别利用另一组特征进行门控增强,最后将所得结果相加得到门控输出.双分组门控机制可以公式化为 ...

DesnowNet: Context-aware deep network for snow removal

5

2018

... 如图1所示,目前用于天气退化图像恢复的算法可以分为3类,即专一型、统一型和同一型.其中,专一型^{[14⇓⇓-17]}为不同任务设计专门的网络结构,模型架构与参数均不相同;统一型^[10-11]为不同任务设计统一的网络结构,模型架构一致但参数不相同;同一型^{[3-4,18 -19]}根据不同天气退化的相似特点设计同一的多天气退化图像恢复网络,在同时存在多种天气退化因素的数据集上训练, 对于不同天气退化图像恢复任务模型的架构和参数相同. ...

... Allweather:根据文献[3]将Snow100K^[14]、Out-door Rain^[20]和Raindrop^[17]数据集组合而成,其包括18 069对图像用来训练多天气退化图像恢复算法. ...

... Snow100K:来自文献[14],训练集包括5万对图像,测试集根据雪的大小分为Snow100K-L、Snow100K-M和Snow100K-S这3个数据集,其中分别包括16 611、16 588和16 801对图像用来评估算法的去雪性能. ...

... 此外,为验证算法恢复自然天气退化图像的表现,选用文献[14]中提供的雪数据集Snow,其中包括1 329幅自然雪图,同时还选用来自文献[21]的雨滴数据集Raindrop、雨雾数据集RainMist和雨痕数据集RainStreak,其分别包括67、13和185幅自然天气退化图像. ...

... Quantitative comparison of different methods on Snow100K dataset

Tab.3

方法	源	Snow100K-L PSNR/SSIM	Snow100K-M PSNR/SSIM	Snow100K-S PSNR/SSIM	平均指标 PSNR/SSIM
RESCAN^[22]	ECCV 2018	26.08/0.8108	29.95/0.8860	31.51/0.9032	29.28/0.8667
SPANet^[23]	CVPR 2019	23.70/0.7930	28.06/0.8680	29.92/0.8260	27.23/0.8290
DesnowNet^[14]	TIP 2018	27.17/ $\underline{0.8983}$	30.87/0.9409	32.33/0.9500	30.12/ $\underline{0.9300}$
JSTASR^[24]	ECCV 2020	25.32/0.8076	29.11/0.8843	31.40/0.9012	28.61/0.8644
SwinIR^[25]	CVPR 2021	28.18/0.8800	31.42/0.9284	33.96/ $\underline{0.9567}$	31.19/0.9217
DDMSNet^[26]	TIP 2021	28.85/0.8772	32.89/0.9330	34.34/0.9445	32.03/0.9182
TransWeather^[4]	CVPR 2022	$\underline{29.21}$ /0.8947	$\underline{33.41}$ / $\underline{0.9416}$	$\underline{34.92}$ /0.9543	$\underline{32.51}$ /0.9279
AWIR-TDM		30.64/0.9193	35.26/0.9472	37.05/0.9680	34.32/0.9448

10.16183/j.cnki.jsjtu.2023.043.T0004

表4

不同算法在雨雾数据集Test1上的定量对比 ...

功能解耦和谱特征融合的雪霾消除模型

1

2023

... 如图1所示,目前用于天气退化图像恢复的算法可以分为3类,即专一型、统一型和同一型.其中,专一型^{[14⇓⇓-17]}为不同任务设计专门的网络结构,模型架构与参数均不相同;统一型^[10-11]为不同任务设计统一的网络结构,模型架构一致但参数不相同;同一型^{[3-4,18 -19]}根据不同天气退化的相似特点设计同一的多天气退化图像恢复网络,在同时存在多种天气退化因素的数据集上训练, 对于不同天气退化图像恢复任务模型的架构和参数相同. ...

Generative adverbial network for function decoupling and edge feature fusion for snow and haze elimination

1

2023

... 如图1所示,目前用于天气退化图像恢复的算法可以分为3类,即专一型、统一型和同一型.其中,专一型^{[14⇓⇓-17]}为不同任务设计专门的网络结构,模型架构与参数均不相同;统一型^[10-11]为不同任务设计统一的网络结构,模型架构一致但参数不相同;同一型^{[3-4,18 -19]}根据不同天气退化的相似特点设计同一的多天气退化图像恢复网络,在同时存在多种天气退化因素的数据集上训练, 对于不同天气退化图像恢复任务模型的架构和参数相同. ...

基于注意机制的轻量化稠密连接网络单幅图像去雨

1

2022

... 如图1所示,目前用于天气退化图像恢复的算法可以分为3类,即专一型、统一型和同一型.其中,专一型^{[14⇓⇓-17]}为不同任务设计专门的网络结构,模型架构与参数均不相同;统一型^[10-11]为不同任务设计统一的网络结构,模型架构一致但参数不相同;同一型^{[3-4,18 -19]}根据不同天气退化的相似特点设计同一的多天气退化图像恢复网络,在同时存在多种天气退化因素的数据集上训练, 对于不同天气退化图像恢复任务模型的架构和参数相同. ...

Lightweight densely connected network based on attention mechanism for single-image deraining

1

2022

... 如图1所示,目前用于天气退化图像恢复的算法可以分为3类,即专一型、统一型和同一型.其中,专一型^{[14⇓⇓-17]}为不同任务设计专门的网络结构,模型架构与参数均不相同;统一型^[10-11]为不同任务设计统一的网络结构,模型架构一致但参数不相同;同一型^{[3-4,18 -19]}根据不同天气退化的相似特点设计同一的多天气退化图像恢复网络,在同时存在多种天气退化因素的数据集上训练, 对于不同天气退化图像恢复任务模型的架构和参数相同. ...

Attentive generative adversarial network for raindrop removal from a single image

4

2018

... 如图1所示,目前用于天气退化图像恢复的算法可以分为3类,即专一型、统一型和同一型.其中,专一型^{[14⇓⇓-17]}为不同任务设计专门的网络结构,模型架构与参数均不相同;统一型^[10-11]为不同任务设计统一的网络结构,模型架构一致但参数不相同;同一型^{[3-4,18 -19]}根据不同天气退化的相似特点设计同一的多天气退化图像恢复网络,在同时存在多种天气退化因素的数据集上训练, 对于不同天气退化图像恢复任务模型的架构和参数相同. ...

... Allweather:根据文献[3]将Snow100K^[14]、Out-door Rain^[20]和Raindrop^[17]数据集组合而成,其包括18 069对图像用来训练多天气退化图像恢复算法. ...

... Raindrop:包括861对训练图像和两个图像对数量分别为58和249的测试数据集.实验采用的测试集为Raindrop-A^[17]. ...

... Quantitative comparison of different methods on Raindrop-A dataset

Tab.5

方法	源	Raindrop-A
方法	源	PSNR/SSIM
pix2pix^[28]	CVPR 2017	28.02/0.8547
Attn. GAN^[17]	CVPR 2018	31.59/0.9170
DuRN^[31]	CVPR 2019	31.24/0.9259
RaindropAttn^[32]	ICCV 2019	31.44/0.9263
SwinIR^[25]	CVPR 2021	30.82/0.9035
CCN^[33]	CVPR 2021	31.34/ $\underline{0.9500}$
IDT^[34]	TPAMI 2022	$\underline{31.87}$ /0.9313
AWIR-TDM		32.84/0.9571

本文算法在Snow100K的测试集上平均PSNR高出1.81~7.09 dB; 相比现有图像去雨雾算法,本文算法在Test1测试集上平均PSNR高出0.69~11.51 dB;相比现有去雨滴算法,本文算法在Raindrop-A测试集上平均PSNR高出0.79~4.82 dB.因此,本文算法不仅可以作为多天气退化图像恢复算法,还可以作为统一型天气退化图像恢复方法,并且在两种情况下均超越现有表现良好的方法. ...

Pre-trained image processing transformer

1

2021

... 如图1所示,目前用于天气退化图像恢复的算法可以分为3类,即专一型、统一型和同一型.其中,专一型^{[14⇓⇓-17]}为不同任务设计专门的网络结构,模型架构与参数均不相同;统一型^[10-11]为不同任务设计统一的网络结构,模型架构一致但参数不相同;同一型^{[3-4,18 -19]}根据不同天气退化的相似特点设计同一的多天气退化图像恢复网络,在同时存在多种天气退化因素的数据集上训练, 对于不同天气退化图像恢复任务模型的架构和参数相同. ...

All-in-one image restoration for unknown corruption

1

2022

... 如图1所示,目前用于天气退化图像恢复的算法可以分为3类,即专一型、统一型和同一型.其中,专一型^{[14⇓⇓-17]}为不同任务设计专门的网络结构,模型架构与参数均不相同;统一型^[10-11]为不同任务设计统一的网络结构,模型架构一致但参数不相同;同一型^{[3-4,18 -19]}根据不同天气退化的相似特点设计同一的多天气退化图像恢复网络,在同时存在多种天气退化因素的数据集上训练, 对于不同天气退化图像恢复任务模型的架构和参数相同. ...

Heavy rain image restoration: Integrating physics model and conditional adversarial learning

3

2019

... Allweather:根据文献[3]将Snow100K^[14]、Out-door Rain^[20]和Raindrop^[17]数据集组合而成,其包括18 069对图像用来训练多天气退化图像恢复算法. ...

... Out-door Rain:雨雾共存的数据集^[20],训练集包括 9 000 对图像.采用其中名为Test1的子集作为测试集,图像对的数量为750. ...

... Quantitative comparison of different methods on Test1 dataset

Tab.4

方法	源	Test1
方法	源	PSNR/SSIM
CycleGAN^[27]	ICCV 2017	17.62/0.6560
pix2pix^[28]	CVPR 2017	19.09/0.7100
HRGAN^[20]	CVPR 2019	21.56/0.8550
SwinIR^[25]	CVPR 2021	23.23/0.8685
PCNet^[29]	TIP 2021	26.19/0.9015
MPRNet^[30]	CVPR 2021	28.03/0.9192
Restormer^[11]	CVPR 2022	$\underline{28.44}$ / $\underline{0.9263}$
AWIR-TDM		29.13/0.9428

10.16183/j.cnki.jsjtu.2023.043.T0005

表5

不同算法在雨滴数据集Raindrop-A上的定量对比 ...

Single image deraining: A comprehensive benchmark analysis

1

2019

... 此外,为验证算法恢复自然天气退化图像的表现,选用文献[14]中提供的雪数据集Snow,其中包括1 329幅自然雪图,同时还选用来自文献[21]的雨滴数据集Raindrop、雨雾数据集RainMist和雨痕数据集RainStreak,其分别包括67、13和185幅自然天气退化图像. ...

Recurrent squeeze-and-excitation context aggregation net for single image deraining

1

2018

... Quantitative comparison of different methods on Snow100K dataset

Tab.3

方法	源	Snow100K-L PSNR/SSIM	Snow100K-M PSNR/SSIM	Snow100K-S PSNR/SSIM	平均指标 PSNR/SSIM
RESCAN^[22]	ECCV 2018	26.08/0.8108	29.95/0.8860	31.51/0.9032	29.28/0.8667
SPANet^[23]	CVPR 2019	23.70/0.7930	28.06/0.8680	29.92/0.8260	27.23/0.8290
DesnowNet^[14]	TIP 2018	27.17/ $\underline{0.8983}$	30.87/0.9409	32.33/0.9500	30.12/ $\underline{0.9300}$
JSTASR^[24]	ECCV 2020	25.32/0.8076	29.11/0.8843	31.40/0.9012	28.61/0.8644
SwinIR^[25]	CVPR 2021	28.18/0.8800	31.42/0.9284	33.96/ $\underline{0.9567}$	31.19/0.9217
DDMSNet^[26]	TIP 2021	28.85/0.8772	32.89/0.9330	34.34/0.9445	32.03/0.9182
TransWeather^[4]	CVPR 2022	$\underline{29.21}$ /0.8947	$\underline{33.41}$ / $\underline{0.9416}$	$\underline{34.92}$ /0.9543	$\underline{32.51}$ /0.9279
AWIR-TDM		30.64/0.9193	35.26/0.9472	37.05/0.9680	34.32/0.9448

10.16183/j.cnki.jsjtu.2023.043.T0004

表4

不同算法在雨雾数据集Test1上的定量对比 ...

Spatial attentive single-image deraining with a high quality real rain dataset

1

2019

... Quantitative comparison of different methods on Snow100K dataset

Tab.3

方法	源	Snow100K-L PSNR/SSIM	Snow100K-M PSNR/SSIM	Snow100K-S PSNR/SSIM	平均指标 PSNR/SSIM
RESCAN^[22]	ECCV 2018	26.08/0.8108	29.95/0.8860	31.51/0.9032	29.28/0.8667
SPANet^[23]	CVPR 2019	23.70/0.7930	28.06/0.8680	29.92/0.8260	27.23/0.8290
DesnowNet^[14]	TIP 2018	27.17/ $\underline{0.8983}$	30.87/0.9409	32.33/0.9500	30.12/ $\underline{0.9300}$
JSTASR^[24]	ECCV 2020	25.32/0.8076	29.11/0.8843	31.40/0.9012	28.61/0.8644
SwinIR^[25]	CVPR 2021	28.18/0.8800	31.42/0.9284	33.96/ $\underline{0.9567}$	31.19/0.9217
DDMSNet^[26]	TIP 2021	28.85/0.8772	32.89/0.9330	34.34/0.9445	32.03/0.9182
TransWeather^[4]	CVPR 2022	$\underline{29.21}$ /0.8947	$\underline{33.41}$ / $\underline{0.9416}$	$\underline{34.92}$ /0.9543	$\underline{32.51}$ /0.9279
AWIR-TDM		30.64/0.9193	35.26/0.9472	37.05/0.9680	34.32/0.9448

10.16183/j.cnki.jsjtu.2023.043.T0004

表4

不同算法在雨雾数据集Test1上的定量对比 ...

JSTASR: Joint size and transparency-aware snow removal algorithm based on modified partial convolution and veiling effect removal

1

2020

... Quantitative comparison of different methods on Snow100K dataset

Tab.3

方法	源	Snow100K-L PSNR/SSIM	Snow100K-M PSNR/SSIM	Snow100K-S PSNR/SSIM	平均指标 PSNR/SSIM
RESCAN^[22]	ECCV 2018	26.08/0.8108	29.95/0.8860	31.51/0.9032	29.28/0.8667
SPANet^[23]	CVPR 2019	23.70/0.7930	28.06/0.8680	29.92/0.8260	27.23/0.8290
DesnowNet^[14]	TIP 2018	27.17/ $\underline{0.8983}$	30.87/0.9409	32.33/0.9500	30.12/ $\underline{0.9300}$
JSTASR^[24]	ECCV 2020	25.32/0.8076	29.11/0.8843	31.40/0.9012	28.61/0.8644
SwinIR^[25]	CVPR 2021	28.18/0.8800	31.42/0.9284	33.96/ $\underline{0.9567}$	31.19/0.9217
DDMSNet^[26]	TIP 2021	28.85/0.8772	32.89/0.9330	34.34/0.9445	32.03/0.9182
TransWeather^[4]	CVPR 2022	$\underline{29.21}$ /0.8947	$\underline{33.41}$ / $\underline{0.9416}$	$\underline{34.92}$ /0.9543	$\underline{32.51}$ /0.9279
AWIR-TDM		30.64/0.9193	35.26/0.9472	37.05/0.9680	34.32/0.9448

10.16183/j.cnki.jsjtu.2023.043.T0004

表4

不同算法在雨雾数据集Test1上的定量对比 ...

Swinir: Image restoration using swin transformer

3

2021

... Quantitative comparison of different methods on Snow100K dataset

Tab.3

方法	源	Snow100K-L PSNR/SSIM	Snow100K-M PSNR/SSIM	Snow100K-S PSNR/SSIM	平均指标 PSNR/SSIM
RESCAN^[22]	ECCV 2018	26.08/0.8108	29.95/0.8860	31.51/0.9032	29.28/0.8667
SPANet^[23]	CVPR 2019	23.70/0.7930	28.06/0.8680	29.92/0.8260	27.23/0.8290
DesnowNet^[14]	TIP 2018	27.17/ $\underline{0.8983}$	30.87/0.9409	32.33/0.9500	30.12/ $\underline{0.9300}$
JSTASR^[24]	ECCV 2020	25.32/0.8076	29.11/0.8843	31.40/0.9012	28.61/0.8644
SwinIR^[25]	CVPR 2021	28.18/0.8800	31.42/0.9284	33.96/ $\underline{0.9567}$	31.19/0.9217
DDMSNet^[26]	TIP 2021	28.85/0.8772	32.89/0.9330	34.34/0.9445	32.03/0.9182
TransWeather^[4]	CVPR 2022	$\underline{29.21}$ /0.8947	$\underline{33.41}$ / $\underline{0.9416}$	$\underline{34.92}$ /0.9543	$\underline{32.51}$ /0.9279
AWIR-TDM		30.64/0.9193	35.26/0.9472	37.05/0.9680	34.32/0.9448

10.16183/j.cnki.jsjtu.2023.043.T0004

表4

不同算法在雨雾数据集Test1上的定量对比 ...

... Quantitative comparison of different methods on Test1 dataset

Tab.4

方法	源	Test1
方法	源	PSNR/SSIM
CycleGAN^[27]	ICCV 2017	17.62/0.6560
pix2pix^[28]	CVPR 2017	19.09/0.7100
HRGAN^[20]	CVPR 2019	21.56/0.8550
SwinIR^[25]	CVPR 2021	23.23/0.8685
PCNet^[29]	TIP 2021	26.19/0.9015
MPRNet^[30]	CVPR 2021	28.03/0.9192
Restormer^[11]	CVPR 2022	$\underline{28.44}$ / $\underline{0.9263}$
AWIR-TDM		29.13/0.9428

10.16183/j.cnki.jsjtu.2023.043.T0005

表5

不同算法在雨滴数据集Raindrop-A上的定量对比 ...

... Quantitative comparison of different methods on Raindrop-A dataset

Tab.5

方法	源	Raindrop-A
方法	源	PSNR/SSIM
pix2pix^[28]	CVPR 2017	28.02/0.8547
Attn. GAN^[17]	CVPR 2018	31.59/0.9170
DuRN^[31]	CVPR 2019	31.24/0.9259
RaindropAttn^[32]	ICCV 2019	31.44/0.9263
SwinIR^[25]	CVPR 2021	30.82/0.9035
CCN^[33]	CVPR 2021	31.34/ $\underline{0.9500}$
IDT^[34]	TPAMI 2022	$\underline{31.87}$ /0.9313
AWIR-TDM		32.84/0.9571

本文算法在Snow100K的测试集上平均PSNR高出1.81~7.09 dB; 相比现有图像去雨雾算法,本文算法在Test1测试集上平均PSNR高出0.69~11.51 dB;相比现有去雨滴算法,本文算法在Raindrop-A测试集上平均PSNR高出0.79~4.82 dB.因此,本文算法不仅可以作为多天气退化图像恢复算法,还可以作为统一型天气退化图像恢复方法,并且在两种情况下均超越现有表现良好的方法. ...

Deep dense multi-scale network for snow removal using semantic and depth priors

1

2021

... Quantitative comparison of different methods on Snow100K dataset

Tab.3

方法	源	Snow100K-L PSNR/SSIM	Snow100K-M PSNR/SSIM	Snow100K-S PSNR/SSIM	平均指标 PSNR/SSIM
RESCAN^[22]	ECCV 2018	26.08/0.8108	29.95/0.8860	31.51/0.9032	29.28/0.8667
SPANet^[23]	CVPR 2019	23.70/0.7930	28.06/0.8680	29.92/0.8260	27.23/0.8290
DesnowNet^[14]	TIP 2018	27.17/ $\underline{0.8983}$	30.87/0.9409	32.33/0.9500	30.12/ $\underline{0.9300}$
JSTASR^[24]	ECCV 2020	25.32/0.8076	29.11/0.8843	31.40/0.9012	28.61/0.8644
SwinIR^[25]	CVPR 2021	28.18/0.8800	31.42/0.9284	33.96/ $\underline{0.9567}$	31.19/0.9217
DDMSNet^[26]	TIP 2021	28.85/0.8772	32.89/0.9330	34.34/0.9445	32.03/0.9182
TransWeather^[4]	CVPR 2022	$\underline{29.21}$ /0.8947	$\underline{33.41}$ / $\underline{0.9416}$	$\underline{34.92}$ /0.9543	$\underline{32.51}$ /0.9279
AWIR-TDM		30.64/0.9193	35.26/0.9472	37.05/0.9680	34.32/0.9448

10.16183/j.cnki.jsjtu.2023.043.T0004

表4

不同算法在雨雾数据集Test1上的定量对比 ...

Unpaired image-to-image translation using cycle-consistent adversarial networks

1

2017

... Quantitative comparison of different methods on Test1 dataset

Tab.4

方法	源	Test1
方法	源	PSNR/SSIM
CycleGAN^[27]	ICCV 2017	17.62/0.6560
pix2pix^[28]	CVPR 2017	19.09/0.7100
HRGAN^[20]	CVPR 2019	21.56/0.8550
SwinIR^[25]	CVPR 2021	23.23/0.8685
PCNet^[29]	TIP 2021	26.19/0.9015
MPRNet^[30]	CVPR 2021	28.03/0.9192
Restormer^[11]	CVPR 2022	$\underline{28.44}$ / $\underline{0.9263}$
AWIR-TDM		29.13/0.9428

10.16183/j.cnki.jsjtu.2023.043.T0005

表5

不同算法在雨滴数据集Raindrop-A上的定量对比 ...

Image-to-image translation with conditional adversarial networks

2

2017

... Quantitative comparison of different methods on Test1 dataset

Tab.4

方法	源	Test1
方法	源	PSNR/SSIM
CycleGAN^[27]	ICCV 2017	17.62/0.6560
pix2pix^[28]	CVPR 2017	19.09/0.7100
HRGAN^[20]	CVPR 2019	21.56/0.8550
SwinIR^[25]	CVPR 2021	23.23/0.8685
PCNet^[29]	TIP 2021	26.19/0.9015
MPRNet^[30]	CVPR 2021	28.03/0.9192
Restormer^[11]	CVPR 2022	$\underline{28.44}$ / $\underline{0.9263}$
AWIR-TDM		29.13/0.9428

10.16183/j.cnki.jsjtu.2023.043.T0005

表5

不同算法在雨滴数据集Raindrop-A上的定量对比 ...

... Quantitative comparison of different methods on Raindrop-A dataset

Tab.5

方法	源	Raindrop-A
方法	源	PSNR/SSIM
pix2pix^[28]	CVPR 2017	28.02/0.8547
Attn. GAN^[17]	CVPR 2018	31.59/0.9170
DuRN^[31]	CVPR 2019	31.24/0.9259
RaindropAttn^[32]	ICCV 2019	31.44/0.9263
SwinIR^[25]	CVPR 2021	30.82/0.9035
CCN^[33]	CVPR 2021	31.34/ $\underline{0.9500}$
IDT^[34]	TPAMI 2022	$\underline{31.87}$ /0.9313
AWIR-TDM		32.84/0.9571

本文算法在Snow100K的测试集上平均PSNR高出1.81~7.09 dB; 相比现有图像去雨雾算法,本文算法在Test1测试集上平均PSNR高出0.69~11.51 dB;相比现有去雨滴算法,本文算法在Raindrop-A测试集上平均PSNR高出0.79~4.82 dB.因此,本文算法不仅可以作为多天气退化图像恢复算法,还可以作为统一型天气退化图像恢复方法,并且在两种情况下均超越现有表现良好的方法. ...

Rain-free and residue hand-in-hand: A progressive coupled network for real-time image deraining

1

2021

... Quantitative comparison of different methods on Test1 dataset

Tab.4

方法	源	Test1
方法	源	PSNR/SSIM
CycleGAN^[27]	ICCV 2017	17.62/0.6560
pix2pix^[28]	CVPR 2017	19.09/0.7100
HRGAN^[20]	CVPR 2019	21.56/0.8550
SwinIR^[25]	CVPR 2021	23.23/0.8685
PCNet^[29]	TIP 2021	26.19/0.9015
MPRNet^[30]	CVPR 2021	28.03/0.9192
Restormer^[11]	CVPR 2022	$\underline{28.44}$ / $\underline{0.9263}$
AWIR-TDM		29.13/0.9428

10.16183/j.cnki.jsjtu.2023.043.T0005

表5

不同算法在雨滴数据集Raindrop-A上的定量对比 ...

Multi-stage progressive image restoration

1

2021

... Quantitative comparison of different methods on Test1 dataset

Tab.4

方法	源	Test1
方法	源	PSNR/SSIM
CycleGAN^[27]	ICCV 2017	17.62/0.6560
pix2pix^[28]	CVPR 2017	19.09/0.7100
HRGAN^[20]	CVPR 2019	21.56/0.8550
SwinIR^[25]	CVPR 2021	23.23/0.8685
PCNet^[29]	TIP 2021	26.19/0.9015
MPRNet^[30]	CVPR 2021	28.03/0.9192
Restormer^[11]	CVPR 2022	$\underline{28.44}$ / $\underline{0.9263}$
AWIR-TDM		29.13/0.9428

10.16183/j.cnki.jsjtu.2023.043.T0005

表5

不同算法在雨滴数据集Raindrop-A上的定量对比 ...

Dual residual networks leveraging the potential of paired operations for image restoration

1

2019

... Quantitative comparison of different methods on Raindrop-A dataset

Tab.5

方法	源	Raindrop-A
方法	源	PSNR/SSIM
pix2pix^[28]	CVPR 2017	28.02/0.8547
Attn. GAN^[17]	CVPR 2018	31.59/0.9170
DuRN^[31]	CVPR 2019	31.24/0.9259
RaindropAttn^[32]	ICCV 2019	31.44/0.9263
SwinIR^[25]	CVPR 2021	30.82/0.9035
CCN^[33]	CVPR 2021	31.34/ $\underline{0.9500}$
IDT^[34]	TPAMI 2022	$\underline{31.87}$ /0.9313
AWIR-TDM		32.84/0.9571

本文算法在Snow100K的测试集上平均PSNR高出1.81~7.09 dB; 相比现有图像去雨雾算法,本文算法在Test1测试集上平均PSNR高出0.69~11.51 dB;相比现有去雨滴算法,本文算法在Raindrop-A测试集上平均PSNR高出0.79~4.82 dB.因此,本文算法不仅可以作为多天气退化图像恢复算法,还可以作为统一型天气退化图像恢复方法,并且在两种情况下均超越现有表现良好的方法. ...

Deep learning for seeing through window with raindrops

1

2019

... Quantitative comparison of different methods on Raindrop-A dataset

Tab.5

方法	源	Raindrop-A
方法	源	PSNR/SSIM
pix2pix^[28]	CVPR 2017	28.02/0.8547
Attn. GAN^[17]	CVPR 2018	31.59/0.9170
DuRN^[31]	CVPR 2019	31.24/0.9259
RaindropAttn^[32]	ICCV 2019	31.44/0.9263
SwinIR^[25]	CVPR 2021	30.82/0.9035
CCN^[33]	CVPR 2021	31.34/ $\underline{0.9500}$
IDT^[34]	TPAMI 2022	$\underline{31.87}$ /0.9313
AWIR-TDM		32.84/0.9571

本文算法在Snow100K的测试集上平均PSNR高出1.81~7.09 dB; 相比现有图像去雨雾算法,本文算法在Test1测试集上平均PSNR高出0.69~11.51 dB;相比现有去雨滴算法,本文算法在Raindrop-A测试集上平均PSNR高出0.79~4.82 dB.因此,本文算法不仅可以作为多天气退化图像恢复算法,还可以作为统一型天气退化图像恢复方法,并且在两种情况下均超越现有表现良好的方法. ...

Removing raindrops and rain streaks in one go

1

2021

... Quantitative comparison of different methods on Raindrop-A dataset

Tab.5

方法	源	Raindrop-A
方法	源	PSNR/SSIM
pix2pix^[28]	CVPR 2017	28.02/0.8547
Attn. GAN^[17]	CVPR 2018	31.59/0.9170
DuRN^[31]	CVPR 2019	31.24/0.9259
RaindropAttn^[32]	ICCV 2019	31.44/0.9263
SwinIR^[25]	CVPR 2021	30.82/0.9035
CCN^[33]	CVPR 2021	31.34/ $\underline{0.9500}$
IDT^[34]	TPAMI 2022	$\underline{31.87}$ /0.9313
AWIR-TDM		32.84/0.9571

本文算法在Snow100K的测试集上平均PSNR高出1.81~7.09 dB; 相比现有图像去雨雾算法,本文算法在Test1测试集上平均PSNR高出0.69~11.51 dB;相比现有去雨滴算法,本文算法在Raindrop-A测试集上平均PSNR高出0.79~4.82 dB.因此,本文算法不仅可以作为多天气退化图像恢复算法,还可以作为统一型天气退化图像恢复方法,并且在两种情况下均超越现有表现良好的方法. ...

Image de-raining transformer

1

2022

... Quantitative comparison of different methods on Raindrop-A dataset

Tab.5

方法	源	Raindrop-A
方法	源	PSNR/SSIM
pix2pix^[28]	CVPR 2017	28.02/0.8547
Attn. GAN^[17]	CVPR 2018	31.59/0.9170
DuRN^[31]	CVPR 2019	31.24/0.9259
RaindropAttn^[32]	ICCV 2019	31.44/0.9263
SwinIR^[25]	CVPR 2021	30.82/0.9035
CCN^[33]	CVPR 2021	31.34/ $\underline{0.9500}$
IDT^[34]	TPAMI 2022	$\underline{31.87}$ /0.9313
AWIR-TDM		32.84/0.9571

本文算法在Snow100K的测试集上平均PSNR高出1.81~7.09 dB; 相比现有图像去雨雾算法,本文算法在Test1测试集上平均PSNR高出0.69~11.51 dB;相比现有去雨滴算法,本文算法在Raindrop-A测试集上平均PSNR高出0.79~4.82 dB.因此,本文算法不仅可以作为多天气退化图像恢复算法,还可以作为统一型天气退化图像恢复方法,并且在两种情况下均超越现有表现良好的方法. ...

自注意力方法	乘法计算量	加法计算量
SA	1.07×10⁹	1.06×10⁹
TSA	8.39×10⁶	8.26×10⁶
STSA	2.62×10⁶	2.49×10⁶

网络模型	网络组成								单步估计用时/s	Raindrop-A
网络模型	ResBlock	ViT	SA	TSA	STSA	FFN	SGFFN	DGGFFN	单步估计用时/s	PSNR / SSIM
基线网络	√		√						0.6634	29.17/0.9162
ⅰ		√	√			√			1.0725	29.86/0.9203
ⅱ		√		√		√			0.8603	31.54/0.9297
ⅲ		√			√	√			0.3961	30.49/0.9381
ⅳ		√			√		√		0.4033	$\underline{31.73}$ / $\underline{0.9394}$
AWIR-TDM		√			√			√	$\underline{0.4080}$	32.33/0.9429

面向多天气退化图像恢复的自注意力扩散模型

A Transformer-Based Diffusion Model for All-in-One Weather-Degraded Image Restoration

1 天气退化图像恢复

图1

2 本文方法

2.1 去噪扩散概率模型

2.2 图像条件扩散模型

图2

图3

2.3 噪声估计网络

图4

3 实验与分析

3.1 实现细节

3.2 数据集设置

3.3 算法对比

3.3.1 合成天气退化图像恢复

图5

图6

图7

3.3.2 自然天气退化图像恢复

图8

3.4 消融分析

4 结语

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

面向多天气退化图像恢复的自注意力扩散模型

A Transformer-Based Diffusion Model for All-in-One Weather-Degraded Image Restoration

1 天气退化图像恢复

图1

2 本文方法

2.1 去噪扩散概率模型

2.2 图像条件扩散模型

图2

图3

2.3 噪声估计网络

图4

3 实验与分析

3.1 实现细节

3.2 数据集设置

3.3 算法对比

3.3.1 合成天气退化图像恢复

图5

图6

图7

3.3.2 自然天气退化图像恢复

图8

3.4 消融分析

4 结语

参考文献 View Option 原文顺序 文献年度倒序 文中引用次数倒序 被引期刊影响因子

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子