实验室2023级硕士研究生李梦凯(导师:彭锦佳)学术论文《Omni Contextual Aggregation Networks for High-Fidelity Image Inpainting》被多媒体视频领域国际学术期刊《IEEE Transactions on Circuits and Systems for Video Technology》全文录用。
目前,大多数基于深度学习的图像修复方法倾向于利用自注意力机制的长距离依赖特性来建模不同区域之间的图像依赖关系。然而,标准自注意力机制的固有二次复杂度通常导致这些方法仅采用单一维度建模,从而限制了模型从空间和通道维度捕捉复杂关系的能力。为此,本文提出了一种新的注意力范式——动态全方位注意力机制(DOAM),它能够同时从空间和通道维度捕获像素间的信息交互,并以线性计算复杂度建模不同区域之间长距离依赖。此外,为了应对大面积图像退化的情况,本文还提出了多频带特征增强(MFE)模块来增强下采样过程中的特征表示。最后,通过利用卷积神经网络获取域相关的先验表征以增强不同域图像的修复效果,所提出的全方位上下文聚合网络(OCANet)在较低的参数和时间成本下,相较于其他方法实现了卓越的性能。
《IEEE Transactions on Circuits and Systems for Video Technology》是JCR一区,中科院1区期刊,影响因子8.3,该期刊专注于图像和视频技术及其相关电路和系统方面的原创研究,致力于推动视频技术和人工智能方法在工程领域的实际应用与发展。
河北大学网络空间安全与计算机学院