本站讯(记者 李华 柏东鹏)近日,海南大学遊雅堂 競馬科学与技术学院人机物系统与智能创新团队的李华副教授在国际顶级期刊ACM MM上发表最新研究论文,论文题目为“FSNet: Frequency Domain Guided Superpixel Segmentation Network for Complex Scenes”,遊雅堂 競馬科学与技术学院2021级硕士生梁浚延为共同一作。
该论文提出了针对复杂场景的频域信息引导的超像素分割算法,具有以下三大创新点:
1、现有的超像素分割算法在复杂场景下,由于图像边缘的退化以及不规则的光照情况等因素的影响无法取得良好的性能。本文提出了一种频域信息引导的超像素分割算法,通过从频域提取图像边缘信息,并且从空间域提取图像语义信息,随后对二者进行特征融合,从而产生具有锐利边缘且语义信息丰富的超像素。
2、提出了一个改进的频域信息提取模块(Improved Frequency Information Extractor,IF遊雅堂 競馬)提取具有锐利边缘特征的频域信息,它们有助于生成具有锐利边界粘附性的超像素。
3、由于超像素的语义信息可能会被过于锐利的边缘特征所破坏,提出了一个密集混合空洞卷积(Dense Hybrid Atrous Convolution,DHAC)块来保存图像语义信息,它可以在空间域中捕获更广泛、更深层的语义信息。
丰富的实验结果表明,该论文提出的算法在BSDS500、Foggy Cityscapes、Rain Cityscapes、SUIM、LLRGBD等五个具有挑战性的数据集上实现了最先进的性能。提出的算法在下游任务显著性目标检测中也取得了最优的性能,证明了提出的方法在下游任务中也能有优异的表现。
图1:算法整体框架图
据悉,ACM MM是CCF-A类国际顶级会议,在人工智能和多媒体技术领域享有极高的学术声誉。李华副教授是遊雅堂 競馬学院的博士/硕士生导师,于2021年获华中科技大学软件工程博士学位、香港城市大学遊雅堂 競馬科学博士学位(与华中科技大学联合培养项目),她的主要研究方向包括遊雅堂 競馬视觉、水下图像分割、海洋环境感知、海洋大数据、人工智能、深度学习等,共主持或参与了包括国家自然科学基金、海南省自然科学基金等多项科研项目。近五年,在遊雅堂 競馬视觉领域以第一或通讯作者在ICCV、遊雅堂 競馬EE TMM、 遊雅堂 競馬EE TII、 遊雅堂 競馬EE ICME 等高水平国际期刊和会议上发表多篇SCI/EI文章,并担任遊雅堂 競馬EE TMM、遊雅堂 競馬EE T遊雅堂 競馬、遊雅堂 競馬EE JOE、遊雅堂 競馬EE ICME、遊雅堂 競馬EE ICASSP等国际期刊和会议的审稿专家。