基于YOLACT与Transformer相结合的实例分割算法研究
DOI:
作者:
作者单位:

1.福州大学 物理与信息工程学院;2.中国福建光电信息科学与技术创新实验室

作者简介:

通讯作者:

中图分类号:

TP 391.4

基金项目:

国家重点研发计划(No. 2021YFB3600603);福建省自然科学基金(No. 2020J01468)


Research on instance segmentation algorithm based on YOLACT and Transformer
Author:
Affiliation:

1.Fujian Science Technology Innovation Laboratory for Optoelectronic Information of China;2.College of Physics and Information Engineering,Fuzhou University

Fund Project:

Supported by National Key R&D Program of China(No. 2021YFB3600603);Natural Science Foundation of Fujian Province(No. 2020J01468)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    为提高单阶段实例分割的检测精度和改善小目标漏检、错检情况,提出一种基于YOLACT改进的YOLACTR算法。该算法首先利用CNN与Transformer相结合,设计一种新的头部预测网络,对特征进一步提取,并使用双向注意力来关联同一实例的掩码信息并区分不同实例之间的掩码特征,注重特征点周围的关联信息,使得检测框的预测更加准确;然后利用多级上采样和设计的CS注意力模块结合形成掩码分支,使其融入多种不同尺度信息,并利用CS注意力来关注不同的尺度信息。在MS COCO数据上,YOLACTR算法与YOLACT算法相比,其边框和掩码检测精度分别提升了7.4%和2.9%,在小目标检测上分别提升了18.9%和13.5%。实验表明,YOLACTR算法可以在多目标复杂场景下,提升检测和分割精度以及分类的准确度,改善了小目标和重叠目标漏检、错检的问题。

    Abstract:

    In order to improve the segmentation accuracy of single stage instance segmentation and improve the small target detection, an improved YOLACTR algorithm is proposed based on YOLACT algorithm. The algorithm first uses the combination of CNN and Transformer to design a new head prediction network to further extract features, and uses two-way attention to correlate the mask information of the same instance and distinguish the mask features between different instances. It pays attention to the correlation information around the feature points, making the prediction of the detection box more accurate. Then the mask branch is formed by the combination of multi-level up sampling module and the designed CS attention module, which integrates a variety of different scale information, and uses CS attention module to pay attention to different scale information. On the MS COCO, compared with YOLACT algorithm, YOLACTR algorithm improves the detection accuracy of Box and Mask by 7.4% and 2.9% respectively, and improves the detection accuracy of small targets by 18.9% and 13.5% respectively. Experiments show that YOLACTR algorithm can improve the accuracy of detection, segmentation and classification in multi-target complex scenes, and improve the problems of missed detection and false detection of small targets and overlapping targets.

    参考文献
    相似文献
    引证文献
引用本文
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-11-02
  • 最后修改日期:2022-11-02
  • 录用日期:2022-12-04
  • 在线发布日期:
  • 出版日期:

漂浮通知

①《半导体光电》新近入编《中文核心期刊要目总览》2023年版(即第10版),这是本刊自1992年以来连续第10次被《中文核心期刊要目总览》收录。
②目前,《半导体光电》已入编四个最新版高质量科技期刊分级目录,它们分别是中国电子学会《电子技术、通信技术领域高质量科技期刊分级目录》(T3)、中国图象图形学学会《图像图形领域高质量科技期刊分级目录》(T3)、中国电工技术学会《电气工程领域高质量科技期刊分级目录》(T3)和中国照明学会《照明领域高质量科技期刊分级目录》(T2)。
③关于用户登录弱密码必须强制调整的说明
④《半导体光电》微信公众号“半导体光电期刊”已开通,欢迎关注