文章

Day27 - YOLO-TLA

看了一篇YOLO-TLA

主要工作是:

  1. 全局注意力模块(GAM)
  2. C3CrossCovn替换Backbone中的C3
  3. Neck中添加小目标检测层
  4. 添加了一个20x20的检测头并连接到neck中的小目标检测层

这是模型的网络结构

model overview

相对于yolov5,他的改进点主要在于C3CrossConv模块的设计和neck的网络结构修改

依我的经验,注意力机制就是凑数的(

至于C3CrossConv(论文里面把Conv打成Covn不知道是不是故意的)

C3CrossConv

上图是C3CrossConv模块

C3

上图是C3模块

可以看到就是把C3里的BottleNeck换成了CrossConv

以下是yolov5中C3的BotleNeck

bottleneck

可以看到所谓的CrossConv模块就是改了一下Bottleneck的维度

对比yolov5结构不难看出

todlayer

这些就是作者添加的小目标检测层

本文由作者按照 CC BY 4.0 进行授权