研究认为,从本质上说,增强检测器的稳健性,其实是要提高其在与训练数据差异较大的未知数据上的泛化能力。然而,基于学习的方法无法避免模型在训练过程中对训练集的依赖,而在场景发生迁移后,这种依赖将损害模型在新数据域上的表达能力。通过分析混合概率模型和自注意力机制的联系,研究发现可以利用概率模型的非学习特性进行特征建模,用于检测网络的特征优化和位置调整。
针对以上思考和发现,本研究提出IA-Det目标检测框架,借助非学习式的注意力机制同时在训练和推理阶段对特征进行优化,以增强检测器在面临未知数据时的目标定位和分类能力。该检测框架的主要贡献为:(1)设计了基于t混合分布的非学习式注意力模型IAM,以迭代的方式计算注意力图。不同于以往学习式的注意力算法,以及语义分割任务中基于混合高斯和EM算法的注意力实现,IAM利用了t混合分布对特点进行鲁棒的注意力计算以及非对称的注意力重新分配,以实现对噪声和真实语义的有效区分;(2)设计了分类响应模块CRB充分利用IAM的注意力图,以提升分类任务。该模块无需重新计算注意力图,而直接从定位分支的注意力图中筛选分类感知的特征位置,从而减小了计算量;(3)设计了前景掩膜IA-Mask,提升IA-Det在夜间情况下的前后景区分能力,以确保注意力计算的准确性。
参考文献(略)