为了满足边缘设备部署的要求,本文使用了轻量级姿态估计模型ShiftPose,ShiftPose以Shift模块代替了Transformer中的自注意力模块,计算速度大幅提升,参数量大幅减小,在解码器部分构造简单,引入门控自注意力单元,采用SimDR坐标表征。在基于回归的方法中, Shift Pose与一些基于Transformer的方法相比,具有更高的帧率且表现出色,更重要的是,与基于热图的方法相比,我们的方法甚至在人体姿势估计任务中也具有竞争力。本文提供了三种参数量的ShiftPose:ShiftPose-T、ShiftPose-M、ShiftPose-L,其中ShiftPose-L在MPII数据集上获得了86.4的PCKh,29.1的PCKH@0.1,以及在COCO数据集上的72.1的mA P和255的FPS,具有10.2M参数和1.6 GFLOPs。
参考文献(略)