表3 利用 Transformer 架构的3D分割方法概述。作者将3D分割方法分为三类:(1)对完整场景(而不是单个目标部分分割)实行3D语义分割的方法,(2)全景分割,以及(3)医学成像分割。与由LiDAR和RGB-D传感器收集的稀疏数据不同,三维医学图像由密集规则网格表现。
Transformer 也已被应用于点云的全景分割。徐等[100]首先为给定的点云生成点状特性和稀疏 Voxel 特性。然后,通过跨尺度注意力模块聚合 Voxel 特性,这答应捕获长距离…
range relationship of object context and increases regression accuracy for the over-segmented large objects.