论文精读《BEVDet: High

您所在的位置:网站首页 雅马哈v457 论文精读《BEVDet: High

论文精读《BEVDet: High

#论文精读《BEVDet: High| 来源: 网络整理| 查看: 265

图像域数据增广

证明:图像空间的数据增广与BEV特征空间是解耦的

设图像像素坐标 P i m a g e = [ x i , y i , 1 ] T P_{image}=[x_i,y_i,1]^T Pimage​=[xi​,yi​,1]T 对应的深度是 d d d, 相机的内参是 I I I (3*3的矩阵),则相应的3D坐标为 P c a m e r a = I − 1 ( p i m a g e ∗ d ) P_{camera}=I^{-1}(p_{image}*d) Pcamera​=I−1(pimage​∗d).

对于图像领域的数据增广,比如翻转、裁剪、旋转都可以表达为3*3的矩阵 A A A,即 P i m a g e ′ = A P i m a g e P^{'}_{image}=AP_{image} Pimage′​=APimage​

注意在视图转换时,为了保证图像 pixel 和 3d 空间中对应点的一致性,需要进行逆变换,即

p camera  ′ = I − 1 ( A − 1 p image  ′ ∗ d ) = I − 1 ( A − 1 A [ x i , y i , 1 ] T ∗ d ) = I − 1 ( [ x i , y i , 1 ] T ∗ d ) = p camera  \begin{aligned} \mathbf{p}_{\text {camera }}^{\prime} &=I^{-1}\left(A^{-1} \mathbf{p}_{\text {image }}^{\prime} * d\right) \\ &=I^{-1}\left(A^{-1} A\left[x_i, y_i, 1\right]^T * d\right) \\ &=I^{-1}\left(\left[x_i, y_i, 1\right]^T * d\right) \\ &=\mathbf{p}_{\text {camera }} \end{aligned} pcamera ′​​=I−1(A−1pimage ′​∗d)=I−1(A−1A[xi​,yi​,1]T∗d)=I−1([xi​,yi​,1]T∗d)=pcamera ​​

因此对图像进行数据增广操作,不会对BEV特征的空间分布产生影响。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3