论文精读《BEVDet: High

您所在的位置：网站首页 › 雅马哈v457 › 论文精读《BEVDet: High

论文精读《BEVDet: High

#论文精读《BEVDet: High| 来源: 网络整理| 查看: 265

图像域数据增广

证明：图像空间的数据增广与BEV特征空间是解耦的

设图像像素坐标 P i m a g e = [ x i , y i , 1 ] T P_{image}=[x_i,y_i,1]^T Pimage=[xi,yi,1]T 对应的深度是 d d d, 相机的内参是 I I I （3*3的矩阵），则相应的3D坐标为 P c a m e r a = I − 1 ( p i m a g e ∗ d ) P_{camera}=I^{-1}(p_{image}*d) Pcamera=I−1(pimage∗d).

对于图像领域的数据增广，比如翻转、裁剪、旋转都可以表达为3*3的矩阵 A A A，即 P i m a g e ′ = A P i m a g e P^{'}_{image}=AP_{image} Pimage′=APimage

注意在视图转换时，为了保证图像 pixel 和 3d 空间中对应点的一致性，需要进行逆变换,即

p camera ′ = I − 1 ( A − 1 p image ′ ∗ d ) = I − 1 ( A − 1 A [ x i , y i , 1 ] T ∗ d ) = I − 1 ( [ x i , y i , 1 ] T ∗ d ) = p camera \begin{aligned} \mathbf{p}_{\text {camera }}^{\prime} &=I^{-1}\left(A^{-1} \mathbf{p}_{\text {image }}^{\prime} * d\right) \\ &=I^{-1}\left(A^{-1} A\left[x_i, y_i, 1\right]^T * d\right) \\ &=I^{-1}\left(\left[x_i, y_i, 1\right]^T * d\right) \\ &=\mathbf{p}_{\text {camera }} \end{aligned} pcamera ′=I−1(A−1pimage ′∗d)=I−1(A−1A[xi,yi,1]T∗d)=I−1([xi,yi,1]T∗d)=pcamera

因此对图像进行数据增广操作，不会对BEV特征的空间分布产生影响。

【本文地址】

论文精读《BEVDet: High

论文精读《BEVDet: High

今日新闻

推荐新闻