论文精读《BEVDet: High |
您所在的位置:网站首页 › 雅马哈v457 › 论文精读《BEVDet: High |
图像域数据增广 证明:图像空间的数据增广与BEV特征空间是解耦的 设图像像素坐标 P i m a g e = [ x i , y i , 1 ] T P_{image}=[x_i,y_i,1]^T Pimage=[xi,yi,1]T 对应的深度是 d d d, 相机的内参是 I I I (3*3的矩阵),则相应的3D坐标为 P c a m e r a = I − 1 ( p i m a g e ∗ d ) P_{camera}=I^{-1}(p_{image}*d) Pcamera=I−1(pimage∗d). 对于图像领域的数据增广,比如翻转、裁剪、旋转都可以表达为3*3的矩阵 A A A,即 P i m a g e ′ = A P i m a g e P^{'}_{image}=AP_{image} Pimage′=APimage 注意在视图转换时,为了保证图像 pixel 和 3d 空间中对应点的一致性,需要进行逆变换,即 p camera ′ = I − 1 ( A − 1 p image ′ ∗ d ) = I − 1 ( A − 1 A [ x i , y i , 1 ] T ∗ d ) = I − 1 ( [ x i , y i , 1 ] T ∗ d ) = p camera \begin{aligned} \mathbf{p}_{\text {camera }}^{\prime} &=I^{-1}\left(A^{-1} \mathbf{p}_{\text {image }}^{\prime} * d\right) \\ &=I^{-1}\left(A^{-1} A\left[x_i, y_i, 1\right]^T * d\right) \\ &=I^{-1}\left(\left[x_i, y_i, 1\right]^T * d\right) \\ &=\mathbf{p}_{\text {camera }} \end{aligned} pcamera ′=I−1(A−1pimage ′∗d)=I−1(A−1A[xi,yi,1]T∗d)=I−1([xi,yi,1]T∗d)=pcamera 因此对图像进行数据增广操作,不会对BEV特征的空间分布产生影响。 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |