标量 对 维列向量 求导,其结果还是一个 维列向量:
标量 对 维行向量 求导,其结果还是一个 维行向量:
形状规则:标量 对向量 的每个元素求导,然后将各个求导结果按向量 的形状排列。 标量对列向量 求导的应用1) ,求 。 标量对列向量求偏导,求得的也是一个列向量,结果向量的每个元素为 对自变量每个元素的偏导数。 将函数 展开得到:
其中,对向量 的各个元素的导数为,
所以
即
2) ,其中 ,现在我们求 。 标量对列向量求偏导,求得的也是一个列向量,结果向量的每个元素为 对自变量每个元素的偏导数。 一个二次型本身是一个多项式,可以写为如下形式:
(公式)
上面步骤是矩阵、向量相乘的过程,最终生成一个数字。不过我们为了方便后续观察,还是保留了行和列的痕迹。将公式稍微变换下(将第 列的值放置在第 行,虽然公式)并却掉括号,如下所示, ![= (\ a_{11} \cdot x_1 \cdot x_1+a_{12} \cdot x_1 \cdot x_2 + \dots + a_{1n} \cdot x_1 \cdot x_n )](https://www.zhihu.com/equation?tex=%3D+%28%5C+a_%7B11%7D+%5Ccdot+x_1+%5Ccdot+x_1%2Ba_%7B12%7D+%5Ccdot+x_1+%5Ccdot+x_2+%2B+%5Cdots+%2B+a_%7B1n%7D+%5Ccdot+x_1+%5Ccdot+x_n+%29)
(每一行求一次和,然后所有行的和相加)
即, ( 个乘积项的和)
现在对 求偏导,我们会发现上面 个乘积项中与 相关的项中,只有第 行和第 列的那些项对 求导才可能不为0,其他项对 的导数都是0。例如对 求偏导,只有第1行和第1列的那些项对 求偏导才可能不为0,其他项由于不存在 ,所以对 的导数都是0,如下图所示, ![](data:image/svg+xml;utf8,svg%20xmlns='http://www.w3.org/2000/svg'%20width='906'%20height='464'/svg) 那么通过上面的分析可以得知,对 求偏导数由以下四种不重叠的情况组成,我们以 为例,如图所示: ![](data:image/svg+xml;utf8,svg%20xmlns='http://www.w3.org/2000/svg'%20width='890'%20height='488'/svg) ,表示上图中的黄色框,由于该框中所有项都不包含 ,所以这部分对 偏导数为0;
,表示上图中的绿色框,该框中共有 项,且都包含 ,所以这部分对 偏导数为: (共有 项,包括 那一项)
,表示上图中的蓝色框,该框中共有 项,且都包含 ,所以这部分对 偏导数为: (共有 项,包括 那一项)
,表示上图中的红色框,该框中仅有1项,且包含两个 ,所以这部分对 偏导数为:
综上可得,
上面是对 的计算过过程,其他值也类似,例如 ,则示意图如下, ![](data:image/svg+xml;utf8,svg%20xmlns='http://www.w3.org/2000/svg'%20width='856'%20height='478'/svg) 因此,对向量 的导数为,
进一步得
当 ,则矩阵 是对称阵, ,则有
即,当 是对称阵时,有
3) ,求 , 这个可以换个形式,即 ,其中 是对称阵,则偏导数为,
参考资料 标量对向量求导 - _yanghh - 博客园
|