线性和非线性最小二乘问题的各种解法 |
您所在的位置:网站首页 › 残差曲线收敛大于1 › 线性和非线性最小二乘问题的各种解法 |
Author:盒子先生KingO 码字不易,欢迎点赞关注,欢迎私信交流。 以下内容为个人学习笔记,参考网址见文末。 一、最小二乘问题概念 最小二乘问题是为了找到测量值和模型预测值之间的最小误差,该问题可以简单的表示为:
假设目标函数为
在上面的解法中,由于 可以通过正交矩阵分块,将SVD最小二乘解进一步化简: SVD也适用于列满秩矩阵的最小二乘求解,实际上SVD分解是最常用的线性最小二乘解法之一。 三、线性最小二乘问题:齐次方程,Ax=03.1 超定齐次方程组对于齐次方程组
常规的思路就是对目标函数 注:导数为0的点,不一定是极值点,也可能是鞍点。 然后,若 此时,最小二乘问题变成了如何寻找下降增量 非线性优化的所有迭代求解方案,都需要用户提供一个 良好的初始值。 4.1 牛顿法对于一元函数 忽略二阶及以上项。 令 故: 则: 以此类推,可以得到迭代公式: 一般来说,矩阵一阶导数称作雅可比矩阵 即: 特点: 要求给定的方程需要二阶可导非凸函数的海森矩阵不一定有逆数据较大的时候,海塞矩阵的计算量偏大适用于最优值附近4.2 梯度下降法梯度下降是用于找到可微函数的局部最小值的一阶迭代优化算法,为了使用梯度下降找到函数的局部最小值,采取与该数在当前点的梯度(或近似梯度)的负值成比例的步骤。 梯度下降法基于以下观测原理得到: 如果实值函数 假设点 那么: 通过这种方式,可以找到极小值。 迭代公式: 缺点: 梯度下降法每次都以梯度的反方向下降,所以,有可能会容易走出锯齿路线,从而增加迭代次数。适用于迭代的开始阶段,最优值附近震荡,收敛慢4.3 高斯牛顿法牛顿法和梯度下降法都是针对目标函数 对 最小二乘问题即求 展开得: 为了求极值,对其求导: 令 优点: 避免求海塞矩阵,减小计算量缺点: 该方法是在高斯牛顿法的基础上进行的改进,基本思路和高斯牛顿法一样。 在高斯牛顿法的缺点中,可以看到,有一点使容易进入锯齿状,导致迭代的次数较长。所以,为了避免其步长过大导致的问题,该方法提出了信赖区域 ,设定一个区域。使得步长能够受到控制。 在更新迭代的过程中,为了判定近似值的好坏,设定了一个评判指标: 算法流程: 1、给定某个初始值 2、对于第 其中, 3、计算近似指标 4、根据经验值,设定 : 若5、求解增量方程 : 6、若 增量方程,通过拉格朗日函数求解: 构建拉格朗日函数, 化简后求导: 即: 通常用 设定最小二乘问题为: 在前面的非线性最小二乘问题中,我们最小化误差项的二范数平方和,作为目标函数。当出现误匹配时,误差 出现这种问题的原因是,当误差很大时,二范数增长得太快了。于是就有了核函数的存在。 核函数保证每条边的误差不会太大以至于掩盖掉其他的边。这种核函数称之为鲁棒核函数。 常见的鲁棒核函数有Huber 核: 当误差 https://zhuanlan.zhihu.com/p/113946848 https://blog.csdn.net/u011178262/article/details/120816301 https://blog.csdn.net/qq_41035283/article/details/121605035 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |