惩罚函数法
惩罚函数法(英语:penalty method)是求解有约束的最优化问题的一种算法。
惩罚函数法的要旨是将一个有约束的最优化问题转化为一系列的无约束问题;这些无约束问题由原问题及罚函数,再加上惩罚因子组成;而且,这些无约束问题的解会收敛于所求问题的解。
基本形式
假设有以下有约束问题:
满足限制
惩罚函数法将问题转化成如下无约束问题的序列
其中
在上述方程, 称为外部罚函数, 称为惩罚因子。在每一次迭代中,我们都增大 (例如变为原来的10倍),然后求解该无约束问题。将每一次迭代的结果将组成一个序列,此序列的极限即为原约束问题的解。
实际应用
障碍惩罚函数法
障碍惩罚函数法同样是在源问题上加入一个与惩罚函数相似的函数项,构成一个解决有约束问题的替代算法。但在这种情况下,迭代将被限制于留在可行域内部,而障碍也将持续使迭代远离可行域的边界。
参见
参考文献
- ^ Galar, M.; Jurio, A.; Lopez-Molina, C.; Paternain, D.; Sanz, J.; Bustince, H. Aggregation functions to combine RGB color channels in stereo matching. Optics Express. 2013, 21: 1247–1257. doi:10.1364/oe.21.001247.
- ^ Researchers restore image using version containing between 1 and 10 percent of information. Phys.org (Omicron Technology Limited). [2013-10-26]. (原始内容存档于2020-12-02).
- Smith, Alice E.; Coit David W. Penalty functions Handbook of Evolutionary Computation, Section C 5.2. Oxford University Press and Institute of Physics Publishing, 1996.
- Courant, R. Variational methods for the solution of problems of equilibrium and vibrations. Bull. Amer. Math. Soc., 49, 1–23, 1943.
- Wotao, Y. Optimization Algorithms for constrained optimization. Department of Mathematics, UCLA, 2015.