本帖最后由 18037632639 于 2024-10-29 14:37 编辑
1.引入
模拟退火是一种随机化算法。当一个问题的方案数量极大(甚至是无穷的)而且不是一个单峰函数时,我们常使用模拟退火求解。
2.解释
根据 爬山算法 的过程,我们发现:对于一个当前最优解附近的非最优解,爬山算法直接舍去了这个解。而很多情况下,我们需要去接受这个非最优解从而跳出这个局部最优解,即为模拟退火算法。
由于退火的规律引入了更多随机因素,那么我们得到最优解的概率会大大增加。于是我们可以去模拟这个过程,将目标函数作为能量函数。
3.过程
先用一句话概括:如果新状态的解更优则修改答案,否则以一定概率接受新状态。
我们定义当前温度为 T,新状态 S’与已知状态 S(新状态由已知状态通过随机的方式得到)之间的能量(值)差为 ΔE(ΔE≥0),则发生状态转移(修改最优解)的概率为
注意:我们有时为了使得到的解更有质量,会在模拟退火结束后,以当前温度在得到的解附近多次随机状态,尝试得到更优的解(其过程与模拟退火相似)。
如何退火(降温)?
模拟退火时我们有三个参数:初始温度,降温系数,终止温度。其中 是一个比较大的数,是一个非常接近1但是小于1的数,是一个接近0的正数。
首先让温度,然后按照上述步骤进行一次转移尝试,再让。当 时模拟退火过程结束,当前最优解即为最终的最优解。
注意为了使得解更为精确,我们通常不直接取当前解作为答案,而是在退火过程中维护遇到的所有解的最优值。
引用一张 Simulated annealing-Wikipedia 的图片(随着温度的降低,跳跃越来越不随机,最优解也越来越稳定)。
4.实现
此处代码以「BZ0J3680」吊打XXX(求n个点的带权类费马点)为例.
#include <cmath>
#include <cstdlib>
#include <ctime>
#include <iomanip>
#include <iostream>
constexpr int N = 10005;
int n, x[N], y[N], w[N];
double ansx, ansy, dis;
double Rand() { return (double)rand() / RAND_MAX; }
double calc(double xx, double yy) {
double res = 0;
for (int i = 1; i <= n; ++i) {
double dx = x - xx, dy = y - yy;
res += sqrt(dx * dx + dy * dy) * w;
}
if (res < dis) dis = res, ansx = xx, ansy = yy;
return res;
}
void simulateAnneal() {
double t = 100000;
double nowx = ansx, nowy = ansy;
while (t > 0.001) {
double nxtx = nowx + t * (Rand() * 2 - 1);
double nxty = nowy + t * (Rand() * 2 - 1);
double delta = calc(nxtx, nxty) - calc(nowx, nowy);
if (exp(-delta / t) > Rand()) nowx = nxtx, nowy = nxty;
t *= 0.97;
}
for (int i = 1; i <= 1000; ++i) {
double nxtx = ansx + t * (Rand() * 2 - 1);
double nxty = ansy + t * (Rand() * 2 - 1);
calc(nxtx, nxty);
}
}
int main() {
std::cin.tie(nullptr)->sync_with_stdio(false);
srand(0); // 注意,在实际使用中,不应使用固定的随机种子。
std::cin >> n;
for (int i = 1; i <= n; ++i) {
std::cin >> x >> y >> w;
ansx += x, ansy += y;
}
ansx /= n, ansy /= n, dis = calc(ansx, ansy);
simulateAnneal();
std::cout << std::fixed << std::setprecision(3) << ansx << ' ' << ansy
<< '\n';
return 0;
}
5.一些技巧
分块模拟退火
有时函数的峰很多,模拟退火难以跑出最优解。
此时可以把整个值域分成几段,每段跑一遍模拟退火,然后再取最优解
卡时
有一个 clock()函数,返回程序运行时间。 可以把主程序中的 simulateAnneal();换成 while((double)clock()/CLOCKS_PER_SEC<MAX_TIME)simulateAnneal();。这样子就会一直跑模拟退火,直到用时即将超过时间限制。
这里的 MAX TIME 是一个自定义的略小于时限的数(单位:秒)。
本文转自Ol Wiki平台
原文链接:https://oi-wiki.org/misc/simulated-annealing/ |