W1:什么是模拟退火算法?
模拟退火算法(Simulate Anneal,SA)是一种通用概率演算法,用来在一个大的搜寻空间内找寻命题的最优解。其原理和金属退火的原理近似。将热力学的理论套用到统计学上,金属在加热至高温后维持该温度,并以一种稳定的速度降温,最后使整个系统达到最稳定状态。
而模拟退火算法则是在求解过程中模拟了这一退火过程,即在求解过程中引入随机因素。模拟退火算法以一定的概率来接受一个比当前解要差的解,因此有可能会跳出这个局部的最优解,达到全局的最优解。
W2:为什么要了解模拟退火算法?
模拟退火算法可以尽可能的求出全局最优解,其与登山算法的优势在于加入了随机因素,当获得的值并不是最优的时候将有一定的概率接受这个值,从而有可能跳出当前的局部最优,获得全局最优解。而随着温度的降低,该概率也会相应减少。
粒子在温度T时趋于平衡的概率为exp(-ΔE/(kT))
在温度为T时,出现能量差为dE的降温的概率为P(dE),表示为:P(dE) = exp( dE/(kT) )。其中k是一个常数,exp表示自然指数,且dE<0。所以P和T正相关。这条公式就表示:温度越高,出现一次能量差为dE的降温的概率就越大;温度越低,则出现降温的概率就越小。又由于dE总是小于0(因为退火的过程是温度逐渐下降的过程),因此dE/kT < 0 ,所以P(dE)的函数取值范围是(0,1) 。随着温度T的降低,P(dE)会逐渐降低。所以该概率同样为算法的选择概率。
W3:模拟退火对哪些问题有用?
求NP问题,例如经典的旅行商/邮递员问题时,在近乎无穷的解中获取最优解(贼好用)
H1:模拟退火算法怎么实现?
直接看代码更清晰(城市遍历最短路径)
代码实例(网上代码对应解析):
#include <iostream> #include <string.h> #include <stdlib.h> #include <algorithm> #include <stdio.h> #include <time.h> #include <math.h> #define N 30 //城市数量 #define T 3000 //初始温度 #define EPS 1e-8 //终止温度 #define DELTA 0.98 //温度衰减率 #define LIMIT 1000 //概率选择上限 #define OLOOP 20 //外循环次数 #define ILOOP 100 //内循环次数(没用到) using namespace std; //定义路线结构体 struct Path { int citys[N]; double len; }; //定义城市点坐标 struct Point { double x, y; }; Path bestPath; //记录最优路径 Point p[N]; //每个城市的坐标 double w[N][N]; //两两城市之间路径长度 int nCase; //测试次数 //城市距离 double dist(Point A, Point B) { return sqrt((A.x - B.x) * (A.x - B.x) + (A.y - B.y) * (A.y - B.y)); } //记录两两城市距离 void GetDist(Point p[], int n) { for(int i = 0; i < n; i++) for(int j = i + 1; j < n; j++) w[i][j] = w[j][i] = dist(p[i], p[j]); } //输入坐标 void Input(Point p[], int &n) { scanf("%d", &n); for(int i = 0; i < n; i++) scanf("%lf %lf", &p[i].x, &p[i].y); } //初始化 ,显示一开始按顺序的长度 void Init(int n) { nCase = 0; bestPath.len = 0; for(int i = 0; i < n; i++) { bestPath.citys[i] = i; if(i != n - 1) { // printf("%d--->", i); bestPath.len += w[i][i + 1]; } else ; // printf("%d\n", i); } // printf("\nInit path length is : %.3lf\n", bestPath.len); printf("-----------------------------------\n\n"); } //输出 void Print(Path t, int n) { printf("Path is : "); for(int i = 0; i < n; i++) { if(i != n - 1) printf("%d-->", t.citys[i]); else printf("%d\n", t.citys[i]); } printf("\nThe path length is : %.3lf\n", t.len); printf("-----------------------------------\n\n"); } //算下一个解 Path GetNext(Path p, int n) { Path ans = p; //rand返回0-randmax之间随机整数 //意思是将0到RAND_MAX之间的整数等分成十份,如果随机的生成数落在第一份,则映射成0,如落在第二份,则映射成1。。。。。。如落在第十分,则映射成9. int x = (int)(n * (rand() / (RAND_MAX + 1.0)));//【0,n) int y = (int)(n * (rand() / (RAND_MAX + 1.0)));//【0,n) while(x == y) { x = (int)(n * (rand() / (RAND_MAX + 1.0))); y = (int)(n * (rand() / (RAND_MAX + 1.0))); } //x,y不相等 swap(ans.citys[x], ans.citys[y]);//交换 ,得到随机的城市路线排布 ans.len = 0; for(int i = 0; i < n - 1; i++) ans.len += w[ans.citys[i]][ans.citys[i + 1]];//计算路径总长度 //cout << "nCase = " << nCase << endl;//第几个解 //Print(ans, n);//输出每个解 nCase++; return ans; } //模拟退火 void SA(int n) { double t = T;//初始温度 srand((unsigned)(time(NULL)));//随机种子 Path curPath = bestPath;//当前所在路径 Path newPath = bestPath;//新路径 int P_L = 0;// 选择计数 int P_F = 0;// 外循环计数 while(1) //外循环,主要更新参数t,模拟退火过程 { for(int i = 0; i < ILOOP; i++) //内循环,寻找在一定温度下的最优值 { newPath = GetNext(curPath, n);//随机出解 double dE = newPath.len - curPath.len;//新路径比已知路径如何 if(dE < 0) //如果找到更优值,直接更新(新路径更短更优) { curPath = newPath;//更新 P_L = 0; P_F = 0; } else { double rd = rand() / (RAND_MAX + 1.0);//随机个【0,1)小数 //如果找到比当前更差的解,以一定概率接受该解,并且这个概率会越来越小 //exp,以e为底 ()为指数,返回值 if(exp(dE / t) > rd && exp(dE / t) < 1)//t是初始温度,dE是路径差, rd是随机数 ,热力学公式 curPath = newPath; P_L++; } if(P_L > LIMIT)//到达概率选择上限 { P_F++; break; } } if(curPath.len < bestPath.len) bestPath = curPath; if(P_F > OLOOP || t < EPS)//外循环已满足 温度到达终止温度 break;//退火结束 t *= DELTA;//每循环一次,温度衰减0.02 } } int main(int argc, const char * argv[]) { int n; Input(p, n);//输入坐标 GetDist(p, n);//计算距离 Init(n);//初始化 SA(n);//退火 Print(bestPath, n);//输出解集 printf("Total test times is : %d\n", nCase);//循环次数 return 0; }