矩阵链相乘
矩阵链乘法
求解矩阵链相乘问题时动态规划算法的另一个例子。给定一个n个矩阵的序列(矩阵链)<A1,A2,...,An>,我们希望计算它们的乘积 A1A2...An
两个矩阵A和B只有相容(compatible),即A的列数等于B的行数时,才能相乘。如果A是p×q的矩阵,B是q×r的矩阵,那么乘积C是p×r的矩阵。计算C所需要时间由第8行的标量乘法的次数决定的,即pqr。
以矩阵链<A1,A2,A3>为例,来说明不同的加括号方式会导致不同的计算代价。假设三个矩阵的规模分别为10×100、100×5和5×50。
如果按照((A1A2)A3)的顺序计算,为计算A1A2(规模10×5),需要做10×100×5=5000次标量乘法,再与A3相乘又需要做10×5×50=2500次标量乘法,共需7500次标量乘法。
如果按照(A1(A2A3))的顺序计算,为计算A2A3(规模100×50),需100×5×50=25000次标量乘法,再与A1相乘又需10×100×50=50000次标量乘法,共需75000次标量乘法。因此第一种顺序计算要比第二种顺序计算快10倍。
矩阵链乘法问题(matrix-chain multiplication problem)可描述如下:给定n个矩阵的链<A1,A2,...,An>,矩阵Ai的规模为p(i-1)×p(i) (1<=i<=n),求完全括号化方案,使得计算乘积A1A2...An所需标量乘法次数最少。
递推关系式
https://blog.csdn.net/Neo_kh/article/details/81282025
①如果i=j,m[i,j]=0
②如果i<j,m[i,j]=min{m[i,k]+m[k+1,j]+p(i-1)p(k)p(j)} i<=k<j
#include <bits/stdc++.h> #define max_size 400 #define INF 100000000 long long s[max_size][max_size];//保存构造最优解信息 long long p[max_size];//矩阵规模的记录 long long m[max_size][max_size];//记录最优值 void matrix_chain_order(int n) { for(int i=1;i<=n;i++) { m[i][i]=0;//初始化最优值(起始于1,结束于n) } for(int l=2;l<=n;l++)//l表示矩阵链的长度 {//计算每一条对角线的最优值 for(int i=1;i<=n-l+1;i++) { int j=i+l-1; m[i][j]=INF; s[i][j]=0; for(int k=j-1;k>=i;k--)//解决方案优先选取先左边的矩阵 {//②如果i<j,m[i,j]=min{m[i,k]+m[k+1,j]+p(i-1)p(k)p(j)} i<=k<j int q=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j]; if(q<m[i][j]) { m[i][j]=q; s[i][j]=k; } } } } } void print_optimal_parents(int i,int j)//打印最优解的结果 { if(i==j) printf("A%d",i); else { //中序二叉树? printf("("); print_optimal_parents(i,s[i][j]); print_optimal_parents(s[i][j]+1,j); printf(")"); } } int main() { int n; while(~scanf("%d",&n)) { memset(p,0,sizeof(p)); for(int i=0;i<=n;i++) { scanf("%lld",&p[i]); } matrix_chain_order(n); print_optimal_parents(1,n); printf("\n"); } }
小结:
动态规划算法设计要素
1.多阶段决策过程,每步处理一个子问题,界定子问题的边界
2.列出优化函数的递推方程及初值
3.问题要满足优化原则或最优子结构性质,即:一个最优决策序列的任何子序列本身一定是相对于子序列的
初始和结束状态的最优决策序列
拓展: 递归实现
#include<string> #include<cstring> #include<iostream> using namespace std; int n; int p[100]; int m[100][100]; int s[100][100]; int dp(int i,int j){ if(i==j) /*如果只有一个矩阵就直接返回*/ return m[i][j]; m[i][j]=999999999; /*将m[i][j]设为无穷大*/ s[i][j]=i; for(int k=i;k<j;k++){ /*将i到j个矩阵分为i到k和k+1到j个矩阵*/ int q=dp(i,k)+dp(k+1,j)+p[i-1]*p[k]*p[j]; if(q<m[i][j]){ /*如果有更小的方案更新*/ m[i][j]=q; s[i][j]=k; } } return m[i][j]; } int main(){ while(cin>>n){ for(int i=0;i<=n;i++){ /*输入矩阵链*/ cin>>p[i]; } memset(m,0,sizeof(m)); /*初始化*/ dp(1,n); /*查找目标1到n个矩阵链乘*/ cout<<m[1][n]<<" "<<s[1][n]<<endl; } return 0; }