int a[n][m]
for(int i=0;i<n;i++){
for(int j=0;j<m;j++){
// a[i][j]
}
}
for(int j=0;j<m;j++){
for(int i=0;i<n;i++){
// a[i][j]
}
}
以上两个循环的效率谁比较高:
对于现代数组来说,都是行存储优先:
a[0][0]
a[0][1]
a[0][2]
....
a[100][0]
a[100][1]
....
a[n][m]
而我们的缓存,主要是将内存中的某段数据放入缓存区,下次访问内存则不需通过内存读取而是直接从缓存读取。
比如一个通用CPU,一级缓存(L1-Cache)的大小为16K,而其组织结构为每32个字节一组,我们能一次缓存8个整形数据:
a[0][0]
a[0][1]
a[0][2]
a[0][3]
如果我们以先列后行的形式进行访问的话:
a[0][0]命中
a[1][0]不命中,重新读取内存数据至缓存
a[2][0]不命中,重新读取内存数据至缓存
...
以此类推,这种读取的方法不仅仅降低了缓存的命中率,而且还增加了大量的读取内存的时间开销。
相反以先行后列地读取:
a[0][0]命中
a[0][1]命中
a[0][2]命中
...
每次读取内存可降低四次访问的时间开销,因为可从缓存中直接读取。
所以,写法1比写法2效率高得多。
来源:CSDN
作者:wanhf11
链接:https://blog.csdn.net/qq_17612199/article/details/51610714