主题:我的AMD OPTERON BENCHMARK -- spin
老板5月份经费到期,帐上还剩了$25,000. 要说我们这行也没什么花销, 一机,一笔,一纸也就够了,乍花这么多钱还得伤点脑筋, 本着一定要多快好省的把钱花出去的原则, 最后决定: 买电脑.
基本配置:
8 NODS, 16 AMD OPTERON246 CPUS,
EACH NOD HAS 2G DDR400 MEMORY.
机器到手已经是六月了, 8个超大砖头, 每个至少有60磅,以后不用去健身房了,实验室里面举砖头就行了. 费了老鼻子劲把他们装到柜子里以后, 老板又出去旅行了,我们放假,一直到现在也没有好好敲打敲打新机器.刚才看了Highway大拿的64位评测, 一时手痒, 说说我做的评测.
其实也不能叫评测, 只是比较了一下我的一个程序在不同系统上的运行时间.这个程序主要是调用LAPACK的双精度复数矩阵求逆.
AMD OPTERON 246 P4 1.3G
PGF77(LAPACK) 12.9(s) 36.7(s)
PGF77(MKL) 9.2(s) 21.9(s)
PGF77(GOTO) 9.0(s) 18.7(s)
LAPACK: 使用标准的LAPACK库.
MKL: INTEL 提供的库
GOTO: 一个日本人做的LAPACK优化库.
看起来结果不那么令人满意,都使用GOTO的优化库,OPTERON也就比P41.3G快一倍左右. 当然也可能是因为OPTERON 才出来不久,GOTO对它的优化并不太好.
本帖一共被 1 帖 引用 (帖内工具实现)
:D, Quantum Monte Carlo?
我刚开始用MKL, 舍不得掏前.
只是你用MKL,为什么不作做PGF和EFC/IFC的比较?
MKL是针对INTEL优化的吧.
pgf/pgc在itanium 2上不行。
首先如果你要测试CPU的性能,你要先保证memory,disk,network等等不会成为bottleneck。(比方说,如果你用dial-up modem测试p4或是athlon64的internet性能,其结论可能是p3或是k7没什么区别)。程序是CPU intensive, memory bandwidth intensive, or I/O intensive...这些问题要先搞清楚。
如果想利用多个node,那么程序的结构就非常关键。有些程序scalability很差,使用更多的CPU也不能提高性能。
编译器的(compiler)的优化对程序有着巨大的影响。Intel在这方面有很强的优势。毕竟他做业界的大哥那么多年了,好多vendor都对intel的CPU做了大量的优化工作!
改头换面而已。嗯,也不喜欢每次编译它都要告诉俺它编译了多少行,一大把没用的警告,然后就算是十几行的程序也要给你个一两兆的可执行文件。
随机选取启始态? 汗, 还是自己的专业..:(