200万网格并行算力测试(OpenFOAM版本)
- 
	 李 李东岳 被引用 于这个主题 李 李东岳 被引用 于这个主题
- 
							
							
							
							
							
							
我测试3200万、800万网格,32核以上非常不线性。64核相对32核的性能提升基本就是个1.2倍。远远达不到2倍。这种intranode的scale就是这样了。64核的机器还可以64核最快。超过64核的机器,基本就是80核最快了。另外那个128核心的7742,性能还不如核心少的7502,这个U我都觉得烫手,测试完了1天就退回供应商了。epyc3代相对还好。但毕竟有老铁买,我不好评价。在epyc4代的型号,这个问题也很严重。一些大教授不差钱一窝蜂的上epyc4代256核的机器,后来实测160核性能最强。然后windows-fluent彻底卡死,epyc3代算3分钟的,windows-fluent上epyc4代要卡3小时。所以我认为多核心的机器,机架式是最终解决方案。 最完美的就是单机32核甚至28核,然后8个节点做到256核。这个性能非常强。远超单机256核数倍。 
- 
							
							
							
							
							
							
@李东岳 @CFDngu 水了这么多楼,这次发个正经的。 
 双路Epyc ES 100-0000000894-04(俗称9654ES,步进b0),内存DDR5 4800 16G×24,硬盘三星980Pro
 OpenFOAM v2112 进行了非常多的fine tunning,但是算例文件没改过,无脑Allrun;宿主操作系统是Windows server 2022,虚拟机软件是hyper-v,客户机操作系统是Ubuntu 20.04。测试结果如下: 
 cores Wall time (s):
 192 57.82
 190 48.26
 128 35.09
 64 45.29
 32 72.56
 16 134.86
 8 167.85
 4 259.53
 2 569.34
 1 928.2峰值性能35 s,以后请叫我榜一大哥。 
 这个记录应该不难破,抄这个配置,裸金属直接安装Ubuntu 20.04就能破。
 
			