Intel近日更新了開源的C++頭文件庫,正式支持AVX-512 SIMD指令集,相比此前的AVX-2指令集,可以提供更高性能的SIMD排序。
基于AVX-512指令集,C++頭文件庫可以對16位、64位數(shù)據(jù)類型進行快速排序,實測在一套Intel Tiger Lake 11代酷睿系統(tǒng)上,NumPy Python的性能提升了多達10-17倍。
具體來說,16位數(shù)據(jù)排序性能提升了17倍,32位數(shù)據(jù)也有12-13倍,64位浮點數(shù)據(jù)則可以提速10倍。
這證明,AVX-512只要適配優(yōu)化得當(dāng),帶來的性能提升是十分顯著的,而且不一定非得吃掉多高功耗。
不過,Intel 12/13代酷睿因為引入混合架構(gòu),不得不犧牲了AVX-512,自然無法從中受益,AMD Zen4架構(gòu)的銳龍7000系列則首次加入了AVX-512。
這就有點尷尬了
(舉報)