Intel近日更新了開源的C++頭文件庫(kù),正式支持AVX-512 SIMD指令集,相比此前的AVX-2指令集,可以提供更高性能的SIMD排序。
基于AVX-512指令集,C++頭文件庫(kù)可以對(duì)16位、64位數(shù)據(jù)類型進(jìn)行快速排序,實(shí)測(cè)在一套Intel Tiger Lake 11代酷睿系統(tǒng)上,NumPy Python的性能提升了多達(dá)10-17倍。
具體來(lái)說(shuō),16位數(shù)據(jù)排序性能提升了17倍,32位數(shù)據(jù)也有12-13倍,64位浮點(diǎn)數(shù)據(jù)則可以提速10倍。
這證明,AVX-512只要適配優(yōu)化得當(dāng),帶來(lái)的性能提升是十分顯著的,而且不一定非得吃掉多高功耗。
不過(guò),Intel 12/13代酷睿因?yàn)橐牖旌霞軜?gòu),不得不犧牲了AVX-512,自然無(wú)法從中受益,AMD Zen4架構(gòu)的銳龍7000系列則首次加入了AVX-512。
這就有點(diǎn)尷尬了。