Skip to content

lec06‐peak cpu performance

CSWater edited this page Mar 11, 2024 · 1 revision

lec06 课件实验说明

编译

假设位于目录 PE下,

cd ./src/code/lec06-peak-cpu

make

可以看到输出

g++ -O3 -march=native -D __AVX512F__ -g example1.cpp -o example1

g++ -O3 -march=native -D __AVX512F__ -g example1-unroll.cpp -o example1-unroll

g++ -O3 -march=native -D __AVX512F__ -g example2.cpp -o example2

g++ -O3 -march=native -D __AVX512F__ -g example3.cpp -o example3

g++ -O3 -march=native -D __AVX512F__ -g example4.cpp -o example4

g++ -O3 -march=native -D __AVX512F__ -g example5.cpp -o example5

g++ -O3 -march=native -D __AVX512F__ -g example6.cpp -o example6
注意CPU需要支持AVX512指令


执行

由于使用了perf,执行时需要sudo权限才能够读取硬件计数器。注意同一CPU上每次运行结果会有些微区别,
在不同的CPU上区别较大。

实验一

sudo .\example1
输出如下: image

实验二

sudo .\example2
image

实验三

sudo .\example3
image

实验四

sudo .\example4
image

实验五

sudo .\example5
image

实验六

sudo .\example6
image

Clone this wiki locally