-
Notifications
You must be signed in to change notification settings - Fork 5
lec06‐peak cpu performance
CSWater edited this page Mar 11, 2024
·
1 revision
假设位于目录 PE下,
cd ./src/code/lec06-peak-cpu
make
可以看到输出
g++ -O3 -march=native -D __AVX512F__ -g example1.cpp -o example1
g++ -O3 -march=native -D __AVX512F__ -g example1-unroll.cpp -o example1-unroll
g++ -O3 -march=native -D __AVX512F__ -g example2.cpp -o example2
g++ -O3 -march=native -D __AVX512F__ -g example3.cpp -o example3
g++ -O3 -march=native -D __AVX512F__ -g example4.cpp -o example4
g++ -O3 -march=native -D __AVX512F__ -g example5.cpp -o example5
g++ -O3 -march=native -D __AVX512F__ -g example6.cpp -o example6
注意CPU需要支持AVX512指令
由于使用了perf,执行时需要sudo权限才能够读取硬件计数器。注意同一CPU上每次运行结果会有些微区别,
在不同的CPU上区别较大。
sudo .\example1
输出如下:
sudo .\example2
sudo .\example3
sudo .\example4
sudo .\example5
sudo .\example6