L1 캐시를 뛰어넘는 값 추측 기법 (2021)
값 추측 기법을 통해 CPU의 분기 예측기를 활용하여 성능을 향상시킬 수 있는 방법을 소개합니다. 이 기법은 연결 리스트 데이터 구조와 sum1
함수를 사용하여 모든 값을 합산합니다. 최적화된 함수 sum3
은 L1 캐시 내 데이터 처리 시 기존 함수보다 훨씬 빠른 45 GB/s의 처리량을 달성합니다. 이는 분기 예측과 추측 실행을 활용한 클레버한 저수준 CPU 최적화 기술을 보여줍니다.