[뉴스] AI/HPC 주간 클리핑 — 2026.04.14
· 약 1분
관심 분야(딥러닝 추론, GPU 아키텍처, HPC)에서 이번 주 눈에 띄는 소식들을 정리합니다.
이번 주 주요 소식
1. NVIDIA Blackwell 2세대 추론 벤치마크 공개
차세대 Blackwell 아키텍처의 FP8 추론 처리량이 H100 대비 최대 4× 향상됐다는 벤치마크 결과가 공개됐습니다.
특히 LLM 디코딩 단계에서의 메모리 대역폭 효율이 크게 개선된 것이 주목됩니다.
2. FlashAttention-3 논문 arXiv 공개
Flash Attention 시리즈의 세 번째 논문이 공개됐습니다.
Hopper 아키텍처(H100)의 **Tensor Memory Accelerator(TMA)**와 비동기 파이프라인을 활용해 Attention 커널 효율을 높였습니다.
3. PyTorch 2.7 릴리즈
torch.compile의 안정성 개선과 함께 CUDA Graph 자동화 기능이 강화됐습니다.
개인적으로 정리한 내용이라 오류가 있을 수 있습니다. 원본 소스를 꼭 확인하세요!
