본문으로 건너뛰기

[뉴스] AI/HPC 주간 클리핑 — 2026.04.14

· 약 1분
hwkim-dev
개발자

관심 분야(딥러닝 추론, GPU 아키텍처, HPC)에서 이번 주 눈에 띄는 소식들을 정리합니다.

이번 주 주요 소식

1. NVIDIA Blackwell 2세대 추론 벤치마크 공개

차세대 Blackwell 아키텍처의 FP8 추론 처리량이 H100 대비 최대 4× 향상됐다는 벤치마크 결과가 공개됐습니다.
특히 LLM 디코딩 단계에서의 메모리 대역폭 효율이 크게 개선된 것이 주목됩니다.

2. FlashAttention-3 논문 arXiv 공개

Flash Attention 시리즈의 세 번째 논문이 공개됐습니다.
Hopper 아키텍처(H100)의 **Tensor Memory Accelerator(TMA)**와 비동기 파이프라인을 활용해 Attention 커널 효율을 높였습니다.

3. PyTorch 2.7 릴리즈

torch.compile의 안정성 개선과 함께 CUDA Graph 자동화 기능이 강화됐습니다.


개인적으로 정리한 내용이라 오류가 있을 수 있습니다. 원본 소스를 꼭 확인하세요!