타겟 하드웨어: Xilinx Kria KV260¶
KV260은 pccx의 기본 타겟 하드웨어 플랫폼입니다.
주요 사양¶
FPGA 패브릭: Zynq UltraScale+ MPSoC (ZU5EV)
DSP 슬라이스: 1,248 개의 DSP48E2
BRAM: 144 개의 블록 RAM (36 Kb · BRAM 당)
URAM: 64 개의 UltraRAM (288 Kb · URAM 당)
동작 주파수: 400 MHz (타겟)
AXI 인터페이스: AXI-Lite (HPM), AXI HP 포트 0–3, AXI ACP
메모리 구조¶
KV260 에서 pccx 는 아래의 메모리 계층을 활용합니다.
L2 URAM 캐시: 114,688 × 128-bit (피처맵·중간 결과 저장)
HP 포트 0/1: 행렬 코어 가중치 스트리밍 (128-bit/clk)
HP 포트 2/3: 벡터 코어 가중치 스트리밍 (32 INT4/clk · 포트당)
ACP 포트: 호스트 DDR4 ↔ L2 캐시 DMA 전송
리소스 활용¶
리소스 |
사용량 |
가용량 |
|---|---|---|
DSP48E2 |
~1,088 |
1,248 |
BRAM (36 Kb) |
~140 |
144 |
URAM (288 Kb) |
~50 |
64 |
LUT |
~200K |
234K |
참고
DSP48E2 예상 사용량은 GEMM 시스톨릭 어레이 1,024 + GEMV reduction 스테이지 1 의 16 DSP × 4 코어 = 64 의 합. SFU/CVO 가 사용하는 BF16 멀티플라이어까지 포함하면 실제 합성 결과는 ~1,150–1,200 범위가 될 것으로 예상된다. 최종 값은 구현 단계에서 갱신.
실제 리소스 사용량은 구성 파라미터 (시스톨릭 어레이 크기, 코어 개수 등) 에 따라 달라진다.