RTL 소스 레퍼런스 (v001)

이 섹션은 아카이브된 v001 NPU 를 구성하는 모든 SystemVerilog 모듈의 권위 있는 브라우저입니다 (8 카테고리 64 파일 + 호스트 측 C API). codes/v001/ 아래 모든 파일은 여기서 언어 인식 literalinclude 로 접근 가능합니다 — 클릭하면 syntax highlighting 된 실제 소스를 바로 읽을 수 있고, 별도 레포로 이동할 필요 없습니다.

더 보기

pccx: Parallel Compute Core eXecutor

상위 블록도와 코어별 역할.

pccx ISA 사양

이 RTL 이 구현하는 64 bit VLIW 명령어 집합.

v001 은 freeze 상태입니다. 활성 RTL 은 hwkim-dev/pccx-FPGA-NPU-LLM-kv260 에 있으며 RTL 소스 레퍼런스 (v002) 에 문서화됩니다.

최상위

NPU_top 래퍼, BF16 배럴 시프터.

최상위
패키지 · 상수

ISA 패키지, 디바이스 · 타입 · 아키텍처 패키지, 인터페이스 정의.

패키지와 상수
컨트롤러

AXI-Lite 프론트엔드, 디코더, 디스패처, 글로벌 스케줄러.

NPU 컨트롤러
행렬 코어 (GEMM)

DSP48E2 MAC 기반 32×32 시스톨릭 어레이.

행렬 코어 (GEMM)
벡터 코어 (GEMV)

병렬 μV-core 와 reduction tree.

벡터 코어 (GEMV)
CVO 코어 (SFU)

Softmax · GELU · CORDIC 비선형 엔진.

CVO 코어 (SFU)
메모리 제어

L2 URAM 캐시, 디스패처, HP 버퍼, CVO 브리지.

메모리 제어
전처리

피처맵 캐시 + BF16 → 고정소수점 파이프라인.

전처리
라이브러리

BF16 수학, 범용 알고리즘, FIFO 큐 기본 블록.

라이브러리
호스트 API (C)

sw/driver/pccx_v1 HAL + 하이레벨 C 인터페이스.

호스트 API (C 드라이버)