Contents Menu Expand Light mode Dark mode Auto light/dark, in light mode Auto light/dark, in dark mode Skip to content
한국어 버전 · View in English →
pccx 문서
pccx 문서
EN · 한국어
RTL Lab Docs Blog

소개

  • pccx: 병렬 컴퓨트 코어 익스큐터

로드맵

  • 로드맵 (Two-Track)

v002 아키텍처

  • pccx v002 아키텍처
    • 개요
    • 하드웨어 아키텍처
      • v001 → v002 설계 근거
      • 탑레벨 아키텍처
      • 물리 플로어플랜
      • 메모리 계층
      • KV 캐시 최적화 전략
      • GEMM 코어 (시스톨릭 어레이)
      • GEMV 코어
      • SFU 코어 (Complex Vector Operations)
      • DSP48E2 W4A8 비트 패킹과 부호 복원
    • 명령어 세트 아키텍처 (ISA)
      • 명령어 인코딩
      • 명령어 상세 인코딩
      • 명령어별 데이터플로우
    • 소프트웨어 스택
      • C API 개요
    • 타깃 모델
      • Gemma 3N E4B — 개요
      • Gemma 3N E4B — 연산자 수준 파이프라인
      • Gemma 3N — Attention 및 RoPE 제약
      • Gemma 3N — LAuReL 과 PLE Calibration 모듈
      • Gemma 3N — FFN Gaussian Top-K Sparsity
      • Gemma 3N E4B 를 pccx v002 에서 실행 — Execution / Scheduling
    • RTL 소스 레퍼런스 (v002)
      • ISA 타입 패키지
      • NPU 최상위 모듈
      • 컴퓨트 코어 모듈
      • NPU 컨트롤러 모듈
    • 검증

타겟 하드웨어

  • 지원 디바이스
    • 타겟 하드웨어: Xilinx Kria KV260

아카이브

  • 아카이브
    • 아카이브: v001 실험적 아키텍처
      • pccx: Parallel Compute Core eXecutor
      • pccx ISA 사양
      • pccx ISA 스프레드시트 뷰
      • pccx v001 호스트 API 개발자 레퍼런스
      • RTL 소스 레퍼런스 (v001)
        • 최상위
        • 패키지와 상수
        • NPU 컨트롤러
        • 행렬 코어 (GEMM)
        • 벡터 코어 (GEMV)
        • CVO 코어 (SFU)
        • 메모리 제어
        • 전처리
        • 라이브러리
        • 호스트 API (C 드라이버)

툴체인 데모

  • 툴체인 데모
    • Mermaid — NPU 블록 다이어그램
    • WaveDrom — AXI4 read 트랜잭션
    • SVG — 테마 대응 4×4 PE 어레이
    • scienceplots — batch size 대비 대역폭
    • Plot gallery
      • Batch size vs achieved HP-AXI bandwidth

도구

  • pccx-lab — 시뮬레이터 & AI 프로파일러
Back to top
View this page
Edit this page

아카이브¶

  • 아카이브: v001 실험적 아키텍처
    • 프로젝트 개요
    • 빠른 메뉴
    • 양자화 전략: W4A16 + BF16 활성화
    • 컴퓨트 엔진
Next
아카이브: v001 실험적 아키텍처
Previous
타겟 하드웨어: Xilinx Kria KV260
Copyright © 2026, hwkim
Made with Furo
Last updated on 2026-04-19
RTL Lab Docs Blog