Blog | hwkim-dev

[프로젝트] llm-lite — Gemma 3N E4B 경량 추론 엔진

2026년 4월 19일 · 약 2분

개발자

llm-lite 는 저사양 로컬 환경에서 Gemma 3N E4B 를 클라우드 없이 돌리는 걸 목표로 만든 멀티 백엔드 추론 엔진이다. 모델 구조는 그대로 두되 공격적인 양자화(INT4 weights + MMAP)와 저수준 하드웨어 가속으로 성능을 끌어내는 방향을 택했다.

[논문] Attention Is All You Need

2026년 4월 17일 · 약 13분

hwkim-dev

개발자

Transformer 모델 구조의 핵심 개념과 수학적 원리를 담은 글이다.

[논문] Gemma 3 4B 내부 처리 과정

2026년 4월 17일 · 약 9분

hwkim-dev

개발자

Phase 1: 모델이 알아들을 수 있게 준비하기

[논문] GPT-1 핵심 정리

2026년 4월 17일 · 약 11분

hwkim-dev

개발자

이 문서는 GPT-1 논문의 architecture와 학습 과정을 수학적/정의와 직관적인 해설을 결합하여 정리한 노트이다.

[논문] Space-Time Approach to Non-Relativistic Quantum Mechanics

2026년 4월 17일 · 약 6분

hwkim-dev

개발자

R.P. Feynman의 'Space-Time Approach to Non-Relativistic Quantum Mechanics' 논문 초록(Abstract) 정리 노트

[공부] Transformer Language Model 구조

2026년 4월 17일 · 약 22분

hwkim-dev

개발자

1. 인공지능이 텍스트를 처리하는 수학적 접근

인공지능 모델은 사람처럼 글자의 형태나 문장의 의미를 직관적으로 이해하지 못한다. 컴퓨터를 구성하는 프로세서는 오직 숫자만을 계산할 수 있는 물리적 장치이다. 따라서 인공지능이 문장을 처리하기 위해서는 가장 먼저 문장을 구성하는 모든 단어를 철저하게 수학적인 숫자의 배열로 변환하는 과정이 필요함.