🚀 My LLM Lab: 나만의 Tiny LLM 만들기

"The best way to understand something is to build it from scratch" - Andrej Karpathy

🎯 목표

나만의 아주 간단한 tiny LLM을 통해 주요 LLM을 이해하고, LLM 전반을 이해하는 expert가 되기 위한 기초 과정

📚 전체 학습 경로

Week 1: 기초 다지기

✅ Day 1: Tiny Autograd Package

상태: 완료
폴더: tiny_autograd_project/
내용:
- 자동 미분 구현
- 계산 그래프와 역전파
- Value 클래스 구현
- 위상 정렬과 Chain Rule

✅ Day 1.5: Neural Network 기초

상태: 완료
폴더: projects/day1_5_neural_net/
내용:
- Neuron, Layer, MLP 구현
- XOR 문제 해결
- 경사하강법과 최적화
- 활성화 함수와 손실 함수

✅ Day 2: 벡터/행렬 연산

상태: 완료
폴더: projects/day2_vector_matrix/
내용:
- NumPy로 효율적인 연산
- Batch 처리
- Softmax와 CrossEntropy
- 행렬곱과 Broadcasting
- Mini MNIST 분류기

✅ Day 3: Attention 메커니즘

상태: 완료
폴더: projects/day3_attention/
내용:
- Self-Attention 구현
- Query, Key, Value 이해
- Scaled Dot-Product Attention
- Multi-Head Attention
- Positional Encoding

✅ Day 4: Transformer Architecture

상태: 완료
폴더: projects/day4_transformer/
내용:
- 전체 Transformer 아키텍처 구현
- Encoder와 Decoder 구조
- Multi-Head Attention 통합
- Positional Encoding
- Layer Normalization
- Feed-Forward Networks
- PyTorch로 실제 구현

Week 2: 실전 LLM 구현

🚀 miniGPT - nanoGPT 스타일 구현

상태: 진행중
폴더: projects/mini_gpt/
핵심 구현:
- Karpathy's nanoGPT 스타일 (~200줄)
- Self-Attention, Causal Masking
- Character-level 언어 모델
- 셰익스피어 텍스트 학습
- Attention 패턴 시각화
실행: cd projects/mini_gpt && python train.py

🤖 오픈소스 LLM 실습 - Qwen2

상태: 진행중
폴더: projects/llm_practice/
실습 내용:
- Ollama로 로컬 LLM 실행
- Streaming 응답 구현
- RAG 시스템 기초
- Fine-tuning with LoRA
- 코드 리뷰/번역/요약 봇
실행: ollama run qwen2:7b

Week 3: 실무 프로젝트

📝 나만의 메모 비서

계획중: 개인 노트 + Qwen = AI 어시스턴트
Vector DB로 지식 관리
Context-aware 응답
실시간 메모 검색 & 요약

⏳ Day 16-20: 도메인 특화 LLM

예정 내용:
- 특정 도메인 데이터 수집
- 커스텀 토크나이저
- 도메인 특화 파인튜닝
- 성능 평가 및 개선

🛠️ 기술 스택

Python 3.8+
NumPy (벡터 연산)
PyTorch (Week 2부터 선택적)
Jupyter Notebook (인터랙티브 학습)

📖 학습 방법

각 Day별 진행 순서:

개념 학습: study_notes/ 읽기
튜토리얼: notebooks/ 따라하기
구현: 스켈레톤 코드 완성
테스트: pytest로 검증
실습: 데모 실행 및 실험

권장 학습 시간:

하루 2-4시간
각 Day 완료 후 충분한 복습
이해가 안 되면 다음 단계로 넘어가지 말 것

🎓 선수 지식

Python 기초 문법
고등학교 수준 수학 (미분)
프로그래밍 기본 개념

💡 핵심 원칙

처음부터 구현: 라이브러리 사용 최소화
이해 중심: 암기보다 원리 이해
점진적 학습: 작은 것부터 차근차근
실습 위주: 코드로 직접 확인

🔗 참고 자료

📝 진행 상황

✅ Week 1: 기초 완료

Day 1: Autograd 구현
Day 1.5: Neural Network 기초
Day 2: Vector/Matrix Operations
Day 3: Attention Mechanism
Day 4: Transformer Architecture (PyTorch)

🚀 Week 2: 실전 구현 (진행중)

miniGPT 구현 (nanoGPT style)
Qwen2 모델 실습
Fine-tuning & LoRA
RAG 시스템 구축

📅 Week 3: 프로젝트 (예정)

나만의 메모 비서 만들기

🚦 현재 진행

miniGPT 학습중 → Qwen2 실습 예정

# miniGPT 학습
cd projects/mini_gpt && python train.py

# Qwen2 실습
ollama pull qwen2:7b
cd projects/llm_practice/01_ollama
python basic_chat.py

"작은 걸음이 모여 큰 도약이 됩니다. 포기하지 마세요!"

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
core		core
data		data
project_specs		project_specs
projects		projects
.envrc		.envrc
.gitignore		.gitignore
README.md		README.md
main.py		main.py
pyproject.toml		pyproject.toml
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🚀 My LLM Lab: 나만의 Tiny LLM 만들기

🎯 목표

📚 전체 학습 경로

Week 1: 기초 다지기

✅ Day 1: Tiny Autograd Package

✅ Day 1.5: Neural Network 기초

✅ Day 2: 벡터/행렬 연산

✅ Day 3: Attention 메커니즘

✅ Day 4: Transformer Architecture

Week 2: 실전 LLM 구현

🚀 miniGPT - nanoGPT 스타일 구현

🤖 오픈소스 LLM 실습 - Qwen2

Week 3: 실무 프로젝트

📝 나만의 메모 비서

⏳ Day 16-20: 도메인 특화 LLM

🛠️ 기술 스택

📖 학습 방법

각 Day별 진행 순서:

권장 학습 시간:

🎓 선수 지식

💡 핵심 원칙

🔗 참고 자료

📝 진행 상황

✅ Week 1: 기초 완료

🚀 Week 2: 실전 구현 (진행중)

📅 Week 3: 프로젝트 (예정)

🚦 현재 진행

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🚀 My LLM Lab: 나만의 Tiny LLM 만들기

🎯 목표

📚 전체 학습 경로

Week 1: 기초 다지기

✅ Day 1: Tiny Autograd Package

✅ Day 1.5: Neural Network 기초

✅ Day 2: 벡터/행렬 연산

✅ Day 3: Attention 메커니즘

✅ Day 4: Transformer Architecture

Week 2: 실전 LLM 구현

🚀 miniGPT - nanoGPT 스타일 구현

🤖 오픈소스 LLM 실습 - Qwen2

Week 3: 실무 프로젝트

📝 나만의 메모 비서

⏳ Day 16-20: 도메인 특화 LLM

🛠️ 기술 스택

📖 학습 방법

각 Day별 진행 순서:

권장 학습 시간:

🎓 선수 지식

💡 핵심 원칙

🔗 참고 자료

📝 진행 상황

✅ Week 1: 기초 완료

🚀 Week 2: 실전 구현 (진행중)

📅 Week 3: 프로젝트 (예정)

🚦 현재 진행

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages