Post Thumbnail

Подробное визуальное объяснение MicroGPT - 200-строчного скрипта Андрея Карпати, который с нуля без библиотек, на чистом Python обучает и запускает GPT.

На примере генерации имен автор интерактивно разбирает каждый компонент: токенизацию, softmax, cross-entropy loss, обратное распространение, эмбеддинги, multi-head self-attention с каузальной маской, residual-связи и RMSNorm, а также обучение через Adam и инференс с temperature sampling.

Между этим игрушечным примером и ChatGPT нет концептуальной разницы - только масштаб

Похожее

Post Thumbnail

Код руками

Автор 7 месяцев вайб-кодил TUI-дашборд для Kubernetes GPU-кластеров на Go с помо...

Post Thumbnail

Мы тупеем

Автор предупреждает, что тотальный переход на agentic coding, когда человек толь...