Подробное визуальное объяснение MicroGPT - 200-строчного скрипта Андрея Карпати, который с нуля без библиотек, на чистом Python обучает и запускает GPT.
На примере генерации имен автор интерактивно разбирает каждый компонент: токенизацию, softmax, cross-entropy loss, обратное распространение, эмбеддинги, multi-head self-attention с каузальной маской, residual-связи и RMSNorm, а также обучение через Adam и инференс с temperature sampling.
Между этим игрушечным примером и ChatGPT нет концептуальной разницы - только масштаб
18.05.2026
Похожее
20.06.2026
Еще раз про LLM
Еще раз про то, как все устроено Статья - это пошаговый разбор устройства сов...
19.06.2026
Локальные модели
Вы любите халяву? Автор рассказывает, как настроить локальные LLM. В частност...
17.06.2026
Git на Rust через AI
Автор решил провести эксперимент по использованию AI-агентов для создания Grit -...
11.06.2026
Claude Code
Практическое руководство по продвинутому использованию Claude Code: от базовых п...