В статье Андрей Карпати показывает microgpt. Это минималистичная реализация GPT всего в 200 строках чистого Python без каких-либо зависимостей.
Автор шаг за шагом демонстрирует полный алгоритмический процесс обучения и инференса языковой модели: от токенизации набора данных из 32 000 имен до создания собственного движка автоматического дифференцирования, реализации архитектуры Transformer с механизмом внимания и MLP-блоками, а также оптимизатора Adam. Несмотря на крошечный размер, проект охватывает все ключевые концепции - эмбеддинги, residual-связи, KV-кеш, softmax и семплирование
Сложно, но в месте с каким нить курсом по GPT можно разобраться и потренироваться
10.03.2026
Похожее
06.06.2026
Код руками
Автор 7 месяцев вайб-кодил TUI-дашборд для Kubernetes GPU-кластеров на Go с помо...
29.05.2026
DOOM запустили в ChatGPT
Автор сделал играбельную версию DOOM в виде MCP приложения, которое запускается ...
22.05.2026
Память агентов
Интерактивное эссе о том, как работает память AI-агентов. LLM сама по себе s...
21.05.2026
Мы тупеем
Автор предупреждает, что тотальный переход на agentic coding, когда человек толь...