В статье Андрей Карпати показывает microgpt. Это минималистичная реализация GPT всего в 200 строках чистого Python без каких-либо зависимостей.
Автор шаг за шагом демонстрирует полный алгоритмический процесс обучения и инференса языковой модели: от токенизации набора данных из 32 000 имен до создания собственного движка автоматического дифференцирования, реализации архитектуры Transformer с механизмом внимания и MLP-блоками, а также оптимизатора Adam. Несмотря на крошечный размер, проект охватывает все ключевые концепции - эмбеддинги, residual-связи, KV-кеш, softmax и семплирование
Сложно, но в месте с каким нить курсом по GPT можно разобраться и потренироваться
10.03.2026
Похожее
23.02.2026
AI или не AI
Весьма интересное обсуждение - стоит ли использовать AI для разработки Go? Рас К...
16.02.2026
Языки для агентов
Автор задумался о том, что будет с языками программирования в мире, где правит б...
20.01.2026
Антиишники
Антирез красиво написал. том, что времена меняются. И становится антиишником не ...
14.01.2026
Жюль Верн
Учимся делать свою GPT на Go. В этом репозитории - код, который написан по следа...