Post Thumbnail

Серия статей, в которой рассказывается о написании Feste - полноценного трансформера в стиле GPT-2. А также о реализации каждого основного компонента - от тензорных операций до многоголового внимания, - чтобы развеять мифы о том, как работает современная языковая модель. Первый шаг - важнейшее преобразование человеческого языка в данные, которые может использовать модель: токенизация.

Похожее

Post Thumbnail

Антиишники

Антирез красиво написал. том, что времена меняются. И становится антиишником не ...

Post Thumbnail

История LLM

Автор до сих пор чувствует какую-то магию в больших языковых моделях (LLM). В пр...

Post Thumbnail

Вайб ссылки

Так. С вайб-кодингом все понятно. А как вам вайб-ссылкинг? Со временем жесткие с...

Post Thumbnail

ИИ техдолг

Vibe coding генерирует кучу техдолга(вот это неожиданность)! В статье вполне ...