Post Thumbnail

Серия статей, в которой рассказывается о написании Feste - полноценного трансформера в стиле GPT-2. А также о реализации каждого основного компонента - от тензорных операций до многоголового внимания, - чтобы развеять мифы о том, как работает современная языковая модель. Первый шаг - важнейшее преобразование человеческого языка в данные, которые может использовать модель: токенизация.

Похожее

Post Thumbnail

HKT

В статье автор экспериментирует с эмуляцией высших типов (HKTs) в Rust через обо...