В статье автор создает приложение на Go для прогноза погоды с использованием LLM, работающей полностью локально на устройстве.
Да да, вместо облачных API, автор использует новую открытую модель Gemma 4 от Google DeepMind и Go-пакет Yzma, который обёртывает llama.cpp для запуска инференса модели в памяти. Приложение загружает квантизированную версию модели (E2B или E4B), формирует промпт с использованием нативных управляющих токенов Gemma 4 для вызова инструментов, получает от модели запрос на вызов функции get_weather, выполняет реальные API-запросы к OpenStreetMap и National Weather Service, а затем возвращает результат модели для генерации финального прогноза.
Всё работает без интернет-зависимости от внешних LLM-провайдеров, но требует достаточной вычислительной мощности. На CPU полный раунд трип может занимать до 1.5 минут, на GPU - около 10 секунд.
В любом случае, Gemma 4 выглядит многообещающе
23.04.2026
Похожее
06.06.2026
Код руками
Автор 7 месяцев вайб-кодил TUI-дашборд для Kubernetes GPU-кластеров на Go с помо...
29.05.2026
DOOM запустили в ChatGPT
Автор сделал играбельную версию DOOM в виде MCP приложения, которое запускается ...
22.05.2026
Память агентов
Интерактивное эссе о том, как работает память AI-агентов. LLM сама по себе s...
21.05.2026
Мы тупеем
Автор предупреждает, что тотальный переход на agentic coding, когда человек толь...