В статье автор разбирается в возможностях полнотекстового поиска в DuckDB.
Он сравнивает DuckDB с более зрелыми решениями, такими как Elasticsearch и PostgreSQL, отмечая, что встроенное FTS-расширение DuckDB поддерживает стемминг, стоп-слова, удаление диакритических знаков и алгоритм ранжирования Okapi BM25.
На практическом примере с 13 000 email-сообщений автор показывает полный рабочий процесс: предварительную обработку писем на Python, импорт JSON-данных в DuckDB, создание FTS-индекса и выполнение различных типов запросов.
В принципе, DuckDB предоставляет достаточно мощный и удобный инструмент для большинства исследовательских сценариев, особенно учитывая скорость работы и простоту развертывания практически на любых источниках данных
17.05.2026
Похожее
25.05.2026
Scylla Control Plane
Discord построил SCP (Scylla Control Plane) фреймворк на Rust для автоматизации ...
09.04.2026
Шахматы на SQL
Автор демонстрирует, как можно реализовать полноценную игру в шахматы, используя...
07.04.2026
Современный SQLite
Это гораздо больше, чем просто встраиваемая база данных. SQLite поддерживает...
26.03.2026
PostgreSQL с Patroni
В статье про создание высокодоступного кластера PostgreSQL с Patroni. Автор ...