В статье автор разбирается в возможностях полнотекстового поиска в DuckDB.
Он сравнивает DuckDB с более зрелыми решениями, такими как Elasticsearch и PostgreSQL, отмечая, что встроенное FTS-расширение DuckDB поддерживает стемминг, стоп-слова, удаление диакритических знаков и алгоритм ранжирования Okapi BM25.
На практическом примере с 13 000 email-сообщений автор показывает полный рабочий процесс: предварительную обработку писем на Python, импорт JSON-данных в DuckDB, создание FTS-индекса и выполнение различных типов запросов.
В принципе, DuckDB предоставляет достаточно мощный и удобный инструмент для большинства исследовательских сценариев, особенно учитывая скорость работы и простоту развертывания практически на любых источниках данных
17.05.2026
Похожее
09.04.2026
Шахматы на SQL
Автор демонстрирует, как можно реализовать полноценную игру в шахматы, используя...
07.04.2026
Современный SQLite
Это гораздо больше, чем просто встраиваемая база данных. SQLite поддерживает...
26.03.2026
PostgreSQL с Patroni
В статье про создание высокодоступного кластера PostgreSQL с Patroni. Автор ...
05.03.2026
Что такое транзакции?
В этой статье автор на пальцах объясняет, как работают транзакции в PostgreSQL и...