Есть список чего-угодно, по-питоновски. В нём надо найти элементы, которые похожи друг на друга. В роли списка могут быть названия файлов, имена людей, элементы справочников, перечень ИТ-систем и т.д. и т.п. Такая задача удивительно часто встречается в жизни.
Под неточными дубликатами мы понимаем такие две текстовые строчки, которые бы человек посчитал практически одинаковыми, за исключением технических/случайных разниц. Например, ошибки, опечатки и т.п. Конечно, метрика "неточных дубликатов" непрерывная, но рассматривается именно в таком ключе.
09.07.2025
Похожее
26.04.2026
Stacking workflow
Так получается, что последнее время я работаю в командах, где принято испольщова...
17.04.2026
Factor
Вечер пятницы, а это значит что? Правильно! Новый язык программирования. Язык...
16.04.2026
Все типы строк
Автор, вдохновлённый тремя основными типами в Rust (String, &str и Vec<char>), а...
08.04.2026
Размер монорепо
Давайте делать монорепу. Что может пойти не так? В монорепе Dropbox объёмом 8...