Есть список чего-угодно, по-питоновски. В нём надо найти элементы, которые похожи друг на друга. В роли списка могут быть названия файлов, имена людей, элементы справочников, перечень ИТ-систем и т.д. и т.п. Такая задача удивительно часто встречается в жизни.
Под неточными дубликатами мы понимаем такие две текстовые строчки, которые бы человек посчитал практически одинаковыми, за исключением технических/случайных разниц. Например, ошибки, опечатки и т.п. Конечно, метрика "неточных дубликатов" непрерывная, но рассматривается именно в таком ключе.
09.07.2025
Похожее
26.11.2025
HTTP кэширование
Отличный пост о том, как грамотное HTTP-кэширование ускоряет сайты, делает их ст...
14.11.2025
Самый сложный язык
Malbolge - это эзотерический язык программирования, созданный для того, чтобы п...
07.11.2025
Carbon
В эту пятницу новый язык программирования - Carbon. Хотя, уже не такой и новый я...
04.11.2025
Пастебин у нас дома ☭
Я уже давно не могу пользоваться gist в github, а говняным pastebin я никогда по...