Algolia - это комплексная платформа для поиска и обнаружения информации с помощью искусственного интеллекта, объединяющая обработку естественного языка и векторный поиск через единый API.
Whoosh - это библиотека классов и функций для индексации текста и последующего поиска по индексу.
Whoosh - это библиотека классов и функций для индексации текста и последующего поиска по индексу.
Whoosh Обзор
Whoosh - быстрая, многофункциональная библиотека полнотекстового индексирования и поиска, реализованная на чистом Python. Программисты могут использовать его, чтобы легко добавлять функции поиска в свои приложения и веб-сайты. Каждая часть работы Whoosh может быть расширена или заменена для точного удовлетворения ваших потребностей.
Некоторые из функций Whoosh включают в себя:
Pythonic API. Pure-Python. Никакой компиляции или бинарных пакетов не требуется, никаких загадочных сбоев. Полевая индексация и поиск. Быстрая индексация и поиск - быстрее, чем любое другое решение для поиска на чистом Python, о котором я знаю. Смотрите тесты. Сменный алгоритм оценки (включая BM25F), анализ текста, хранение, формат публикации и т. Д. Мощный язык запросов. Чистая проверка орфографии Python (насколько я знаю, единственная).
Свист может быть полезен в следующих обстоятельствах:
Везде, где чисто Python-решение желательно, чтобы избежать необходимости собирать / компилировать нативные библиотеки (или заставлять пользователей собирать / компилировать их). В качестве исследовательской платформы (по крайней мере, для программистов, которым Python легче читать и работать с ним, чем Java;) Когда простой в использовании интерфейс Pythonic для вас важнее, чем сырая скорость. Если ваше приложение может эффективно использовать одно глубоко интегрированное решение для поиска и поиска, вы можете положиться только на то, чтобы быть там, а не на двух разных поисковых решениях (простое / медленное / доморощенное интегрированное, индексированная / быстрая / внешняя двоичная зависимость в качестве опция).
Свист был создан и поддерживается Мэттом Чапутом. Первоначально он был создан для использования в интерактивной справочной системе 3D-анимации Side Effects Software Houdini. Side Effects Software Inc. любезно согласилась с открытым исходным кодом.