Algolia est une plateforme complète de recherche et de découverte de l'IA, intégrant de manière transparente le traitement du langage naturel et la recherche vectorielle par le biais d'une API unique.
Whoosh est une bibliothèque de classes et de fonctions permettant d’indexer du texte, puis de rechercher l’index.
Whoosh est une bibliothèque de classes et de fonctions permettant d’indexer du texte, puis de rechercher l’index.
Whoosh Description
Whoosh est une bibliothèque rapide et riche en fonctionnalités d'indexation et de recherche en texte intégral implémentée en pur Python. Les programmeurs peuvent l'utiliser pour ajouter facilement une fonctionnalité de recherche à leurs applications et à leurs sites Web. Chaque partie du fonctionnement de Whoosh peut être étendue ou remplacée pour répondre exactement à vos besoins.
Certaines des fonctionnalités de Whoosh incluent:
API Pythonic. Pure-Python. Aucune compilation ni paquetage binaire requis, pas de crash mystérieux. Indexation et recherche par champs. Indexation et récupération rapides - plus rapide que toute autre solution de recherche pur-Python que je connaisse. Voir Benchmarks. Algorithme de notation enfichable (y compris BM25F), analyse de texte, stockage, format de publication, etc. Puissant langage de requête. Correcteur orthographique en Python de qualité production (à ma connaissance, le seul).
Whoosh pourrait être utile dans les cas suivants:
N'importe où, une solution pure-Python est souhaitable pour éviter de devoir construire / compiler des bibliothèques natives (ou forcer les utilisateurs à les construire / compiler). En tant que plate-forme de recherche (du moins pour les programmeurs qui trouvent que Python est plus facile à lire et à utiliser que Java;) Quand une interface Pythonic facile à utiliser est plus importante pour vous que la vitesse brute. Si votre application peut tirer parti d'une solution de recherche / recherche profondément intégrée, vous pouvez compter uniquement sur votre présence au lieu de disposer de deux solutions de recherche différentes (une simple / lente / intégrée, une dépendance intégrée, une dépendance binaire indexée / rapide / externe / externe). option).
Whoosh a été créé et est maintenu par Matt Chaput. Il a été créé à l'origine pour être utilisé dans le système d'aide en ligne du logiciel d'animation 3D de Side Effects Software, Houdini. Side Effects Software Inc. a gracieusement accepté d'ouvrir le code.