Whoosh is een bibliotheek met klassen en functies voor het indexeren van tekst en het vervolgens doorzoeken van de index.
Whoosh is een bibliotheek met klassen en functies voor het indexeren van tekst en het vervolgens doorzoeken van de index.
Whoosh Overzicht
Whoosh is een snelle, uitgebreide index voor het indexeren en doorzoeken van volledige tekst geïmplementeerd in pure Python. Programmeurs kunnen het gebruiken om eenvoudig zoekfunctionaliteit toe te voegen aan hun applicaties en websites. Elk deel van hoe Whoosh werkt, kan worden uitgebreid of vervangen om precies aan uw behoeften te voldoen.
Enkele van de functies van Whoosh zijn:
Pythonic API. Pure-Python. Geen compilatie of binaire pakketten nodig, geen mysterieuze crashes. Fielded indexering en zoeken. Snel indexeren en ophalen - sneller dan elke andere pure Python-zoekoplossing die ik ken. Zie benchmarks. Inplugbaar score-algoritme (inclusief BM25F), tekstanalyse, opslag, boekingsindeling, etc. Krachtige zoektaal. Zuivere Python-spellingcontrole van productiekwaliteit (voor zover ik weet, de enige).
Whoosh kan nuttig zijn in de volgende omstandigheden:
Overal is een pure-Python-oplossing wenselijk om te voorkomen dat ze native bibliotheken moeten bouwen / compileren (of gebruikers moeten dwingen ze te bouwen / compileren). Als een onderzoeksplatform (tenminste voor programmeurs die vinden dat Python gemakkelijker te lezen en te werken is dan Java;) Wanneer een eenvoudig te gebruiken Pythonic-interface voor u belangrijker is dan ruwe snelheid. Als uw toepassing goed gebruik kan maken van een diep geïntegreerde zoek / zoek-oplossing, kunt u erop vertrouwen dat u er gewoon bent, in plaats van twee verschillende zoekoplossingen (een eenvoudige / trage / inlandse oplossing geïntegreerd, een geïndexeerde / snelle / externe binaire afhankelijkheid als een keuze).
Whoosh is gemaakt en wordt onderhouden door Matt Chaput. Het is oorspronkelijk gemaakt voor gebruik in het online helpsysteem van Houdini, de 3D-animatiesoftware voor 3D-animatie. Side Effects Software Inc. kwam genadig overeen om de code open-source te maken.