Whoosh là một thư viện các lớp và hàm để lập chỉ mục văn bản và sau đó tìm kiếm chỉ mục.
Whoosh là một thư viện các lớp và hàm để lập chỉ mục văn bản và sau đó tìm kiếm chỉ mục.
Whoosh Tổng quan
Whoosh là một thư viện tìm kiếm và lập chỉ mục toàn văn bản nhanh, đầy tính năng được triển khai bằng Python thuần túy. Các lập trình viên có thể sử dụng nó để dễ dàng thêm chức năng tìm kiếm vào các ứng dụng và trang web của họ. Mọi phần trong cách thức hoạt động của Whoosh đều có thể được mở rộng hoặc thay thế để đáp ứng chính xác nhu cầu của bạn.
Một số tính năng của Whoosh bao gồm:
API Pythonic. Tinh khiết-Python. Không có gói biên dịch hoặc nhị phân cần thiết, không có sự cố bí ẩn. Lập chỉ mục và tìm kiếm Lập chỉ mục và truy xuất nhanh - nhanh hơn bất kỳ giải pháp tìm kiếm Python thuần túy nào khác mà tôi biết. Xem điểm chuẩn. Thuật toán chấm điểm có thể cắm (bao gồm BM25F), phân tích văn bản, lưu trữ, định dạng đăng, v.v. Ngôn ngữ truy vấn mạnh mẽ. Trình kiểm tra chính tả Python thuần chất lượng sản xuất (theo như tôi biết, chỉ có một).
Whoosh có thể hữu ích trong các trường hợp sau:
Bất cứ nơi nào một giải pháp Python thuần túy là mong muốn để tránh phải xây dựng / biên dịch các thư viện riêng (hoặc buộc người dùng xây dựng / biên dịch chúng). Là một nền tảng nghiên cứu (ít nhất là đối với các lập trình viên tìm thấy Python dễ đọc và làm việc hơn Java;) Khi một giao diện Pythonic dễ sử dụng quan trọng với bạn hơn tốc độ thô. Nếu ứng dụng của bạn có thể sử dụng tốt một giải pháp tìm kiếm / tra cứu tích hợp sâu, bạn có thể chỉ dựa vào đó chứ không phải có hai giải pháp tìm kiếm khác nhau (một giải pháp đơn giản / chậm / trong nhà được tích hợp, một phụ thuộc nhị phân được lập chỉ mục / nhanh / bên ngoài như một Lựa chọn).
Whoosh được tạo ra và được duy trì bởi Matt Chaput. Ban đầu nó được tạo ra để sử dụng trong hệ thống trợ giúp trực tuyến của phần mềm hoạt hình 3D Houdini của Side Effects Software. Phần mềm Side Effects Inc. đã đồng ý với mã nguồn mở.