Wir haben eine Liste von 6 kostenlosen und kostenpflichtigen Alternativen zu Apache Nutch zusammengestellt. Zu den Hauptkonkurrenten gehören Scrapy, Mixnode. Neben diesen vergleichen Benutzer auch Apache Nutch mit StormCrawler, ACHE Crawler, ProxyCrawl. Außerdem können Sie hier auch andere ähnliche Optionen ansehen: About.
Wir haben eine Liste von 6 kostenlosen und kostenpflichtigen Alternativen zu Apache Nutch zusammengestellt. Zu den Hauptkonkurrenten gehören Scrapy, Mixnode. Neben diesen vergleichen Benutzer auch Apache Nutch mit StormCrawler, ACHE Crawler, ProxyCrawl. Außerdem können Sie hier auch andere ähnliche Optionen ansehen: About.
Apache Nutch ist ein hochgradig erweiterbares und skalierbares Open-Source-Webcrawler-Softwareprojekt.
Apache Nutch ist ein hochgradig erweiterbares und skalierbares Open-Source-Webcrawler-Softwareprojekt.
Apache Nutch Plattformen
Windows
Linux
Mac
Apache Nutch Überblick
Apache Nutch ist ein hochgradig erweiterbares und skalierbares Open-Source-Webcrawler-Softwareprojekt.
Nutch ist vollständig in der Programmiersprache Java codiert, die Daten werden jedoch in sprachunabhängigen Formaten geschrieben. Die Architektur ist sehr modular, sodass Entwickler Plug-Ins für das Parsen, Abrufen, Abfragen und Clustering von Daten nach Medientypen erstellen können.
Der Fetcher ("Roboter" oder "Webcrawler") wurde speziell für dieses Projekt von Grund auf neu geschrieben.