Nós compilamos uma lista de 6 alternativas gratuitas e pagas para o Apache Nutch. Os principais concorrentes incluem: Scrapy, Mixnode. Além disso, os usuários também fazem comparações entre Apache Nutch e StormCrawler, ProxyCrawl, ACHE Crawler. Além disso, você pode conferir outras opções semelhantes aqui: About.
Nós compilamos uma lista de 6 alternativas gratuitas e pagas para o Apache Nutch. Os principais concorrentes incluem: Scrapy, Mixnode. Além disso, os usuários também fazem comparações entre Apache Nutch e StormCrawler, ProxyCrawl, ACHE Crawler. Além disso, você pode conferir outras opções semelhantes aqui: About.
O Apache Nutch é um projeto de software de rastreador da Web de código aberto altamente extensível e escalável.
O Apache Nutch é um projeto de software de rastreador da Web de código aberto altamente extensível e escalável.
Apache Nutch Plataformas
Linux
Mac
Windows
Apache Nutch Visão geral
O Apache Nutch é um projeto de software de rastreador da Web de código aberto altamente extensível e escalável.
Nutch é totalmente codificado na linguagem de programação Java, mas os dados são gravados em formatos independentes da linguagem. Possui uma arquitetura altamente modular, permitindo que os desenvolvedores criem plug-ins para análise de tipo de mídia, recuperação de dados, consulta e cluster.
O buscador ("robô" ou "rastreador da web") foi criado do zero especificamente para este projeto.