Selecione seu idioma

Página inicial arrow-right Apache Nutch

Nós compilamos uma lista de 6 alternativas gratuitas e pagas para o Apache Nutch. Os principais concorrentes incluem: Scrapy, Mixnode. Além disso, os usuários também fazem comparações entre Apache Nutch e StormCrawler, ProxyCrawl, ACHE Crawler. Além disso, você pode conferir outras opções semelhantes aqui: About.


Scrapy
Free Open Source

O Scrapy é uma estrutura de código aberto e colaborativa para extrair os dados necessários dos sites.

Transforme a web em um banco de dados!

StormCrawler
Free Open Source

O StormCrawler é um SDK de código aberto para a criação de rastreadores da Web distribuídos com o Apache Storm.

Raspar e rastrear sites enquanto é anônimo e ignora qualquer restrição, bloqueio ou captura

ACHE Crawler
Free Open Source

O ACHE é um rastreador da Web para pesquisa específica de domínio.

Heritrix
Free Open Source

O projeto de rastreador da Web de código aberto, extensível, em escala da Web e com qualidade de arquivamento do Internet Archive.

O Apache Nutch é um projeto de software de rastreador da Web de código aberto altamente extensível e escalável.

Apache Nutch Plataformas

tick-square Linux
tick-square Mac
tick-square Windows

Apache Nutch Visão geral

O Apache Nutch é um projeto de software de rastreador da Web de código aberto altamente extensível e escalável.

Nutch é totalmente codificado na linguagem de programação Java, mas os dados são gravados em formatos independentes da linguagem. Possui uma arquitetura altamente modular, permitindo que os desenvolvedores criem plug-ins para análise de tipo de mídia, recuperação de dados, consulta e cluster.

O buscador ("robô" ou "rastreador da web") foi criado do zero especificamente para este projeto.

Apache Nutch Recursos

tick-square Scalable
tick-square Extensible by Plugins/Extensions

Principais alternativas ao Apache Nutch

Compartilhe sua opinião sobre o software, deixe uma avaliação e ajude a torná-lo ainda melhor!

Apache Nutch Etiquetas

web-scraper web-crawling web-crawler java-based

Sugerir alterações

Seu feedback

Selecione uma classificação
Por favor, selecione uma classificação

Your vote has been counted.

Do you have experience using this software?