Выберите свой язык

Главная arrow-right Apache Nutch

Мы составили список из 6 бесплатных и платных аналогов Apache Nutch. Основные конкуренты: Scrapy, Mixnode. Кроме того, пользователи также проводят сравнения между Apache Nutch и StormCrawler, ProxyCrawl, ACHE Crawler. Также вы можете рассмотреть другие аналогичные варианты здесь: About.


Scrapy
Free Open Source

Scrapy - это открытая и совместная структура для извлечения необходимых вам данных с веб-сайтов.

Преврати сеть в базу данных!

StormCrawler
Free Open Source

StormCrawler - это SDK с открытым исходным кодом для создания распределенных веб-сканеров с помощью Apache Storm.

Царапать и сканировать веб-сайты, оставаясь анонимным, и обходить любые ограничения, блоки или капчи

Heritrix
Free Open Source

Интернет-архиватор с открытым исходным кодом, расширяемый, масштабируемый в сети, проект поискового робота.

Apache Nutch - это расширяемый и масштабируемый программный проект с открытым исходным кодом.

Apache Nutch Платформы

tick-square Windows
tick-square Linux
tick-square Mac

Apache Nutch Обзор

Apache Nutch - это расширяемый и масштабируемый программный проект с открытым исходным кодом.

Nutch полностью написан на языке программирования Java, но данные записываются в независимых от языка форматах. Он имеет высокомодульную архитектуру, позволяющую разработчикам создавать подключаемые модули для анализа медиа-типов, извлечения данных, запросов и кластеризации.

Сборщик («робот» или «веб-сканер») был написан с нуля специально для этого проекта.

Apache Nutch Функции

tick-square Scalable
tick-square Extensible by Plugins/Extensions

Лучшие аналоги Apache Nutch

Поделитесь своим мнением о программном обеспечении, оставьте отзыв и помогите сделать его еще лучше!

Apache Nutch Теги

web-scraper web-crawling web-crawler java-based

Предложить изменения

Ваш отзыв

Выберите рейтинг
Пожалуйста, выберите рейтинг

Your vote has been counted.

Do you have experience using this software?