言語を選択

ホームページ arrow-right Apache Nutch

Apache Nutch の代わりとなる 6 個の無料および有料のリストをまとめました。 主な競合相手はScrapyMixnodeです。 これらに加えて、ユーザーは Apache Nutch と StormCrawlerACHE CrawlerProxyCrawl の間の比較も行います。 また、他の同様のオプションもここで確認できます: About


Scrapy
Free Open Source

Scrapyは、Webサイトから必要なデータを抽出するためのオープンソースで協調的なフレームワークです。

ウェブをデータベースに変えましょう!

StormCrawler
Free Open Source

StormCrawlerは、Apache Stormを使用して分散Webクローラーを構築するためのオープンソースSDKです。

ACHE Crawler
Free Open Source

ACHEは、ドメイン固有の検索用のWebクローラーです。

匿名でWebサイトをスクレイピングおよびクロールし、制限、ブロック、またはキャプチャをバイパスします

Heritrix
Free Open Source

The Internet Archive's open-source, extensible, web-scale, archival-quality web crawler project.

Apache Nutchは、拡張性が高くスケーラブルなオープンソースのWebクローラーソフトウェアプロジェクトです。

Apache Nutch プラットフォーム

tick-square Windows
tick-square Linux
tick-square Mac

Apache Nutch 概要

Apache Nutchは、拡張性が高くスケーラブルなオープンソースのWebクローラーソフトウェアプロジェクトです。

Nutchは完全にJavaプログラミング言語でコーディングされていますが、データは言語に依存しない形式で記述されています。 高度にモジュール化されたアーキテクチャを備えているため、開発者はメディアタイプの解析、データ取得、クエリ、クラスタリング用のプラグインを作成できます。

フェッチャー(「ロボット」または「ウェブクローラー」)は、このプロジェクト専用にゼロから作成されました。

Apache Nutch 機能

tick-square Scalable
tick-square Extensible by Plugins/Extensions

トップApache Nutchの代替案

ソフトウェアについての意見を共有し、レビューを残してさらに向上させるのに役立てましょう!

Apache Nutch タグ

web-scraper web-crawling web-crawler java-based

変更の提案

あなたのフィードバック

評価を選択してください
評価を選択してください

Your vote has been counted.

Do you have experience using this software?