Nutch is a highly extensible, highly scalable, matured, production-ready Web crawler which enables fine grained configuration and accomodates a wide variety of data acquisition tasks. Scalable Relying on Apache Hadoop™ data structures, Nutch is great for batch processing large data volumes but can also be tailored to smaller jobs. Pluggable Out of the box Nutch offer powerful plugins i.e., parsing
2011年10月25日に開催された「Oracle Database / Exadata Summit」では、オラクルのビッグ・データ戦略を示した基調講演に続いて、具体的な施策を紹介するセッションが立て続けに実施された。その1つであるセッション「Big Data時代を導くITテクノロジー(1)-OracleとHadoopをつなぐOracle Loader for Hadoop概要」では、ビッグ・データの分散処理基盤として広く使われているHadoopとOracle Databaseの連携を実現する最新のソフトウェア/ハードウェア群が紹介された(編集部)。 《Oracle Database / Exadata Summit》レポート・シリーズ 「ビッグ・データ時代の企業システムはどうあるべきか?」――オラクルからの提案を4つの記事で紹介します。 (1)オラクルのソフトウェアとEngineered
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く