Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

decentralizeとcloudに関するHeavyFeatherのブックマーク (3)

  • 優良企業はなぜHadoopに走るのか

    ちなみに、この分析のために必要とされるMapReduceのコードであるが、そのサイズはわずか20ステップだという。Yahoo!のプレゼンテーターである、エリック・バルデシュバイラー氏によると、たとえ経験の浅いエンジニアであっても、MapReduceによるプログラミングは可能であるとされる。 また、VISAのジョー・カニンガム氏からも、貴重なデータが提供されていたので以下に紹介する。同社では、1日に1億トランザクションが発生するため、2年間で700億強のトランザクションログが蓄積され、そのデータ量は36テラバイトに至るという。こうしたスケールのデータを、従来のRDBを用いて分析するには、約1カ月の時間が必要とされてきたが、Hadoopを用いることで13分に短縮されたという。 これまでは、Yahoo!にしろVISAにしろ、膨大なデータをRDBに押し込むほかに方法はなく、その分析に数十日を要する

    優良企業はなぜHadoopに走るのか
  • アマゾン、ウィザードだけで使えるHadoopサービス開始 - @IT

    2009/04/02 米アマゾンの子会社、Amazon Web Services(AWS)は4月2日、多数のOSインスタンスを起動して大規模分散処理を行える「Amazon Elastic MapReduce」のベータサービスを開始した。 Amazon Elastic MapReduceは、オープンソースの分散処理フレームワークApache Hadoop 0.18.3を利用したサービスで、Webブラウザベースの管理コンソールやコマンドラインツール、APIを使ってジョブを投入することで、大量データの解析や計算量の多い科学計算、統計処理が可能。大量のログ処理や機械学習、金融計算、データマイニング、Webサイトのインデクシング処理などに使えるという。 ジョブを処理するノードは、従来からAWSが提供しているAmazon EC2で稼働し、データの入出力にはAmazon S3が使える。データの入力にはイ

  • メディア・パブ: クラウドコンピューティング市場/技術を俯瞰する図

    2008年はクラウドコンピューティングの年になる。そのようなことを昨年末に書いた覚えがある(この記事)。バズワードとしてWeb2.0が陳腐化してきた昨年あたりから脚光を浴び始めたのが,クラウドコンピューティングである。 確かに旬のテーマになってきた。でもしばらくウォッチしていないと,方向感覚を失ってしまっていた。クラウドコンピューティング市場/技術の全体像をビジュアルな図で紹介しているブログに出会ったので,取り上げて見る。 ドイツ技術リサーチャーMarkus Klems氏 (Research assistant at Germany-based FZI Research Center for Information Technology)のブログである。最初の図は,クラウドコンピューティングのプレーヤーを示している。 Merrill Lynchの“The Cloud Wars: $100

  • 1