[B! hadoop] koemuのブックマーク

Hadoopはどのように動くのか ─並列・分散システム技術から読み解くHadoop処理系の設計と実装記事一覧 | gihyo.jp

第21回Sparkの設計と実装［2］～Sparkにおけるデータ共有の仕組みと耐障害性の実現方法猿田浩輔，山田浩之 2016-06-08

koemu 2015/10/22

hadoop

リンク

Dataproc | Google Cloud

Dataproc is a fully managed and highly scala ble service for running Apache Hadoop, Apache Spark, Apache Flink, Presto, and 30+ open source tools and frameworks. Use Dataproc for data lake modernization, ETL, and secure data science, at scale, integrated with Google Cloud, at a fraction of the cost. Flexible: Use serverless, or manage clusters on Google Compute and Kubernetes. Deploy a Google-recom

koemu 2015/09/25

"Managed Hadoop & Spark" 選択肢が広まって良い

リンク

ドリコムを支えるデータ分析基盤 - かにぱんのなく頃に

はじめにこれはドリコムAdventCalendar の4日目です３日目は、@arihh さんによる 3年くらいお菓子神社運営してきたです自己紹介 @ka_nipan ドリコムに新卒で入社し、Android開発、BtoBtoC のwebサービス開発を経て、現在は弊社アプリのログ収集から集計、可視化、その他周辺ツールといった分析基盤の面倒を見ています本日はそのデータ基盤の話を書きますデータ分析基盤全体図弊社では Hadoop をオンプレで運用していて、そこにログや分析用のデータを置いていますメリット運用コストが安い Treasure Data、Big Query、Amazon Redshift 等の外部サービスを使うよりは安く済みます自由度が高い各サービスには容量をはじめ色々と制限があったり、こちらの要求仕様にマッチしない部分が少なからずありますが、自前の場合その辺は融

koemu 2014/12/04

「基本的に HDFS には gzip 圧縮した tsv ファイル等を置いていて、SequenceFile は置いていません」オンプレで設置するほうが良いと判断できるほどの状況なのだな…

リンク

Presto: Free, Open-Source SQL Query Engine for any Data

Calling our Presto community speakers – we want to hear from you! Fill out out community call for papers to speak at upcoming meetups and conferences. What is Presto?Presto is an open source SQL query engine that’s fast, reliable, and efficient at scale. Use Presto to run interactive/ad hoc queries at sub-second performance for your high volume apps.

koemu 2014/01/23

リンク

“統計の基礎を無視している”Hadoop使いが考えるビッグデータ

Hadoopをバッチ処理の高速化に活用しているノーチラス・テクノロジーズは、ビッグデータのブームに真っ向から異論を唱える。「ビッグデータは中身のないバズワード」と断言する代表取締役社長神林飛志氏に、その真意を聞いた。 Hadoop＝ビッグデータは大きな誤解ノーチラス・テクノロジーズは、基幹系システム向けのミドルウェアを手がける国産ベンチャー。Webサービスのように決して派手ではないが、「そもそもダウンすると、飛行機が飛ばないとか、病院で人が死んでしまうとか、電車が動かないとか、生活に影響が出る分野」（神林氏）という、まさにミッションクリティカルな領域のITで、同社の製品は活用されている。同社の「Asakusa Framework」は、Hadoopを活用した分散処理により、基幹系バッチの高速化を実現する。神林氏は、「Hadoopというと、WebやSNS系、BIやデータ解析での使い方がメ

koemu 2012/05/09

リンク

Hoop(httpfs)とwebhdfsの違い - たごもりすメモ

Hadoop 1.0.0がリリースされた。まあ中身のほとんどはただの 0.20.x 安定板リリースなので特別に言うことはないんだけど。詳しくは以下のblogを読むのがよろしい。 hadoopのバージョン表記について - 科学と非科学の迷宮ただしひとつだけびっくりしたのは、webhdfsなる機能が入ってきたこと。(このblogでよく話題にしている)Hoopと並んでそんなようなものがあること自体は知ってたけどあんまり興味なかったのだが、Apache Hadoopのパッケージに(Hoopより先に)入ったとなるとちょっと注目せざるをえない。が、httpfs(Hoop)とwebhdfsじゃ名前も似てて超まぎらわしい。いったい何がなんなの。なお自分はWebHDFSはAPIリファレンスを読んだだけで、実際にはカケラも触っていない。その状況での理解による内容なので、注意して読んでください。先に結論

koemu 2012/01/04

hadoop

リンク

『モバゲーの大規模データマイニング基盤におけるHadoop活用』－Hadoop Conference Japan 2011－ #hcj2011

『モバゲーの大規模データマイニング基盤におけるHadoop活用』－Hadoop Conference Japan 2011－ #hcj2011 2011/02/22 [登壇後エントリ] ：" 「モバゲーの大規模データマイニング基盤におけるHadoop活用」－Hadoop Conference Japan 2011 #hcj2011 で登壇してきました " http://d.hatena.ne.jp/hamadakoichi/20110222/p1Read less

koemu 2011/12/31

リンク

Platfora Support

koemu 2011/09/10

Hadoop

リンク

Asakusaソースコードリーディング第4回（#AsakusaReading）

御徒町＠MultiVersionConcurrentClimber(MVCC) @okachimachiorz1 リマインダーです。今週の金曜日です。AsakusaSCR第Ⅳ回　時間変更で19:30からです。要注意です。http://j.mp/mP1K7Z

koemu 2011/08/27

リンク

CDH3u0の仮想マシンにAsakusaをセットアップするスクリプト — Gist

koemu 2011/08/11

hadoop

リンク

Cloudera

Join three industry experts as they reveal 2025 data and AI trends | Jan 21 Register now

koemu 2011/08/08

hadoop

リンク

Hadoop向け基幹バッチ分散処理ソフト「Asakusa」の全貌

Hadoopは分散処理によって、大量データの一括処理をRDBMSよりも大幅に高速化できるミドルウエアで、これまではログ解析など特定の分野で使われてきた。これを、基幹バッチ処理に適用するためのフレームワークが登場した。オープンソースソフトウエアの「Asakusa」である。本連載では、Asakusaの開発責任者がその全体像を解説する。Hadoopがなぜ速いのかを解説したあと、Asakusaの構成要素や設計方法、実際のコーディング例を示す。

koemu 2011/08/08

リンク

asakusafw

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

koemu 2011/08/08

Hadoop

リンク

NTTデータ公式サイト

NTTデータ（国内事業会社）企業情報プロフィール社長メッセージ役員一覧 NTTデータのテクノロジー NTTデータグループ（持株会社）企業情報プロフィール社長メッセージ Our Way 役員一覧サステナビリティ沿革グループ会社協賛・文化活動取引先企業の皆様へ NTT DATA, Inc.（海外事業会社）企業情報

koemu 2011/05/19

hadoop

リンク

ソフトバンク通信3社向けHadoop研修資料

2010年9月7日に実施いたしました、ソフトバンクモバイル株式会社、ソフトバンクテレコム株式会社、ソフトバンクBB株式会社むけHadoop研修の資料を公開いたします。 Read less

koemu 2010/12/12

リンク

Last.fm – the Blog · Python + Hadoop = Flying Circus Elephant

As a research intern here at Last.fm, dealing with huge datasets has become my daily bread. Having a herd of yellow elephants at my disposal makes this a lot easier, but the conventional way of writing Hadoop programs can be rather cumbersome. It generally involves lots of typing, compiling, building, and moving files around, which is especially annoying for the “write once, run never again” progr

koemu 2010/12/12

リンク

HBaseとはどんなNoSQLデータベースなのか？日本語で読める情報を集めてみた

Facebookが新しいサービス「Messages」の基盤として、NoSQLデータベースの「HBase」を選択したことを、先日の記事「Facebookが新サービスの基盤にしたのは、MySQLでもCassandraでもなく、HBaseだった」で紹介しました。 HBaseは、Facebookによると次のような特徴を備えていると説明されてます。負荷に対して非常に高いスケーラビリティと性能を発揮 CassandraよりもシンプルなConsistency Model（一貫性モデル）を備えている自動ロードバランス、フェイルオーバー、圧縮機能サーバーごとに数十個のシャードを割り当て可能、などなどこのHBaseはどのようなデータベースなのでしょうか？情報を集めてみました。 HBase入門のプレゼンテーション最初に紹介するのは「HBaseエバンジェリスト」Tatsuya Kawano氏のプレゼン

koemu 2010/11/22

DB
Hadoop

リンク

Googleの並列ログ解析向け言語「Sawzall」が公開されたので使ってみた | Preferred Research Blog

最近光麺にハマっている太田です。グーグル、分散処理のためにデザインされた言語「Sawzall」をオープンソースで公開 ? Publickeyで紹介されている、並列ログ解析向け言語「Sawzall」を試してみました。動かし方のドキュメントが少なかったので、紹介エントリを書いてみます。プロジェクトページドキュメント Sawzallについては、5年前に論文が発表されており一部概要を知ることは出来ましたが、先日実装がオープンソースで公開されました。論文の第一著者はUNIXやPlan9の開発者で知られるRob Pike氏です。 Interpreting the Data: Parallel Analysis with Sawzall MapReduceのOSS実装として「Hadoop」が良く知られていますが、Hadoop向けの言語としてはHiveやPig等が有名です。 Hive: MapRed

koemu 2010/11/14

リンク

IBM版Hadoopでクラスターを簡単セットアップ

はじめに IBM版Apache Hadoop（英語名：IBM Distribution of Apache Hadoop / 通称：IDAHO）とは、IBMのJava VMで動く、インストーラー付きApache Hadoopです。先進テクノロジー・ソフトウェアの無償ダウンロードサイト「IBM alphaWorks」で公開されています。本記事執筆時点では、32-bit Linux version of the IBM SDK for Java 6 SR 8で稼働します。また、IDAHO-1.0では、Apache Hadoop version 0.20.2をベースにしています。 IDAHOには、Web-UIによるインストーラーがついています。SSH設定、Javaランタイム、Hadoopなどの設定を自動的に行いますので、Hadoopクラスターのセットアップが簡単に行えます。また、一回の作業で複

koemu 2010/10/17

セットアップが楽になってる、かな？

hadoop

リンク

平成２１年度産学連携ソフトウェア工学実践事業報告書の公表について（METI/経済産業省）

高信頼組込みソフトウェア開発（委託先：一般社団法人JASPAR）報告書（PDF形式：3,278KB）（ZIP形式：2,993KB）ソフトウェア工学の実践強化に関する調査研究（委託先：株式会社三菱総合研究所）報告書（PDF形式：2,501KB）クラウドコンピューティング時代のDependabilityの考え方などに関する米国の動向調査（委託先：株式会社アイ・ビー・ティ）報告書（PDF形式：4,583KB）（ZIP形式：4,300KB）クラウド・コンピューティングに関する国内外の制度・技術動向等の調査研究（委託先：株式会社野村総合研究所）報告書（PDF形式：2,050KB）高信頼クラウド実現用ソフトウェア開発（分散制御処理技術等に係るデータセンター高信頼化に向けた実証事業）（委託先：株式会社エヌ・ティ・ティ・データ）（PDF形式：9,606KB）（ZIP形式：8,656

koemu 2010/09/29

リンク

はてなブックマーク

タグ

関連タグで絞り込む (22)

hadoopに関するkoemuのブックマーク (24)

お知らせ

今週のはてなブックマーク数ランキング（2025年1月第2週）

月間はてなブックマーク数ランキング（2024年12月）

今週のはてなブックマーク数ランキング（2025年1月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス