[B! cascading] msyktのブックマーク

msykt id:msykt

cascadingに関するmsyktのブックマーク (3)

Powering Big Data at Pinterest. Interview with Krishna Gade. | ODBMS Industry Watch
msykt 2015/04/26
S3にログを書き込むSecorというツールが気になったのと、SparkとMemSQLの連携が面白そう

log

kafka

singer

s3

secor

spark

cascading

memsql
リンク
Cascading使ってみた
久々の更新になってしまった。前回Google App Engine Pipeline APIを紹介したが、その中でCascadingというキーワードが出てきたと思う。今回はずっと気になっていたCascadingとやらHadoopの関連プロジェクトについて触れてみたい。ただWordCountをやってみるのはもう飽きたのでw 今回はより実用的にApacheログの解析をやってみたい。下記のログファイルを解析に使う。 Cascadingアプリケーションのソースは下記処理の内容について、細かく説明するのはまた次回以降。（まだ調査、勉強中です。。）大まかに処理の流れを追うと入力データ（ソース）から必要な部分を抽出し、 "ip", "time", "method", "event", "status", "size"という項目をもつタプル（データベースの行やレコードとよく似ている）に整形する
msykt 2013/03/09
hadoop

cascading
リンク
Cascadingサンプル：WordCount(Hishidama's Hadoop Cascading WordCount Memo)
WordCountサンプル CascadingでHadoopチュートリアルのWordCountと同様の処理を行うプログラム。 package jp.hishidama.hadoop.cascading.wordcount; import java.util.StringTokenizer; import org.apache.hadoop.fs.Path; import cascading.flow.Flow; import cascading.flow.FlowConnector; import cascading.flow.FlowProcess; import cascading.operation.Aggregator; import cascading.operation.AggregatorCall; import cascading.operation.BaseOperati
msykt 2013/03/09
hadoop

cascading
リンク
1

お知らせ

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx

はてなブックマーク

タグ

関連タグで絞り込む (8)

cascadingに関するmsyktのブックマーク (3)

お知らせ

今週のはてなブックマーク数ランキング（2025年2月第3週）

今週のはてなブックマーク数ランキング（2025年2月第2週）

月間はてなブックマーク数ランキング（2025年1月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (8)

cascadingに関するmsyktのブックマーク (3)

Powering Big Data at Pinterest. Interview with Krishna Gade. | ODBMS Industry Watch

Cascading使ってみた

Cascadingサンプル：WordCount(Hishidama's Hadoop Cascading WordCount Memo)

お知らせ

今週のはてなブックマーク数ランキング（2025年2月第3週）

今週のはてなブックマーク数ランキング（2025年2月第2週）

月間はてなブックマーク数ランキング（2025年1月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス