小ネタです。EMR上でspark-shellを利用する際のログレベルの変更方法について紹介します。また、それだけだと余りにも内容が少ないので、log4j.properties がどのようにして読み込まれるかについても解説します。 前提 以下の環境を前提としています。 emr-4.7.1 でアプリケーションは Hadoop, Spark Sparkのバージョンは 1.6.1 ハードウェア構成は m1.medium を 1 台(検証用なのでマスターノードのみ) EC2キーペアを設定(SSHで接続して操作するため) 東京リージョン AWS CLIだと以下のようなコマンドになります。KeyName, SubnetId, log-uriをご自身の環境に合わせればそのまま利用できるはずです。 aws emr create-cluster --applications Name=Hadoop Name=
