Rを使えるようになるための10のこと+α
Rは統計解析を行うことができる強力なツールです。計算上の信頼性はとても高く、世界中の分析者が日々分析用パッケージを公開しております。近年では行政機関で使われているという事例もちらほら聞きます。
・姫路市役所での事例
これまでSASは使ってきたけどRは全く使ったことがない!JAVAとかC++とかガリガリ書けるけどRはよく分からない!という方々がすんなりRの世界に入れるよう、資料の探し場所や導入部分をまとめておきます。
※まだ不完全ですが情報を入手し次第アップデートしていきます。
1. 資料を探す場所
- CRAN
- R本体、パッケージ、PDF資料などの置き場
- Task Viewに分野ごとのまとめ
- Searchでパッケージや資料の検索
- CRANの読み方は「しーらん」派と「くらん」派でわかれる(どっちでもいいw)
- Rjpwiki
- 日本語で書かれている、これまでのRに関する資料の集大成
- データの加工技、基本的な統計手法のことはほとんど載ってます
- JapanR
- 日本最大のRコミュニティ
- 各地で行われているコミュニティの資料がまとめられている
- Jin`s Page
- あらゆる手法のアーカイブが載っています
- 近年流行っている「Rで学ぶデータサイエンス」シリーズを書かれている先生です
- R-tips
- Rの使い方がわかりやすくまとまっています
- 教科書
- 統計学:Rを用いた入門書
- Rによる統計解析ハンドブック 第2版
- Rによるデータサイエンス - データ解析の基礎から最新手法まで
- Rによるデータサイエンスシリーズ
- などなど多数(上3つが分野網羅的)
- R-bloggers
- 世界のRエンジニアのブログ集
- 最新のトピックが分かります
2. Rの基本的な使い方
- インストール
- CRANのDownloadからダウンロードしてインストール
- 設定は特にいじる必要なし
- 起動するとR Consoleという画面が出るのでそこでコードを書いて実行していく
- 実行してみる
- コンソールでplot(iris)と書いてエンター→何かグラフがでる
- コンソールでlm(iris)と書いてエンター→何か線形回帰してくれる
- コンソールでirisと書いてエンター→何かデータが表示される
- コンソールでprcomp(iris[, -5])と書いてエンター→何か主成分分析してくれる
- 終了してみる
- コンソールのバツボタンをクリック
- 「作業スペースを保存しますか?」「いいえ」
3. Rのパッケージを使う
- install.packages("")でインストール
- library()で使えるようになる
- R本体がアップデートされた場合、パッケージはインストールしなおす必要がある
4. Rの便利設定
5. Rの亜種
- RStudio
- Rをサーバー上にインストールして利用できる
- amazon EC2に入れて「ブラウザさえあればRが使える!」みたいにできる
- RevolutionR
- Rより3倍速い(らしいが自分の環境では早くならなかった)
- Emacs ESSモード
- EmacsでRを使う
- 普通にRを使うよりワンテンポ遅い
- エディタに慣れてるひとはコーディングが断然早くなる思う
- library(Rcmdr)
- RをGUI操作できる(ちょっと古い)
- library(rattle)
6. Rをどうやって使う?
- 「ファイル→新しいスクリプト」でスクリプトを出してそこで書く
- 行を選択して「ctl+R」で実行
- コンソール上でそのまま書いて実行
- テキストエディタでコーディング
- コピペしてコンソールに貼付け(macはエンターが必要)
- Emacs ESSモード
それぞれ利点・欠点がありますのでお好みで。
7. コーディングの時の注意
- Googleはこうやってるみたいなのでとりあえずこれに習って書くようにする
8. デバッグ
- Rデバッグあれこれ
- options(error=recover)
- R言語でユニットテスト
9. 関数の使い方が分からないとき
- 「?関数名」でヘルプが出る
- ヘルプファイルには「lm {stats}」のように「関数名{パッケージ名}」と書かれている
- Google検索などでヘルプファイルだけヒットした場合パッケージ名はこれで分かる
- 「??文字列」でその文字が含まれている関数やパッケージが検索される
10. その他の情報
- 他にもこれが便利!ってのかあればぜひお知らせ下さい!
- Rはオープンソースソフトです。ユーザーの皆さんでRを育てていきましょう!
11. パッケージの作り方
- 「10分で分かるRパッケージの作り方」
- R CMD build hogehoge
- 私はmacでやっています。winだとエラー。
- R CMD check hogehoge
- ftp://cran.r-project.org/incomingにアップロード(FTPのツールを使う)
- macだとhttp://panic.com/jp/transmit/が便利。サーバーにcran.r-project.orgを入力、ユーザー名は空白。あとはtar.gzをincomingフォルダに移動させるだけ。
- cran@r-project.orgに連絡する
- R CMD build hogehoge