2008年1月28日月曜日

僕がRを好きな10の理由

[]僕がRを好きな10の理由

  • 吉田康久さんのblogより

10あるかどうかは後で考える。「僕が」なので一般性は保証しない、というかない。

(1)目的にあってる

  • まあ、統計とかそっちの興味を持ってる段階で、RubyとかPerlを常用するよりはRをよく使いますよねw。まあ、Rに持っていくためのテキスト処理とかはPerlでやりますけど。あ、あとはWebとのインターフェイスのためにPythonとか使うかもしれないですけど。
  • なるほど・・テキスト処理はPerlですか・・私は何も知らないのよね。何も知らないけどRをやってみようと思っています。

(2)インタラクティブに実行できる

  • やってすぐに実行できるというのは、思っていたより結構重要。
  • これはコンパイルが要らないということなのでしょう。なにしろそれがしはBasicしか知りませんので、実行してエラーが出ても、不感症。またやりゃいい・・というのがボクには大事。

(3)ツールが整っている

  • Emacs上でRをごりごりやれるESSが最強。
  • 書いてある意味がよくわかりませんが、セミナーを受けてaffyデータを一挙に正規化できる「rma」には感心しました。あっこれはBiconductorのモジュールなのかも・・。ツールが多いということは、ツールが作りやすいということなのかもしれません。

(4)書籍が豊富

  • 最近たくさん出ています。文法系を説明したものから、Rを使った統計解析まで。RjpWikiの充実っぷりは異常。
  • 統計解析の一端はセミナーで学びました。SAMやpermutationテスト、クラスタ解析、k-meansなどなど。大学院生が何をやっているのかがようやくわかりました。Golub君のリンパ腫の生データを使いながら、R/Bioconductorでサクサク解析していくのは楽しかったし、今まで雲の上の雲上人会話だった上記統計用語にようやく実感が伴ったといったところですな。
  • この技法の面白い所は「怠惰なヒト向け」の技法ではないかと思うのです。
    • >plot(e[,1],e[,2])なんて嬉しくなります。出来るだけタイプする文字を少なくすることに意を尽くしている。
    • i=i to 44000なんて要らないのよね。宣言なんかないのよね。x一個でベクトルも行列もオブジェクトになっちゃうのよね。
    • オブジェクトeに属するすべての数字を対数変換したいのならlog10(e)と書けばいいし、それを再びeと置きたいのなら一挙にe <- log10(e)と命令すればいい。なんとすっきりしたロジックなのだろう。感心するは!

(5)オブジェクト指向

  • オブジェクト指向と総称的関数etcなおかげでplotとかsummary、printなどとりあえずこれらのメソッドを覚えておけばどうにかなる。記憶しておかないといけないとこが少ないのは助かる。
  • そうなんだ・・記憶しなくてはいけない事が少ないのは助かるが、記憶しなくていけないことすら、まだ私は出会っていないような気がする。

(6)なんでもできる

  • なんでも…じゃないけど回帰分析も分散分析もプロットも数値計算もとりあえずRの文法覚えておけばどうにかなる。
  • これは本当にそう思わせる何かがある。ヒートマップ(クラスター解析でよく見る赤と緑や赤と青の縞々模様)を作らせるのに > hetatmap(esig,colo=topo.colors(16))だけでいいんだもの!

(7)ヘルプ充実

  • 「?関数」とか「example(関数)」とかやればとりあえず使いかたが分かる。
  • そうなんだ、まだ余録に与っていないから何もいえない。

(8)どこでも使える

  • WinでもMacでもLinuxでも。
  • セミナーでは講師がLinux,ボクがMac,前後のお兄さんたちはWinだったし・・・。

(9)フリー

  • SPSSとか個人じゃ使えないですよー。
  • これってライセンスがウン十万するソフトのことでしょうか?それを言えばGeneSpringsはone lissenceがだいたい60万だしね。

0 件のコメント:

コメントを投稿