朱鷺の杜(IBIS)ブログ

情報論的学習理論(IBIS)に関する管理人の独断と偏見に満ちた意見

パターン認識 (Rで学ぶデータサイエンス 5)

R については以前にも少し触れたことがありますが、最近 R に関する本が雨後の竹の子のようにたくさん出てきてどれを選んだらいいかよくわからない状態です。

そんな中、共立から最近出た パターン認識 (Rで学ぶデータサイエンス 5) を入手しましたので紹介します。

著者の金森、竹之内、村田の3氏は統数研の江口先生と共に U-divergence を用いたブースティングで有名で、私も個人的に知り合いです。
本には当然ブースティングも入っていますが、クラスタリング、判別分析、ロジスティック回帰、k-近傍法、LVQ, 決定木、SVM などの機械学習の基本的なアルゴリズムが網羅されています。

このシリーズがややこしいのは、既刊にマシンラーニング (Rで学ぶデータサイエンス 6)というのもあることで、こちらは統計や平滑化などの著書で有名な辻谷 将明,竹澤 邦夫両先生の著によるものです。 SVM とニューラルネットは入っていますが、基本的には伝統的な統計手法の本です。 というわけで題名からするとなんだか紛らわしいので、著者の研究分野と目次をよく見て買った方がよいと思います。

さて「パターン認識」本に話を戻すと、まずいきなり1章は評価法の説明で、ROC とか AUC とかからはじまります。 ただしまえがきによると「初学者は1章はとばせ」と書いてあります^^;
その後の章はそれぞれの手法をオムニバス式に並べて、必要に応じてどの章から読んでも大丈夫なようにできています。 手法の説明はすっきり明快であまりくどくないのがいいです(初学者にはちょっときついかも)。 とりあえずプログラムがあるので百聞は一見にしかずということでしょう。逆に言うと全体のストーリーを追うというような読み方には向いていないです。

最近の話題では、パス追跡アルゴリズムとミニマックス確率マシンが入っているのが目新しいところです。 この辺りは岩波本のサポートページでも書いておかなくっちゃと思っていたところなので、この本で勉強してまとめておこうと思いました。
あと、多値判別のために ECOC を実装しているのですが、復号にコントラスティブダイバージェンス・平均場近似・MCMC というマニアックな手法を使っていて、入門者にはマニアック過ぎだろうとか思いましたが、この辺りは最後の方なので専門家向けという面もあるのでしょうね。

それにしても R のコードの整備は大変だったろうなと思います。
まあ、この3氏は私と違って几帳面な性格ですからバグや誤植も少ないことでしょう。(パターン認識のサポートページはこちら)
一応私が昔作った Splus 向けの混合分布のコードを参考にしてくださっている部分があり、それで謝辞に入れていただいており恐縮しています。
90年代に書いたコードなので kernlab とかで使われている S4 メソッドではなく、古い S3 のメソッドを使っているところが少々恥ずかしいところです。



ところで、ついでに山ほどある R 関係の本もちょっとだけレビューしておきます。
RjpWiki のページに R 本リスト という完全リストがあります。

言語の解説と手法の解説のどちらに重点があるかでもいろいろ違いますし、バイオインフォとかマイニングなど特定の目的向けに書かれた本もあり、どれがいいというのは一概に言えないです。

R 言語自体の解説として、私のまわりでわりとバランスがいいのはやや古めですがRの基礎とプログラミング技法で、これを卒業するレベルくらいになると、グラフィックスについては久保拓弥さんが訳して最近出版されたRグラフィックス ―Rで思いどおりのグラフを作図するために―が決定版という感じです。
一方、言語自体のレファレンスとしてはRの普及に尽力されている間瀬先生のRプログラミングマニュアル (新・数理工学ライブラリ 情報工学)が定評があります。

統計関係では、やはり間瀬先生などが書かれた工学のためのデータサイエンス入門―フリーな統計環境Rを用いたデータ解析 (工学のための数学)をしましまさんに見せてもらって統計初心者向けの教科書としてわかりやすそうな感じでした。Rによる統計解析は、丁寧な解説で定評のある青木先生の書かれた本で、しっかり統計を勉強するのによい本です。

まあ共立本のようにタイトルが必ずしも中身をあらわしていないということもあるし、上の評価もあくまで私の周りでの評価なので本屋さんで実際に手にとって見るというのが一番なんでしょうね。
岩波本のようになかなか本屋さんに置いてない場合はとりあえず買ってみるしかできないでしょうけど^^;、R の本ならわりと小さな本屋さんでもいっぱい並んでいると思います。

スポンサーサイト

コメント

コメントの投稿


管理者にだけ表示を許可する

トラックバック

トラックバックURLはこちら
http://ibisforest.blog4.fc2.com/tb.php/104-141576a7
この記事にトラックバックする(FC2ブログユーザー)

FC2Ad