朱鷺の杜(IBIS)ブログ

情報論的学習理論(IBIS)に関する管理人の独断と偏見に満ちた意見

カーネル多変量解析第8刷お礼

お久しぶりです。

2016年9月5日付でカーネル多変量解析の8刷が発行されました。
もう初版から8年ほど経っていますが、ご愛顧いただき有難うございます。
8年の間に、計算量やメモリ量を削減するような手法の工夫や、福水さんのカーネルベイズの登場などでいろいろな進展がありましたが、基本的に重要な部分はそれほど変わっていないと思います。
また、今回はしばらく放置していた誤植を修正しました。

一方世の中はディープラーニング真っ盛りで、私も成り行きで某雑誌に解説文を書いたりしました。
ディープラーニングも理論的にいくつか面白い研究がある一方で、世の中は実用化に対する過度な期待感があって、状況が違うとはいえ、昔のニューロブームに似た空気感を感じてしまいます。

いろいろな大学や研究所でAIやデータ解析の研究センターが設立され、いろいろな予算を獲得しようという話をたくさん聞きますが、だいたい箱だけ作って中身がなくて、ふたを開けてみたらAIじゃない人たちばっかりだったということも多いみたいです。

何回も書いているように、私はどちらかというとそういう喧騒からは少し距離をおいて研究していきたいなと思っています。
秋の夜長、じっくり本でも読みながら過ごしたいと思います。
本と言えば正定値行列や制御の情報幾何で有名な小原敦美さんから献本いただいた
行列不等式アプローチによる制御系設計 (システム制御工学シリーズ)
はあまりまじめに勉強してこなかった制御の話がしっかりと書かれている本なのでとりあえずこの辺から読んでみようかなと。

情報幾何で思い出しましたが、チェコで開催された情報幾何のワークショップ IGAIAに参加しました。甘利先生も80歳になっても相変わらず衰えることなく研究にもビールにも遠足にも全力を注がれていました。 凄過ぎます。

情報幾何関係の最近の書籍としては、以前に紹介した藤原さんの
情報幾何学の基礎 (数理情報科学シリーズ)
の他、甘利先生が日本語で書かれたものを英訳した上で全面的に手を入れた
Information Geometry and Its Applications (Applied Mathematical Sciences)
も出ましたし、名工大の松添さんの
Differential Geometrical Foundations of Information Geometry: Geometry of Statistical Manifolds and Divergences
も近日中に出版されると思うので、数学的にしっかりしたものを読みたい方にはお勧めだと思います。









スポンサーサイト

ibis2015感想

つくばでIBISが行われたので感想を. いろいろバックオーダー抱えていてこんなん書いている場合ではない気もするのですが という投稿を見かけてしまったので取り急ぎ書いてみます.

つくばの開催であるにもかかわらず,私はお役御免で,完全に物見遊山で参加できました.
実行委員・プログラム委員のみなさまお疲れ様でした&ありがとうございました.
(私はせめてもの貢献として,つくばのランチ情報などツイートしてました)

企画セッションは全体的に理論の話が多かったのはうれしかったです.
初日に鈴木さんの理論のセッションで幕開けし,三日目には河原さんの劣モジュラ―のセッション.
あと一つは応用よりですが最近話題のマテリアルインフォの話などを入れた津田さんのデータ駆動科学のセッション.
今年はセッション数も厳選されていた感じです.
休憩時間が設定されていないというのがなかなかストイックでした.

ポスターセッションはたっぷり時間がとってありましたが,
それでも見たいと思うような人気のポスターは人だかりができていて
順番待ちするかほかのポスターに移るかというなかなか難しい決定問題に直面しました.
なんかいい運用法ないですかね.

初日の若手セッションはパネルもあって面白い試みでした.
来年は若手 vs シニアみたいな構図のパネルにして若手がシニアをやりこめるところとかも見てみたいです.

そのほかインパクトが大きかったのはERATO代表の河原林さんのトークですね.
まとめもできているようです.
私の属している研究所のAI研究センターもまっとうに dis られておりました.
どこまでがネタトークなのかわからないので突っ込むのもどうかと思うのですが,私は特にスーパーエリート云々はあんまり共感できませんでした.
それはそれで大事な話だと思いますが,研究者の人口や裾野が広がった現代においては,
いろいろなタイプの研究者も含めてどうやって研究を進めていくかを考えていく必要もあるのかなと思います.

あと,招待講演で久々に安倍さん@IBMのお話が聞けたのも個人的には感慨深いです.
話に出てきたRWCのころはまだ駆け出しの研究者で雲の上の存在の方でした.

懇親会では研究会賞の表彰も行われ,現在いっしょに研究させていただいている村田研の高野さん・日野さんを中心とした研究(受賞対象研究には私は入っていません)と,しましまさん中心の研究(これは一応私も名前が入っている)が受賞しました.

というわけで,今年も IBIS 楽しめました(若干体調が悪くてアフターが不完全燃焼でしたが).
筑波大の推薦入試や筑波山の紅葉祭りなどとぶつかってつくばでもホテルが取りにくいという話がありましたが,
来年は紅葉時期の京都で開催らしいので日程が決まったら速攻でホテルを予約しないとまずそうです.

なお,今月12月半ばにはやはり京都でスパースモデリング主催の国際会議 HD^3 が開催されますので,
年末のお忙しい時期ですが是非ご参加ください. 懇親会には楽しいアトラクションもあるとの噂です.

【“ibis2015感想”の続きを読む】

近況報告(サイエンスzero・献本いただいた本など)

毎月一日にはたいてい丸亀製麺で釜揚げうどん半額を食べるので1か月の刻みはだいたい把握しているのですが,今年ももうあと2か月になってしまいました. 人工知能やら機械学習やら世の中動きが激しくて結構忙しいものの,あまり研究している気がしないので少し腰を落ち着けて研究に集中したいものです.

さて,いくつか近況報告や献本いただいた本の紹介(献本いただいた方々ありがとうございました):

まず1件目.
8月に科研費スパースモデリングがNHKサイエンスZEROに取り上げられました.
数学関係はテレビにするのが難しいのか,ガリレオっぽい演出があったり,一般視聴者向けの説明に苦労している感じでした.
私を含め計画班・公募班の一覧が一瞬映りましたが,多すぎて探すのが大変でしたね.
なお,ネットでの感想まとめはtogetterまとめnaverまとめにあります.

2件目.
予告ですが,産総研お台場で行われる人工知能セミナーで話します(11/24開催).
詳細はこちら. 申込制ですのでご興味のある方は是非.私の情報幾何の話は入門向けで知っている人には退屈かもしれないですが,園田さんの話は deep learning の理論としても非常に興味深いです.
なお,その次の日から IBIS2015 がつくば国際会議場(エポカル)で行われますのでそちらも合わせてどうぞ.

あとは献本いただいた本など.
情報幾何学の基礎 (数理情報科学シリーズ)
量子情報理論の研究で著名な藤原さんの書かれた情報幾何の本.甘利研時代は重なりはないのですが,大阪大学に兼任していた時期にお世話になりました.多様体のちゃんとした話から最後は量子情報幾何の話まで,数学的にちゃんとしていながら難しくなく学部レベルの大学生でも十分に理解できる内容になっていると思います.

岩波データサイエンス Vol.1
伊庭さんが何やら活動されているのは twitter など通じてうすうす知っていたのですが,献本いただいて少しその実態がわかりました.本のような雑誌のようなわりと軽く読める本です.円城塔氏の連載小説も載っていたりして雑誌といっても学術雑誌とはかなり趣は違います.そもそも月刊なのか季刊なのかもよくわからなかったのですが,サポートサイトの Q and A を見てやっと理解しました.
こんなところで宣伝するまでもなくバカ売れしているみたいで,発刊記念イベントなども行われたようです.
この業界盛り上がっていますね.次は自然言語処理関係だそうです.

深層学習: Deep Learning
3冊目は deep learning の本で,人工知能学会誌に連載されていたものを大幅修正加筆して出てきたものです.発売日は11月5日ですが,しましまさんから著者分を分けていただきました.ありがとうございます.しましまさんの気合の入りようからして,deep learning の定番書となることは間違いないでしょう.



最初にも書きましたが,個人的にはあまり忙しくなっても逆に頭が働かなくなるので,ちょっと引いたところで落ち着いて地道な問題を解くような研究をしていきたいと思っています.

カーネル多変量解析7刷お礼&近況報告&面白そうな本

5月25日付でカーネル多変量解析の7刷が発行されましたのでお礼方々ご報告申し上げます.

気づいてみるとこのブログも前回更新してからほぼ1年更新してませんでした.
前回は6刷のお礼で今回が7刷のお礼.
ほぼ増刷のお礼ブログの感がありますが,絶版されるまでは続くでしょう.
この間にもAmazonレビューが一つ増えました(ほめ過ぎですがヤラセではありません^^;).
一方,先日 Facebook で突然友人から「同僚がこの本で勉強してた」というコメントをもらって冷汗出ましたがうれしかったです.
これからもみなさんご愛顧の程よろしくお願いします.
(ちなみに4刷からは誤植もそのまま放置していますので本屋さんとかで古い版が置いてあっても違いはありません.)


さて,1年も経つといろいろなことがありますが,身の回りの話を書くと,ちょっとだけ所属が変わりました.
産総研は中期計画の第3期というのが終わって4月から第4期というのに突入したのですが,その際に再編が行われて,
私が属している情報数理研究グループはメンバーはそのまま人間情報研究部門というところに属すことになりました.
上の名前はコロコロ変わりますが.情報数理という研究室で25年変わらずずっとやってきたので,上の方で何が起きても関係ない感じです.

ただ,昨今の人工知能やビッグデータなどのブームで産総研も遅ればせながら人工知能研究センターというのが5月に発足しまして,私も片足だけ突っ込んでいます.なんとなく機械学習分野では研究のスピードが速くなっているというイメージを持っている人が多いようですが,理論的なところとか基本のアルゴリズムなんかはそんなに速く進んでいるわけではないと思っているので,あまりブームに巻き込まれずマイペースでやりたいなと思っています.


最後に機械学習関連で面白そうな本もこの1年いろいろ出てきたので少しリストしておきます.

甘利先生の情報幾何の新展開
数理科学の連載に加筆修正を加えたもの.情報幾何に関する定本の一冊になるでしょう.
本当はもっと分厚い本でがっつりしたのが望まれるところですが,出版業界もなかなか厳しいのでそんなにマニア向けの本は出せないでしょうね.
ちなみに英語版が企画されており,そちらは誤植なども直っているとのうわさもあります.

それから,ヘイスティ本の翻訳:統計的学習の基礎
ビショップ本よりやや翻訳チームが若くなっています.
これの原著はかなり昔がっつり輪講しましたが,行間を相当読む必要のある本で,手元に現物がないのでその辺り配慮があるのかどうかがよくわかりません.単なる翻訳だとするとビショップ本よりは少しとっつきにくいかも.でも個人的にはビショップ本より好きな本です.

最近,杉山さんを中心に若手の方々が出された本:機械学習プロフェッショナルシリーズ
これも手元になくてパラパラっと見ただけですが,プロフェッショナルといいつつそれなりに初学者向けの配慮はされているようです.岩波本と違って(?)予告されているシリーズがちゃんと出ていきそうです.岩波本よりもページ数も少なめなのでその分著者の負担も軽いというのもあるかもしれません.
上記リンクは東北大の岡谷さんのディープラーニングの本で,ブームなので結構売れそうです.ほかにもNTT・CS研の岩田具治さんのトピックモデルなんかも面白そうです.トピックモデルでは東大中川研の佐藤一誠さんのトピックモデルによる統計的潜在意味解析というのも出ていて,この分野の注目度の高さを表していますね.

かくいう岩波本にも乱数生成と計算量理論というシリーズ5冊目がようやく登場.これまた手元にないのでわかりませんが,最初は私の本と色が同じ?かと思ってしまいましたが並べてみるとこちらはやや紫がかった色です.

テーマ:心・脳・言葉・人工知能 - ジャンル:学問・文化・芸術

カーネル多変量解析6刷お礼

カーネル多変量解析の初版6刷が5月15日付で発行されました.(中身は4刷から変わっていません.)
みなさまのご愛顧のおかげです. ありがとうございます. 
Amazon でもずっとなかったカスタマーレビューが最近1件だけですがつけていただけたのもなんとか生きながらえている一因かと思います.
今後ともよろしくお願いします.

# 追記: そういえば消費税値上げの影響で税込み価格が値上がりしております^^

さて,5月は松山で行われた人工知能学会の全国大会とDeep Learningの湘南会議というのに参加したのでショートレポートします.

人工知能学会はなんとなく怪しげだなあという先入観があってずっと敬遠してきたのですが,昨年の富山から参加しています.
まあなんだか学問として怪しい話も結構ありますが,機械学習関係の発表はかなりクオリティが高いです.
たくさんパラレルになっているので聞きたい発表が重なっていると部屋を行ったり来たりするのが大変ですが,これは贅沢な悩みですね.
最近元気がない国内学会の中では活気のある学会だと思います(国内学会もむやみとたくさん増えたのでいい加減減らせばいいと思うのですが...).
内容もいいですが,場所も温泉と地酒縛り?な感じで参加のモチベーションがわきます.

もう一つの湘南会議というのは,2011年からNIIが主導して開催している合宿形式の研究会で,今回 dropout とかで有名な Pierre Baldi を中心に企画されました. Deep Learning は機械学習のホットトピックの一つですが,私の中では一種の spam word になっているので,昨年の5月に invitation mail が来たときたぶん無意識にスルーしてしまったんだと思います. 先月統数研の福水さんにお会いした時に「あかほさんのところにも invitation 出しましたよー」というのを聞いて古いメールを掘り出して急きょ参加することになったという事情です.
まあ Deep Learning といっても日本ではほとんどそれ自体を研究対象としている人はおらず,海外からの参加者もさまざまな人たちが参加したのであまり Deep Learning ガッツリという感じではありませんでした.
ただ,自分より圧倒的に優れた方々と英語漬けな研究環境で過ごせたのはものすごく刺激になりました.
(早口でよくわからない話も多くて思いっきり消化不良気味ではありましたが)
甘利先生もフル参加でしたが78歳とは思えないほどお元気で私が修論指導を受けていた時と全然イメージが変わらないスーパーマンぶりでした.

参加者は,海外組では主催者の Pierre Baldi, Tomaso Poggio のほか Aapo Hyvarinen, Klaus-Robert Mueller, Jean-Philippe Vert, Joachim Buhmann, Shimon Edelman など20名ほど,
国内組は主催者の福水さんのほか,甘利先生,中原さん@理研,岡谷さん@東北大,栗田さん@広島大,麻生さん@産総研,杉山さん@東工大,津田さん@東大,恐神さん@IBM,Kevin Due @ NAIST, Erik De Schutter@OIST, 定政さん@NEC が参加されていました(記憶に頼っているので抜けているかも)

# 追記2: そういえば deep learning が流行っているせいか,昔高畠さんといっしょに研究していた contrastive digergence の情報幾何の論文に関する問い合わせがいくつかありました. なんかマイナー国際会議の上にリンク先が切れていたのでローカルに論文を置きました. 
Shotaro Akaho, Kazuya Takabatake: Information Geometry of Contrastive Divergence. ITSL 2008: 3-9

岡谷さんの解説記事を読むと,我々の提案している Progressive Contrastive Divergence は他の人が提案した Persistent Contrastive Divergence として知られているようです. 偶然頭文字が同じですが,研究も宣伝と発表する場所が大切だということですね.

新年度

毎度のことですが,久々の更新です.すみません.

うちのグループでは久々の新人,兼村さんを迎えました.
それ以外にも,科研費新学術研究スパースモデリングのポスドクとして昨年末から来られている荒木さん,サバティカルで短期滞在中の福永さん,と若い人たちが増え,フレッシュな新年度となっています.
私も若い人たちから刺激を受けてまだまだ頑張っていきたいと思います.

さて,電子情報通信学会誌の今月の特集が「データを読み解く技術──ビッグデータ,e-サイエンス,潜在的ダイナミクス──」ということで,麻生さんが編集担当でそうそうたるメンバーが執筆しており一読の価値ありです.

あと,以前献本いただいた,弁当屋の統計技師の続編となるとある弁当屋の統計技師2も献本いただきました(もうかなり前になりますが).ありがとうございます.

今回は因子分析や分散分析というなかなか高度な話をラノベ風ストーリーにすることに挑戦しています.
ラノベで統計入門したい人ってそんなにいるのかなあとか思っていたのですが,Amazon のレビューがたくさんついているのを見て,私が知らないだけで結構需要が大きいということを知りました.

書こうと思っていて書き忘れたので追記:

フレッシュな人を増やす運動の一つです.
昨年度から東工大の知能システム専攻で連携教員をやっているのですが,当研究室での研究に興味のある方はお気軽にあかほまでご連絡ください.
すずかけ台とつくばが遠いので,ちょっと変則的な感じにはなってしまいますが,すずかけ台の方は渡辺澄夫先生のところに間借りする形になっており,できるだけ不便がないようにいろいろ工夫はしたいと思っています.

新年のご挨拶+応用数理ハンドブック+IBIS2013+ICDM2013

新年あけましておめでとうございます。
今年もよろしくお願いします。

だいぶ日数が空いてしまいましたが、秋から12月までいろいろと立て込んでいてブログを更新する余裕がありませんでした。
年も明けて少し気分も入れかわったところで、去年の話をいくつかまとめて報告。



まずは本の宣伝。

11月に応用数理ハンドブックという本が朝倉書店から出ました。
一項目2~4ページで解説する事典のような本です。
機械学習については東工大の杉山さんがとりまとめをされていて、私は「パターン認識」ということで2ページ書かせていただきました。
(最初4ページもOKだと思って4ページ書いたら出版社の人にダメって言われて泣く泣く2ページに縮めましたw)

朝倉書店のHPにある宣伝をコピペ

数値解析,行列・固有値問題の解法,計算の品質,微分方程式の数値解法,数式処理,最適化,ウェーブレット,カオス,複雑ネットワーク,神経回路と数理脳科学,可積分系,折紙工学,数理医学,数理政治学,数理設計,情報セキュリティ,数理ファイナンス,離散システム,弾性体力学の数理,破壊力学の数理,機械学習,流体力学,自動車産業と応用数理,計算幾何学,数論アルゴリズム,数理生物学,逆問題,などの30分野から260の重要な用語について2~4頁で解説したもの。


学習関連では神経回路と数理脳科学でも関連する話が書かれています。
大きい本なので値段もそれなりですが、応用から数理までわりとユニークなまとめ方をしていると思うので、関連する分野に興味のある方にはお勧めです。
研究とは関係ないのですが個人的には折紙工学がツボでした。

ネットには詳細な目次は出ていなくて、私が買った現物も職場にあるので明日にでも追記欄に関連する目次を載せておきます。(追記しました)



さて、次は11月に開催された IBIS2013について。
会議の詳細は神嶌さんが朱鷺の杜wikiにまとめているのでそちら(http://ibisforest.org/index.php?しましま/IBIS2013)を参照してください。
ここではあまり中身と関係なく独断的な感想のみ書きます。

まず去年に引き続き今年も東京に3日間通ってそれだけでかなり疲れました。
東工大(大岡山)だったのでまだ救われましたが、ふだん長時間通勤しなれていない身には結構つらかったです。
個人的にはその後も理研に3日通ったり、東工大すずかけ台に2週連続で朝一の電車で出かけたりなどが続き、それだけで年末のパワーを吸い取られてしまいました。
来年は地方開催のようなので少し楽になるかな?

全体的にはオーガナイズドセッションが充実していて、むしろ「ちょっと多過ぎでは?」と感じました(気合入りすぎ?)。
ビッグデータやディープラーニングといった今時の話題を散りばめて人もたくさん集まっていましたが、IBISの主役であるポスターセッションが場所も時間もオーガナイズドセッションに押され気味だったような気がします。
ただ、ポスタープレビューが復活したのはうれしかったです。ポスター会場が狭いのと、人気のあるポスターはなかなか話が聞けないのでとりあえずポスタープレビューで概要を聞いておくだけでも有用でした。

ビッグデータのパネルは「大御所そろえました!」って感じでしたが、もっと若い人たちに過激なことをしゃべってもらうというのもよかったのではないかと思いました。

あと、私は出ませんでしたがお金を取ってチュートリアルをやったのも新しい試みで、好評だったようです。一部の講義はマニアック過ぎという話も聞きましたが、まあそれはそれで IBIS らしくていいですね。



最後はアメリカのダラスで行われたICDM2013の報告。ICDMはデータマイニングの主要会議の一つで、私ははじめて参加したのですが、神嶌さんと連名でワークショップに出していたので勉強方々行ってきました。

ダラスはテキサス州ということでなんとなく漠然と温暖なところに行くイメージでしたがこれがとんでもないことに。
確かに会議の数日前までは最高気温26度前後という暑そうな気温でしたが、会議が始まるころにスノーストームが吹き荒れ、飛行機の便が乱れまくりました。 
私はサンフランシスコ経由で行ったのですが、幸いにも飛行機は少しの遅れで到着。
ところが、ダラスに着いてみると、町中が雪景色で、しかも氷点下で道路が凍結しまくり。
暖かい地方なので車もスタッドレスとか全くはいていないようで、タクシーもほとんど走っていない状態(鉄道なども全面アウト)。
かろうじて空港で知り合った ICDM 参加者の人と数少ないタクシーに乗り込んで行くも、立ち往生している車が続出で大渋滞。
通常30分程度で行くところが2時間半もかかってやっとホテルに到着しました。
後で聞いたところによると東大の山西先生など5時間以上かかったということもあったようです。

それで私の共著者の神嶌さんですが、ミネアポリス経由で来る予定が、ミネアポリスからの便は早々に欠航が決定。
ワークショップでの発表を翌日に控えていたので間に合うのかなあと思っていたら、なんと翌日も欠航に…
というわけで急きょ私が代理発表することに。
神嶌さんから資料をメールしてもらい、自分でも簡単な資料を作ってなんとか発表しました。
しかし、そもそもワークショップに間に合わない人たちが続出して、開始時間をずらしたりして、それでも invited talk がキャンセルになるなど大混乱でした。

一部始終のツイートを神嶌さんがまとめたのがこちら(http://togetter.com/li/600120)です。
なかなか臨場感あります。

町中は雪と氷で閉ざされていましたが、なんとか本会議には参加者もほぼ集まって、盛況な会議となりました。
ICDM本会議はアクセプト率が全体で2割程度とかなり厳しく、どの発表もレベルの高さを感じさせるものでした。
キーノートが「推薦システム」「ヘルスケアのプライバシー」「ネット広告」という、神嶌さんとかといっしょにやっている話に関連の深い話が多かったので面白かったです。



以下続きの追加部分に応用数理ハンドブック機械学習関連項目を追記しました. 【“新年のご挨拶+応用数理ハンドブック+IBIS2013+ICDM2013”の続きを読む】

「とある弁当屋の統計技師」をもとにデータサイエンス分野の行く末について考え、最後にスパースモデリングを宣伝するエントリー

とある弁当屋の統計技師」という本を献本いただきました。ありがとうございます。

著者は石田基広さんという方で、テキストマイニング系の方なので研究関係では接点はなく面識はありませんが、R言語関係の本をこれまでにも多数出版されていて著書ではいつもお世話になっています。

本のタイトルは「とある魔術の禁書目録」のパロディになっていると思いますが、禁書目録の方は全く知らないのでタイトル以外もパロディになっているかどうかは分かりません。

内容はまっとうな統計の入門書で、当初思っていたよりは挿絵は少なく、(これもちゃんとした定義は知らないのですが)ラノベ風の本です。 とまあ、このように元ネタの方面に疎いのでそういう観点からの評者としては私は全く適していませんのでご容赦ください。

さて、ストーリーは、新米のデータサイエンティスト文太と弁当屋の乱子が弁当屋の売り上げデータ解析をネタに展開していくという形です。(乱子というとシェイプアップ乱を連想してしまいますが)

平均~回帰分析~ロジスティック回帰まで、いろいろな注意点にも触れながら入門できるようになっています。
あまり露骨には出てきませんが R を使ってデータ解析しています。

データ解析をほとんど知らない人への統計の入門書としてレベルは適切で説明も的を射たもので、実用書としておすすめだと思います。

ただ全く理不尽な望みですが、個人的には統計の実用面よりはその周りに絡んでいる数学的なところに知的好奇心の面白さを感じているので、そのあたりがうまく表現されている本もあるといいなあと思います。数学ガールなんかは純粋な数学に対する知的好奇心だけで売れているわけで、機械学習もこういう感じで行けないかなあと思ってしまうわけです。

すみません、ちょっと自分の趣味に走りすぎましたね。

まあデータサイエンティストを増やすというのは重要ですし、すそ野を広げるという意味で入門的な本がいろいろ出るのはいいことだと思います。 
専門書ばかりだったこの世界に新風を巻き起こしたのはわたせせいぞう氏のイラストを表紙に使ったデータマイニング入門(豊田秀樹著)でしょうか。内容は見ていないのでわからないですが、評判はよいようです。

最近だと、イラストで学ぶ機械学習(杉山将)なんかも入門向けをねらっているのでしょうか。

「イラストで学ぶ機械学習」の宣伝に「黄色本より先に読もう」と書いてあるのですが、黄色本というのはビショップ本のことでしょうか?確かにビショップ本はいきなりバックグラウンドがない人が学ぶにはしきいが高いでしょうね。

ただ、入門書を増やすだけではダメで、大学なんかでちゃんとしたデータサイエンスの教育システムがない現状を
どうにかすることも大事だと思います。統数研なんかはいろいろ取り組みもしているようですが、まだ多くの分野ではデータサイエンスという研究分野の重要性が認知されていない気もします。

と書いているうちに、宣伝すべきことを思い出しました。

文科省科研費の新学術領域研究で、今年度から「スパースモデリングの深化と高次元データ駆動科学の創成」という領域がスタートしました。代表は東大の岡田真人先生で、私もカーネル法による非線形スパースモデリングで計画班を担当しています。

この領域を大きく広げるにあたって、公募研究を募集しています。
全国各地でキックオフシンポジウムや公募説明会が開催されます。先日東京で行われたものは非常に盛況でしたが、今週末(2013-9/29)には京都大学で開かれます。ご興味を持たれた方は是非ご参加ください。

また、公募説明会に参加されなかった方でも、この分野の盛り上がりにもつながると思いますので、公募をご検討ください。

あわせて、私の計画班ではポスドク公募しております。メール等でお問い合わせいただければ詳細に説明させていただきますので、こちらもよろしくお願いします。

注:こんな私が畏れ多くも声優統計という本の序文を書かせていただいたりして、全く失礼しました。声優統計も献本していただいたのですが、さすがに書評を書く知識も勇気も足りません _o_

カーネル多変量解析5刷発行お礼,Rで正準相関分析など

今日はお知らせをいくつか.

***

まず一つ目.
カーネル多変量解析ですが6月5日付で第5刷が発行されました.
一回ごとの刷数はわずかですが,多くのみなさまのおかげでなんとか絶版の危機からは脱しております.
ありがとうございます.

***

それから,神経回路学会誌の2013年6月号(20巻2号)に「正準相関分析入門 ー複数情報の観測からの共通情報抽出法ー」という解説記事を書きました.
上記リンク先にはまだ目次は出ていませんが冊子はすでに発行されています.

昔は機械学習の研究者と神経回路学会会員はかなりオーバーラップがありましたが最近はセパレートしている感じがしますので,ここで宣伝させて頂きます.

正準相関分析は複数の情報源から共通情報を取り出すという手法で,脳科学やバイオインフォマティクスなど幅広い応用を持つ手法です.

今回の解説記事ではとりあえずRやmatlab で正準相関分析してみることができるようにできるだけ易しく解説したつもりです.

難しいところは参考文献をあげるだけでごまかしていますが,麻生,栗田,大津の非線形正準相関分析の話はあまり目にする機会がないと思いますので少し詳しく説明しました. マルチモダリティ・センサフュージョンといった問題にご興味がある方はぜひお読みいただければ幸いです.

同じ号では以前産総研にいらっしゃった栗田さん(広島大学)が巻頭言を書いていらっしゃいますが,私のカーネル正準相関分析の仕事も,栗田さんや今も産総研の麻生さん,退職された大津さんなどの仕事に触発されての研究です.

なお,神経回路学会の記事は通常2~3ヶ月で会員に電子アクセス可能な状態になり,1年後にはフリーアクセスになります.

***

最後にもう一つアナウンス.

9月に鳥取で開かれる IBISML/PRMU/CVIM 合同研究会で,「機械学習におけるコストをめぐる話題」というタイトルで講演をさせていただく予定です.こちらもよろしくお願いします.

Rによるベイジアン動的線型モデル

Rによるベイジアン動的線型モデルという本を翻訳者のNTTドコモの萩原さんから献本して頂きました.
直接面識はありませんがありがとうございます.

この本は翻訳本ですがサイズも和書サイズでコンパクトで持ち歩くのも苦労がないというのが大きなポイントです.
洋書はたいてい分厚くて翻訳の時はそれがネックになることが多いです.
ビショップ本もそのおかげで上下巻に分けることになりましたが,この本はフォントを小さくするなどして小さく収めています.

内容はRのパッケージであるDLM (dynamic linear model) パッケージを使ったベイズ流の時系列解析の本です.
具体的にはカルマンフィルタのようなところからパーティクルフィルタ(逐次モンテカルロ)までさまざまな手法が説明されています.
線型モデルに限定しており,一般の状態空間モデルみたいになんでもOKということはありませんが,かなり広い範囲の時系列に適用可能な話になっています.
なかなか機械学習の教科書だと載っていないイノベーション,可制御性や可観測性といった制御理論の重要な概念に言及されていることも特色だと思います.

このブログでも再三パーティクルフィルタの紹介はしているのですが,結局のところ私自身は研究でパーティクルフィルタを使ったことがありません.一応ホームグランドであるRのパッケージということなので,ぜひ今度は何か時系列解析するときには使ってみたいと思います.

原著者序文には,「(訳者の方が)本書をただ読んだだけでなく,内容をチェックし,Rコードの1つ1つの各部分までもテストし,われわれの仕事を詳細にわたって改訂してくれました」と書いてあります.
翻訳本はいくらでも手抜きすることも可能ですが,ビショップ本のように原著を改訂するぐらいの気合でやれば相当いいものを作ることができます. 本書もそのような本になっていると思います. どうしても翻訳調の文になるのは仕方がないところですが,訳語や言い回しなどはかなり苦労された感じで,読みにくいということは全くありません.

こういう専門書は本当は日本人の著者が日本語で書き下ろすのがベストだとは思いますが,昨今みんな忙しくて書く暇がなく(それゆえ岩波本のシリーズも遅れていますが),ページ数の制限などからあまり詳しくも書けません. その点洋書はしっかりと書かれているのでじっくり勉強するのに適していると思います.

ビショップ本を何度か引き合いに出しますが,あの本もビショップの書く力もさることながら,謝辞にちょこっとだけ書かれている Markus Svensen さんという超マニアックな TeXnician がいたから完成したというところはあると思います.
日本だとなかなかこういう執筆体制が取れないということもいい和書がなかなか出ない背景にはあるのではないでしょうか.
ちなみに,残念ながら Svensen さんは Microsoft を退職されたようなのでもう抜本的にはビショップ本の改訂も難しいという状況のようです.
次のページ

FC2Ad