fc2ブログ

「応用基礎としてのデータサイエンス」宣伝 & 公平性の受賞 & 就活完了

まずは本の宣伝

講談社から先月発行された「応用基礎としてのデータサイエンス」の機械学習のセクションを執筆しました.
これは数理・データサイエンス・AI教育強化拠点コンソーシアム というデータサイエンス教育を振興する枠組みに沿ったテキストになっています(放送大学とかもこれに準拠しています).
以前に同様のコンセプトで発行されてベストセラーになっているらしい「教養としてのデータサイエンス」 の続編という位置づけです.

最初にキーワードだけ指定されて,各著者は割と自由に原稿を書くというスタイルでした.
ただし,いろいろ重複する部分とかもあって,一部削除したり詳しくしたり,用語を統一するなどの調整が行われました.
まあ大事なことは何度でも言うという感じで,いくつかの話題については複数のセクションに登場するものもあります.
かなり広い分野を俯瞰できる内容となっているので書店とかで手に取ってみてください.

***

次に公平性の話です.

2022 年の ECML-PKDD という国際会議で Test of Time award という賞を受賞しました.
(リンク先の私の名前がタイポってますが,まあこういうの慣れてるんで笑)
この賞は10年前に出版されてインパクトが大きかった論文に送られるもので,まあしましまさんの先見の明が認められたものだと思います.
自分自身は研究にあまり社会性を持ち込まないのですが,技術的な部分で目から鱗が落ちたのは,公平な確率モデルが必ずしも公平ではないと気付いた瞬間でした.

どういうことか簡単に説明します.

まず,入力 X, 出力 Y, センシティブ情報 S があったとします.
例えば,ある人にお金を貸せるかどうかを決める学習マシン P(Y|X ,S) を作るような想定で,X が個人の属性情報, Y はお金を貸せるかどうか, S は人種みたいな情報とします.
Y と S が独立になれば公平であると言えるので,P(Y, S) = P(Y) P(S) を満たすように学習を行えばよいように思います.
ECML-PKDD で受賞した論文はこれを正則化項としてできるだけ等式に近づけようというコンセプトでした.
しかしながら,確率モデルとして P(Y, S)=P(Y) P(S) となったとしても,実際にお金を貸すかどうかは決定論的に行われるのでたくさんの人に対してこの学習モデルを適用した結果は公平にはなりません.
例えて言うと,いびつなコインで70%で表,30%で裏のとき,賭ける際に一番得なのは常に表に賭けるということと同じことです.
この辺の話は actual independence と呼んで,その後の論文で考察しています.

***

最後に自分の就活の話です.

以前のエントリーで産総研は定年が60歳なので,その後働きたければ就活をしないといけないという話を書きました.
その後いろいろ活動して,2023年3月1日付で統数研に着任しました.
正確に言うと,情報システム研究機構のデータサイエンス施設が本務で,統数研に兼務するという状態です.
また,さらにややこしいところですが,産総研にも籍を残すというクロスアポイントメントという制度になっていて,表面的には職場環境は何も変わらないという状況です.
クロアポ実現に至るまでの経過とかについては,ここには書けないことも多いのですが,特に統数研側で私の個人的な都合のために御尽力いただいた先生方には感謝しかありません.

データサイエンス施設および統数研での主なミッションはデータサイエンス教育ということなので,最近放送大学とか教科書書いたりとかしているのでその辺のスキルは活かせるかなと思います.
まあまだ始まったばかりなのでよくわかっていない部分もありますが,何か面白い話がでてきたら報告します.

今日は産総研のことをもう少し書きます.
実は国家公務員の延長を受けて定年延長という話が進んでいます(どこまで公開情報かがわからないので詳しくは書きませんが).
ただし,私の場合は65歳までは勤められないようで,また人件費の関係だと思いますが60歳を超えると給与もだいぶ目減りしそうということでまあ統数研に移籍したのは正解だったと思います.
あとは,現在のオフィス環境がかなり快適というのも大きいです.
産総研はお役所的な体質が強くて,研究所としてのマネージメントとして???と思うことは多々ありまし,最近は社会実装という名のもとにとにかく役に立つこと優先の風潮は強いです.
しかしながら,私が30年以上過ごしているこのフロアは産総研の中の異空間とも言える場所で,時間の流れや空気感がほかとは全く違います.
そこに棲む地縛霊としてもうしばらくこのフロアを見守りたいと思っています.






スポンサーサイト



カーネル多変量解析13刷お礼 & IBIS2022 & 献本 など

お久しぶりです.
コロナも完全に収束してはいませんが,社会活動とのバランスが取れ始めているかなあという昨今です.

さて,2022年12月5日付でカーネル多変量解析の13刷が発行されました.
前回12刷が2020年11月だったのでほぼ2年ぶりです.
出版から14年が経ち,だんだんフェードアウトはしていっていますが長年ご愛読いただき感謝です.

なお,どこかしらで電子書籍版?が購入できるという話なんですが,ネット検索でも出てこないので入手方法はちょっと謎です.
(岩波の方に聞いてみればいいんですが)

***

先日 IBIS2022 がつくば国際会議場で久々にリアル開催されました(ポスター以外はzoomでハイブリッド)
何年もお会いしていなかった方々と再会して気分も盛り上がりました.
そちらに気を取られて講演やポスターの方は個人的には二の次になってしまいましたが,
一番印象に残ったのは,河原さんがオーガナイズされていたセッションでNTTの橋本さんという方が紹介されていた
RKHS の内積を拡張して一般の環に値を取る RKHM という話を初めて聞いてすごくおもしろかったです.

会議全体では,若手交流企画など意欲的な企画もあり,非常に盛況だったと思います.
私自身は全く貢献していませんが,実行委員会・プログラム委員会の方々お疲れさまでした.

***

献本いただいた本の紹介をします.

1冊目は6ステップでマスターする機械学習です.
これは翻訳で,原著は知らなかったのですが,兼村さんが監訳されていて献本していただいたのだと思います.
ありがとうございます.
Python 入門から深層学習・強化学習への適用までを6ステップに分割して python で実践しながら身に着けられる構成です.
コンパクトにいろいろな技術を学べるようになっていますが,深層学習よりもむしろより基本的な機械学習の説明が丁寧で,
多重共線性やARIMAモデルなどにもちゃんと触れられているのが好印象でした.
全体的には派手過ぎない装丁なのも個人的には好みですが,アンサンブル学習のところでいきなりアベンジャーズのイラスト(それも結構地味め)が出てきて笑えました.
日本語版ならではのものとして,日本語参考文献も厳選されていて学習者の参考になりそうです.

2冊目は三重大の萩原さんの書かれた入門 統計的回帰とモデル選択で,現在 amazon などで予約受付中です.
萩原さんは特異モデルの先駆的な研究で著名な方で昔から仲良くさせてもらっており,本書も草稿段階で原稿を見せていただきました.
線形回帰とモデル選択を軸として,Rを使いながらしっかりとした理解できるようになっている教科書です.
特に2章で導出されている変数選択規準はすごく丁寧に書かれています.
実現可能な場合とそうでない場合,推定とは異なる入力点での予測など機械学習を理解するうえで非常に重要な考え方です.
また,3章で触れられている変数増加法・減少法の問題点なども知っておくべき重要な知識です.
昨今は深層学習のアーキテクチャエンジニアリングでなんとかするみたいな研究が全盛ですが,学生さんには機械学習の数理的な面白さを感じ取れる本書のような書籍でまずしっかりと機械学習の基礎を身に着けてほしいなと思います.

***

最後は放送大学の宣伝です.
12月12日から機械学習概論IIの何回目かの再放送が始まります(放送大学:機械学習概論II).
例によって時間帯はリアルタイムで見るには微妙な時間ですが,ご覧になっていただけるとうれしいです.
なお,機械学習概論Iはかなり初心者に寄り添った内容でしたが,概論IIの方は内容的にもかなり欲張っているので,一度見るだけではなかなか難しいという声も聴いています.
ということで,録画して何度も見るというのがおすすめです(自分が映っているところは恥ずかしいんですが).

ちなみに有料ですがこちらのリンク先(⇒「機械学習概論I)にあるように,ネットの受講も可能なようで,認証状(PDF形式)やデジタルバッジが発行されるとのことです.







放送大学・献本いただいた本など

今日は今年度かかわった放送大学の話と献本していただいた本について書きます.

放送大学はコロナが始まった2020年の春ごろに統数研の伊庭さんにお声がけいただいたのがきっかけでスタートし,
最近やっと一区切りついたので記録しておきます.

すでに何回かは放送があって,実は今日から再々再放送くらい?で4日連続放送があるのでその宣伝も兼ねています.

初日の番組情報はこちらから:
データサイエンスの技術 機械学習概論I 第1回 機械学習の歴史と要素技術
BS231というちょっと変わったチャンネルなので探すのに苦労するかもしれません 笑

あと,ちょっとどういう形になるのか把握していないのですが,インターネット配信講座ということで近日公開となっています.
(短い動画もついてます)機械学習Ⅰ

***

さて,これまでの経過を少しまとめておきます.

伊庭さんとは最初に少し打ち合わせをしたくらいで,私も頭の片隅にはあったのですが,以後ほとんど
忘れてかけていたのですが,2021年の年明け前後にいよいよスタートするので準備するようにとの連絡が来ました.

ニューラルネットワーク担当の電通大の庄野さんと同時並行という形で進んでいきました.
庄野さんはふだんから授業で使われているスライドをベースにできますが,私の方はほとんどゼロからのスタートということで
出だしでいきなり差をつけられていました(笑

最初にやるのはこのスライドづくりです.ただし,見栄えは制作会社のデザイナーの方がきれいに清書してくださったり,
著作権の交渉とかも全部やってくださるのでその辺は楽です.
(ちなみに今回の制作会社さんはアマゾンラテルナというところで,あのアマゾンと関係あるのかと思ったら関係ないそうです...というかこっちの方が前からあるらしい)

私もいろんなところで機械学習入門みたいなセミナーはやっているのですが,スライドは適当に作っていてしゃべりで補うという
感じだったのでほぼ一から作り直しになりました.(こう書くとしゃべりが得意みたいに見えますが実際はそんなことはなくて単に
仕事が雑なだけです 笑)

放送大学のスライドがほかのと違って難しいのは時間が決まっているということです.
45分の授業でしかも Part1~ Part3 の3部構成というフォーマットが決まっているので,それに合わせて内容とかも
考えないといけないのが全く分かりませんでした.
普段だと,少なければ丁寧にゆっくりと,多ければ急いで早口でみたいなリアルタイム適応でのりきっていたのですが
(失敗することも多い)放送大学はそういうわけにはいきません.

スライドを作った後は,台本作りという過去に経験したことのない作業に入ります.
今まで原稿作って読むとかまともにしたことがないので,気が重くてなかなかとりかかれませんでしたが,なんとか形にして提出.

この後,スライドと台本を放送できる形にまで詰めていきます.
コロナ禍の中,制作会社の方々と Zoom で打ち合わせです.
私の説明がいい加減なところとか,制作会社やプロデューサーの方が理解できないところをつぶしていきます.
これが結構大変で,1コマの授業で半日x2回くらいみっちりやります.
たぶん制作会社の担当者の方が私の授業を一番理解しているのではないかと思います.
(ほかの授業では制作会社の方がこんなに苦労しないのではないかと思ったり...)
ともかくこの過程で自分の頭の中がかなり整理されて自分の勉強にもなりました.

こうしてスライドと台本が固まるといよいよ収録です.
収録は幕張にある放送大学まで出かけていき,スタジオで収録です.
打ち合わせを少しした後,メイクさんにヘアメイクや顔のメイクをしてもらうというこれも人生やったことない体験です.
(担当するメイクさんによって髪の分け方とか結構違うのでそこも注目ポイント...違)

それからスタジオに入るといろいろなスタッフさんがいます.
カメラがたくさん並んでいて数名のカメラマンの方々のほか,プロンプターを進めてくださる方や,メイクさんその他もろもろいらっしゃいます.
「赤穂先生入られまーす」みたいな感じで人生ほとんどない主役体験している錯覚に...
ワイヤレスマイクをつけていただいたりして,いよいよ収録開始.

基本的にはフロアディレクターの方の指示で進んでいきます.
プロデューサーや制作会社の方もフロアと別室で収録をチェック.

私のような新参者は基本的には台本を棒読みです.アドリブ等一切ありません(というか無理).
しかも言い間違えたり,だんだん疲れてきて声が裏返ったりするとNGになるのですが,それは文単位で改めて言い直せば
後でちゃんと編集していただけるので,そこはだんだん慣れてきました.
ただし長文は最後の方ミスしないかどうかヒヤヒヤしながらしゃべっています.

適宜休憩や感染予防の換気などをはさみながら収録は終了します.
これを1日かけて2コマずつ収録します(最初の方は私の準備が間に合わなくて1コマしか取れない日もありました)

最初の撮影で放送大学の中谷先生(現・放送大学オンライン教育センター長)と記念撮影
「機械学習概論Ⅰ」の収録が始まりました

収録したものを制作会社の方で番組に仕上げていきます.スライドのズームなどの効果やナレーションでの説明を
入れたり,いかにも番組っぽいものになります.
担当の中谷先生と私でチェックして最終調整して番組完成です.
私と画面が両方映っているような場面でもスライドの間違いがあればそこだけ直すこともできたりして,
映像編集すごいなと思っていたんですが,手作業的な部分がかなり多いそうです.

ナレーションは途中は人工音声なのですが,最終版では声優さんがやってくださっています.
私の番組全部ではないかもしれないですが,表示を見たら逢坂力さんというwikpedia にも出ているような方で無茶苦茶イケボ.
私のひどい声とのギャップにめげそうになります...

それで,今完成しているのは「機械学習概論I」ですが,概論IIの方も先月収録を終了し,最後の映像チェックも終わったので
現在絶賛最終の完成に向けて進んでいるところで,私ができることはもうないということでこの記事にまとめさせてもらいました.

***

最後のおまけ気味で献本いただいた本の紹介.

以前にも献本いただいた阪大の機械学習100問シリーズの続巻もいただきました.
機械学習の数理100問は数理科学2021年5月号に書評を書かせていただきました.
そしたら共立出版のアリがと蟻さんのツイートで言及していただいた上に私の本の紹介もしてくださいました.
蟻がとうございます_o_ 共立出版 アリがと蟻

その後お送りいただいたのは,スパースとカーネルです.
スパースの方は,LASSO のバリエーションがメインの内容で,カーネルは福水本を理解するための本という感じです.
鈴木先生は証明も基本的にちゃんと載せてくださっているので,その意味でも非常にありがたいです.
「○○の証明はここに書いてある」という情報は結構知りたいものなので,朱鷺の杜wikiを作った最初の動機もそこにあります.
それにしてもシリーズものを一人でやるというそのパワーに圧倒されます.
鈴木先生ありがとうございました.

スパース推定100問 with Python (機械学習の数理100問シリーズ 4)
機械学習のためのカーネル100問 with Python (機械学習の数理100問シリーズ 8)

最後は同僚の神嶌さんが翻訳された Pedro Domingos の Master Algorithm です.
この本に関しては翻訳の苦労を近くで聞いていました.
最近放送大学や一般の方向けへの講演とかで,いかに機械学習を易しく説明するかというのに苦労するのですが,
この本は読み物の形を取って,非常にわかりやすくいろいろなことを説明していると思います.
いわゆる教科書のようにエッセンスを淡々と並べるのではなく,物語のようにいろいろな例えや文学作品なども含めた引用も
交えながら数学アレルギーがあるような方にも読んでもらえるものになっているかなと思います.
ただ,メインのタイトルの「マスターアルゴリズム」が機械学習や人工知能を想起させないのがちょっと不利なのかなと思います.
やはり,機械学習も昔に比べればメジャーになったとはいえ少し難しいイメージはありますし,やはり一般感覚としては人工知能が圧倒的にメジャーなので副題の方も「究極の人工知能」と書いておいた方がよかったかも.
まあその辺は神嶌さんにもいろいろこだわりがあることだと思います. 神嶌さん,献本ありがとうございました.

マスターアルゴリズム 世界を再構築する「究極の機械学習」

田中勝さんの思い出

先日6月14日に元同僚の田中勝さん(福岡大)がお亡くなりになりました.
今日は田中さんとの思い出を少し書こうと思います.

私が電総研に入った翌年の91年に同じ研究室(情報数理研究室)に入ってこられました.
(私が修士卒で田中さんが博士卒で入ったので年齢は田中さんが2歳年上)

素粒子物理の理論研究(九大)からこの分野に入ってこられたという,当時としては異色の経歴でした.
当時の室長は大津展之さん,少し年上の先輩方に栗田多喜夫さん(現広島大)や麻生英樹さんというすごい面々がいましたが,
田中さんとは年も近くて仲良くしていただきました.

親分肌で面倒見がよく,人望も厚くて,後から入ってきた本村陽一さんや藤木淳さん(現福岡大)なんかも田中さんにとてもなついていたと思います.
当時は今と違ってゆるやかな時代で,部長の田村浩一郎さんの部屋で飲んだり,ソフトボール部という名の宴会部でよく飲み会をしたりしていました.
田中さんが購入したバーベキューセットで電総研の駐車場で週末になるたびバーベキューしていたのもよく覚えています.

研究では,当初コンピュータビジョン方面で運動群の表現論まわりの研究をされ,まだ目新しかったGAの勉強会をやったりもしました.
その後,脳型計算などの方面でもいろいろ研究されて,PCNN とか NMF といった技術も田中さんに教えてもらいました.
こうやって書いてみると,アンテナを張って最先端のものをいち早く研究していたんだなあと思います.

電総研が産総研に変わる前に,情報数理のOBの三島健稔さんがいた埼玉大に移られました.
その前後の時期は現在名城大の堀田一弘さんとかがまだ学生さんで,電総研と埼玉大の交流が深い時代でした.

その後福岡大に移られましたが,福岡に出張するたびにギネスビールの店とかウイスキーの店とかいろいろ飲みに連れて行ってもらいました. 最近では Tsallis エントロピーなどからインスパイアされて τ情報幾何という情報幾何学の新しい枠組みの建設に注力されていました.

エントロピーの幾何学 という著書も出されていて,なかなか難しい内容ですが田中さんらしいこだわりの一冊になっています. 機械学習分野は物理出身ですごい仕事をする人が多いので,バックグラウンドの弱い自分などは戦々恐々という感じではありますが,いろいろ教えてもらうことも多くてありがたい存在でした.

産総研にもたびたび来ていただいていて,最後はコロナの最初の緊急事態宣言が出る前につくば駅構内の日本酒バーで小林匠さんと3人で飲んだのが最後となりました.
最近も,田中研の学生さんが産総研で最近RAをやられていることもあり,来られる予定だったということで残念でたまりません.

ともかく突然の訃報に驚きと喪失感に襲われています.

# 今日はついでに献本された本の話も書こうと思ったのですが,ちょっとそぐわない気もするのでまた日を改めて.

田中さんのご冥福を心よりお祈りします.

カーネル多変量解析12刷お礼

新型コロナで電車にも全く乗らずつくばから動かない生活が半年続いていますが、それ以外はあまり大きな影響はなく過ごしています。
オンラインでいろいろやるのが快適で、出かけるのが面倒になってしまって、今後東京でも出張するのは億劫だなあという気持ちはあります。
みなさんはいかがお過ごしでしょうか。

さて、2020年10月26日付でカーネル多変量解析12刷が増刷されました。
1刷あたりの数は少ないですが、長く細々とご愛顧いただいている証拠です。
本当にありがとうございます!
思えば、カーネル多変量解析が出た後、世の中はディープラーニングブームとなり、カーネル法についての本がそんなに出版されなかったので逆に生き残れたのかなという気もします。
ディープラーニングも実はカーネル法と関係があるというような話も出てきて、しぶとく売れ続けているのはラッキーな面もありますね。

前回書き忘れていましたが、昨年甘利俊一先生が文化勲章を受章されました。
遅ればせながらおめでとうございます!
文化功労者の時はパーティーが開かれましたが、今回はオンラインでシンポジウム開催でした。
直接お会いできなかったのは残念でしたが、トークされた方々の裏話や逸話などがとても面白かったです。
あとは何といっても甘利先生の健在ぶりがすごいです。
ご自身では老いぼれとかもうこれで最後とかおっしゃっていますが、まだまだ全然若手に負けてないですね。
これからもご活躍を期待しています。
私も(レベルは全く違いますが)少しは見習わないと...

文化勲章といえば、今年度は産総研名誉フェローの近藤淳さんが受賞されていました。
近藤淳さんは私が電総研に入った時にはすでに伝説的な感じで、ノーベル賞候補とも言われていました。
(近藤効果と類似の研究ですでにいくつかノーベル賞出ているらしい)
私とは分野が違いますが、電総研内でときどきお見かけしてオーラを感じていました。

最後に、献本いただいた本の紹介。
しばらく前になりますが、大阪大学の鈴木譲先生から 統計的機械学習の数理100問 with Python (機械学習の数理100問シリーズ) を献本いただきました。
統計的機械学習やスパース推定、グラフィカルモデルといったトピックについて R と Python で問題形式で学習していく意欲的なシリーズの2冊目(1冊目はR版)です。
シリーズの予告を見ると最後の方に渡辺澄夫ベイズ理論とかなっているのがマニアックです。

鈴木先生は阪大の連携大学院の頃や集中講義をやったときなど、大変お世話になっている先生で、確か「数学的に新しいことを証明していない限り論文書かない」とか明言されていたと思いますが、非常に研究にストイックであり、かつ教育にも非常に情熱をもっておられます。

内容を見ると、鈴木先生らしく数学的な導出なども丁寧で、かつ数学に偏りすぎずプログラミングなどの問題もバランスよく入っています。 そもそもこれだけの内容(今後も含めて)お一人で全部書かれるというのが超人的過ぎて尊敬の気持ちしかないです。
(大学での講義がベースになっているということなのですでに材料はそろっていたのかもしれませんが、いずれにしても私には不可能です)

私はふだん R 使いなので、Python 版を送られたということは私にちゃんと勉強しろという鈴木先生のご配慮があるのかもしれません。
ということで鈴木先生ありがとうございました!





産総研におけるキャリアと大人の就活

世の中新型コロナウィルスで大変な中,さりげなく全然関係ないエントリーを書いてみます.

「20年務めた管理職をお役御免になりヒラの研究者になった」
というようなことをツイッターに書いたので,もしかするとご心配をおかけしたかもしれないので一応経緯を書いておこうと思います.
とは言っても人事案件なので細かいところまでは書けないし,もしかするとエントリーごと削除することになるかもしれませんがご了承ください.

はじめに書いておきますが,一応ヒラとは言っても上級主任研究員という肩書はついています.
ただし,それがどんな役職なのか外の人には全然わからないでしょうし,私も正直わかりません.
これは産総研が経産省系の研究機関に由来しているもので,文科省系だと助教・准教授・教授というわかりやすいステップがあるのに比べてわかりにくいです.

産総研の場合,外から見えるのは管理職としての職階で,私が務めていた研究グループ長やその上の研究ユニット長(正・副)があります(さらにその上もあるけど雲の上でよくわからない).
大学で言うと専攻長とかそういうのに対応するのかもしれませんが,どちらかというと持ち回り制の強い大学ポストに比べて永続的な役職で,研究者としてはどちらかというと避けたいものです.
多少給料はいいのかもしれませんが,仕事量に対して log スケールでしか増えないので割には合わないです.

研究者の理想としては「ヒラ5」という言葉があります.
これは管理職にならずに俸給表の5級をもらえるポストに就くという意味で,産総研では(昔の人を除くと)かなり狭き門なのである意味私の現在の状況は研究者の理想のポジションということは言えます.

ただし,ここに至るまでに少し紆余曲折がありました.
実は研究グループ長を退任するに際して,管理職でない研究者としてのとあるポジションを提示されました.
それは産総研の中でも数人だけが就けるポジションで,高く評価してもらってありがたいなあということでお受けしました.
(先に書いておくと,このポジションはそれなりに大変で省庁に呼ばれて説明したり義務もいろいろあるらしいです)
もちろんそれは無条件ではなく,推薦はするけど一応審査は天上で行われるとのことでした.
審査会に提出されるのは業績リストとA4 1枚程度の推薦書で,通常はそのまま通るはずがなぜか私のケースはリジェクトというまさかの結果に.
まあ理由が業績ではないようなので研究者としては納得しましたが,産総研の殿上人たちには評価されてないんだなあと感じた瞬間でもあります.

その後,研究グループ長より上の管理職ポジションを提示されたりしましたが,それは上に書いたように研究者として望むものではないのでお断りしました.
研究者としてのポストはほかにもいろいろあり,最初にも書きましたがいまいち区別がわかりませんが,最終的には一番ミニマムなポジションが内示されました.

ちょうどそんな折,昨年度後半くらいから,いくつかの大学や研究所からお誘いを受けました.
産総研は非常によい研究環境だと思うのですが,最大の問題は定年がお役所横並びで60歳ということです.
国立大学などでは多くが65歳,私立大学の一部では70歳を採用しているのに比べると,この高齢化社会で60定年で仕事をリタイアするのはちょっと厳しいです.
というわけで産総研の研究者は定年前に就活をする必要が出てきます.
幸運にも定年ぎりぎりで次のポジションが見つかるケースもありますが,最近の大学等ではあまり高齢の人を採りたがらない傾向があるので,移るのであれば早めに決めないと行き場がなくなるという事情があります.

声をかけていただいたのは,私にはもったいないようなすばらしい一流大学や一流研究所なのですが,結果的には全部お断りすることになって現在に至っています.
いくつか理由はありますが,主なものとしては以下のようなものが挙げられます.

・この歳になるといろいろしがらみもあって地方とかだと単身赴任になるし首都圏でも通うのが大変だと難しい

・任期があるケースがあって,60歳後そんなに長く働けないのであれば移る意味が薄い

・あとは仕事の内容. 私のところに最近来るのはデータサイエンスなどの教育プログラムに関するポストで,そのための仕事量は非常に多いことが予想されるので,管理職をこんなに嫌がっている自分としては敬遠してしまいます.

とはいえ,これから定年までは何かしら次の職を探しながらという日々が続くわけです.
公務員の定年延長があればもう少し長く産総研にいられそうなんですが,なんか政権の上の方でごちゃごちゃ問題起きてたり,新型コロナウィルスでそれどころじゃないという感じなのでそれもちょっと期待薄かなと半分あきらめています.

現在は新型コロナウィルスの影響が予測不能な段階で,自分もいつ感染してしまうかわからないので,あまり先のことは考えず,とりあえず日々の生活や研究を大事に一日一日過ごしていきたいと思っています.
研究や仕事で私とつきあいのある人もこれからつきあいのできる方も含めて今後ともよろしくお願いします.




カーネル多変量解析11刷お礼

9/5 付でカーネル多変量解析11刷が出ました.今回も特に修正はありません.
長年のご愛顧に感謝です.

また,以前のエントリーで言及させていただいた持橋さん,大羽さんによるガウス過程と機械学習も出版されましたね.
この本の中で,「『カーネル多変量解析』の2.3節(b)および7.2節(c)で正規過程としてふれられています.」と言及していただいていて,ありがたいことです.

カーネル法やガウス過程回帰はディープラーニングの理論的な研究でも重要な役割を果たしていますし,前回書いたようにベイズ最適化という応用でも注目されています.私の本がいまだにご好評いただいているのはそのような背景があるのではないかと思っています.

今後ともご愛顧いただけるとうれしいです.よろしくお願いします.


カーネル多変量解析10刷お礼

11/5 付でカーネル多変量解析の10刷が出ました.今回は特に修正なしです.
ディープラーニングの陰に隠れ細々とではありますが長きにわたりご愛顧いただきありがとうございます.

また11/4~7 には IBIS2018 が札幌で開催されました.(しましまさんのメモへのリンク
毎年発表件数や参加者が増えすぎて予測がつかず運営の方々もご苦労が多かったようです.
チュートリアル・オーガナイズドセッション・ポスターセッションいずれもクオリティが高く楽しめました.
査読なしであれだけクオリティが高く維持できるのはとても貴重だと思います.

多くのトップ国際会議では査読でクオリティを保っている部分もありますが,査読が研究者の大きな
負担になっています.その割に査読者によるばらつきが多くてあまり有効に働いてない気がします.
採録される論文と不採録論文の質的な違いはほとんどない現状だと思います.

研究を進めるという観点で言えば ArXiv に出た論文でも最近はちゃんとリファーされるわけですし,
査読を厳しくするという文化は見直した方がよいのではないでしょうか.
査読なしにすると会場のキャパが足りなくなるという問題が起きますが,例えば
ちょっと分野は違いますが北米神経科学会のように,ほぼ査読なしで巨大な会場を用意して,交流と議論の場として活発さを保つことは可能だと思います.

機械学習の数理など

前回書いてから気づくと1年近く経っていてこのままだと今年何も書かないことになってしまうので久々に書きます.
ブログも若い人たちが役に立つ情報をガンガン発信してくれていてここであえて書く内容もなかなかないので更新もますます少なくなりそうですが,いろいろ宣伝や適当な戯言を細々と書いていこうと思います.

まずは数理科学 2018年 08 月号(サイエンス社)に「機械学習と微分幾何学」という記事を書きました(私にはこのタイトルではちょっと荷が重かった).
甘利先生が「人工知能は暴走するのか」という挑戦的なタイトルの記事を書かれていて,この巻は発売直後に売り切れてしばらく Amazon などでも取り扱い中止になっていましたが現在は復活しているようです.
ただし Amazon だと定価の2倍くらいの値段がついていて理不尽なので数理科学の在庫を置いているような大手の本屋さんで買うことをお勧めします.

微分幾何学といってもそんなに難しい話には触れずにできるだけ多くの人がわかるように書いたつもりです.
本当は駒木先生のベイズの話とか曲がった空間の話を書かないと情報幾何の本領は見えてこないかもしれませんが,まあそのレベルの人はちゃんと論文読むと思うので許してください.

この特集記事もそうですが,最近は機械学習も理論的な側面への関心が高まっているように思います.
ディープラーニングとかブラックボックスでとりあえず性能は出ても気持ち悪いと思う人が増えているのでしょうか.

先日,産総研AIセンター主催で「人工知能の数理 というセミナーをセンターの唐木田さんと渡辺澄夫先生の二本立てで開催したところ,200人定員が応募翌日には満員御礼,待ち人数が最終的に400人近いという大盛況でした.渡辺先生の書かれた本も好評のようです.
Mathematical Theory of Bayesian Statistics (Chapman & Hall/Crc Monographs on Statistics & Applied Probability)

ノーベル賞で基礎研究系が受賞しても研究費が基礎研究に重点化されることはあまりなくて,内閣府とか省庁主体の SIP, PRISM, AMED, NEDO など予算規模はでかいけどあまり実質的に研究できる気がしないものが増えていって(お役人さんにはそういうのが目に見えやすいんだろうけど)日本の科学技術行政大丈夫かなと思うことがありますが,若い人はちゃんと理論や基礎にちゃんと向かっているのは頼もしいと思います.


さて,これも宣伝ですが,最近出たシステム制御情報学会の学会誌
「ガウス過程回帰の基礎から応用」特集号にも「ガウス過程回帰の基礎」という入門解説記事を書きました.
なぜか数理科学と同様私の記事の後に鈴木大慈さんの記事があります.
鈴木さんの解説はどちらも格調高い感じで美しく感銘を受けましたが,格調高すぎてちょっと難しいという方は私の記事でまず肩慣らししてから進むことをお勧めします.

ベイズ最適化がらみでガウス過程回帰もかなり注目が高いですね.
持橋さんと大羽さんのガウス過程回帰の講談社MLPプロフェッショナルシリーズ本が来年2月に出るようです.
『ガウス過程と機械学習』サポートページ
システム制御情報学会解説と合わせてお楽しみください(システム制御情報学会記事は半年経つとJ-STAGE で無料公開されるようです).



最後にもうだいぶ前になりますが献本いただいた本の紹介です:

Rによる機械学習入門
鈴木さん同様の統計・機械学習の理論家で泣く子も黙る金森さんの書いたRを使った機械学習入門本.
スパースやブースティングが入っているのはもちろん,ベイズ最適化とか密度推定とかが入っているのが特色でしょうか.記述も平易で,Rを使ってデータ解析を始める方にはよいのではないでしょうか.

フリーソフトではじめる機械学習入門(第2版):Python/Wekaで実践する理論とアルゴリズム
Python と Weka で機械学習を学ぶ本の改訂版を献本していただきました.時流を反映して Keras や Tensorflow なんかを使う話も入っています.著者の荒木さんには直接の面識はないですが,
マンガでわかる機械学習みたいなものをはじめいろいろ書かれていますね.私は書くのが遅いのでうらやましい筆力です.

研究者の日常

とある方から,一般の人にとって研究者は謎に包まれていて
一体何をしているのかという話を聞いたので,ちょっと書いてみようと思います.
詳しく書くと1冊本が書けそうなので,とりあえず今日のところはさわりだけ.
こちらのブログの読者の方は立派な研究者だと思うので,もう一つの方に書いたほうがよかったかな...
まあ今日は完全に一般の方向けという視点で.

研究者といっても,大きく分けると
1.企業の研究所の研究者
2.大学の研究者
3.国立研究所の研究者
とあって,私は3番目に該当するのでそれを中心に書きます.

大学も一応兼任したりして多少は知っていますが,我々との大きな違いは
学生さんがいて教育やその関係の仕事もしなければならないということでしょうか.

企業には勤めたことがないのでわかりませんが,これは千差万別で
大学や国立研究所の研究者に近いところから,ほとんど製品の開発しているようなところまで
さまざまあるという話です.

研究者の仕事は基本的に新しい発見をして論文を書くことです.
基本的にはその目的のためには24時間365日をどのように使ってもよいです(と私は思います).
実際私の研究所の勤務は多くの研究者が「裁量労働制」で働いており,一日の中でいつどれだけ職場に行くかはほぼ完全に自分の裁量で決められます.

ただし,実際には二つの理由で本当に完全な自分勝手はできません.

一つは法的な制約です.たぶん研究者を想定せずに決められた労働基準法の枠組みに縛られるので深夜10時以降の労働は制限されていますし,出張や休暇でなければ一日のうち一瞬は職場に顔を出す必要があります. 一応退勤管理もしっかりあって来た時間と帰る時間には web 上でクリックして証拠を残さなければなりません.(法人化される前はもっとずっといい加減で天国でした)

もちろん世の中にはブラック研究室っぽいところもあるようなのでそういうのに対する歯止めの役目はあると思います.(大学ではかなりヤバイところもあるようです)

もう一つは,研究上の理由です.
研究を完全に個人でやっていればまあ上のようにほぼ完全に自由ですが,場合によってはチームを組んで研究に取り組むこともありますし,その場合にはミーティングしたり,動物を扱う実験では時間的な制約も受けます.実験系でお子さんのいる研究者の方は我々ほど自由が効かないので大変という話も聞きます.まあ世の中で騒がれている育児の問題はここではかなりマシな状況だと思います.
このほか,役付きの職員は細々とした会議や,研究所運営の雑用がいろいろあります.ただ,これは学生さんがいる大学の方が圧倒的に大変そうです.

さて,研究者の具体的な日常はどのような感じでしょうか.
私の回りの典型的な研究者の場合は,お昼前までには研究所に行ってお昼を食べ,いろいろと仕事をして,おなかがすいたら途中おやつを食べ,夕方は晩御飯前の時間に適当に帰るという感じ
...ってこれでは小学生の日記みたいですが,こんな感じの勤務だと研究者じゃないご近所さんにはまともな仕事についてないんじゃないかと疑われるという笑い話もあります.実際には家でもどこでも区別なく仕事をする感じなので公私の区別をつけるのがなかなか難しいです.

具体的な仕事内容は,論文を書くのが仕事だと書きましたが,実際には書くアウトプットよりもはるかにたくさんの論文を読んだりしてインプットをたくさん入れる必要があります.新しいことを見つけるためには,過去の研究をできるだけたくさん知っている必要があります.

有名な言葉として
「巨人の肩に乗る(過去の偉大な研究の上に立てばわずかな新規性でも世界一の新しい研究ができる)」
「車輪の再発明をしない(ちゃんと過去の研究を調べて無駄に同じことを発明するのを防ぐ)」
というのがあります.そのためにたくさんの論文を読んだり,勉強会やセミナーを開いて研究を他の人に聞いてもらったりということも日常的に行われます.外に出かけて行って学会等に出かけるのも勉強になります.これらは完全に自発的なもので,最終的に自分が最大限の研究成果を出すために自分自身で判断します.

普通の研究者が雑用的にやる仕事としては,予算申請と学会関係の仕事があります.
研究をするのに,自分の研究所からもらう研究費だけでは足りない場合も多いので,科研費やいろいろな補助金などに申請する書類を書きますが,これは結構大変です.多くのポスドクを雇ったり,大型装置の維持費がかかるような研究者だと本当に大変ですが,私のような研究者はできるだけ予算申請は最小限にして研究に集中できるようにしています.

もう一つの学会関係の仕事は,論文査読と学会開催の委員が主な仕事です.これらはほぼ完全にボランティアですが,特に大きな資金源を持たない学会はこうしたボランティアに支えられて成り立っています.

というわけで十分長くなってしまったので今日はこの辺にしておきますが,研究者も人の子.スランプに陥ったり,精神的に辛くなることも往々にしてあります.そんなときは気分転換も必要で,まあこれは人によっていろいろだと思いますが,いろいろな仕方で息抜きもしながら研究者の日常を乗り切っています.まあその辺の話の方が面白いと思うのですが,それはいずれ稿を改めて.

ブログ内検索

プロフィール

あかほ

ブロとも申請フォーム

カレンダー

02 | 2023/03 | 04
- - - 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 -