朱鷺の杜(IBIS)ブログ

情報論的学習理論(IBIS)に関する管理人の独断と偏見に満ちた意見

モンテカルロ囲碁

しばらく研究会や講演会からごぶさたしていましたが,今日産総研で以前から噂には聞いていた
モンテカルロ囲碁の講演があったのでメモ.
(FC2ブログは1ヶ月更新しないと宣伝が入るという事情もありますが)

機械学習とからめて検索したらこちらでも少し前に話題になっていたようです. 詳しい情報はそちらで解説されているのでここでは単に感想や今日の講演で質疑で得られた情報だけ書いておきます.

講演者は以前電総研のゲームラボにも滞在されていた Martin Muller さんという方で,Fuegoというプロジェクトを進めていらっしゃいます.

ポイントはモンテカルロと探索木のテクニックを組み合わせているところで,どちらかだけだと弱いということのようです. まあいろいろ工夫はあるのでしょうが,基本的には単純な手法でよくこれだけ強くなれるものだなという印象です.

モンテカルロと言っても,かなり原始的なモンテカルロで,マルコフ連鎖とか,マルチカノニカル,マルチテンパリングなどといった高級な話は一切なし. ただ,ヒューリスティックでそれに近いことはやっている部分もあるみたいです.

一方平均場近似とかについても聞いてみましたが,それについては全く知見が得られず(平均場近似って何?って感じだった). 昔から平均場近似囲碁はいけるんじゃないかと思っているのですが,まだ未知数のようですね.

あとは強化学習との関連はかなり意識していました. もともと TD-Gammon 以来そのアプローチは考えられてはいて,ただ囲碁は複雑すぎるので Backgammon が限界だろうみたいな感じだったと思っていました. そういう流れからすると温故知新とも言えます.
逆に囲碁じゃない強化学習にモンテカルロを使うというのも来るかもしれませんね. すごく素人的な発言ですが.

ともかく今日聞いた話の感じでは,工夫する余地が山ほど合って,まだまだ強くなりそうです.

ちなみに先日 Fuego ではないですが Mogo というモンテカルロの囲碁プログラムを試してみましたが,噂に違わず9路盤では相当に強かったです. 互先でほとんど勝てませんでした.
期待値の高い手を打ってくるのですが,手厚くかつバランスのいい手を打ってきます.
19路だとさすがに手が広すぎて序盤は意味不明な手を打ってきます.

というわけで,ゲームの世界も機械学習が活躍できそうですが,こういうシステム系のプロジェクトは私にはあまり向いていないのでとりあえずは傍観モードというところでしょうか.
スポンサーサイト

コメント

とても魅力的な記事でした。
また遊びに来ます!!

  • 2013/08/26(月) 06:26:41 |
  • URL |
  • 履歴書の書き方の見本 #-
  • [ 編集]

コメントの投稿


管理者にだけ表示を許可する

トラックバック

トラックバックURLはこちら
http://ibisforest.blog4.fc2.com/tb.php/91-b7fb76dd
この記事にトラックバックする(FC2ブログユーザー)

FC2Ad