スーパーマリオで分からなくするAlphaGo超解説

えーと,あれ?
これって全部間違いだよね?

私は囲碁の知識はほぼゼロですが、その昔、プロのゲーム制作者を目指していたこともあり、

目指していたけど,明日から本気出す?

なぜ、これまで囲碁はコンピュータよりも人間の方が有利だったのでしょうか? 最も大きな要因は、「探索空間の大きさ」です。

うーん,それもあるけど,評価関数の作りにくさというのも大きい.*1

評価関数の精度が高ければ,効率良く枝刈りして探索空間を実質的に小さくできる.これができないと,チェッカーや将棋でも探索空間が大きすぎて,プログラムは強くなれなかっただろう.

単純計算…コンピューターの方が得意
思考…人間の方が得意

まずは「思考」の定義をしような.

今回、AlphaGoを勝利に導いたのが、「モンテカルロ木探索」の発明だと言われています。

は?
モンテカルロ囲碁はAlphaGo以前の世代から使われてるでしょ.*2
http://minerva.cs.uec.ac.jp/~ito/entcog/contents/lecture/date/5-yoshizoe.pdf

コンピュータ囲碁 ―モンテカルロ法の理論と実践―

コンピュータ囲碁 ―モンテカルロ法の理論と実践―

これの発売が2012年.amazonで調べるだけでも裏付けは取れる.

AlphaGoで画期的に変わったのがディープラーニングの適用.
ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装 深層学習 Deep Learning (監修:人工知能学会)
ここで深層学習というキーワードが一言も出てこないのには恐れ入った。深層学習はAlphaGoで一躍有名になり,すでにバズワードの一つとなっているというのに.

  • これら20体のマリオを実際にプレイさせて、より距離が進んだマリオが優秀なマリオだという評価を下します。
  • 20体のマリオから優秀なマリオ2体を親として選びます。この2体の親マリオが持つ遺伝子データを交叉させて、子マリオを2体、生成します。

これは遺伝的アルゴリズムの解説だと思う.
遺伝的アルゴリズム―その理論と先端的手法 金融工学のための遺伝的アルゴリズム Robust Control Systems with Genetic Algorithms (Control Series Book 3) (English Edition) 

東条雅彦

まさか同姓同名の別人ってことじゃないよね?単純に畑違いの人なんじゃ.




関係ないけど,ぐぐってて見つけたのでついでにメモ.

最強囲碁AI アルファ碁 解体新書 深層学習、モンテカルロ木探索、強化学習から見たその仕組み

最強囲碁AI アルファ碁 解体新書 深層学習、モンテカルロ木探索、強化学習から見たその仕組み

翔泳社だし,AlphaGo関連本の中で一番期待できるかな?

追記:どうも内容が軽すぎるらしい.こりゃ技術者向けじゃねーな.

*1:他のゲームプログラムでも最後まで読み切ってるわけではなく,適当な所で打ち切って,その時の評価関数の期待値が最も良くなるものを選ぶ.もし評価関数が完璧ならば,1手先を読むだけでも必勝のプログラムになるが,もちろんそんな美味い話はなかった.

*2:つまりは「一世代」前のアルゴリズム.AlphaGoでも使われてはいるけれど,決め手はそこじゃない.