「ぼくがかんがえた世界最強のAI」以下略

ホットエントリより.
なんにも感銘を受けない文章だった.

その結果わかったのは、AlphaZeroのアプローチでは、確かに「学習を続けていけばいつの日か最強になる」ことはどうも間違いないが、ほぼ無限大に近いほど広い選択肢がある場合、天文学的な計算機か、天文学的な時間が必要ということだ。

そらべつに普通の話じゃね.NP完全問題とか.


AlphaGo的なアプローチだと,ルービックキューブハノイの塔にも弱いと思うぞ.

あくまでもランダム探索をするだけなので、あたり(必勝)を引くためには信じられないくらい多くの場面を経験させなければならない。

ランダムなのは,そりゃそういうアプローチを取ったからでは.

囲碁においては,各「駒」の価値が同等で,チェスや将棋では有効だった「強い駒を取れば有利」のような評価関数が使えなかった.正解が分かるなら効率良く枝刈りもできるが,囲碁にはこのアプローチも使えない.必然的にランダム探索に近くなるため従来手法では効率が悪い.そこに出てきたのが駒が同等なのを逆手に取った「モンテカルロ碁」であり,AlphaGoもその延長線上にある,ということらしい.*1

コンピュータ囲碁 ―モンテカルロ法の理論と実践―

コンピュータ囲碁 ―モンテカルロ法の理論と実践―

http://minerva.cs.uec.ac.jp/~ito/entcog/contents/lecture/date/5-yoshizoe.pdf

だからやはり僕の感覚ではこれは人間でいう「勝負勘」という直感に近い。人間は、いくら理詰めで考えているように見えても、頭の中で、最後は直感に頼るのだ。

これも言い古されてると思うけれど,「直感」とは膨大な経験と思考に裏付けられた知的判断に他ならないのではないか.ただそれが瞬間的に行われ,その複雑な因果関係を人に説明するのが難しいだけの.「直感だから知能ではない」というのは,素人が陥りがちな誤りだと思う.*2

僕は、AlphaZeroが、あれほど複雑な囲碁のようなゲームが攻略できるのだから、当然、もっと情報量の少ないポーカーや麻雀のようなゲームでもできるに違いないと独自にAlphaZeroを改造し、実験を続けた。

非技術者ならここで感銘を受けるかも知れないけど,エンジニアの思考とは思えん.*3

AlphaGoといえどそこまで汎用のAIではないし,ポーカーのように「運」や「ハッタリ」の要素が強いゲームにおいては,「知的な」AIだから勝てるという類の物でもあるまい.「人狼知能プロジェクト」の方がそっち系だろう.*4

「Q&A:人工知能の未来(前編)」

一方、どんな既定のマシンの機能も相関関係が全くありません。どういう意味かというと、あるマシンはチェスの世界チャンピオンには勝てるかもしれませんが、チェッカーや他のボードゲームをプレイすることは絶対に不可能でしょう。また、あるマシンはクイズの大会で勝てるかもしれませんが、 “あなたの名前は?” という簡単な問いには答えられないかもしれません。

https://postd.cc/q-and-a-2/

"How do you feel?" に答えられるようになるのはいつの日か.

Tamer(テーマー)とは、「調教師」のことである。*5
DeepTAMERでは、AIのエージェント(agent)がゲーム環境(environment)で遊ぶのを人間のTamerが観察するというところがミソだ。

人間は、コンピュータの振る舞いに対し、適宜「いまのプレイは良い」「いまのプレイはダメ」ということをヒントとして教えてあげるだけで良い。

ようは、AIを人間がコーチするのである。

サッカーロボットのチームプレイや雪道での自動車の運転のようなものなら効率良く学習できそうだが,囲碁やレントゲン写真による診断,ルービックキューブやポーカーのような正解が分かり難いものにはどこまで有効なんだろうか.


もちろん研究者としてはその弱点など百も承知で研究を進めてると思うのだが,こういう提灯記事だとそういう制限事項については触れないことが多いのでね.

*1:モンテカルロ法でゲームプログラミング.最初聞いた時は笑ったわ.「その発想はなかった!」ってね.正に逆転の発想.

*2:「「統計的機械学習」に限ればだいたい正しいけれど、そもそもルールベースに限界があったので感覚的なものを捉えられる「柔らかい」枠組みが流行ってきた、という経緯があるので、そういうものだとしか。」 http://d.hatena.ne.jp/JavaBlack/20180514/p1

*3:手数の組み合わせだけなら オセロ<チェス<将棋<囲碁みたいだし,難易度もだいたいそうなってる.だが囲碁がチェスや将棋より難しかったのはそれだけが理由じゃない.

*4: http://d.hatena.ne.jp/JavaBlack/20150830/p1

*5:どちらかというと「猛獣使い」のニュアンスのようだ.lion tamer とか出てくる.