イ・セドル,AlphaGoに初勝利
イ・セドル vs AlphaGo 四局目.イ・セドル78手目の「ワリコミ」(?)以降,一気に形勢がセドル側に傾き,そのままセドル勝利になった模様.以前から言われていたAlphaGoの「弱点」を突かれた形のようだ.
やはり乱戦になってからの大局の読みは,完璧ではないんだろう.とはいえ,そう思ったからといって,思うように乱戦に持ち込めるのも,その乱戦の中で最善手を打ち続けられるのも名人ならではだろうが.
またGoogle DeepMind側にとっても,これは貴重なデータだ.なぜ判断を誤ったのか.どう改善すべきか.この棋譜を元に改良すればさらに強くできるわけだから.*1似たような事をインタビューで繰り返し述べているな.
- http://d.hatena.ne.jp/JavaBlack/20160131/p1
- http://antibayesian.hateblo.jp/entry/2016/03/10/041739
- 「AlphaGo の論文をざっくり紹介」http://technocrat.hatenablog.com/entry/2016/03/14/011152
- 「コンピュータ囲碁における モンテカルロ法 ~ 理論編~」 http://minerva.cs.uec.ac.jp/~ito/entcog/contents/lecture/date/5-yoshizoe.pdf
nitro15
http://nitro15.ldblog.jp/tag/AlphaGo
「【AlphaGo】イ・セドルvsAlphaGo Googleディープマインドチャレンジマッチ第4局速報」
http://nitro15.ldblog.jp/archives/47079097.html
午後3時40分/イ・セドルの揺さぶりが通じるだろうか
イ・セドルの石がAlphaGoの中央黒地の中に閉じ込められた。 どうにか打開してこそ勝負して見ることができる。
ハン・ジョンジン9段が解説を放棄したがる。
"85,87,89も全て打つ事はできない手だ。"全部悪手という意味だ。
むしろ逆だと思う.
経験してない手に対してニューラルネットが形勢判断を誤ったからこそ崩れてる.形勢判断を誤ればその後も同様に誤り続けるので,同様にミスをしてるのでは.
「【AlphaGo】イ・セドルvsAlphaGoチャレンジマッチ第4局 イ・セドル、AlphaGoを揺さぶった'神の一手'」
http://nitro15.ldblog.jp/archives/47081845.html
興味深くも黒11までは2局と同じ手順が続いた。 AlphaGoには'このような場面ではこのように打つのが答'というパターンが公式のように位置しているのか。 そのような気がかりなことを持たせる進行だ。
というか,わざわざ乱数でも入れない限りは、同じ入力に対しては同じ答を返すのが普通のプログラムだし.
ゲームソフトなら同じ局面でも異なる手を返すように工夫すると思うけど,AI研究用ならランダム要素はむしろ排除したいのでは.それでも同じ局面にならない限りは問題にならないし,そんな所を突いて勝ってもプロ棋士としての自慢にもならないし.
呆れ返ることが起こった。 AlphaGoのとんでもない手に当惑したように"私がこのような子供に三局も負けた"というイ・セドルの表情だ。 キム・ヨンサム プロはひょっとして"コウを考えているかもしれない"と解説する。
うーん,プログラムは人間とは全く異なる視点で囲碁を処理してるからねえ.
「【AlphaGo】「最後の第5局は黒番で打つ!」イ・セドルvsAlphaGo第4局記者懇談会」
http://nitro15.ldblog.jp/archives/47082138.html
序盤が始まった時AlphaGoは自ら優勢を推定した。 このような進行にイ・セドル9段の妙手が出てきてAlphaGoが失敗を犯した。 局面が複雑になった瞬間に出てきたイ・セドル9段の妙手がAlphaGoを揺さぶったのだ。
AlphaGoの限界をテストするために韓国でイ・セドル9段と対局したことなのだが私たちはまた成果を達成した。 AlphaGoの弱点が分かってこそ改善する事ができる。 イ・セドル9段のような創意的な天才との対局をするだけでAlphaGoの弱点を発見する事ができると考えた。
どうしてもそのようにして学習された知識は弱点が存在する他ない。しかし私どもの開発者は囲碁上手ではないのでその弱点を把握できなかった。
だがイ・セドル9段のような上手との対局をするだけでAlphaGoの弱点を把握できたのだ。 今日の中央の戦闘のような複雑な部分がまさにAlphaGoの弱点だった。 イ・セドル9段の強い実力のおかげでAlphaGoは今日大切な経験をした。 戻って今日の対局の中央接戦を分析してAlphaGoを補完する資料とする。
・AlphaGoは二種類のバージョンがあるといった。以前のバージョンをそのまま使ったのか、他のバージョンを使ったのか?
・デミス:私どもが使ったシステムは分散型システムだ。バージョン18AlphaGoを使って、すべての対局で同じバージョンを使った。公式的な媒体ではシングル型より強力な分散型を使う。
デミス:AlphaGoは相手が誰なのか関係なく相手は最高の手を打つという仮定の下に自らの勝率を最大化するための手を検討する。正確な手を打ってこそ自身の勝率が最大化されるのかどうか、ただそれだけ探す。
・AlphaGoの弱点は何か?
・イ・セドル:ひとまずAlphaGoが露出させた弱点は二つある。基本的に白番よりは黒番を大変とするのではないかと思う。今日予想できない手が出てきた時一種のバグ形態で数手進行された。考えることが出来なかった手に対する対応力が落ちる。白よりは黒を難しがるという点もAlphaGoの弱点だ。
「【AlphaGo】尻尾を下ろした柯潔「私も勝率は5%」中国プロ棋士の反応」
「【AlphaGo】「AlphaGoの弱点は……」朴永訓インタビュー」
http://nitro15.ldblog.jp/archives/47077884.html
シリーズを決定する最後の対局だった第3局を備えるためにイ・セドルは同僚・後輩棋士らと研究してコウの乱戦を考慮しこれを実戦で試みた。
通じなかった。
AlphaGoは乱戦で全く押されなかったしコウに正確だった。
・なぜそうだろうか?
“弱点が発見できないためだ。 AlphaGoは布石能力、動き、感覚、読み、形勢判断、ヨセまであらゆる分野で強い。”
“ただ正常にプレーするのが良いだろう。 弱点を発見する事ができると幸運だ。 そうなるとその弱点を他の棋士にも教えられるはずだ。 しかし五対局は相手の弱点を知るにはあまり少ない。”
・何か?
“まずコウに対する把握が途中だ。 第3局でコウが登場したがすでにイ・セドル9段が滅びた以後に登場したことなのでAlphaGoは勝負と関係がないと判断してコウに対してそんなに気を遣わないようだった。それでもAlphaGoがコウを運用する能力は完ぺきだった。 コウをしていて止めて上辺148に打ったのも良い手であった。 あたかもコウを正しくするとは思わないように動くが実際にコウをしなければならなくて取り出さなければならない決定的な時期には果断性があった。
それでも疑わしいのはこのコウがAlphaGoがとても優勢な中で行われたことなので、もし勝負所でもそうするだろうかという気がするためだ。 それでもAlphaGoが基本的に実力が優れているのでコウの変数にあまり期待してはいけない気もする。
また他の疑問がある。AlphaGoのように人工神経網が結びついてはいないが既存のモンテカルロ ツリー探索を主力にするプログラムは同時に色々な所、例えば左辺右辺中央右上などで複雑にからまる戦闘が出てくればプログラムの読みが急激に弱くなる弱点を見せると開発者が指摘してきた。
開発者はそのようなプログラムに勝ちたいなら色々な所の戦闘を同時に構成する戦闘をしろと人々に助言するさえする。 AlphaGoは深層神経網が共にするとかなり改善になっただろうが実際に気になることではある。
「【AlphaGo】世界サイバー棋院ソン・ジョンス常務の第4局観戦記」
http://nitro15.ldblog.jp/archives/47088554.html
ディープマインドのデミスハサビスの話によれば3ラウンドは‘中盤までは二転三転する対等な戦いだった。’と言う。 専門家たちの見解は相変らず‘序盤優位先行獲得’に重きを置いているがそれは序盤に勝負を決めろとの意味ではない。 接近戦を避けて全盤的な布陣で優位を先行獲得しなければならないという意味なのだがそれが最高のプロ イ・セドルにも話のように容易ではないというのが問題であった。
「【AlphaGo】歴史を二回揺さぶった人間と機械の勝利」
http://nitro15.ldblog.jp/archives/47088751.html
デミス博士が学生時代に囲碁をデービス博士に教えたのかと尋ねたところ“デミス博士が当時囲碁に対する動機付与をしたことは正しいが囲碁を習ったのは幼い時期父からであった。”とした。 また“GoogleAlphaGoチームは全員碁を打つことができる。 Aja Hunag博士がアマチュア6段で最高手でありデミス博士は1級程度で大部分は初級の実力だ。”といった。
事実以前からグーグル役職員のうちには囲碁好きな人が少なくなかった。 社内囲碁クラブも組織されている。 12日グーグル共同創業者セルゲイ・ブリンも囲碁に心酔して事業を疎かにした自身の過去の話を取り出した。
「【AlphaGo】進化するAlphaGo、イ・セドル勝利の可能性は?」
三村囲碁jp「Google DeepMind Challenge Matchの感想4」
3局目の一方的な勝利の後、本局も黒のAlphaGoが気持よく打ち進めている様に思えた。セドルさんの碁とは思えない程、抑えこまれていたと思う。
しかし中央で妙手を放った後にAlphaGoがミスを連発して崩れた。
白としては、中央で手が無ければそのまま負けを認めるしかない状況だった。渾身の勝負手がAlphaGoのヨミの盲点をついた様だが、そこでまだ冷静に対処していれば黒が悪くなかった筈だ。これまで恐ろしい程の強さを見せていただけに、不可解な乱れに本当に驚いた。
不可解というか...いやまー,プログラムってそういうもんです.
むしろそういうのが出ないように作るのがどんだけシンドイことか...機械翻訳なんて見てればボロボロなのがよく分かるはず.
最終局は本来ニギリ直しで先後を決めるが、イ・セドルさんが黒で打ちたいという提案をして受け入れられた。
へー,そうなんだ.
まーDeepMindとしてはデータ収集が目的だし,見せものとしても,そっちの方が面白いし,特に問題は無いな.
村上深「AlphaGo VS イセドル(第4戦)感想 一縷の希望。ワリコミは成立していなかった?」
http://ameblo.jp/deeper810/entry-12138949950.html
本局のハイライトは、上辺のシノギに関する白78で衆目の一致でしょう。図2以降は俺個人の読み筋なので、間違いがあればご指摘欲しいです。
この手、見た瞬間は俺もびっくりしましたが、確かに理にかなっていると、これまた瞬間的に思いました。というのは、この形、いくつかの条件が整えば、脱出できるんだけどな、ということを考えていたため。
もし、本当は手が生じていないのであれば、白78は唯一地中に活を見出した神手ではなく、AlphaGoのミスを誘った鬼手という意味になります。
いずれにしても、AlphaGoは手どころで間違え、白78の時点での最善図を逃していることはまぎれもない事実です。
2ch名人
「李世ドル九段、AlphaGoに勝利! 人類の意地を見せる!」
http://i2chmeijin.blog.fc2.com/blog-entry-3554.html
どうでもいいけど,こういうところで「人類の意地を見せる!」って書く人って,プログラマのことを宇宙人や魔法使いと勘違いしてるんだろうか.これって普通に「人間vs人間」の戦いなんだけどねえ.
「AlphaGo、GitHubで公開中 Natureに掲載された論文からレプリカを作成」
その他
- http://jp.techcrunch.com/2016/03/13/20160313defeated-go-world-champion-beats-deepmind-ai-in-penultimate-match/
- http://www.itmedia.co.jp/news/articles/1603/13/news034.html
- http://www.asahi.com/articles/ASJ3F5WKJJ3FUHBI014.html
- http://blog.livedoor.jp/itsoku/archives/48080030.html
- http://headlines.yahoo.co.jp/hl?a=20160313-00000047-jij-kr
- http://www3.nhk.or.jp/news/html/20160313/k10010441931000.html
- http://togetter.com/li/949505
- http://www.itmedia.co.jp/news/articles/1603/13/news021.html
- http://www.asahi.com/articles/ASJ3D6R5LJ3DUHBI02J.html
nature [Japan] January 28, 2016 Vol. 529 No. 7587 (単号)
- 出版社/メーカー: ネイチャー・ジャパン
- 発売日: 2016/02/05
- メディア: 雑誌
- この商品を含むブログ (4件) を見る