AlphaGo 対 柯潔 第一戦

初戦はAlphaGoの勝利.


https://www.youtube.com/channel/UCP7jMXSY2xbc3KCAE0MHQ-A
https://www.youtube.com/channel/UCdorR_zaMnK5MDNLi-08JXw

イ・セドル戦の時ほどの新鮮な感動はもはやないが,あの時は人間側がコンピュータ囲碁を嘗めてかかっていた.油断もあっただろう.おそらく今回は可能な対策もしての真剣勝負である.それでもAlphaGoが勝利したというのはやはりすごいことなのだ.

  • 昨年のイ・セドル戦のものに三子で勝てる.
  • 昨年のイ・セドル戦では分散バージョンだが,今回はシングルバージョン.
  • 使ってるCPUは昨年の1/10.
  • 現在の実装では1点差でも確実に勝つ手を選ぶように調整されている.「大量得点」は狙ってない.*1
  • 人間の棋譜を全く参考にしないバージョンの噂もあったが,その点については今回は昨年と同じく人間の棋譜で初期化したもの.*2

ところで「柯潔」 九段の名前の読み方って,本当はどうなんだろう.日本語表記だとカタカナで「カケツ」って書かれてることが多いけど,アルファベット表記だと「KE JIE」になってるので,実は「ケ・ジェ」とか「カ・ジィエ」みたいなのかもしれない. *3

Nitro15

http://nitro15.ldblog.jp/tag/AlphaGo

柯潔「AlphaGoは囲碁の神」2局は25日午前11時30分続行

http://nitro15.ldblog.jp/archives/50099070.html

  • 対局が終わって突然あざ笑うように、笑い出したが?

(コ・ジェ) “確かに笑わったがあざ笑ったのではない。 私が負けているという事実を既に知っていたし、AlphaGoがキチンと打ってきた。 あきれてむなしい笑いが出てきたのだ。”

(デミス・ハサビス) “私もAlphaGoの弱点が何か分からない。 それをコ・ジェ9段が発見するように願う。 昨年、イ・セドル9段がAlphaGoの弱点を露出させてくれた。 我々はマッチが終わった後、戻ってアーキテクチャーを改善し、知識間隙(knowledge gap)解消に努めた。 それでさらに強いAlphaGoを作ることができた。”

  • 今日はコ・ジェが半目で負けた。AlphaGoの目標はそのまま勝つのではなく全面的、圧倒的に勝つのではないのか?

(デミス) “AlphaGoはいつも勝利確率を最大化するが、勝利ロジックを最大化しようとしない。 すなわちバランスを企てる(trade-off)。”

(デービッド シルバー) “勝利確率を高めるには、不確実性を減少させなければならない。 そのように見ればAlphaGoの手は緩く見えることがある。”

  • どんなGPUを使ったか?

(シルバー)“昨年には分散型バージョンを使ったが、今回のバージョンはシングルバージョンだ。 GPUではなくTPUを使った。 イ・セドル9段との対局当時と比較して、コンピュータ資源は10分の1に小さくなったがさらに強くなった。”

今回のバージョンは1年前と比べて三子強い実力

http://nitro15.ldblog.jp/archives/50100753.html

また、人間の棋譜を全く学習しなかったという推測も回ったが違ったと発表された。 ただし、今年1月ドイツで開かれたDLDカンファレンスで、GoogleディープマインドCEOデミスハサビス博士がある講演で、‘人間の棋譜で初期化しないで事前準備しないバージョン’に対する言及があった。 それは別途のバージョンで開発中であることと推測される。

また、AlphaGoマスター(60戦全勝した時)は、昨年イ・セドル9段と対局した時のAlphaGoを三子で勝つ実力だ。

今回の‘未来の囲碁サミット’で、AlphaGoマスターはイ・セドル9段時のAlphaGoと比較して、適用するコンピュータ資源の規模は約10倍小さくなったが性能はさらに強くなった。

イ・セドルとのマッチ当時CPU(中央処理装置)が2000個、TPUが50ほどだった。 今回TPUは似た水準で使うが、CPUは200個の程度だけを使う。(TPUは改良されたGPU程度で見ることができる。 また、価値網(value network)で飛躍的な性能向上を見せたGoogleディープマインド側は明らかにしている。

三村囲碁JP

http://mimura15.jp/archives/category/ai

「The Future of Go Summit①感想」

http://mimura15.jp/archives/2060

2016年末からネット対局場に現れた「Master」が、AlphaGoのニューバージョンだった。世界チャンピオンクラスの棋士を含む選手たちを相手に、なんと60連勝をした。

手数の長い部分的なヨミや、コウ、弱点とされていた部分を完璧にクリアして、破壊的な戦闘力が加わっていた。

それからまた5ヶ月経っている。コンピュータープログラムの進歩は、時間感覚が全く僕らとは違う。更に別世界の強さになっていて不思議ではない。

Masterの時点ですでに、人類を越えた事は誰しも認めている。

そういう文脈からすると、本局はあまり衝撃を感じない。

普通に上手い人の碁、という印象だ。普段、柯潔さんや世界のトップ棋士が勝つ時の碁を見ているのと、私的には変わらない。

「今までに無い碁」では無かった。

ついで

適当に検索しただけ.

最強囲碁AI アルファ碁 解体新書 深層学習、モンテカルロ木探索、強化学習から見たその仕組み

最強囲碁AI アルファ碁 解体新書 深層学習、モンテカルロ木探索、強化学習から見たその仕組み

進化を続けるアルファ碁 最強囲碁AIの全貌 (囲碁人ブックス)

進化を続けるアルファ碁 最強囲碁AIの全貌 (囲碁人ブックス)

人工知能は碁盤の夢を見るか? アルファ碁VS李世ドル

人工知能は碁盤の夢を見るか? アルファ碁VS李世ドル


囲碁AI時代の新布石法 (囲碁人ブックス)

囲碁AI時代の新布石法 (囲碁人ブックス)

Alphago Vs Lee Sedol: The Match That Changed the World of Go

Alphago Vs Lee Sedol: The Match That Changed the World of Go




今では「1世代前」のアルゴリズムになるのか.

コンピュータ囲碁 ―モンテカルロ法の理論と実践―

コンピュータ囲碁 ―モンテカルロ法の理論と実践―



人工知能の核心 (NHK出版新書)

人工知能の核心 (NHK出版新書)

ディープブルーvs.カスパロフ

ディープブルーvs.カスパロフ

コンピュータ将棋の進歩 6 -プロ棋士に並ぶ-

コンピュータ将棋の進歩 6 -プロ棋士に並ぶ-

*1:圧倒的差で勝ちを狙いに行くプログラムも作れるだろうが,そうすると「脇が甘くなる」かもしれない.今は「人間より強くなる」が目的なので,現時点では手堅い打ち方を選択しているのだろう.そういう意味ではAlphaGoはまだまだ「成長途中の未熟な若輩者」なのだ.
この対局が終わればAlphaGoは一般公開するという話もあるようなので,もしそうなれば,AlphaGoを使った,純粋に囲碁の可能性を追求する全く新しい手の研究が世界中で行われるようになるかもしれない.

*2:これも現在の目的が「人間より強くなる」ことなので,予想される話.人間の棋譜を全く参考にしないバージョンは「人知を越えた」手を打つかもしれないが,人間相手にすると意外と脆いかもしれない.まず今は堅実に人間に勝つことだけを目指してるのだろう.人知を越えた手を繰り出すのはその後.

*3:http://nitro15.ldblog.jp/archives/49834337.html では「コ・ジェ」と表記されている.