将棋のプロ棋士である広瀬章人八段向けに「最強の将棋AIマシン」を組むべく奔走する本連載。前回は、プロ棋士の間でコンピュータを使った研究が本格化していること、必要な演算装置には多コアCPUである米AMDの「Ryzen Threadripper」や並列計算の多いAI処理に向いたGPUがあることを紹介した。

　今回注目するのは、「CPU計算による将棋ソフト」と「GPU計算による将棋ソフト」のいまの実力と、それにつながる技術的な変遷についてだ。

コンピュータ将棋がプロに勝った日　その技術は“AIブーム”にあらず

　コンピュータ将棋の歴史は長く、コンピュータ将棋協会が主催する「世界コンピュータ将棋選手権」の第1回は1990年に開催されている。連綿と紡がれた歴史を全て振り返るのは1本の記事では難しく、ここでは公式戦でコンピュータが現役プロ棋士に初めて、平手で勝利を収めたところから始めたい。

　2013年3月から4月にかけて行われた、ドワンゴと日本将棋連盟主催の「第2回将棋電王戦」。5人のプロ棋士と5つのコンピュータ将棋ソフトが平手で勝負というコンセプトで、結果はプロ棋士側が1勝、コンピュータ側が3勝、1引き分け。この第2局で、佐藤慎一四段（当時）に勝ったのが将棋ソフト「Ponanza」（ポナンザ）だ。これが「コンピュータ将棋による現役プロ棋士に対する初めての公式戦勝利」といわれる。

「第2回将棋電王戦」の結果

　もっとも、この後の第3局では「ツツカナ」が船江恒平五段（当時）に、第5局では「GPS将棋」が三浦弘行八段（当時）に勝利を収めている。Ponanzaが特に有名ではあるが、コンピュータ将棋全体の積み重ねが一つのマイルストーンに到達したと見るのがいいだろう。

　ここでまず指摘したいのは、勝利した将棋ソフトはいずれもCPUで計算していることだ。近年のAIの特徴や、英DeepMindの囲碁AI「AlphaGo」のイメージから「人間に勝ったAIはディープラーニングなんでしょ？」という印象を持つこともありそうだが、AlphaGoが頭角を現したのは2015年。いわゆる第3次AIブームの火付け役となった論文が出たのは12年。米NVIDIAのGPUプログラミング環境である「CUDA」の提供開始も07年で、コンピュータ将棋の歴史から見れば“新しい技術”といえる。

　コンピュータ将棋は、現在の「GPU＋ディープラーニング」的なAIブームとは独立した研究の中で育まれてきたのだ。

DL系「AlphaZero」が強豪将棋ソフト「elmo」に圧倒

ニューラルネットワークを使った「習甦」（しゅうそ）の評価関数（「コンピュータ将棋における大局観の実現を目指して」より）

　コンピュータ将棋にニューラルネットワークを持ち込む考え方も、なかったわけではない。先の第2回将棋電王戦の第1局で敗北した「習甦」（しゅうそ）は評価関数に3層のニューラルネットワークを採用していた。

　最強の名をほしいままにしていたPonanzaは、2017年5月の第27回世界コンピュータ将棋選手権に、プリファード・ネットワークスのライブラリ「Chainer」でディープラーニングを実装した「Ponanza Chainer」として参加した。Intel Xeon22台、グラフィックスカード「GeForce GTX Titan X」128枚、総メモリ4.8TBという文字通りの化け物スペックも用意したが、同大会の優勝ソフト「elmo」（Xeon E5-2686 v4、メモリ256GB）に敗北を喫することになる。

　そんなelmoに勝ったとして話題になったのが、DeepMindの「AlphaZero」だ。人間の対局データを使わずに以前のAlphaGoより強くなった「AlphaGo Zero」の汎用バージョンで、たった2時間の学習でelmoに対し90勝8敗2分という成果を上げたと、同社が17年12月に発表した。

「AlphaZero」はゲーム固有のドメイン知識を必要とせずに学習を行う。将棋、囲碁、チェスで当時の世界最強AIに勝利した

　ただし、将棋ソフト「やねうら王」作者であるやねうらお（磯崎元洋）さんは自身のブログで「従来の将棋ソフトを圧倒的に追い抜いたのかについては若干の疑念がある」と指摘。AlphaZeroの学習には米Googleの専用計算ハードウェア「TPU」が大規模に使われていることから「教師を作るのに使用している計算資源がわれわれより2桁くらい多いように思う」としていた。

　いずれにしても、ディープラーニングで実装されたAIが、従来の将棋ソフトのトップに勝ったのはやはり一つの区切りといえそうだ。そしてこの頃から、21年時点の“CPU最強”と“GPU最強”が胎動を始める。

“CPU最強”と“GPU最強”の胎動

　　　　　　 1|2|3|4 次のページへ