トップ » BOOK » AlphaZero 深層学習・強化学習・探索人工知能プログラミング実践入門

AlphaZero 深層学習・強化学習・探索人工知能プログラミング実践入門

著者：布留川英一

定価	3,520円（本体3,200円＋税10%）
発行・発売	株式会社ボーンデジタル
ISBN	978-4-86246-450-7
総ページ数	336ページ
サイズ	B5変形、オールカラー
発売日	2019年

本書の詳細

サンプルを作りながら、最新・最強の機械学習フレームワーク「AlphaZero」が学べる！

Google傘下の英国DeepMind社が開発した「AlphaGo」は、2015年に「囲碁」の一流棋士に圧勝したことで、世界中の大きな注目を集めました。それを発展させ、「囲碁」だけでなく「チェス」「将棋」でも最強のコンピュータソフトを目指して作られたのが、2017年末に発表された「AlphaZero」です。

本書では、この最新・最強の機械学習フレームワークである「AlphaZero」の仕組みを解き明かします。「AlphaZero」は、これまでも使われてきた「深層学習」「強化学習」「探索」のアルゴリズムを組み合わせて作られており、それぞれの構成要素を理解することで、全体像を把握できます。

「深層学習」「強化学習」「探索」のそれぞれの構成要素ごとにサンプルプログラムを用意しているので、動作を確認しながら、ステップバイステップで学んでいくことが可能です。機械学習の実行にはマシンリソースが必要ですが、本書では無償で利用できるクラウド上の「Google Colaboratory」を利用することで、Webブラウザだけで実行と確認を行うことができます。

「AlphaZero」の仕組みが理解できたところで、本書の最終章でそれを応用し「コネクトフォー」「リバーシ」「簡易将棋」の3つのサンプルを作成してみます。AIと人間で対戦して、「AlphaZero」でどのぐらい強いプログラムができるのかを実際に確認してみることが可能です。

ダウンロードデータは、ZIP形式で圧縮されています。WinZip（Windows）やStuffit（Macintosh）等のアプリケーションで解凍してご使用ください（ファイルサイズ：約120MB）。

ダウンロード

以降の正誤は、2刷で修正済み
■P.132の表4-2-2とP.133の表4-2-3
※表の内容が逆になっていました。

■P.137の最後のリスト中
誤：
# 方策に従って行動と次の状態の取得
[s_next, a] = get_s_a_next(pi, s)
正：
# 方策に従って行動を取得
a = get_a(pi, s)

# 行動に従って次の状態を取得
s_next = get_s_next(s, a)

■P.139（4章）の数式
正しい数式はこちらです

■P.139（4章）のリスト中
誤：delta_theta[i, j]=(n_ij + pi[i, j] * n_i) / total
正：delta_theta[i, j]=(n_ij – pi[i, j] * n_i) / total

誤：stop_epsilon = 10**-3 # 閾値
正：stop_epsilon = 10**-4 # 閾値

誤：for episode in range(1000):
正：for episode in range(10000):

■P.169（4章）とP.171（4章）のリスト中
修正箇所が長いので、以下のテキストファイルをご覧ください。
p169とp171の正誤情報

■P.217の一番上のリスト
誤：create_dual_network()
正：dual_network()

■p247の一番上のリスト
誤：retrain_network()
正：train_network()

6章　AlphaZeroの仕組み
6-1 AlphaZeroで三目並べ
6-2 デュアルネットワークの作成
6-3 モンテカルロ木探索の作成
6-4 セルフプレイ部の作成
6-5 パラメータ更新部の作成
6-6 新パラメータ評価部の作成
6-7 ベストプレイヤーの評価
6-8 学習サイクルの実行

7章　人間とAIの対戦
7-1 ローカルのPython開発環境の準備
7-2 TkinterでGUI作成
7-3 人間とAIの対戦

8章　サンプルゲームの実装
8-1 コネクトフォー
8-2 リバーシ
8-3 簡易将棋

いつもクリエイターのそばに

CONTACT

ONLINE STORE

CGiN

ボーンデジタルオンラインブックストア

CGWORLD SHOP

TOOLFARM Japan

Font Garage