ゲームのための人工知能（上）

ゲームのための人工知能（上）
三宅陽一郎
三宅陽一郎@miyayou
2017.7.5
https://www.facebook.com/youichiro.miyake
http://www.slideshare.net/youichiromiyake
y.m.4160@gmail.com

人工知能の歴史
１９５６年１９８６年２０1６年
人工知能
発祥
日本人工知能学会
発足
現在

経歴
京都大学（数学）大阪大学（原子核実験物理）東京大学
（エネルギー工学/人工知能）
高エネルギー加速器研究所（半年ぐらい。修士論文）
http://www.facebook.com/youichiro.miyake

Works (2006-2016)
AI for Game Titles
Books

ゲームAIの参考リンク集
• ディジタルゲームの人工知能
（Artificial Intelligence in Digital Game）
• https://www.ai-gakkai.or.jp/my-
bookmark_vol32-no4/

アンチャーテッド4 の人工知能
• Authored vs. Systemic: Finding a Balance for
Combat AI in 'Uncharted 4'
• Matthew Gallant
• http://www.gdcvault.com/play/1024467/Auth
ored-vs-Systemic-Finding-a

参考文献
三宅陽一郎「大規模ゲームにおける人工知能 ─ファイナルファンタジーXV の実例をもとに─」
(17ページ) （人工知能学会誌、2017 2号） http://id.nii.ac.jp/1004/00008567/

「IT、都市、ヘルスケア、あらゆる領域で
人工知能と人間が共創する未来」
• WIRED 「INNOVATION INSIGTS」
http://wired.jp/innovationinsights/post/analytics-cloud/w/cocreation_with_ai

• ThinkIT https://thinkit.co.jp/author/10026
• AI最前線の現場から【スクウェア・エニックス】

目次
• 第一章人工知能とは？
• 第二章なぜ今、人工知能技術が注目されているか
• 第三章人工知能の各種事例
• 第四章人工知能の発展の方向
• 第五章ゲームAIと人工生命
• 第六章人工知能と創造性
• 第七章メタAIの発展
• 第八章モバイルゲームにおける人工知能
• 第九章データ解析・学習によるオンラインゲームのサ
ポート

自然知能と人工知能
人間
＝自然知能
機械
＝人工知能

ダートマス会議（1956年）
我々は、1956年の夏の2ヶ月間、10人の人工知能研究者
がニューハンプシャー州ハノーバーのダートマス大学に集
まることを提案する。そこで、学習のあらゆる観点や知能
の他の機能を正確に説明することで機械がそれらをシミュ
レートできるようにするための基本的研究を進める。機械
が言語を使うことができるようにする方法の探究、機械上
での抽象化と概念の形成、今は人間にしか解けない問題
を機械で解くこと、機械が自分自身を改善する方法などの
探究の試みがなされるだろう。我々は、注意深く選ばれた
科学者のグループがひと夏集まれば、それらの問題のうち
いくつかで大きな進展が得られると考えている。
https://ja.wikipedia.org/wiki/%E3%83%80%E3%83%BC%E3%83%88%E3%83%
9E%E3%82%B9%E4%BC%9A%E8%AD%B0
人工知能＝人間の知能を機械に写す（移す）。

機械（マシン）
ソフトウェア
知能
身体
機能
知能
http://www.1999.co.jp/blog/1210192
http://ja.wallpapersma.com/wallpaper/_-
%E3%83%AA%E3%82%B9%E3%80%81%E5%A3%81%E7%B4%99%E3%80%81%E3%83%AF%E3%82%A4%E3%83%89%E3%82%B9%E3%82%AF%E3%83%AA%E3%83%BC%E3%83%B3%E3%81%AE%E3%80%81%E3%
83%9E%E3%83%83%E3%82%AF%E3%80%81%E3%83%9A%E3%83%83.html

身体性とインテリジェンス
Gray’s anatomy
脳の中心の部位は身体とつながっている。
生理機能を司っている。
それを囲うように、辺縁体、大脳がある。
http://square.umin.ac.jp/neuroinf/brain/005.html
http://www.amazon.co.jp/Grays-Anatomy-Anatomical-Clinical-Practice/dp/0443066841

意識/無意識の知性
身体の制御に
つながる
感覚を統合する
知性全体人の意識的な部分
意識自身には機能がない
環境
身体
意識
無意識
意識的な知性
無意識的な知性
表象意識に浮かび
上がるイメージ

人間の精神
意識
前意識
無意識
知能
言語による
精神の構造化
外部からの
情報
言語化のプロセス
シニフィアン
/シニフィエ
言語回路
（＝解釈）
意識の形成
世界を分節化している

人間の精神
意識
前意識
無意識
外部からの
情報
言語・非言語境界面
（シニフィアン/シニフィエ）
意識の境界面（表象）
知覚の境界面
知能と身体の境界面
（仏教で言う：阿頼耶識）

人間の精神
意識
前意識
無意識
外部からの
情報
知能と身体の境界面
（仏教で言う：阿頼耶識）
（シニフィアン/シニフィエ）
意識の境界面
知覚の境界面
意識は常に何かについての意識である。（志向性）
フッサール『イデーン』
我々は知覚によってこの世界に住み着いている。
メルロ＝ポンティ『知覚の現象学』
ソシュール「一般言語学講義」
大乗仏教「阿頼耶識」

人間の精神
意識
前意識
無意識
外部からの
情報
生態学的人工知能
※生態＝環境・身体との
結びつきを考える
伝統的な人工知能
身体知

人間の精神
意識
前意識
無意識
知能
言語による
精神の構造化
外部からの
情報
シニフィアン/シニフィエ
言語回路
（＝解釈）

人間の精神、機械の精神
意識
前意識
識
外部からの
情報
意識
前意識
無意識
外部からの
情報
知覚の境界面
人工知能は、人間の知能を機械に移したもの。

第二章なぜ、今、人工知能技術が
注目されているのか？

この３００年の技術の動向
時間
規模
産業革命
情報革命
ネット革命
知能革命
機械化・自動化（オートメーション化）
電子情報化
オンライン化
知能化
第二次産業革命
電動化
1750 1860 1960 1990 Now…
現代は「知能化」の時代に
入りつつある。
第一次AIブーム第二次AIブーム第三次AIブーム

時間
規模
産業革命
情報革命
ネット革命
知能革命
電子情報化
オンライン化
知能化
電動化
1750 1860 1960 1990 Now…
第一次ＡＩブーム
＝ＡＩ分野の立ち上がりのブーム（専門家の中）。研究の黎明期。
第二次ブーム
＝パーソナルコンピューターの普及。ニューラルネットの改善。
社会にコンピューターが広がって行くとき雰囲気。
第三次ブーム
＝ビックデータの上に学習する人工知能

人工知能がブームになるとき
時間
規模
情報革命
ネット革命
知能革命
電子情報化
オンライン化
知能化
1960 1990 2000
1970 1980 2010

二つの人工知能
IF (s_collison==true)
register_all(s_star);
assign_edge();
assign_vertex();
mix_all();
シンボルによる人工知能
（記号主義）
ニューラルネットによる人工知能
（コネクショニズム）
IBM ワトソン
Gooogle検索
など
AlphaGo
など
http://www.nature.com/nature/journal/v518/n7540/full/nature14236.html

神経素子（ニューロン）とは？
入力
入力
入力
出力
入力
この中にはイオン（電解,Na+,K+）
溶液が入っていて、入力によって電圧が
高まると出力する仕組みになっています。
100mVぐらい
ニューラルネットワーク内シグナル伝達スピード 100(m/sec) … 案外遅い
http://www.brain.riken.go.jp/jp/aware/neurons.html

ニューラルネットを理解しよう② 数学的原理
http://www.pri.kyoto-u.ac.jp/brain/brain/11/index-11.html
医学的知識
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/sozai/ai.html
モデル化
数学的モデル
ニューロン
人工ニューロン
入出力関係のグラフ入出力関係の関数（シグモイド関数）
ニューラルネットワーク
（ニューロンをつなげたもの）
道具はこれで全て。これで何ができるだろう？

深階層ニューラルネットワーク
ニューラルネットワーク＝信号（波形）処理だけで知能を作る。

時間
規模
1960 1990 2000
1970 1980 2010
シンボルによる人工知能は
堅実に進化する

時間
規模
1960 1990 2000
1970 1980 2010
ニューラルネットによる人工知能は、
浮き沈みが激しい。

時間
規模
1960 1990 2000
1970 1980 2010
ニューラルネットによる人工知能は、浮き沈みが激しい。
＝しかし、人工知能がブームになる時は、
必ず改良されたニューラルネットワークが現れる。

社会
機械レイヤー
情報処理レイヤー
人工知能レイヤー

2 第１次AIブーム
時間
規模
情報革命
ネット革命
知能革命
電子情報化
オンライン化
知能化
1960 1990 2000
1970 1980 2010

2 第一次ＡＩブーム（1960年代）
• コンピューターは大型のものしかない。
• 人工知能という分野自体が誕生したばかり。
• ニューラルネットという新しい分野のブーム。
１９世紀後半
人間の脳は
ニューロンという
もので出来てい
るらしい
２０世紀前半
ニューロンの
電気的性質が
解明される
（ホジキン博士、
ハクスレー博士）
1950年代に
ニューラルネット
発明
1963年に
ホジキン＝ハク
スレー方程式が
ノーベル賞

2 第一次ＡＩブーム（1960年代）
もし A ならば B
もし B ならば C
よって、
もし A ならば C
（記号主義）
推論ベースニューラルネット
誕生

3 第二次ＡＩブーム（1980年代）
• パソコンが普及して行く。
• ルールを集めて知能を作ろう。
• 逆伝播法によるニューラルネットのブーム。
パソコンが
世の中で
普及して行く
知識主義
＝
たくさんの知識
を人工知能に
与えて推論
すれば知能が
できる
インターネット
もなく、知識
が足りない。
推論も専門的
な機能のみ。

IF （A） then B
IF （C） then D
IF （E） then F
IF （G） then H
IF （ I ） then J
（記号主義）
ルールベース
新しい学習法＝
逆伝搬法

0 0 0
【逆伝播法】
ここが１になるように、
結合の強さを、
さかのぼって変えて行く。

4 第三次ＡＩブーム（2010年代）
• インターネットが普及して行く。
• インターネットで蓄積されたデータを学習させて
知能を作ろう。
• 改善されたニューラルネットのブーム。
が世の中で
普及して行く
データ
学習主義
＝
たくさんのデー
タを人工知能
に学習させる
現在、進行中

（記号主義）
データベース
新しい学習法＝
ディープラーニング
データベース
検索エンジン
キーワード検索結果
検索
人
次の章で
説明
します

インターネットによる
膨大なデータ
時間
規模
1960 1990 2000
1970 1980 2010
ルールベース
逆伝播法
データベース
ディープ
ラーニング
推論ベース
ニューラル
ネット誕生
小型・中型
コンピュータの普及
大型コンピュータ
専門家のみのブーム

第三章人工知能の各種事例

データの海が人工知能を育てる
• Amazon（協調フィルタリング）
• IBMワトソン
• IBM Watson in みずほ銀行
• AlphaGO
• ソニー「デジタルアナウンサー」
• Nvidia「自動運転」
• 医療用診断データベース

人
人工
知能
「人」の間に人工知能。たとえば予定を自動調整してくれる。
人
いつ空いている？えーと…
予定表予定表
来週の月曜日の
夜どうですか？

Ａｍａｚｏｎ「協調フィルタリング」
ユーザデータ群
（たとえば販売サイト）
A B C ?
評価 5 1 4
A,B,C という映画を購入した人に、
次にどの映画を推薦するべきか？
A B C M
評価 4 2 5 5
同じ購入履歴で、同じような評価をしている
人が高く評価している映画を探して来る。
推薦

IBM ワトソン
ネット上のあらゆるWiki
百科事典データベース
など
りんご赤い 90%
甘い 70%
青森 55%
フランス 40%
果物 32%
…
しぶい 7%
IBMワトソンは、文章の中の語の相関を学習する。
その学習データを用いて、インプットされた語と、
相関の強い言葉をリストアップする。

IBM Watson in みずほ銀行
• オペレーターが顧客の要望を復唱する。
• 言葉に変換
• 自動的に関連するマニュアルを表示する
https://www.change-makers.jp/business/10573
要件クライ
アントさん
IBM
ワトソン
オペレーター
バックアップ

IBM Watson in 東京大学医学部
• 論文を学習させる。
• 論文を積み上げると富士山ぐらいになりそうな勢
い。＝人間では無理。
• 症状を入れると、論文のリストが出て来る。
症状患者さん
IBM
ワトソン
お医者
さんバックアップ

IBM Watson in 保険会社
• 保険会社の判例を学習させる。
• 一人前になるのに数年かかる。
• かつてはベテランが教えていた。
• タブレットからIBMワトソンがアドバイス
事故
内容
クライアン
トさん
IBM
ワトソン
新人
バックアップ

IBM ワトソン
IBMワトソンは、
社内の暗黙知を吸収し蓄積する。

ソニー「デジタルアナウンサー」
• ニュース原稿を流し込む
• エージェント（ＡＩ）が身振り
をまじえて読み上げる。
ソニー、CGキャラがニュースを自動で読み上げる“デジタルアナウンサー”--渋谷で実験
http://japan.cnet.com/news/service/35087113/

AlphaGO
膨大な棋譜のデータ
（人間では多過ぎて
読めない）
この棋譜を
そっくり打てる
ように学習する
自己対戦して
棋譜を貯める
この棋譜を
そっくり打てる
ように学習する
AlphaGO

Deep Q-Learning
Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves,
Ioannis Antonoglou, Daan Wierstra, Martin Riedmiller (DeepMind Technologies)
Playing Atari with Deep Reinforcement Learning
http://www.cs.toronto.edu/~vmnih/docs/dqn.pdf
画面を入力
操作はあらかじめ教える
スコアによる強化学習

二つの人工知能
IF (s_collison==true)
register_all(s_star);
assign_edge();
assign_vertex();
mix_all();
（シンボリズム））
IBM ワトソン
など
AlphaGo
など

学習過程解析
Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves,
Ioannis Antonoglou, Daan Wierstra, Martin Riedmiller (DeepMind Technologies)
Playing Atari with Deep Reinforcement Learning
http://www.cs.toronto.edu/~vmnih/docs/dqn.pdf

• Pπ ロールアウトポリシー（ロールアウトで討つ手を決める。
Pπ（a|s） sという状態でaを討つ確率）
• Pσ Supervised Learning Network プロの討つ手からその
手を討つ確率を決める。Pσ（a|s）sという状態でaを討つ確
率。
• Pρ 強化学習ネットワーク。Pρ（学習済み）に初期化。
• Vθ(s’) 局面の状態 S’ を見たときに、勝敗の確率を予測
する関数。つまり、勝つか、負けるかを返します。
Mastering the game of Go with deep neural networks and tree search
https://deepmind.com/research/alphago/

Mastering the game of Go with deep neural networks and tree search
https://deepmind.com/research/alphago/

あから２０１０
激指 YSS
合議
Bonanza
GPS
将棋
あから2010合議サーバログを可視化してみた（A Successful Failure）
http://blog.livedoor.jp/lunarmodule7/archives/1121781.html

Nvidia「自動運転」
• 専用のグラフィックボードを
開発
• 市場へ向けて投入
• 高速道路用など用途別。
http://www.nvidia.co.jp/object/drive-px-jp.html

http://www.nvidia.co.jp/object/drive-automotive-technology-jp.html

• 人間には扱えないような大きなデータから、
• 人間では気づかない特徴を学習している。
学習する人工知能から学ぶこと
• さらに人間の解釈を通過することなく、
• 直接サービスやアクションを展開する
（当然アマゾンの開発者は我々に何を推薦してい
るか知らない）

学習する人工知能から学ぶこと
ユーザー
データ
AI

第三章まとめ
• 人工知能は、オートメーションの新しい姿。
• 人間に近い領域までオートメーションする。
• だから人間には脅威を感じる。
• だからそれは、「社会インフラ」の新しい形で
もある。

第四章人工知能の発展の方向

時間
規模
産業革命
情報革命
ネット革命
知能革命
電子情報化
オンライン化
知能化
電動化
1750 1860 1960 1990 Now…
現代は「知能化」の時代に
入りつつある。

人工知能と社会
ロボット
世代
人口
人工知能
少子高齢化社会
ロボットと人工知能で
少子高齢化社会を支える

エンジニアリングとしての人工知能の
二つのアプローチ
人工知能を作る
(キャラクターAI、ロボット…)
既にあるものを知能化する
(家電、電車、ポスター、なんでも…)

知能化
• 工場 → （知能化） → オートスケジューリング
• 配送 → （知能化） → 自動分配・自動配送
• 車 → （知能化） → 自動走行・ＩＴＳ
• 家電 → （知能化） → コミュニケーション家電（ルンバなど）
• インターネット → （知能化） → Web.4.0 (GoogleのDeep Learning など)
• TV → （知能化） → キーワード・趣向による自動録画
• 注文サービス → （知能化） → 自動受付・自動サービス
社会の隅々にまで、知的機能がインプリメント（実装）される。
知能化

知能化
社会の隅々にまで、知的機能がインプリメント（実装）される。
知能化現実世界
（～1995）
現実世界
2.0
（2015～）

エンジニアリングとしての人工知能の
二つのアプローチ
人工知能を作る
(キャラクターAI、ロボット…)
既にあるものを知能化する
(家電、電車、ポスター、なんでも…)
いきなり、人工知能を作ることは難しい。
まずは「知能化」を考えてみましょう。

http://static.flickr.com/5051/5525304279_65012a492c_s.jpg
？
http://flopdesign.com/download/Human_S/pages/B50.html
？

人間の知能の形/人工知能の知能の形
人間（生物）の知能＝総合的知能
一つの知能がいろんなことをできる
お料理できる
将棋が打てる
目的地へ行ける
何でもできる可能性を
持つ総合知性

AlphaGO
＝囲碁しか打てない
＝人間より強い
ナビ
＝目的地へのルート
＝とても正確
お掃除ロボット
＝お掃除しかできない
＝ 24時間掃除
IBM ワトソン
＝記号の統計情報しかない
＝何百万行のテキストの関係を記憶
お料理ロボット
＝お料理しかできない
＝何万と言うレシピ
人工知能＝専門的知能
一つのことしかできない。

お料理ロボット
＝お料理しかできない
AlphaGO
＝囲碁しか打てない
ナビ
＝目的地へのルート
お掃除ロボット
＝お掃除しかできない
IBM ワトソン
＝記号の統計情報しかない
＝何百万行のテキストの関係を記憶
人工知能＝専門的知能
一つのことしかできない。一つのことがとても（人間より）得意。

時間（イメージ）
空間（論理）
殆どの人工知能は与えられたフレーム（問題設定）の
外に出ることはできない。
人間は柔軟にフレーム（問題設定）を創造し
変化させることができる。
人間と人工知能の違い

機械
人間はどのように人工知能を
発展させて来たか？
記号
自然
言語
概念
人間
AI
意味
言葉
情報画像
範疇
判別
イメー
ジ
意味
映像
判別
時系
列
流れ
意味
Deep Learning

機械
人間はどのように人工知能を
発展させて来たか？
記号
自然
言語
概念
人間
AI
意味
言葉
情報画像
範疇
判別
イメー
ジ
意味
映像
判別
時系
列
流れ
意味機械（マシン）が得意なこと（＝情報処理、画像処理、映像処理）と、
人間が得意なこと（＝概念、イメージ、想像）は正反対。

時間
規模
産業革命
情報革命
ネット革命
知能革命
電子情報化
オンライン化
知能化
電動化
1750 1860 1960 1990 Now…
第一次、第二次ブームにはなくて、第三次ブームにあるもの。
それはインターネットをなどを介して蓄積されたデータである。
第三次ブームの人工知能は、膨大なデータを温床として学習
することで生成される。

）
人工
知能
人はどのように人工知能を使っているか？
情報の海を母体として、人工知能が育っている。
＝情報の海を母体として人工知能が生まれる
人間
記号の海
言葉の海
意味の海
概念の海
情報の海

情報の海
（ネットワーク）
ネット空間の人工知能
人間
検索エンジンがあるおかげで、かろうじて人間は情報の世界を渡ることができる。
検索エンジン
（Googleなど）

新しい現実空間
人工知能
クラウド
現実世界
（～1995）
人工知能による新しい空間
パソコン
現実がデジタル空間を内包していたはずが、
内包したデジタル空間が現実を変化させて行く。

新しい現実空間
クラウド
現実世界
（～1995）
人工知能による新しい空間
パソコン
新しい現実空間さらに、キーワードは「実世界指向」
ソフトウェアは身体を持って現実に出る。
それは現実世界を変貌させて行く。
「現実世界 2.0」

IT技術による新しい現実空間のサービス（新規）
ネット空間
現実空間
クラウド/人工知能
進出・
浸食
ロボット
実空間
センシング
ドローン
IoT
現在起こっていること～ネット空間から現実空間への回帰
ゲーム空間
人工知能
https://www.ingress.com

情報空間の拡大
～人工知能の舞台が広がる
http://www.s-hoshino.com

• やがて街全体が情報空間になる。

• やがて街全体を制御する人工知能が出現する。

• やがて街全体を制御する人工知能が出現する。
• やがて家全体を制御する人工知能が出現する。

飽和したネット空間のサービス競争（飽和）
ネット空間
現実空間
進出・
浸食
ロボット
実空間
センシング
ドローン
IoT
現在起こっていること～ネット空間から現実空間への回帰
ゲーム空間
人工知能
新しい
現実空間の
誕生
https://www.ingress.com
@2010-2015 SQUARE ENIX CO., LTD. All Rights Reserved.

飽和したネット空間のサービス競争（飽和）
ネット空間
現実空間
進出・
浸食
ロボット
実空間
センシング
ドローン
IoT
現実世界とデジタル世界をまたぐゲーム空間
ゲーム空間
人工知能
デジタル世界の人工知能
現実世界の人工知能
未開拓
成熟
巨大な内部空間
巨大な外部空間
新しい
人工知能の
誕生
我々は、
デジタル空間＝現実空間にまたがる
巨大な人工知能を作り出そうとしている。

第五章ゲームAIと人工生命

FC SFC SS, PS PS2,GC,Xbox Xbox360, PS3, Wii
DC （次世代）Hardware 時間軸20051999
ゲームの進化と人工知能
複雑な世界の
複雑なＡＩ
ゲームも世界も、ＡＩの身体と内面もますます複雑になる。
単純な世界の
シンプルなＡＩ
（スペースインベーダー、タイトー、1978年）（アサシンクリード、ゲームロフト、2007年）

(例) スペースインベーダー(1978)
プレイヤーの動きに関係なく、決められた動きをする
（スペースインベーダー、タイトー、1978年）

（例）プリンス・オブ・ペルシャ
「プリンス・オブ・ペルシャ」など、
スプライトアニメーションを用意する必要がある場合、
必然的にこういった制御となる。
（プリンスオブペルシャ、1989年）

原始の海＋光＋熱＋稲妻
http://us.123rf.com/400wm/400/400/anterovium/anterovium1102/anterovium110200037/8952668-light-beams-from-ocean-surface-penetrate-underwater-through-deep-blue-sea.jpg

ユーリーミラーの実験
ガスから生命の構成要素であるアミノ酸を合成した。
ハロルド・ュ―リーの研究室で、スタンレー・ミラーが実験（1953年）
http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB:Miller-Urey_experiment_JP.png

極性頭部非極性尾部
水と仲良し水と溶けあえない
（参考）永田和宏「生命の内と外」（「考える人」（Vol.45））

原始の海で構造化＝外と内の形成
外
内
Energy

http://28275116.at.webry.info/201005/article_7.html

エントロピーの法則
時間
エネルギー
もしエネルギーが流入しなければ、その系のエントロピー（雑然さ）は増大する。

構造のヒステリシス
Energy
生物＝エネルギーが高い状態で
ひっかかっている。
なぜ？
構造のヒステリシス

世界
外と内の交流
エネルギーE をゲット
アクション・老廃物
極めてメカニカルな次元。

世界
外と内の交流＝非平衡系
エネルギーE をゲット
アクション・老廃物
内部構造を持つ。
（そして内部構造が維持される）

世界
外と内の交流＝非平衡系
INPUT
OUTPUT
代謝機能（内部処理）

散逸構造とは？
http://www.jst.go.jp/pr/announce/20090522/
http://www.applc.keio.ac.jp/~asakura/asakura_j/dissipative.html
散逸構造は非平衡系であり、ゆらぎを成長させ、系の自己組織化を促す。
ベナールセル
https://www.youtube.com/watch?v=UhImCA5DsQ0

世界
外と内の交流＝散逸構造
INPUT
OUTPUT
代謝機能

テセウスの船（パラドックス）
船の老朽化した部分を、新しい木に入れ替えているうちに、
全部を入れ替えてしまった。
はたしてこの船は元の船と同一のものであろうか？
http://img02.hamazo.tv/usr/j/a/g/jagr/629.jpg

テセウスのパラドックス
物質的構成＝循環する
物質によらず不変なもの構造

物質的構成＝循環する
物質によらず不変なもの構造情報

だから、こう言える。
生物は物質的存在であると同時に、
情報的存在でもあるのだ。

物質
情報
情報
物質
生物は、情報的存在であり、同時に物質的な存在である。
物質は情報に存在を与え、情報は物質に構造を与える。

情報と物質
情報
物質
生物は、情報的存在であり、同時に物質的な存在である。
物質は情報に存在を与え、情報は物質に構造を与える。

「情報と物質」から「精神と身体」へ
情報
物質
精神・知性
身体

精神と身体、そして進化
情報
物質
精神・知性
身体
進化

世界
外と内の交流＝散逸構造
INPUT
OUTPUT

世界
物質的循環
物質
物理的INPUT
物理的OUTPUT
生理的代謝機能

世界
情報的循環
情報INPUT
INFORMATION
OUTPUT
INFORMATION
情報処理＝情報代謝
（つまり思考）
物質的存在としての身体がそうであるように、情報的存在として人間は、
情報を摂取し、記憶し（＝情報体としての自分を組み換え）、情報をアウトプット・排泄する。

世界
情報的・物質的循環
物質
物理的OUTPUT
代謝機能情報INPUT
INFORMATION
OUTPUT
INFORMATION
生理的代謝機能
物理的INPUT

世界
情報的循環
情報INPUT
INFORMATION
＝センサー
OUTPUT
INFORMATION
＝エフェクター
＝意志決定
物質的存在としての身体がそうであるように、情報的存在として人間は、
情報を摂取し、記憶し（＝情報体としての自分を組み換え）、情報をアウトプット・排泄する。

情報
物質
精神・知性
身体
人工知能
ハードウェア

情報
物質
精神・知性
身体
人工知能
ハードウェア
知能は生き物の情報的側面である。

ユクスキュルの生物学

問い
生き物の「視る」とカメラの「視る」は
どう違うだろうか？
http://www.free-picture.net/reptiles/lizards/chameleon-wallpapers.jpg.html
生物の持つ目は、生物の知能と身体と深く結びついている
能動的な眼であり、
カメラは使用者の意思に従う受動的な眼である。

主体と客体はどう結ばれるか？
客体
（対象）
関係がない
http://sozai-free.com/sozai/00992.html

客体
（対象）
関係がない

関係がある
http://illpop.com/png_insecthtm/aquatic_a02.htm

客体
（対象）
関係がある

客体
（対象）
関係がある知覚作用

機能環
実行器受容器
知覚と作用で客体を“つかんでいる“
客体
作用器官知覚器官
“現実”（主観世界）の構成要素
ユクスキュル/クリサート「生物から見た世界」（岩波文庫）
知覚世界作用世界

機能環
効果器
受容器
知覚と作用で客体を“つかんでいる“
客体
“現実”（主観世界）の構成要素
ユクスキュル/クリサート「生物から見た世界」（岩波文庫）
知覚世界活動世界
作用器官知覚器官

機能環
効果器受容器
客体
活動神経網知覚神経網
前野佳彦訳・ユクスキュル「動物の環境と内的世界」（みすず書房）
知覚微表担体
対象化された機構
活動担体
内的世界

環世界のスキーム（機能環）
効果器受容器
客体
知覚微表担体
活動担体
内的世界
知覚微表（Merkmal）＝客体から送られてくるさまざまな刺激
知覚微表担体（Merkmaltrager）
＝客体に備わる刺激を発する諸特質
活動担体（Wirkungstrager）
＝客体の捕捉領域になりうる諸特質

環世界のスキーム（機能環）
効果器受容器
客体
知覚微表担体
活動担体
内的世界
受容器
＝一定の刺激を受け取る
＋
定められた刺激以外のすべての刺激を捨象する
（知覚の統一性）

機能環
効果器受容器
客体
知覚微表担体
活動担体
内的世界

世界無限
こうした諸々の機能環によって、すべての動物の、その固有の環境と
緊密に連結される。ユクスキュル「動物の環境と内的世界」(原著：1921, 前野佳彦訳:2012)

環世界のイメージ
環世界＝「かたつむりの殻」のように、生物それぞれが持ちつつ、
それが世界であり、それ以外の世界へ逸脱できない世界。

エージェント・アーキテクチャ
WORLD
INTELLIGENCE
センサーエフェクター
認識
Knowledge
Making
意志決定
Decision
Making
運動
Motion
Making
記憶体 Memory
情報体としての知能のカタチ

WORLD
INTELLIGENCE
認識
Knowledge
Making
意志決定
Decision
Making
運動
Motion
Making
記憶体 Memory
情報の循環＝インフォメーション・フロー

WORLD
INTELLIGENCE
認識
Knowledge
Making
意志決定
Decision
Making
運動
Motion
Making
記憶体 Memory
「情報の循環＝インフォメーション・フロー」は物質の循環の情報版。
これによって知性は自己を情報的に自己組織化できる。やはり知性も散逸構造である。

レベル
ナビゲーション
AI
メタAI
キャラクター
AI
エージェントを動的に配置
レベル状況を監視
エージェントに指示
ゲームの流れを作る
自律的な判断
仲間同士の協調
時にチームＡＩとなる
メタAI, キャラクターAIの為に
レベルの認識のためのデータを準備
オブジェクト表現を管理
ナビゲーション・データの管理
パス検索 / 位置解析
Support
敵キャラクタ－
プレイヤー
頭脳として機能
情報獲得
コントロール
現代ゲームAIの仕組み
http://dear-croa.d.dooo.jp/download/illust.html
http://www.anne-box.com/

３Ｄゲームの中のＡＩ
Halo
（ＨＡＬＯ、バンジー、2001年）デバッグ画面
The Illusion of Intelligence - Bungie.net Downloads
http://downloads.bungie.net/presentations/gdc02_jaime_griesemer.ppt

Intelligence
World
センサー
Information Flow
エフェクター
Agent Architecture

知能の世界
環境世界
認識の
形成
記憶
センサー・
身体
記憶体
情報処理過程
情報
統合

知能の世界
環境世界
認識の
形成
記憶
意思の
決定
センサー・
身体
意思決定
モジュール
意思決定
モジュール
意思決定
モジュール
記憶体
情報処理過程
情報
統合

知能の世界
環境世界
認識の
形成
記憶
意思の
決定
身体
制御
エフェクター・
身体
運動の
構成
センサー・
身体
意思決定
モジュール
意思決定
モジュール
意思決定
モジュール
記憶体
情報処理過程運動創出過程
身体部分
情報
統合
運動
統合

知能の世界
環境世界
認識の
形成
記憶
意思の
決定
身体
制御
身体
運動の
構成
センサー・
身体
意思決定
モジュール
意思決定
モジュール
意思決定
モジュール
対象・
現象
情報の流れ（インフォメーション・フロー）
影響を与える影響を受ける

サブサンプション・アーキテクチャ（ロドニー・ブルックス）
INPUT OUTPUT
時間
情報抽象度
反射的に行動
少し場合ごとに対応
抽象的に思考
理論的に考える
= 自意識の構築化
Subsumpution Architecture
運動の実現のプロセス
= 身体運動の生成

ルンバ（iRobot社）
http://chihoko777.exblog.jp/12567471/

環境世界
認識の
形成
記憶
意思の
決定
身体
制御
エフェクター・身体
運動の
構成
センサー・身体
意思決定
モジュール
意思決定
モジュール
意思決定
モジュール
記憶体
身体部分
情報
統合
運動
統合
「構成的自己＝知能」
の形成（創造）
存在（身体・記憶）
自分のコア
受け渡し
自我を安定させる
自分を時間と世界
に投げ出す

メタＡＩの歴史
1980 1990
メタＡＩというのは、ゲームそのものに埋め込まれたＡＩ。
1980 1990 2000
古典的メタAI
現代のメタＡＩ
キャラクターＡＩ技術の発展

メタＡＩの歴史
1980 1990 2000
古典的メタAI
現代のメタＡＩ
キャラクターＡＩ技術の発展
その歴史は古く、1980年代にまでさかのぼる。
その時代と現代のメタＡＩは、異なる点も多いので、
古典的メタＡＩ、現代のメタＡＩと名づけて区別することにしよう。

（例）「ゼビウス」（ナムコ、1983）
敵出現テーブル巻き戻し
敵0
敵１
敵2
敵3
敵4
敵5
『あと面白い機能なんですけれど、ゼビウスには非常に簡単なAIが組み込まれています。
「プレイヤーがどれくらいの腕か」というのを判断して、出てくる敵が強くなるんです。
強いと思った相手には強い敵が出てきて、弱いと思った相手には弱い敵が出てきます。そういっ
たプログラムが組み込まれています。ゲームの難易度というのは「初心者には難しくて、上級者
には簡単だ」ということが、ひとつの難易度で(調整を)やっていくと起きてしまうので、その辺を何
とか改善したいな、ということでそういったことを始めてみたのですけれど、お陰で割合にあまり上
手くない人でも比較的長くプレイできる、うまい人でも最後のほうに行くまで結構ドラマチックに楽
しめる、そういった感じになっています。』
－遠藤雅伸（出演）、1987、「糸井重里の電視遊戯大展覧会」『遠藤雅伸ゼビウスセミナー』フジテレビ－
ゼビウス

現代のメタAI
より積極的にゲームに干渉する。
メタAI
敵配位敵スパウニングストーリー
レベル
動的生成
ユーザー

メタＡＩ Left 4 Dead の事例
Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and
Interactive Digital Entertainment Conference at Stanford.
http://www.valvesoftware.com/publications.html
今回は Left 4 Dead の事例を見てみる。

適応型動的ペーシング
[基本的発想]
(1) ユーザーがリラックスしている時に、ユーザーの
緊張度が一定の敷居を超えるまで敵をぶつけ
続ける。
(2) ユーザーの緊張度が一定の緊張度を超えると
敵を引き上げる。
(3) リラックスすると敵を出現し始める（(１)へ）。
Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and
Interactive Digital Entertainment Conference at Stanford.

メタAI(=AI Director)によるユーザーのリラックス度に応じた敵出現度
ユーザーの緊張度
実際の敵出現数
計算によって
求められた
理想的な敵出現数
Build Up …プレイヤーの緊張度が目標値を超えるまで
敵を出現させ続ける。
Sustain Peak … 緊張度のピークを3-5秒維持するために、
敵の数を維持する。
Peak Fade … 敵の数を最小限へ減少していく。
Relax … プレイヤーたちが安全な領域へ行くまで、30-45秒間、
敵の出現を最小限に維持する。
Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and Interactive Digital Entertainment Conference at Stanford.
より具体的なアルゴリズム

メタＡＩがゲームを認識する方法
キャラクター用に作成された
ナビゲーションメッシュを
メタＡＩがゲームの
状況を認識するために使用する。

メタAIが作用を行う領域
メタＡＩが作用（敵の生成・
消滅）を行う領域を、
AAS（= Active Area Set）と
言う。

メタAIが作用を行う領域
(AAS=Active Area Set)

安全な領域までの道のり(Flow Distance)
メタＡＩはプレイヤー群の経路を
トレースし予測する。
- どこへ来るか
- どこが背面になるか
- どこに向かうか

プレイヤーからの可視領域
可視領域（プレイヤーから見えている
部屋）では、敵のスパウニング（発生）
はできない。

敵出現領域
背後前方
前方と背後のプレイヤー群から見えてない部屋に、
モンスターを発生させる。

まとめ
メタＡＩは、ゲームの流れを動的に作るＡＩで、キャラクターＡＩ、イベントなどに
は命令だけを出す。これは明確に、メタＡＩと他のモジュールが独立した関
係にあるから可能なこと。

メタAIまとめ
メタＡＩは、ゲームの流れを動的に作るＡＩで、キャラクターＡＩ、イベントなど
には命令だけを出す。これは明確に、メタＡＩと他のモジュールが独立した
関係にあるから可能なこと。

フィールド
３つのＡＩの連携の例
ナビゲーション
AI
メタAI
キャラクターAI
状況を監視し、キーとなる役割を
適切なタイミングでエージェントに
指示する。
自律的な判断。
仲間同士の協調
地形を解析する
目的に応じた点を見つけ出す
目的地までのパスを計算する
Support
エージェントが自律的に戦闘・協調しつつ、ナビゲーションAIが
戦術的ポイントを教え、メタAIは、全体の戦闘の流れを作る。

ネットワーク上のグラフ検索法
ダイクストラ法
M
F
L
B
A
Ｓ
O
P
D
C
G
S
V
H
Q
X
K
N
J
R
T
W
E
I
U
Z
Y
Ｇ
54
6 3
7 23
B C
3
G
D E
3
2 24
L
3
3
5
5
J
F
出発点（S）を中心に、最も短い経路
を形成して行く。Gにたどり着いたら終。
各ノードの評価距離＝出発点からの経路

ネットワーク上のグラフ検索法
A*法
M
F
L
B
A
Ｓ
O
P
D
C
G
S
V
H
Q
X
K
N
J
R
T
W
E
I
U
Z
Y
Ｇ
54
6 3
7 23
B C
3
3
2 24 3
5
5
出発点（Ｓ）を中心に、
そのノードまでの
最も短い経路を
形成して行く。
Gにたどり着いたら終了。
ゴール地点がわかっている場合、現在のノードとゴール
との推定距離（ヒューリスティック距離）を想定して、
トータル距離を取り、それが最少のノードを探索して行く
各ノードの評価距離＝出発点からの経路＋ヒューリスティック距離
ヒューリスティック距離
(普通ユークリッド距離を取る)
3+14.2 3+13.8
G H
3
5+10.5 6+8.4

パス検索とは
現在の地点から指定したポイントへの経路を、
リアルタイムで計算して導く技術。
RTS - Pathfinding A*
https://www.youtube.com/watch?v=95aHGzzNCY8

Counter Strike: Path Following (デモ)
The Official Counter-Strike Bot
http://aigamedev.com/insider/presentation/official-counter-strike-bot/

3次元パス検索
ARMORED CORE V のパス検索（CEDEC 2011）
https://cedil.cesa.or.jp/cedil_sessions/view/593
株式会社フロム・ソフトウェア技術部
岡村信幸

3次元パス検索
岡村信幸「ARMORED CORE V のパス検索（CEDEC 2011）」

キャラクターＡＩ：意思決定
知能とは何か？

環境
人工知能とは？
身体
人工知能＝人工的な存在（＝身体）を環境の中で活動させる
入力（センサー）行動（アウトプット）
知能

知能の内部世界
環境世界
身体
センサー・
身体

思考
環境世界
身体
センサー・
身体
記憶

環境世界
認識の
形成
記憶
センサー・
身体
記憶体
情報処理過程
情報
統合
記憶

環境世界
認識の
形成
記憶
意思の
決定
センサー・
身体
意思決定
モジュール
意思決定
モジュール
意思決定
モジュール
記憶体
情報処理過程
情報
統合
記憶

環境世界
認識の
形成
記憶
意思の
決定
身体
制御
身体
運動の
構成
センサー・
身体
意思決定
モジュール
意思決定
モジュール
意思決定
モジュール
記憶体
身体部分
情報
統合
運動
統合
記憶

知能の世界
環境世界
認識の
形成
記憶
意思の
決定
身体
制御
身体
運動の
構成
センサー・
身体
意思決定
モジュール
意思決定
モジュール
意思決定
モジュール
対象・
現象
情報の流れ（インフォメーション・フロー）
影響を与える影響を受ける
記憶

意思決定モデル
ステート（状態）ベースAI
ゴール（目標）ベースAI
ルール（規則）ベースAI
ビヘイビア（振る舞い）ベースAI
意思決定というものは非常に高度で複雑なプロセスです。
でも、ゲームで用いるいくつかの簡易モデルが存在します。
シミュレーションベース AI
ユーティリティ（効用）ベース AI
Rule-based AI
State-based AI
Behavior-based AI
Goal-based AI
Utility-based AI
「○○-based AI」とは、○○をAIを構築する基本単位として採用したＡＩということ。
タスク（仕事）ベース AI
Task-based AI
意思決定
Simulation-based AI

ステートマシン入門

ステートベース
ステート自分の行動を記述する。
ステートステート
遷移条件
世界と自己の変化を記述する。

ステート・マシン
ステート
ステートステート
ステートマシン（有限状態マシン）
ステートに自分への命令、遷移条件に世界と自分の状況の変化を書く。
ループ構造により、フィードバック構造はない。

ステート・マシン
ステートマシン（有限状態マシン）
ステートに自分への命令、遷移条件に世界と自分の状況の変化を書く。
ループ構造により、フィードバック構造はない。
待機
攻撃パトロール

警戒
追跡
追いかける
攻撃する
威嚇攻撃
味方に指示
出口をかためる
味方を呼ぶ
味方がいない
かつ
戦闘範囲外
味方と合流
味方と合流
味方がいる
見失う
見える
見失う見つける
巡回する
１０秒経つ
物音を
聴く
応答がきた
階層型ステート・マシン

(例) Quake HFSM
状態遷移図を用いる
http://ai-depot.com/FiniteStateMachines/FSM-Practical.html

階層型ゴール指向型プランニングとは？

一つのゴールはより小さなゴールから組み立てられる
Goal
Goal Goal Goal

ゴールはより小さなゴールから組み立てられる
Goal
Goal Goal Goal
Goal
Goal
Goal Goal Goal

ゴール指向アクションプランニングとは？

F.E.A.R.のプランニング
シンボルによる連鎖プランニング
ターゲットＡが
死んでいる
ターゲットＡが
死んでいる
攻撃
武器が装填
されている
武器が装填
されている
装填する
武器を
持っている
武器を
持っている
武器を拾う
条件なし
プラナー
プランニング
Jeff Orkins, Three States and a Plan: The AI of FEAR
http://alumni.media.mit.edu/~jorkin/gdc2006_orkin_jeff_fear.pdf

計画を立てるＡＩ/計画を変更するＡＩ
Jeff Orkins, Three States and a Plan: The AI of FEAR
http://alumni.media.mit.edu/~jorkin/gdc2006_orkin_jeff_fear.pdf

ユーティリティ・ベース
• ユーティリティ・ベースは高度に抽象的な戦術
決定の方法。
• 世界をモデル化し、評価すべき行動群の効用
（ユーティリティ）を数値に還元する。

The Sims シリーズのＡＩの作り方
人をダイナミクス（力学系、動的な数値の仕組み）として動かす。
世界を動かす PeerAI(=キャラクターＡＩ) を構築。
Sub
Peer
Meta
Meta
Peer
Sub
[原則] 周囲の対象に対する、あらゆる可能な行動から、
ムード（幸せ）係数を最大化する行動を選択する。
Sims (not under direct player control) choose what to do by selecting, from all of the
possible behaviors in all of the objects, the behavior that maximizes their current happiness.
Will Wright, AI: A Design Perspective (AIIDE 2005)
http://www.aaai.org/Papers/AIIDE/2005/AIIDE05-041.ppt
Kenneth Forbus, Will Wright, “Some notes on programming objects in The Sims – Example”
http://www.qrg.cs.northwestern.edu/papers/Files/Programming_Objects_in_The_Sims.pdf

The Sims における「モチーフ・エンジン」
Ken Forbus, “Simulation and Modeling: Under the hood of The Sims” (NorthWerstern University)
http://www.cs.northwestern.edu/%7Eforbus/c95-gd/lectures/The_Sims_Under_the_Hood_files/frame.htm
Data
- Needs
- Personality
- Skills
- Relationships Sloppy - Neat
Shy - Outgoing
Serious - Playful
Lazy - Active
Mean - Nice
Physical
- Hunger
- Comfort
- Hygiene
- Bladder
Mental
- Energy
- Fun
- Social
- Room
Motive Engine
Cooking
Mechanical
Logic
Body
Etc.
AIの人格モデル

最適（＝最大効用）な行動を選択する
Hunger +20
Comfort -12
Hygiene -30
Bladder -75
Energy +80
Fun +40
Social +10
Room - 60
Mood +18
Toilet
- Urinate (+40 Bladder)
- Clean (+30 Room)
- Unclog (+40 Room)
Mood +26
Bathtub
- Take Bath (+40 Hygiene)
(+30 Comfort)
- Clean (+20 Room)
Mood +20
[原則] 周囲の対象に対する、あらゆる可能な行動から、
総合的な効用（＝Mood）を最大化する行動を選択する。

ムードの計算方法と各パラメーターのウェイトグラフ
Mood = W_Hunger(X_Hunger) * X_Hunger + W_Engergy(X_Energy) * X_Energy + …
-100 0 100 -100 0 100
-100 0 100 -100 0 100
-100 0 100 -100 0 100
-100 0 100 -100 0 100
W_Hunger W_Energy
W_Comfort W_Fun
W_Hygiene
W_Social
W_Bladder W_Room

効用(Utility)の計算の仕方
W_Hunger
X_Hunger
W_Hunger(-80)
-80 60
W_Hunger(60)

効用(Utility)の計算の仕方
W_Hunger
X_Hunger
W_Hunger(-80)
-80 60
W_Hunger(60)
Hunger degree at -80 ＝ W_Hunger(-80)*(-80)
Hunger degree at 60 ＝ W_Hunger(60)*(60)
Δ ＝ W_Hunger(60)*(60) - W_Hunger(-80)*(-80)
Utility for hunger

限界効用逓減の法則
X_Hunger
W_Hunger(-80)
-80 60
W_Hunger(60)
Δ（-80 → 60）＝W_Hunger(60)*(60) - W_Hunger(-80)*(-80)
Δ (60→90）＝W_Hunger(90)*(90) - W_Hunger(60)*(60)
90
W_Hunger(90)
Δ（-80 → 60） is much larger than Δ(60→90）
ある程度満たされたものを満たすより、
満たされないものをある程度満たす方が大きな満足をもたらす
Utility for hunger
ビールは一杯目が一番おいしい

The Sims 3 では、多くのムードや欲求が準備される。
行動対象
GDC09 資料 http://www.gdcvault.com/play/1452/(307)-Breaking-the-Cookie-Cutter

アフォーダンスとユーティリティ
並木幸介
[CEDEC]ぽかぽかアイルー村における、アフォーダンス指向のAI事例。AIに多様な振
る舞いをさせる手法 http://cedil.cesa.or.jp/session/detail/697

参考文献
三宅陽一郎
「ディジタルゲームにおける
人工知能技術の応用の現在」
(19ページ)
（人工知能学会誌、2015）
※ＰＤＦをダウンロードできます。
http://id.nii.ac.jp/1004/00000517/

意思決定モデル
ゴール（目標）ベースAI
ルール（規則）ベースAI
ビヘイビア（振る舞い）ベースAI
意思決定というものは非常に高度で複雑なプロセスです。
でも、ゲームで用いるいくつかの簡易モデルが存在します。
シミュレーションベース AI
ユーティリティ（効用）ベース AI
Rule-based AI
State-based AI
Behavior-based AI
Goal-based AI
Utility-based AI
「○○-based AI」とは、○○をAIを構築する基本単位として採用したＡＩということ。
タスク（仕事）ベース AI
Task-based AI
意思決定
Simulation-based AI
ステート（状態）ベースAI

ビヘイビアツリー入門

root
バトル
撤退
休憩
攻撃
隠れる
逃走する
足止めする
立ち止まる
回復する
トラップ
眠る
回復薬を飲む
弓を放つ
剣を振る
森に潜む
穴を掘る
建物に隠れる
攻撃魔法
氷系
風系プライオリティ
プライオリティ
シークエンス
シークエンス
ランダム
ランダム
ランダム
ビヘイビア
（末端ノード）
層
層
選択ルール
選択ルール

root
バトル
撤退
休憩
攻撃
隠れる
逃走する
足止めする
立ち止まる
回復する
トラップ
眠る
回復薬を飲む
弓を放つ
剣を振る
森に潜む
穴を掘る
建物に隠れる
攻撃魔法
氷系
シークエンス
シークエンス
ランダム
ランダム
ランダム
ビヘイビア
層
層
選択ルール
選択ルール
この層の中で実行可能なうち、
最も優先度の高いノードを実行する

root
バトル
撤退
休憩
攻撃
隠れる
逃走する
足止めする
立ち止まる
回復する
トラップ
眠る
回復薬を飲む
弓を放つ
剣を振る
森に潜む
穴を掘る
建物に隠れる
攻撃魔法
氷系
シークエンス
シークエンス
ランダム
ランダム
ランダム
ビヘイビア
層
層
選択ルール
選択ルール
この層の中で実行可能なノードを
順番に実行する。

root
バトル
撤退
休憩
攻撃
隠れる
逃走する
足止めする
立ち止まる
回復する
トラップ
眠る
回復薬を飲む
弓を放つ
剣を振る
森に潜む
穴を掘る
建物に隠れる
攻撃魔法
氷系
シークエンス
シークエンス
ランダム
ランダム
ランダム
ビヘイビア
層
層
選択ルール
選択ルール
この層の中で実行可能なノードを
ランダムに一つ実行する。

Behavior Tree Architecture of
Spec Ops: The Line
Vienna Game/AI Conference 2012
Behavior Workshop

The Game
• Spec Ops: The Line – AAA Third-Person Shooter for Xbox 360, PS3, PC
• We are Daniel Kollmann and Jörg Reisig ( YAGER Development / Berlin )

Behavior Trees in SOTL
Summary:
• No separation between Evaluation and Execution
• Parallel processing of nodes
• Loops and decorators
• Synchronization points for groups
• Events drive the evaluation, reactive

• No separation between Evaluation and Execution
Evaluation aborts currently executed action
No Evaluation while an action is being executed
Composite
Condition
Actions

• Parallel processing of nodes
Stack can have multiple top nodes
All children of a parallel are updated one after another Run in parallel

• Loops
Loops keep triggering their child until a certain
condition is met.
• Decorators
Decorators are active as long as their child
is running.
Keep pushing the child
Apply effect/buff

• Gates
Gates placed react to counters stored for
individual AIs, squads or globally.
Check counter
Increment counter

• Events and impulses
Any node in the stack can be the target of an event. When the event fires the
tree jumps back to that node.
An impulse checks if a certain event was fired not long ago. If an impulse is not
active, it is completely ignored and does not return any result.
Jump here
Do this

Jump here
Do this

• Events and impulses
Events can also be blocked
in a branch.
Jump here
Do not react to any following need for cover
Do this

Final conclusion ....
• The event system always aborts active nodes even when not doing
anything. Being able to specify some conditions would be nice.
• Parallels sort of allow you to create your own behaviour nodes, instead
have no parallels and build biggers nodes.
• Gates are really useful if used in the right places. For more complex stuff
rather do a dedicated node.

強化学習（例）
強化学習
（例）格闘ゲーム
キック
パン
チ
波動
R_0 : 報酬＝ダメージ
http://piposozai.blog76.fc2.com/
http://dear-croa.d.dooo.jp/download/illust.html

強化学習
（例）格闘ゲームTaoFeng におけるキャラクター学習
Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela Applied Games Group,Microsoft Research Cambridge
"Forza, Halo, Xbox Live The Magic of Research in Microsoft Products"
http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx
Microsoft Research Playing Machines: Machine Learning Applications in Computer Games
http://research.microsoft.com/en-us/projects/mlgames2008/
Video Games and Artificial Intelligence
http://research.microsoft.com/en-us/projects/ijcaiigames/

CORE Layer は、Physical Laryer 、Mission Layer のうちで、
どの認識を生成するかを決定するコマンドを投げる。
CERA-CRANIUM認識モデル
Arrabales, R. Ledezma, A. and Sanchis, A. "Towards the Generation of Visual Qualia
in Artificial Cognitive Architectures". (2010)
http://www.conscious-robots.com/raul/papers/Arrabales_BICS2010.pdf

CERA-CRANIUM認識モデル
http://aigamedev.com/open/article/conscious-bot/

2K Bot Prize
FPSを用いたチューリングテスト
http://www.conscious-robots.com/en/conscious-machines/conscious-robots/conscious-robots-team-wins-the-2k-botprize-2010-competi.html
http://aigamedev.com/open/article/conscious-bot/Movie:

2K Bot Prize
FPSを用いたチューリングテスト
http://aigamedev.com/open/article/conscious-bot/Movie:
AI と人間のプレイヤーが混在しながら戦う。
人間と一番間違われたAIが優勝。

http://www.botprize.org/2010.html

戦術位置検索システム

戦略位置検出システム（TPS）
• ゲーム内の地形を、
• ゲーム内でリアルタイムで把握して、
• 自分の能力に合わせて、
• 最も適した位置を発見する
システム

戦略位置検出システムの歴史
• Tactical Position Picking
Killzone (2005, Guerrilla)で実装される。
• TPS (Tactical Point System)
CRYENGINE (2010, CRYTEK)でツール化・システム化
• EQS(Environment Query System)
UNREAL ENGINE 4 （2014, Epic games）でツール化・システム化
• PQS (Point Query System)
SQUARE ENIX のFFXVの開発で2014年に開発。

戦略位置検出システムの原理
ポイント生成（Generation）
対象とする領域にポイント群を自動配置する。（例）グリッド状、同心円状など。
フィルタリング（Filtering）
生成したポイントから、目的に合わない条件（1）を指定して、削除して行く。
生成したポイントから、目的に合わない条件（２）を指定して、削除して行く。
．
．
．
生成したポイントから、目的に合わない条件（N）を指定して、削除して行く。
評価（Evaluation）
残ったポイント群を、評価式によってスコアをつけて、最高スコアの点を選ぶ。

PQS (Point Query System)
弓兵（AI）が次の目的地を発見したい。
(i) ゲーム現状
(ii) AIを中心に点をグリッド状に
生成し配置。（Generation）
(iii) 足場の悪い点を除く（Filtering）
(iv) 敵の近くのポイント、弓が届かな
いポイントを除く。(Filtering)
(v) 味方の近くを除く（Filtering）
(vi) 最も高い位置にあるポイントを選
択する。
このようにして、自分の最適な戦術位
置を自分自身で発見する。

（例）クエリー（Query）システム
＝問い合わせシステム
敵
目的
地
味
方味
方
味
方
Query(最短パス)
Query(安全パス)
Query(味方合流パス)
Query(武器の届く、高台ポイント)

ポイントを動的に配置して評価する

戦略位置検出システム
Matthew Jack, Mika Vehkala
Spaces in the Sandbox: Tactical Awareness in Open World Games (GDC2013)
http://www.gdcvault.com/play/1018038/Spaces-in-the-Sandbox-Tactical

EQS (E)EQS (Environment Query System) in UE4

EQS (Environment Query System)
in UE4

ゲームのための人工知能（上）

More Related Content

ゲームのための人工知能（上）