[B! AlphaZero] yuichi0613のブックマーク

yuichi0613 id:yuichi0613

AlphaZeroに関するyuichi0613のブックマーク (1)

「AlphaZero」がチェス、将棋、囲碁の各世界最強AIを打ち負かす - ITmedia NEWS
米Alphabet傘下の英DeepMindは12月6日（現地時間）、「Alpha Go Zero」から進化させた強化学習採用のAI「AlphaZero」が、チェス、将棋、囲碁のそれぞれの世界最強AIを打ち負かしたと発表した。強化学習（reinforcement learning）は大まかに言うと、学習用のデータを使わずに、AIが選択した行動が正しければ報酬を与えることで、AIの状況判断能力を上げていく機械学習方式。AlphaZeroはまた、行動の選択に「モンテカルロ木探索（MCTS）」と呼ばれる検索アルゴリズムを使う。 AlphaZeroはこの方法で、チェスを9時間学習した後チェスの世界チャンピオンAI「Stockfish」を、将棋を12時間学習した後世界コンピュータ将棋選手権の2017年の勝者「elmo」に、囲碁を13日間学習した後Alpha Go Zeroに勝利した。
yuichi0613 2018/12/09
"DeepMindは、AlphaZeroの目的はチェスや将棋、囲碁に勝つことの先にあり、様々な実世界の問題を解決するシステムを構築することにあると語った"／理解があってれば、将棋では後手のほうが勝率高いってこと？

AI

将棋

学習

AlphaZero
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx