17:10-17:55
「強化学習の概要と応用向きの課題」
株式会社ディー・エヌ・エー / 東京電機大学
AI 本部 AI システム部 AI 研究開発第三グループ / 理工学部 非常勤講師
甲野 佑 氏
講演概要
強化学習は大規模なデータを予め必要とせず、自律的に試行錯誤して学習するという、他の機械学習とは異なる特性を持ちます。今や複雑なゲームの自律プレイをも可能とし、期待される応用範囲は飛躍的に広がっています。しかし先端の強化学習手法では深層学習と強化学習それぞれの理論やテクニックが混同され、新たな習得が困難になっています。本講演ではその補助として深層(教師あり)学習と対比した強化学習の基礎を解説します。
プロフィール
情報学博士。大学での研究ではヒトの意思決定傾向や脳における行動の習慣/階層化過程を組み合わせた強化学習モデルの基礎研究を行っていた。入社以来オセロニアの Game AI 開発に携わっており、学習アーキテクチャ全体の設計と強化学習アルゴリズムの実装、開発などに従事している。 業務と無関係に個人的な興味は、強化学習を実用レベルにするための人間の高い学習能力の理解(理論化)と模倣(アルゴリズム化)。