強化学習プログラミング講座

強化学習プログラミング講座

AI講座

強化学習プログラミング講座

講座概要

概要 強化学習とは、機械学習の手法の1つです。囲碁や将棋の一手から自動運転やロボットの行動などを試行錯誤して制御していく学習のことです。このセミナーでは、機械学習用ライブラリ「Chainer」「ChainerRL」「OpenAI Gym」を用いてプログラムを実装するスキルを習得することができます。AI技術者にとって必要となる知識を実践を通して学べる講座です。
対象者
  • DXを推進するIT部門チームのメンバー
  • 今後AIを用いたシステム開発を予定されている方
  • ITシステムの開発経験をお持ちの方
時間 5時間
カリキュラム 強化学習の基本的な知識と仕組み、さらに強化学習プログラムを実装する上で必要なライブラリや設定項目を学習する
  • 強化学習の学習手法の概要について(Q学習、DQN 、SARSA)
  • 強化学習の活用事例
  • Q学習の学習手順と用語(状態・行動・報酬)について
  • Qテーブルの更新とQ学習のパラメーターについて
  • DQN(Deep Q Network)とは
  • DQNの学習手順について
  • 誤差関数とQ-network、Target-networkの重みの更新
  • ε-greedy法による探索について
  • DQNの進化アルゴリズム

ロボットアーム動作の最適化や、ブロック崩しゲームの強化学習ブログラムを機械学習用ライブラリ「ChainerRL」「OpenAI Gym」を利用して実装する
  • 棒を倒さないように土台を最適化する強化学習プログラムを実装する
  • ロボットアームの動きを最適化する強化学習プログラムを実装する
  • ブロック崩しゲームの強化学習プログラムを実装する
  • 機械学習用ライブラリ「ChainerRL」「OpenAI Gym」の使い方について
  • 「ChainerRL」「OpenAI Gym」のインストール方法について
  • 「ChainerRL」を使った強化学習プログラムの実装手法について
  • CartPole問題を使ったQ学習プログラムを実装する
  • 報酬の割引率や、過去の結果の重要視度を変更する
  • Acrobot問題を使ったDQN(Deep Q Network)プログラムを実装する
  • ハイパーパラメーターの設定と学習精度を高める方法について
  • 「OpenAI Gym」のシミュレーション環境について
  • 報酬計算の手法を変更し学習精度を上げる
  • Breakout問題(ブロック崩し)を使ったCNNの強化学習プログラムを実装する
オプション -
受講料 44,000円(税込)/名
オプション料 -