Development

みんなの強化学習講座 -PythonとGoogle Colaboratoryで基礎から少しずつ学ぶ強化学習の原理と実装-

What you’ll learn

  • 強化学習の原理について、基礎的な知識を学びます。
  • Pythonで書かれた強化学習のコードが読めるようになります。
  • 自分の力で、強化学習のコードを実装する力が身に付きます。
  • PyTorch、OpenAI Gym、Stable Baselinesなどのライブラリを使用して、深層強化学習を実装できるようになります。
  • 強化学習全般についての知識が身につきます。
  • 最新の研究事例を学びます。

Requirements

  • Pythonの基礎を学ぶためのテキストがダウンロード可能ですが、動画によるPythonの解説はありません。
  • 何らかのプログラミング経験があった方が望ましいです。
  • Google Colaboratoryを使用するため、ローカル環境はWindowsでもMacでも大丈夫です。
  • Google Colaboratoryを使用するためにGoogleアカウントが必要になります。
  • 中学レベルの数学で十分です。高度な数学は必要ありません。
  • ディープラーニング(深層学習)の解説は必要最低限となります。

Description

みんなの強化学習講座 -PythonとGoogle Colaboratoryで基礎から少しずつ学ぶ強化学習の原理と実装- 注: Google Colaboratoryのバージョンアップにより、現在Section5のコードを実行するとエラーが発生します。ご迷惑をおかけしますが、対応法を調査中ですので解決まで少々お待ちください。

みんなの強化学習講座は、「強化学習」について学び、親しむためのコースです。

強化学習では、「環境において最も報酬が得られやすい行動」を「エージェント」が学習し、自発的に様々な行動パターンを獲得します。

本コースは、この強化学習の原理およびコードによる実装を基礎から丁寧に解説します。

様々な場面で応用されつつある強化学習を身に付け、活用できるようになりましょう。

注: 本コースに先立ちYouTubeでのライブ講義【Live人工知能】がありました。本コースの動画はこのライブ講義をUdemy用に再構成したものになります。

コースの内容は以下の通りです。

Section1. 強化学習の概要

→ 強化学習の全体像を把握し、開発環境であるGoogle Colaboratoryの使い方を学びます。

Section2. シンプルな強化学習

→ 最小限のPythonのコードで、強化学習の一種Q学習を実装します。

Section3. 強化学習の原理

→ 強化学習の理論、動作原理を学びます。

Section4. 深層強化学習

→ ディープラーニング(深層学習)と強化学習を組み合わせた深層強化学習について学びます。

Section5. 強化学習の応用

→ OpenAI Gymを利用して、月面着陸船の制御にトライします。また、強化学習の先端研究の紹介も行います。

なお、今回の講座でプログラミング言語Pythonの解説は最小限となりますが、Pythonの基礎を解説するノートブックがダウンロード可能です。

本コースはディープラーニング用フレームワークとしてPyTorchを、強化学習の環境としてOpenAI Gymを使用します。

また、Pythonの開発環境にはGoogle Colaboratoryを使用します。

Who this course is for:

  • 強化学習に興味があるけど、最初のとっかかりが分からない方。
  • 強化学習の難解な数式に辟易した方。
  • 強化学習のコードがPythonで書けるようになりたい方。
  • 強化学習を使って、何らかの問題を解決したい方。
  • 強化学習全般の知識が欲しい方。
  • 強化学習関連のライブラリが使いこなせるようになりたい方。
  • 仕事上、強化学習の知識が必要になった方。

Related Articles

Leave a Reply

Your email address will not be published.

Back to top button

AdBlocks

Turn off the ad blocker