Gym是為測試和開發RL算法而設計的環境/任務的集合。它讓用戶不必再創建復雜的環境。Gym用Python編寫,它有很多的環境,比如機器人模擬或Atari 游戲。它還提供了一個在線排行榜,供人們比較結果和代碼。
第1章 強化學習與常用的仿真環境平臺介紹(MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2等)
第2章 OpenAI gym中的常用仿真環境介紹,包括Atari 2600 游戲系列、MuJoCo 物理模擬器、Toy text 文本環境、Robotics機械手與機械臂模擬器等
第3章 馬爾科夫決策過程MDP
第4章 基于gym的MDP實例講解,基于OpenAI Gym構建股票市場交易環境
第5章 基于gym的強化學習實踐:基于值函數的強化學習方法實現;基于策略梯度的強化學習方法實現
第6章 虛擬環境Universe: 一個用于訓練解決通用問題 AI 的基礎架構
第7章 基于Universe的強化學習實踐:用OpenAI公司的Gym工具庫和Universe平臺為游戲創建人工智能機器人 |