強化学習の評価環境や機械学習の評価データのメモ

強化学習

OpenAI Gymで知識が止まっていたが,3D環境として最近はUnity-ML-agentが色々と提供しているようだ。ぜひ使ってみる。

OpenAI Gym

gym.openai.com

github.com

強化学習の評価環境と言えばコレ。Atari環境だけでなく簡単な古典制御のClassicやテキストベースのAlgorithmがある。 ロボット環境として2DロボットのBox2Dがある。3Dロボット環境もMujocoが提供されているが,Mujoco自体がライセンスが必要で使い勝手が悪い。MujocoをOSSのPyBulletに置換するRoboschoolも開発されていたが既にDEPRECATEDになっている。Third-partyのPyBullet-Robotics Environmentは使える。 他にもGymと同じ外部APIを定義したThird-partyの環境も多くが公開されているので覗いてみると良い。

VizDoom

github.com

Doomと言う1人称視点の3DゲームをAI研究用に提供している。表現学習の例としても使われる。 昔見たときよりも機能が拡充されていた,Detection/Segmentationに使える視覚形式やPythonAPIも提供されているようだ。

DeepMind Lab

github.com

VizDoomと似た目的で使用できそうな1人称視点の3Dゲーム環境。 ただし,環境構築は手間があるように見える。時間があるときに動かしてみよう。

Gym-miniworld

github.com

VizDoomやDeepMindLabと類似の目的の環境。Pure-Pythonで環境構築が容易という点がある。

Obstackle Tower

github.com

Unityエンジンの3Dゲーム。VizDoomとは違って1人称視点ではない。

Football

github.com

サッカーゲームの環境。マルチエージェントや戦略が必要なタスクとして利用できそうだ。

その他

戦略,マルチタスク系ではFootball以外にもStarCraft環境があるようだ。

機械学習

追記する。