強化学習の評価環境や機械学習の評価データのメモ
強化学習
OpenAI Gymで知識が止まっていたが,3D環境として最近はUnity-ML-agentが色々と提供しているようだ。ぜひ使ってみる。
OpenAI Gym
強化学習の評価環境と言えばコレ。Atari環境だけでなく簡単な古典制御のClassicやテキストベースのAlgorithmがある。 ロボット環境として2DロボットのBox2Dがある。3Dロボット環境もMujocoが提供されているが,Mujoco自体がライセンスが必要で使い勝手が悪い。MujocoをOSSのPyBulletに置換するRoboschoolも開発されていたが既にDEPRECATEDになっている。Third-partyのPyBullet-Robotics Environmentは使える。 他にもGymと同じ外部APIを定義したThird-partyの環境も多くが公開されているので覗いてみると良い。
VizDoom
Doomと言う1人称視点の3DゲームをAI研究用に提供している。表現学習の例としても使われる。 昔見たときよりも機能が拡充されていた,Detection/Segmentationに使える視覚形式やPythonのAPIも提供されているようだ。
DeepMind Lab
VizDoomと似た目的で使用できそうな1人称視点の3Dゲーム環境。 ただし,環境構築は手間があるように見える。時間があるときに動かしてみよう。
Gym-miniworld
VizDoomやDeepMindLabと類似の目的の環境。Pure-Pythonで環境構築が容易という点がある。
Obstackle Tower
Unityエンジンの3Dゲーム。VizDoomとは違って1人称視点ではない。
Football
サッカーゲームの環境。マルチエージェントや戦略が必要なタスクとして利用できそうだ。
その他
戦略,マルチタスク系ではFootball以外にもStarCraft環境があるようだ。
機械学習
追記する。