2015-08-13から1日間の記事一覧

強化学習

一般メモ大枠は動学的最適化，つまり，目的関数がある関数の積分形式（または総和）で与えられ，目的関数を最大化する関数を求める問題の解法だと思われる．強化学習の特徴として試行性（試行をしながら学習すること．探索と利用のトレードオフの話など．…