scikit-learnのメモ

全体通して

付属のデータセットに関して

  • 分類問題が2つ(iris:虫, digits:手書き文字), 回帰問題が3つ(boston:家の価格, diabetes:糖尿病, linnerud:心理状態)入っている.
  • それぞれが,dataでx(サンプル数x特徴量数の2次元配列,目標値は入らない)を, targetでyを取り出せる.digitsなどはimageで画像としても取れる.

パラメタ探索

  • アルゴリズムは設定パラメタを持っている.grid searchやcross validationで機械的に適切なパラメタを設定することができることもある.