scikit-learnのメモ
全体通して
- 多くの機械学習アルゴリズム(SVM, MLP, etc.)を統一したAPIで利用できる.つまり,多くの学習アルゴリズムが,モデルのオブジェクトを生成したら,fit(X,y)で学習して,predict(T)で予測する
- iris, digit, boston_house_priceなどの有名なサンプルデータセットが付属しているのでチュートリアルに適している.
付属のデータセットに関して
- 分類問題が2つ(iris:虫, digits:手書き文字), 回帰問題が3つ(boston:家の価格, diabetes:糖尿病, linnerud:心理状態)入っている.
- それぞれが,dataでx(サンプル数x特徴量数の2次元配列,目標値は入らない)を, targetでyを取り出せる.digitsなどはimageで画像としても取れる.
パラメタ探索
- 各アルゴリズムは設定パラメタを持っている.grid searchやcross validationで機械的に適切なパラメタを設定することができることもある.