coursera: How to win a data science competitionを視聴"Hyperparameter tuning", " Tips and tricks", "Advanced features" - neighborhood analysis:大まかなグループに分けて評価するときの手法。グループごとにまとめて評価してしまう。
- matrix factorization:次元削減と特徴量抽出におけるメジャーな手法。SVD, PCAなど。
- tSNE on MNIST:可視化ツール。2Dか3Dのベクトル空間を可視化する事ができる。論文などでもよく使われる。
- tuningするパラメータをimportance feasibility understandingの3つで優先順位をつける。
- XGBoostもいいが、LightGBMの方が訓練時間が早い。
- データの欠損値をみるのは大切。
- submitごとにnotebookを分けてgitに保存しておく。
- domainに関する知識も多少は必要。
- 共同でコンペに参加するなら、自分と同じ実力の人と組んで、一緒に成長する。
|