相田 太一‎ > ‎Kaggle勉強会‎ > ‎

2019/04/27

coursera: How to win a data science competitionを視聴
"Hyperparameter tuning", " Tips and tricks", "Advanced features"
  • neighborhood analysis:大まかなグループに分けて評価するときの手法。グループごとにまとめて評価してしまう。
  • matrix factorization:次元削減と特徴量抽出におけるメジャーな手法。SVD, PCAなど。
  • tSNE on MNIST:可視化ツール。2Dか3Dのベクトル空間を可視化する事ができる。論文などでもよく使われる。
  • tuningするパラメータをimportance feasibility understandingの3つで優先順位をつける。
  • XGBoostもいいが、LightGBMの方が訓練時間が早い。
  • データの欠損値をみるのは大切。
  • submitごとにnotebookを分けてgitに保存しておく。
  • domainに関する知識も多少は必要。
  • 共同でコンペに参加するなら、自分と同じ実力の人と組んで、一緒に成長する。
Comments