このサイトを検索
トップ
言語資源・ツールの公開
学術論文
国際会議
研究会
大会
修士論文
卒業研究(課題研究報告書)
伊藤 甲斐
猪俣 慶樹
岡田 正平
梶原 智之
後藤 大明
須戸 悠太
髙橋 寛治
竹野 峻輔
林 秀治
松本 宏
三上 侑城
宮西 由貴
村松 祐希
山本 和英
Gamar Ivan Azuaje Suarez
Nguyen Van Hai
最近の更新履歴
所在地と連絡先
山本和英 編集
山本 和英
山本和英 編集
SNOW
山本和英 編集
トップページ
山本和英 編集
稲岡 夢人
稲岡夢人 編集
View All
ページ作成者
相田太一
4月 16, 2019
相田 太一
>
Kaggle勉強会
>
2019/04/17
タイタニック
欠損値の多い年齢を予測するモデルを作ろうとしていたが、本当にそれでいいのか悩み中。
年齢予測、生死予測で2回同じデータを用いることになる気がする。
→年齢予測、生死予測でモデルが違うから仕方がない?
年齢予測をするのであれば、1の位は切り捨てて10代未満、10代〜90代のように10歳ごとに割り当てる。
→他クラス分類?
年齢は生死に大きく影響するため、平均値で補完するのは危険だと判断し、年齢予測モデルを作成することに。
→XGBoostを使ってみる。:
参考[
link
]
年齢予測に使うのは、以下の3つ。
SibSp:同乗した兄妹/配偶者の人数
Parch:同乗した両親/子供の人数
Pclass:チケットの等級
Comments