論文:Detecting Online Hate Speech Using Context Aware Models 担当:VIETさん attentionは短い文で使うより長い文で使う方が良いのかも。 Neuralで間違うところをLogisticでカバーしていた。 省略などの略字は文字単位で見た方が良さそう。 文脈を考慮することの必要性を証明。 Neural Network ModelでUsernameを加えた時に結果が悪くなった理由?:わからないが、LSTMは文字でなく文章、単語を入力した方が良い。これが関係しているのかも。 アノテーションについて。Hatefulの判断が難しくないか?:2人による人手。練習もある。ルールを決める。一緒にラベルして、98%同じだっt。 タイトルは素性として使えるの?:タイトルによってHatefulかどうかが変わる。 Usernameは必要ない?:Logisticでは必要だが、Neural Networkでは必要ない。 LIWC feature?:わからない。辞書? AUC?:ROCのグラフ(横軸:True Possible、縦軸:False Possible)の曲線の面積。多い程よい。(0 <= TP,FP <= 1) |