相田 太一‎ > ‎文献紹介‎ > ‎

2019/02/13

論文:Detecting Online Hate Speech Using Context Aware Models
担当:VIETさん

attentionは短い文で使うより長い文で使う方が良いのかも。
Neuralで間違うところをLogisticでカバーしていた。
省略などの略字は文字単位で見た方が良さそう。
文脈を考慮することの必要性を証明。
Neural Network ModelでUsernameを加えた時に結果が悪くなった理由?:わからないが、LSTMは文字でなく文章、単語を入力した方が良い。これが関係しているのかも。
アノテーションについて。Hatefulの判断が難しくないか?:2人による人手。練習もある。ルールを決める。一緒にラベルして、98%同じだっt。
タイトルは素性として使えるの?:タイトルによってHatefulかどうかが変わる。
Usernameは必要ない?:Logisticでは必要だが、Neural Networkでは必要ない。
LIWC feature?:わからない。辞書?
AUC?:ROCのグラフ(横軸:True Possible、縦軸:False Possible)の曲線の面積。多い程よい。(0 <= TP,FP <= 1)

Comments