相田 太一‎ > ‎文献紹介‎ > ‎

2019/01/30

論文:Modeling Naive Psychology of Characters in Simple Commonsense Stories
担当:上脇さん

NPMI?:PMI(自己相互情報量)を-1 ~ 1で正規化したもの
VE?:極値スコア?
9ページの単位:センテンス
10ページの結果?右:Maslow's needs、左:Plutchik basic emotions
F値が異なる。モデル(LSTM、CNN、NPNなど)によって異なる?
MaslowとReissで感情の分け方が近いのに結果が異なる?:感情を細かく分けると近い領域(怒りと怒る)が発生するから異なる
NPNはどんなモデル?:Neural Process Networks
TF-IDF + Entity Context:文の中で変化していくからPrecisionが下がってRecallが上がる
Fig.3は人手、それを学習させると精度が上がった、という内容。



論文:Correction of OCR Word Segmentation Errors in Articles from the ACL Collection through Neural Machine Translation Methods
担当:菅さん

OCR:画像→テキスト。Google翻訳とか。→空白区切が酷い。置換誤り。
この論文は、空白挿入誤りを訂正する研究。
2005年以降の論文は正しいデータ(pdf?→空白の情報がない)。空白を除いて入力。
式の誤りがすごい。やったところで感。
どのように論文を選んでいるのかは不明。
訂正後の評価は空白だけ。置換誤りは気にしない。置換誤りで空白の誤りが生まれるとしたら、置換誤りもやるべきでは?
訂正の評価?N:元々の間違い数、raw text:抽出、corrected text:分かち書きを直した時?



論文:対話行為に固有の特徴を考慮した自由対話システムにおける対話行為推定
担当:鈴木

28ある特徴が、4つのグループで有効である根拠:書いていない。筆者らが「有効と考えられる。」と設定した。
今後の課題「フィラー」への精度向上、具体的に:新しい特徴の発見
table4は全パターンを1つずつ入れた?組み合わせなどはしていない?:目的が「最も有効な特徴を探す」だから1つずつ。
特徴量の決め方?:「特徴セットの最適化」に則る。(全特徴−特徴)>(全特徴)の時、引いた特徴が重要なのでは?とする。これを全パターン行う。有効な特徴だけをロジスティック回帰に用いる。
入力は0/1?実数値?:0/1。その特徴があるか、ないか。
対話行為列?:それまでの発話内容をまとめたもの。



論文:Stress Test Evaluation for Natural Language Inference
担当:守谷

ロバスト性:ある要因の影響を受けにくいこと。今回は「NBとIS以外のモデルでスペルミスに対するロバスト性が確認された」=スペルミスの影響を受けにくい。
State-of-the-artの弱みを探す。
Mat:マッチセット、Mis:ミスマッチセット
Named actuality:固有名詞
テキストから常識を教えるのは厳しそう。

Comments