発表概要 日本語の助動詞「れる」「られる」の語義曖昧性を換言を用いて解消するために、「れる」「られる」の自動意味判別を行った。 本研究では、辞書を用いた手法とCRFを用いた手法で自動判別を行った。 そして、2つの手法を用いて、「れる」「られる」に意味付与を行った評価データセットに対して自動判別を行った。 追加内容 時間の都合上、原稿提出時に間に合わなかったが、CRFの学習データ量の影響について調査を行っている。 この調査では、学習データとなる文の量を200,400,800,1600,3200(最大)と変化させた時の正解率の変化について調べた。 結果は、こちらのようになっている。 質疑応答、コメント ・受け身、尊敬、可能は正解率ではなくF値で評価する方がよい。 →本研究で使用したデータセットは意味の出現頻度に偏りがあるため、そちらのF値による評価が適切だと思います。 ご指摘ありがとうございます。 ・評価データセットの意味の付与に関して、人によって付与する意味が変化するような例があるのではないか。 →そのような例はあります。 しかし、今回は作業者が一人で、「れる」「られる」1つに対し、必ず1つの意味を付与しているので、その点については考慮できていません。 今後、評価データセットを作成する際は複数の作業者で意味の付与を行う必要があると感じています。 ・尊敬の意味を判別する上で、主語が重要なのではないか。 →そう思います。 しかし、主語を断定することが難しく、主語が尊敬の対象であるかという判別も難しいため、今回は実施しておりません。 また、評価データセットには主語の無い文も存在するので、主語についての処理が出来たとしても、尊敬の意味判別が大きく改善するとは限りません。 発表に関する反省 内容を説明する前提でポスターを作成していたため、途中から見に来る方がポスターを見た時、誤解をしてしまう場面があった。 見ただけで研究内容が分かるようなポスターの構成を心がける必要がある。 また、他の方のポスターを見ると、どうしてもデザインで見劣ってしまうように感じた。 |
福嶋 真也 >