吉澤 亜斗武‎ > ‎

YANS2019

  1. 発表報告(スライドポスター
    • 表題:Transformerを用いた日本語誤り訂正
    • 頂いたアドバイス,コメント
      ・分割粒度が文字<単語<SentencePieceとなっているけど,
      SentencePieceの語彙数を調整して
        文字<SentencePiece<単語みたいにできたら,文字と単語のいいとこ取りのような分割ができるのでは?
      ・入力分割で文字単位と単語単位でそれぞれ訂正できることが違うのであれば,それぞれで入力して,
        両方のエンコード情報
      をうまい感じにまとめるモデルが提案できないか?
      ・NAIST誤用コーパスは作文なので,作文特有の誤りがあったり,一文ごとの訂正では正解文のように訂正するのが難しいのでは?
    • 自身のプレゼンテーション能力
      ・相手の顔色や理解を確認しながらプレゼンする力やまだまだ足りないと思った.メリハリをつけたプレゼンを行えるようにしたい.
      ・簡潔に,伝えたいことははっきり伝えられた.

  2. 参加報告
    • 他の人の発表を聞いて
      ・GECを超えた,言語学習者支援のためのタスクや評価
        P76:ニューラルネットワークを利用した日本語学習者の複数項目作文能力推定
        P89:文法誤り訂正を拡張した新タスクの提案
        細かなスペルのミスなどよりも,文章全体として主張の一貫性や構成などを評価したい

      ・コピー機構を用いてOOVを防ぐ研究
        P13:外部知識と対話文脈を用いた対話の展開予測に基づく応答生成
        P72:コピー機構を用いた構造化データからのテキスト生成

      ・固有表現抽出
        P16:単語ベースモデルおよび文字ベースモデルによる固有表現抽出の性能比較
        P39:辞書を用いたコーパス拡張による,化学ドメインDistantly Supervised固有表現抽出
        P87:BERTの転移学習によって獲得した日本語固有表現抽出モデルの性能評価
        また,固有表現(に限らないが)の表記ゆれなどは企業もいろいろ研究しているようだった.

      ・対話においては多様性のある応答を目指すものが目立った
        P26:話者情報と外部知識を用いた複数人対話における応答選択
        P33:応答多様性を考慮した雑談対話評価のための疑似応答獲得
        P73:大規模対話データからの感情表現に着目した応答文生成

    • 招待講演1「トップカンファレンスへの論文採択に向けて(NLP研究分野版)」:鈴木 潤 氏
      ・若いうちは,プログラミング力やサーベイ力を高めたほうが良い
      ・アイディアや論文執筆力はノウハウ的なところがある
      ・論文の書き方は,良い論文を参考にする.特にTiltle,Abst,Intro重要.  査読者に読みたいと思わせることが重要.
        その意味では,研究内容も,査読者(同分野の人)が喜びそうなものが通りやすい.
      ・論文は投稿することが重要.不採択数はチャレンジしている証拠.

    • 招待講演2「いまとこれからの言語処理を考える」:松本 裕治 氏
      ・end-to-endでいいのか?理由や証拠が説明できない
      ・単語,句,文の表現はベクトルで良いのか?
        I know ◯◯     :事実  I believe ◯◯       :事実?
        I don't know ◯◯   :事実?  I didn't know ◯◯ :事実
      ・昔の理論:主辞駆動句構造文法(HPSG),語彙概念構造(LCS)
      ・できるはずのことをできるように
Comments