感情解析:- Mathieu Cliche,BB_twtr at SemEval-2017 Task 4: Twitter Sentiment Analysis with CNNs and LSTMs, SemEval-2017,pp573-580
- Twitterの感情分類に関する論文.CNNとLSTMを組み合わせて,distant supervisionを用いている.SemEval-2017の英語のサブタスク5つで40チーム中トップであった.ただ,多くのデータを用いてやっているため,データ量の勝負になっている気もする.
- Gilbert Badaro,Hussein Jundi,Harzem Hajj,Wassim El-Hajj,EmoWordNet: Automatic Expansion of Emotion Lexicon Using English WordNet,Lexical and Computational Semantics(*SEM),2018,pp86-93
- 英語のWordNetを活用してDepecheMoodを拡張してEmoWordNetを構築するという論文.EmoWordNetは,67000語で構成されている.また,SemEval 2007のニュースヘッドラインデータセットを使用して感情認識タスクでEmoWordNetを評価した.DepecheMoodの使用と比較して改善されているといった結果であった.EmoWordNetは,http://oma-project.comで公開されている.
- Yequan Wang,Minlie Huang,Li Zhao,Xiaoyan Zhu,Attention-based LSTM for Aspect-level Sentiment Classification,EMNLP,2016,pp606-615
- Aspectレベルでの感情分類を可能にする論文.The appetizers are ok, but the service is slow.という文章があった際に前菜は極性的に正であるがサービスは負である.こういった局面に対して細かく分類するために語順を考慮してるであろうLSTMを用いてモデルを作ってAttention-basedで分類しているもの.
評判解析: - 五島圭一,高橋大志,株式価格情報を用いた金融極性辞書の作成,自然言語処理,2017,Vol.24 No.4,pp547-577
- 金融分野に特化した極性辞書の作成に関する論文.ニュースデータと株式価格データより金融極性辞書の作成をしている.自動ではあるが,極性辞書の作成は,日経のニュースデータを用いているため,ノイズが少ない.
話し言葉・書き言葉換言: - 下田裕晃,住田一男,話し言葉から書き言葉への変換における対訳単位分割,情報処理学会第77回大会,pp2-203--2-204
- 統計的機械翻訳を用いて日本語の話し言葉を書き言葉に変換する論文.フィラーと書き言葉に変換する際に不要な話し言葉表現の除去をしている.
- Graham Neubig,秋田祐哉,森信介,河原達也,文脈を考慮した確率的モデルによる話し言葉の整形,情報処理学会研究報告,2009,pp1-6
- 音声を会議録に変換することに関する内容.文脈情報を考慮した翻訳モデルを導入し,システムのさらなる精度向上を目指す,翻訳モデルの条件付き確率と同時確率の対数線形補間を行うことで高精度の翻訳パターンを優先的に利用することを可能とする,2つの内容に取り組んでいる.実験では,国会会議録と音声認識結果を用いた実験をしている.コーパスサイズの影響があり,データ数を増やしていくとの記述が有り,やはりデータ数での勝負になっていると思った.
- Kaji, Nobuhiro, Masashi Okamoto, and Sadao Kurohashi. "Paraphrasing predicates from written language to spoken language using the web." Proceedings of the Human Language Technology Conference of the North American Chapter of the Association for Computational Linguistics: HLT-NAACL 2004. 2004.
- 話し言葉と書き言葉の変換に関する内容.Webから収集した文章及び音声言語コーパスにおけるフレーズの出現回数に基づいて換言を判断.実験結果としてコーパスでの精度(Precision)が94%,換言精度(accuracy)は76%であった.
- Gabriel Murray,Giuseppe Carenini,Summarizing Spoken and Written Conversations,EMNLP,2018,pp773-782
- 会議及び電子メールドメインにおける会話の要約に関する内容.会議や電子メールを一般的な会話機能と共通の会話として扱うことで,より多くのドメイン特有の機能に依存するものに対応可能.
- Graham Neubig,秋田祐哉,森信介,河原達也,統計的機械翻訳の枠組みを用いた話し言葉の整形,言語処理学会年次大会発表論文集, C2-4, pp. 222-225,2010
- 統計的機械翻訳に基づく話し言葉の整形に関する内容.雑音のある通信路モデルを用いて忠実な書き起こしを整形する手法を拡張して対数線形モデルに様々な素性を導入して重み付き有限状態トランスデュー座で実装したもの.根本的な解決内容としては,「Graham Neubig,秋田祐哉,森信介,河原達也,文脈を考慮した確率的モデルによる話し言葉の整形,情報処理学会研究報告,2009,pp1-6」と同じ.
その他(中間領域を含む): - Genta Indra Winata,Onno Pepijn Kampman,Pascale Fung,ATTENTION-BASED LSTM FOR PSYCHOLOGICAL STRESS DETECTION FROM SPOKEN LANGUAGE USING DISTANT SUPERVISION,ICASSP2018
- 人の心理的ストレスを分類する内容.ストレスのある単語が色付きで出ていたがほぼ人間が判断可能な単語ばかりであった.(卒業やプレッシャーなど)したがって,リストを作ったほうが精度もさらに向上するのではないかと考えられる.
- 小林のぞみ,乾公司,乾健太郎,語釈文を利用した「p/n辞書」の作成,人工知能学会言語・音声理解と対話研究会,2001
- 国語辞典の語釈文を用いてブートストラップ的に辞書構築をするといった内容.しかし,登録語数が113件であり,登録語数が少ないように思われる.国語辞典の語釈文でなければもう少し語数は増やせるのか考えてみても良いかも知れない.
|
|