情報抽出 自然言語で記述されたテキストから何らかの構造的な情報を 自動的または半自動的に抽出するタスクおよびその周辺技術のこと MUC:Message Understanding Conference
固有表現抽出 固有表現 →人名・組織名・地名といった固有の名前を持つ対象を指す表現 MUCは固有表現として「人名」「組織名」「地名」「日付」「時間」「割合表現」「金額表現」の7種類を対象に設定した。 固有表現はテキストのドメインや情報抽出のタスクに依存しているという点には注意が必要。 固有表現抽出 →テキストから固有表現を抽出するタスク 質問応答や要約タスクなどでも幅広く使われ、自然言語処理の基本的ツールのひとつ。 参考文献 言語処理学会(2009)『言語処理学事典』共立出版 |