●解析…入力文の構文的構造の解析。主語、述語、目的語の対応。 *形態素解析 入力文を単語に分割、品詞の割り当てを行う。 単語辞書、連結可能行列などを用いる。 最長一致法、形態素数(分節数)最小法、コスト最小法などがある。 多義の単語の曖昧さは連結可能行列で減らすことができる。 *構文解析 形態素解析の結果である品詞列から文法に基づいた構文解析木を生成。 係り受けの曖昧さが存在すると困難になる。 例.美しい水車小屋の乙女→美しい 水車小屋の乙女(美しい乙女) →美しい水車小屋の 乙女(美しい水車小屋) *格解析(意味解析) 意味的情報を用いて構文解析木から格構造を作り出す。同時に動詞の意味を決定する。 格フレーム辞書(動詞の意味、それぞれの意味に対して出現する格の種類、 接続する助詞を記述したもの)を用いる。 格に入り得る単語の制限のため、意味マーカが記述される(人、乗り物、感情etc...)。 意味マーカには動詞の意味を決定する役割もある。 ●変換…原言語の格構造を目標言語の格構造に置き換える。 *訳語選択 原言語の単語の訳を格関係にある単語より決定。 記述された訳し分け規則(共起による単語の意味の推測など)を使用する。 *構文変換 原言語と目標言語における構文の有無などのずれを吸収 例.The news made me disappointed.(→そのニュースが私をがっかりさせた。) →私はそのニュースでがっかりした。 ●生成…選択した訳語を並べ、調整を行って最終的な訳文にする。 *文生成 変換された格構造から単語列に変換。具体的には生成規則(格の出現順など)により、 句構造の変換と訳語の語順の決定。 例.格構造 動詞(述語:買う)ー動作主格(主語:私) \対象格(目的語:カメラ) → 動作主格+対象格+動詞(私 カメラ 買う) → 私はカメラを買う *形態素生成 単語に表記された情報により、最終的な単語に置き換える。 例.buy(+過去形)→bought 問題点 すべての処理、情報(知識)を手動で記述する。 →膨大な人手、長い年月が必要。 参考文献 「アナロジーによる機械翻訳」 佐藤理史著 共立出版株式会社 「自然言語処理の基礎」 奥村学著 コロナ社 |