- 松本さん「A Framework of a Mechanical Translation between Japanese and English by Analogy Principle - Makoto Nagao」
- 和→英翻訳のフレームワークについて
- PCに文を渡す→さっきと1文字変えた文を渡す→学習させる
- 辞書は例文が多いのでその例文を変えれたら良い(シソーラスを使って単語の類似度を見たりして)
- 「日本語を単語に区切る→訳す→くっつける」という手法は難しい!
- ↑そこで、「日本語をブロックで区切る→訳す→くっつける」方が良い。
- 規則と生データ
- 解析的な規則を使ったものは、仮説が変われば使えなくなる…
- 生データを使ったものは、ずっと変わらない!
- フレームワークについてなので、細かい部分は述べていない。
- その分、とても理解がしやすかった。
- 宮西「機械学習を用いた日本語機能表現のチャンキング」
- 機能表現と内容表現の区別をつける。
- 途中から、機能表現をどれだけ取り出せるか?になっているような…(私の読解力のなさが原因かもしれない)
- 学んだこと
- 自立語=内容語で付属語=機能語。自立語-付属語が対で、内容語-機能語が対。
- 自立語-機能語が対になったり、内容語-付属語が対になる使い方はしない。
- Support Vector Machineは境界を決めることができる。
- 「学習できる」ということしか理解せずに読んでいた。
- 最初の例で出した目的と最後の結果が違うような気がする。
- 指摘を受けるまで気づかなかった。内容の理解もちろんだが、最初と最後で矛盾がないかも考えながら読もうと思う。
|
|