小林雄一郎(阪大/学振)ランダムフォレストを用いた英語習熟度の自動推定 対象:習熟度の情報が付与された自由英作文 評価 テキスト全体に対する評定者の印象に基づく全体的評価 作文を語彙や文法などの項目別に評定していく分析的評価 手法 ランダムフォレスト k-近傍法 まとめ ランダムフォレスト、k-近傍法を用いて、自由英作文における書き手の習熟度を推定 異語率や平均文長などが寄与 中西聖明、木藤善信、木村祐介、椎名広光、北川文夫(岡理大)辞書の意味を利用した日本語単語と英語単語の難易度推定 背景:近年国際的な留学生の増加→海外での使用を前提とした外国語学習の必要性 問題点:単語の適切な学習難易度が不明瞭 手法:SVM 藤田彬、田村直良(横浜国大)作文事例に基づいた児童の「書くこと」に関する学習傾向についての分析 ー小学四年生による紹介文・感想文を中心にー 作文添削の必要性 常にある一定の基準に沿って 全ての問題点に言及し 適切な助言を与える 児童書き言葉コーパスに求められる条件 教師による点検を再現した情報が付与されていること 様々な文章能力水準にある児童の作文が収録されていること 「坂本真樹、小学生の作文コーパスの収集とその応用の可能性」 目的と手法 日本語児童書き言葉コーパスの構築 幅広い学習状況の作文の収集 網羅的かつ一般性の高い点検(添削)情報の付与 質疑 コーパスデザインに対して、現場の先生に相談などは? → 現場の先生に見せるためのコーパスではなく、相談していない。 浅石卓真、歌川光一、中村由香(東大)中学理科教科書におけるテキストの時系列比較:学習指導要領との対応に着目して 目的 各時期の学習指導要領と出版社の編集趣意書をもとに「基礎・基本の重視」の観点 重要な科学概念を軸とした構成→小数の語彙を繰り返し使用して全体を記述 応用的な/高度な内容の削減→使われる語彙の種類の減少 「活用」「探究」活動の充実→日常生活の関連語彙の増加 質疑 この研究の目的は? → どの観点からの学力が変化しているのかを整理すること、なにが欠けているかを指摘することが目的 宮尾祐介(NII)、川添愛(津田塾大/NII)、松崎拓也(東大)、横野光(NII)言語処理技術の統合的評価基盤としての大学入試問題 謎を見つける→謎を解く さまざまな解くべき問題が見えてくる 「適切な」謎を設定することが重要 大学入試 人工知能研究にとってオープンかつクローズドな問題 大学入学レベルの人間と同等の知識や常識が必要 厳密な公平性→非常に制限された世界 誤解や曖昧性が生じないような問題文 必ず正解が存在し、合理的な解放が存在 様々な人工知能の協働 自然言語処理、画像認識など 人間との比較 人間と人工知能の違いが客観的に見える アプローチ 解放システムの協働 唯一絶対のアプローチではない 入出力はXML 数学:Mathematicaに入力すれば解ける 知識を問う問題:含意関係認識 オントロジーに基づく推論 それぞれの科目のためのMathematica = ドメインオントロジーに基づく推論 概念化・事例化:異なる抽象化レベルの間の橋渡し(国語、英語、倫理) 文章の自然さの認識:対話理解、読解問題 おわりに 言語処理研究にとって「大学入試を解く」は興味深い謎 実用アプリケーションとの接点も多い 知識の検索、知識の構造化、対話システム、要約・情報編纂、自然言語インターフェース 試験としての難しさと変ホ処理としての難しさは多くの場合異なる 人間とコンピュータの違いはどこにあるのか? コーパス、基盤システム、ベースラインシステムを公開予定 |