発表概要
我々は、非英語母語話者による技術英文作成支援のため、技術文書が集積された英語技術文献コーパスの中からユーザによる入力英文に近い英文を検索し、例示するツールを開発している。従来の方法では英文を、形態素解析後に適当な基準で類義語でまとめたり、品詞化したn-gram(n連鎖)で特徴づけ、入力英文とコーパス内の英文の類似度を算出し、それが高い順に提示する。ただ、素直なn-gramでは、文内でも遠く離れた不連続な語間の関係や、構文的特徴を類似度に考慮することはできない。そこで本研究では、英文に対して、形態素解析に加え、チャンキングとよばれる解析を施し、浅い構文構造に相当するチャンク構造まで考慮したn-gramを考慮し、英文間の類似度を算出し、例文を提示する方法を提案する。新しい方法と従来の方法との例文検索の実際的な差異については、発表時に説明する。
Counter: 1954,
today: 1,
yesterday: 0
Last-modified: 2014-11-17 (Mon) 01:55:52 (JST) (3680d) by kawaguchi