研究発表
- 160
概要
本論文では,非英語母語話者の英語技術文書作成を支援するWebアプリケーションについて報告する.このアプリケーションは,ユーザが入力した英文に類似した実例文を技術文献コーパスからランキング形式で抽出する.アプリケーションには単語間の類義関係に関する情報が備わっており,表現は異なるものの意味は類似しているような英文まで捉えることできる.コーパスから英文を抽出する際に,文の単語n-gram(連続する単語n組)を考えることで,コロケーションのような局所的な文脈の類似性も考慮している.類似文のランキングには,情報検索でよく使われるコサイン類似度に加え,技術文書らしさの指標として特徴表現の多寡で抽出した英文を重み付けしている点も独創的である.なお,結果表示を行うインタフェースには置き換えられた語とn-gramが特定しやすいようにハイライト機能を持たせ,可視性・操作性を勘案したものとなっている.
Counter: 83495,
today: 24,
yesterday: 67
最終更新: 2011-05-08 (日) 22:02:42 (JST) (4884d) by ozeki