機械翻訳ユーザ辞書
共通フォーマット設定
Asia-Pacific Association for
Machine Translation
AAMTトップページ UPFトップページ


全体構想

現在市場では、すでに20種類以上の機械翻訳ソフトウェアが販売されています。そのいずれの機械翻訳ソフトウェアも、まだまだ人間翻訳者の品質には遠く及びません。機械翻訳の翻訳品質を向上させるには、ユーザ毎にユーザ辞書に単語を登録する作業が必要です。しかし、各ソフトウェアのユーザ辞書はのフォーマットは全て異なっているため、A社の機械翻訳ソフトウェアの利用者が作ったユーザ辞書は、B社の機械翻訳ソフトウェアの利用者は利用することができません。

UPF活動では、図に示すようにA社用のユーザ辞書をB社のユーザ辞書でも利用できるようにして、対訳辞書の情報を広く共有できるようにすることを目的とするものです。この対訳情報を共有できるしくみをつくることによって、利用できる対訳情報が飛躍的に増えることになるのです。

 

UPFの具体的活動は以下の通りです。

共通フォーマットは、「基本言語変換標準(UPF/M)」と「拡張言語変換標準(UPF/K)」に分けて開発します。UPF/Mとは、一般に機械翻訳ソフトウェア用の対訳辞書にある、「品詞」や「活用」といった最低限の翻訳を可能とする情報を共通化するものです。これに対して、UPF/Kは、「意味分類」や「英語の動詞が持つ文型(英語でSV、SVO、SVC、SVOO、SVOCのどの文型をとるか)」といった翻訳の質の向上に必要な情報です。これらの情報は複数の機械翻訳ソフトウェア間でそれぞれ異なった構造を持っており、構造の異なるものを共通化することは難しいものです。そこで、UPF/Kでは情報を記述するための汎用的な形式を定義します。したがって、UPF/MとUPF/Kは以下のようにまとめることができます。

(a)基本言語変換標準(UPF/M)
全機械翻訳ソフトウェアのユーザ辞書で取り扱うことができ、UPF/Mとの間で相互変換(UPF/Mから各社ユーザ辞書・各社ユーザ辞書からUPF/M)可能であることを推奨する辞書情報の記述形式

(b)拡張言語変換標準(UPF/K)
各機械翻訳ソフトウェアのユーザ辞書で記述する可能性のあるすべての辞書情報を記述する形式。各社で利用できる情報は変換可能となる。

これらの成果は、平成10年3月に一般に無料で公開します。

参加協力企業・団体
・ アジア太平洋機械翻訳協会 ・ (株)NEC情報システムズ ・ (株)日本電気 ・ (株)インターグループ ・ シャープ(株) ・ (株)東芝 ・ (株)ノヴァ ・ (株)富士通研究所 ・ 日本システムウェア(株) ・ 沖電気工業(株) ・ キヤノン(株) ・ (株)日立製作所 ・ 松下電器産業(株) ・三洋電機(株) ・カテナ(株) ・九州松下電器(株) (順不同)


Last Update : 1 Dec. 1997