UNLエンサイクロペディア
UNLエンサイクロペディアとは?
UNLエンサイクロペディアはUNLで書かれるすべての人々の経験的かつ科学的知識、知恵および文化の収集である。UNLで可能にする言語、情報およびディジタル技術の集束はローカルの多様性を保ちながら人類に共通の財産に関するすべての形態の文化や知識を集める。UNLのメリットは人々が自国語で文化や知識を他の人々とそれぞれの国語で共有できることである。それゆえ、UNLエンサイクロペディアは真に普遍的である。
近年では、情報通信技術(ICT)によって高められた民族間の相互依存は経済、文化、知識システムと政治体制を互いに近づかせた。しかし、言語の障壁は多民族間における公平な情報伝達、知識利用、文化交流および相互理解を妨げている。その結果として、グロバリゼーションがローカル文化のアイデンティティと存続を脅かすように、対立や衝突が増える。UNLエンサイクロペディアはICTメディアを利用し、言語の障壁を取り除き、すべての人々が互いに技術、知識、知恵、価値感、生活スタイル、気持ちと信念を分かち合える基盤を提供する。それゆえ、UNLエンサイクロペディアは自然な歴史的反応として、文化の多様性を保ちながら相互に知識を促進することによって公正という要求に応じるために出現したといえよう。
既存のエンサイクロペディア、例えばブリタニカ、ラロッセなどは、英語、中国語、フランス語、日本語、ロシア語、などで書かれているのに対して、UNLエンサイクロペディアはコンピューターのための意味ネットワーク言語であるUNLで書かれることになる。UNLエンサイクロペディアの開発は、テキストや人間の頭に存在する種々多々の形式の知識をUNLで記述することに存する。UNLエンサイクロペディアはこのUNL記述(UNLドキュメント)を対応のUWに連結することでUNLオントロジーに統合する。このUNLエンサイクロペディアは普遍的な多言語エンサイクロペディアであり、UNLオントロジーを通して人々のために知識をナビゲートし、コンピューター処理のために必要な知識記述が提供する。
UNLエンサイクロペディアの構成
UNLエンサイクロペディアは二つの部分から構成される:UNLオントロジーのUWシステム(概念の階層構造)とコンテンツのエンサイクロペディア。UNLエンサイクロペディアのコンテンツはさまざまな情報や知識を記述するUNLドキュメントである。各UNLドキュメントはそれが記述するUWと連結される。UWシステムのUWはUNLエンサイクロペディアでのそれぞれの記述へのエントリーとなる。UNLエンサイクロペディアの各記述に含まれるすべてのUWと二項関係はその記述への検索キーとなる。
図1はUNLエンサイクロペディアの構成を示す。UNL DocはUNLドキュメントの略称で、各UWに関する記述を示す。

図1 UNLエンサイクロペディアの構成
UNLエンサイクロペディアの特徴
広範囲に及ぶ知識
UNLエンサイクロペディアの知識はレベルが多岐に渡り広範囲に及ぶ。UWシステムのトップレベルでは、UNLエンサイクロペディアの中核と考えられる一般的な概念に関する知識が記述される。概念の記述は主に、それは何であるか、それをどう作るあるいは使うか、その時間や期間などに関する。UWシステムの下層レベルでは、通常の特定の概念だけでなく、アーカイブや本のコンテンツも記述する。アーカイブや本のコンテンツは複合概念として扱われ、UNLエンサイクロペディアのUNLアーカイブまたはUNLライブラリを構成する。
UWとコンテンツ記述の相互連結性
UNLエンサイクロペディアではUWの概念に関する知識はUNL表現で記述される。UNL表現の記述に含まれるUWはすべてUWシステムの中で適切な位置につく。これらのUWはそれらが含まれるUNLエンサイクロペディアの記述への検索キーとなり、その知識もUNLエンサイクロペディアで記述される。このアーキテクチャは知識記述が記述済みの知識を使うことを保障し、多文書にわたるUWに関する知識を容易見つけることができる。
多言語navigability
UNLエンサイクロペディアでは知識はUNLで記述される。このUNLエンサイクロペディアに登録される知識はUNLシステムを通して多言語で検索し読むことができる。
UNLエンサイクロペディアに関して詳しくは下記を参照されたい:
http://www.undl.org/encyclopedia/
UNLエンサイクロペディアのコンテンツはUNLエクスプローラでアクセスできる:
www.undl.org/unlexp/
UNLエクスプローラ
UNLエクスプローラとは?
UNLエクスプローラはウエブ上のUNLに基づくスマートな多言語情報と知識管理システムである。利用者が言葉の障壁を感じなく、UNLに基づく情報と知識の検索が可能となる統合環境を提供する。UNLエクスプローラは情報と知識をUNLオントロジーのUWシステムに基づいて管理しナビゲートする。通常のエンサイクロペディアと違い、自然言語の単語の替わりに、UWがそれに関する情報や知識を記述するUNLドキュメントと連結される。このUNLドキュメントの集合はUNLエンサイクロペディアと呼ぶ。UNLエクスプローラはUNLエンサイクロペディアだけでなくUNLオントロジーが与える情報や知識も検索または編集する手段を提供する。UNLに基づくスマートな多言語情報と知識管理システムでは、UWと二項関係は情報や知識へのキーとなり、UWは自然言語の対訳語と連結され、二項関係は自然言語入力文から変換される。UNLエクスプローラを使って、利用者はUNLあるいは自然言語で情報や知識を検索、観覧、編集できる。検索はUNLオントロジーが与える言語的そして意味的情報についても、UNLエンサイクロペディアが提供する一般的な情報や知識についてもできる。UNLエンサイクロペディアの検索はコンテンツあるいはキーワード(キーコンセプト)検索ででき、UNLオントロジーのUWシステムによってもナビゲートされる。UNLエンサイクロペディアに含まれるすべてのUWと二項関係はそれらを含まれる情報や知識へのキーとなる。

図2 UNLエクスプローラの構成
UNLエクスプローラの現状と未来
UNLオントロジーの検索はUNLを含む多くの言語で可能である。UNLエンサイクロペディアのコンテンツの検索はUNL,英語と日本語で可能である。UNLエクスプローラはランゲージサーバーを使って自然言語とUNLの変換を行う。このため、新しいランゲージサーバーができればいつでもつなげることができる。近い将来、UNL、英語および日本語による情報の問い合わせができ、インターネット上の英語と日本語のウエブページを対象にした、UNLに基づく検索や問い合わせもできる予定である。情報や知識の編集は現時点では特定の開発者に限定されているが将来自由編集可能モデルに基づくシステムに改良する予定である。
UNLエクスプローラの特徴
意味共起関係検索
すべてのUW間の可能な意味共起関係はUNLオントロジーで定義される。各関係はそれが持てるもっとも一般的なUW間で定義される。このUNLオントロジーに対して意味共起関係検索は次の三つの方法で行うことができる。それらは二つのUW間にある関係が成り立つかどうかを問い合わせることと、あるUWとある関係を持てるUWは何かを問い合わせること、二つのUWにはどんな関係が可能かを問い合わせることである。これらの検索はすべてUWシステムの属性継承のメカニズムを利用して行われる。
UNLに基づく意味ネットワーク検索
コンテンツ検索はUNL表現に基づいて行われる。UNLエクスプローラでは利用者はUNLエンサイクロペディアのコンテンツを検索するのに自然言語文による問い合わせを入力することができる。自然言語文が入力されるとUNLエクスプローラはそれをUNL表現に変換するようまずランゲージサーバーにリクエストする。検索はUNL表現を用いて行われる。UNLに基づく検索は二項関係が用いられる。UNL表現に検索はあいまいな結果を減らすことができ、そのうえ、UWシステムの属性継承のメカニズムを利用して同義語に関する情報や知識も提供することができる。
内包的な定義に基づく推論
UNLオントロジーでは、UWにその概念に必須な属性を特定するための内包的な定義が与えられている。それはその概念が定義するセットやクラスに属すための必要かつ十分な条件である。例えば、“author”の概念定義は“a person who writes books or a person who wrote a particular book”である。この定義に基づいて、“Oe is the author of Silent Cry”という知識を使って“Oe wrote Silent Cry”を推論できる。その逆も可能である。この推論機構はUNLエクスプローラのコンテンツ検索で利用されている。
多言語情報検索
UNLエクスプローラの目的は利用者に言語の障壁がなく情報をアクセスできる総合的な環境を提供することである。UNLエクスプローラを通して、利用者は自国語で他の言語で書かれた情報や知識を検索でき、または自国語で情報や知識を提供や編集できる。このために、情報や知識をUNLで表現する必要がある。情報は一旦UNLで表現すればすべての言語から利用できる。そして、自然言語とUNLの相互変換を行うランゲージサーバーの数を増やす必要もある。
UNLグラフィック編集
UNLエクスプローラではUNLグラフィックエディターを必要に応じて使うことができる。UNLグラフィックエディターを使ってUNL表現をグラフに表示したり、そのグラフを修正することでUNL表現を編集することができる。
UNLエクスプローラは次のURLで使うことができる:
www.undl.org/unlexp/
UNLプラットフォーム
UNLプラットフォームとは?
UNLプラットフォームはUNLに基づく多言語文書開発ウエブアプリケーションである。UNLプラットフォームを使って利用者は自然言語の文書からUNLドキュメント、あるいはUNLドキュメントから自然言語の文書を作ることができる。UNLドキュメントの開発は自然言語文をUNL表現に変換することに存する。UNLプラットフォームは必要なすべてのUNLシステムのツールを統合し、UNLドキュメントあるいは自然言語の文書の作成を助けるためのさまざまな機能を提供する。利用者のニーズや目的に応じて、UNLプラットフォームは異なるレベルの機能を提供する。UNLプラットフォームを使って、利用者は直接HTML形式の文書から自然言語の文をUNL表現に変換し、そのUNL表現をターゲット言語文に変換してターゲット言語のHTML文書を作成できる。シンプルモードでは簡単な方法で手動ワード選択ができる。
プロモードではワード選択では辞書エントリーの修正ができる。これらの機能を使って利用者が正確なUNL表現を作ることができる。UNL表現はUNLグラフィックエディターを使って編集することができる。UNLグラフィックエディターはUNLオントロジーを参照して利用者の修正結果を検証する。

図3 UNLプラットフォームの構成
UNLプラットフォームの現状と将来
UNLプラットフォームは英語や日本語とUNL表現の相互変換ができる。近い将来、中国語が追加される予定である。
UNLプラットフォームの特徴
多岐にわたる機能レベル
UNLプラットフォームでは三つのレベルでエンコンバージョンすることができる。それらはワード編集可能、ワード選択可能、および自動の三つである。自動変換では文から直接UNL表現を得ることができる。ワード選択可能な変換ではより正確なUNL表現を得ることができる。ワード編集可能な変換では正確なUNL表現を得るためのコントロールができる。また、必要に応じてアノテーションを利用してUNL表現を作る機能も追加する予定である。
HTML文書自動処理
UNLプラットフォームではHTML文書を直接かURLを指定して入力することができる。HTML文書が入力されると文検出と抽出が自動的に行われる。HTML文書のレイアウト情報はそのテキストから得られるUNL表現とともに格納される。レイアウト情報はターゲット言語のHTML文書を構成するときに使われる。ターゲット言語のHTML文書の形成はそのUNL表現に対してデコンバージョンがリクエストされたときに行われる。この機能を利用してUNLプラットフォームはウエブページの翻訳に使うことができる。
UNLグラフィック編集
UNLエクスプローラではUNLグラフィックエディターを必要に応じて使うことができる。UNLグラフィックエディターを使ってUNL表現をグラフに表示したり、そのグラフを修正することでUNL表現を編集することができる。
UNL変換開発支援
UNLとの変換モジュールの開発をサポートするための総合開発支援ツールは開発中である。このツールはエンコンバージョンとデコンバージョンのルールや辞書の開発をサポートするためのさまざまな機能を備える。このツールを使って既存の変換ルールや辞書を修正したら新しい言語を処理するための変換ルールや辞書を作ることができる。
UNLプラットフォームは下記のURLで使うことができる:
www.undl.org/unlpf/
|