オントロジー工学序説
Ontology Engineering

― 内容指向研究の基盤技術と理論の確立を目指して ―
Towards the Basic Theory And Technology for Content-Oriented Research

溝口理一郎    池田満
Riichiro Mizoguchi and Mitsuru Ikeda

大阪大学 産業科学研究所
ISIR, Osaka University
8-1 Mihogaoka, Ibaraki, Osaka 567 Japan

E-mail:mizemail

Keywords:Ontology, Knowledge engineering, Knowledge reuse, Content-directed AI

Summary

There are two types of research styles in AI such as "Form-oriented" and "Content-oriented" and the former has dominated the AI research to date. Recently, however, the importance of "Content-oriented" research has been recognized. This is partly because several problems to solve require not only formal theories but also technologies dealing with content of knowledge. Although content-oriented research seems promising, which is partly justified the success of expert systems research, we have to admit that content-oriented research is suffering the following three difficulties: 1) The research tends to become ad-hoc, 2) we do not have any sophisticated technologies for enabling the research results to accumulate, and 3) we have no basic research. Without overcoming these shortcomings, we could not expect the growth of the research.

The main objectives of this paper is to propose a new research field called "Ontology Engineering" and to show it can be a basic research of content-oriented research and provide such technologies badly needed by it. We begin the paper by discussing what an ontology is. Although ontology is becoming popular within a community, it is not well understood in AI community in general. We carefully explain what an ontology is. To our knowledge, how to use an ontology is one of the crucial issues in ontology research. Therefore, we analyze the depth of the ontology use in seven levels as well as discussing what concrete advantages ontology can give in the real-world problem solving. The next topic is the classification of ontologies in which we introduce an idea of specification of problem solving context by identifying task ontology. We exemplify some content-oriented research including our recent work. Finally, on the basis of the discussion made thus far, we present some research agenda of ontology engineering which covers philosophy, knowledge representation, general and domain ontologies, standardization, electronic data/knowledge interchange, knowledge reuse/sharing, media integration, and so forth.

1.まえがき

人工知能研究のなかには,論理や知識表現などを扱う「形式指向」の研究と知識の内容を研究の対象とする「内容指向」の研究がある[溝口,96a].人工知能研究はこれまで「形式指向」の研究を中心に行なわれてきたが,近年,内容指向の研究の重要性が高まっている.それは,現実に存在する知識処理の課題の多く,例えば,知識の再利用,複数のエージェントが協調するために必要な通信,理解に基づくメディア統合,大規模知識ベース/常識ベースの開発,知識の標準化による知識共有などの問題の解決には,推論などの形式的な操作の高度化だけではなく,様々な形態で存在する知識の「内容」を扱う基礎研究と高度技術が不可欠であることが明らかになってきたからである.

形式化の一つである論理は形式的に健全な議論を規定するための強力な道具を提供する.そこでは,形式的に正しい思考を規定することができ,人間の思考の抽象的な限界を議論することも可能である.しかし,健全な推論によって,与えられた問題を解決するためにはどのような知識を用意すればよいか,そもそも知識とは何か,我々は認識をどのように構成し,知識の具体的内容はどういう構造と性質を持っているのかといった疑問に「形式」は答えてくれないのである.

その意味で,「知能」を形式的に捉える,あるいはその根源を問題解決機能(推論,論理など)に求めることの代わりに「知識」の重要性を力説したFeigenbaumの主張は正しかった[Feigenbaum, 77].このことはエキスパートシステムの成功が証明している.しかし,それは更に深化しなければならない.即ち,Feigenbaumの時代の知識に対する理解は,「専門家の専門知識をルールで表現する」ということが本質であった.現在はそこから遥かに進歩している.知識は様々な形態を取って存在することから分かるように,知識源は実に多様である.専門家,データ集合(データベース),ドキュメント,画像の中にも存在する.そして,知識を扱う主体としてコンピュータ(ソフトウェアエージェント)と人間との2種類のエージェントが存在する.即ち,知識はこれら両方のエージェントのために存在するべきである.知識は複数のエージェントの間で共有され,様々な目的のために再利用されなければならない.そしてコンピュータによる知識処理は,このような多様な知識源に潜在する知識を両エージェントにとって操作可能な形に,抽出,変形,組織化する技術,即ち,知識メディア技術に進化しなければならない.その基礎を与える学問がオントロジー工学である. (注)筆者等が使う「エージェント」という単語は人間とコンピュータとを一般化し た主体的な動作主という意味である.

「内容指向」の研究の重要性はある程度認識されつつある.それにも関わらず,これまでの人工知能研究の多くは形式指向の研究が重要視され,内容指向の研究は軽んじられてきた.これにはいくつかの理由があるが,最も重要なことは内容指向の研究が以下のような問題を抱えていることであろう.

これらの問題点を解決することなしには,内容指向研究の発展は望めない.多くの場合,「開発」にとどまり,「研究」へと昇華することは難しい.この様な問題を解決するのが,本論文で提唱するオントロジー工学である.オントロジー工学は,知識ベースの設計意図,核となる概念化,基本概念の意味の厳密な定義などを与えるだけでなく,実世界の情報モデル構築のために不可欠な,知識を「積み上げる」技術と理論を提供する.

オントロジーに関する研究はこの数年間で急速な広がりをもって行なわれている.しかし,未だにオントロジー自身に関する定義が定まっていないのが現状であり,まして外部にいる研究者には不透明な部分が多い.更に,我が国においてはオントロジー研究の重要性が必ずしも正しく理解されているとは言えない.オントロジーは哲学的な理論から現実の問題解決に直接関係する具体的な課題まで幅広い議論が必要であり,それだけに奥が深く,理解も混乱しがちである.しかし,工学としての知識処理の将来を考えたとき,「内容指向」研究を支える基礎としてオントロジー研究は今後ますます重要となる.

本稿では,「記号処理による知識記述」の世界の範囲内で今後の研究の一つの中核をなすと考えられるオントロジー工学を提唱し,その詳細について論じる.次章において,オントロジーの定義に関して論じる.3章ではオントロジーの工学的な利用形態を整理し,その役割,すなわち,オントロジー工学の意義を論じる.次に4章ではオントロジーの分類を行なう.5章では,内容指向研究の具体的なイメージを示すためにいくつかの研究の方向を議論する.最後に,筆者等が考えるオントロジー工学の研究課題を示す.

2.オントロジーとは

2.1 簡単な定義

まず,オントロジーの簡単な定義から始めよう.

一言でオントロジーを表現する場合にはこの様になるが,深い理解のためにはこれでは不十分である.(2)と(3)の定義の相違点は4.1で明らかにすることにして,以下ではオントロジーの詳細な定義を与える.

2.2 包括的な定義

オントロジーと類似する概念であるTaxonomy,TerminologyとVocabulary,そしてオントロジー記述の重要な概念である公理と準公理をとりあげて相互の違いを明確にしておく.まず初めに大前提から始めよう.Ontologyの日本語訳である「存在論」は最後に「論」がつくことから,オントロジーは学問の一分野を指すと考えることが普通である.しかし,現在ではそこでの考察の結果である,「体系化された存在に関する記述」を指す意味で用いられることが多く,工学的にもその意味の方が大切であるので,ここでは後者を指すものとして議論を進める.

(1) Terminology(用語論)

概念に関する合意を得た後に,その概念に付与すべきラベルを決定する必要があるが,ラベルを何にするかを論じることが中心課題となる.言い方を変えれば,概念の呼び名を議論の対象としている.

(2) Vocabulary(語彙)

自然言語処理などで用いられる処理の対象とする単語の集合を指す.単語は必然的に概念を指示するためオントロジーと非常に近い関係にある.しかし,語彙は自然言語依存であり,普遍性に欠ける.しかも,語彙(単語)が指す概念の意味と単語間の関係の記述に関する配慮もオントロジーに比べて弱い.Terminologyでは概念が先にあるのに対して,Vocabularyは名前が先にあり,その意味の明示的な記述に興味の中心がある.

(3) Taxonomy(分類学)

一般には分類全般を指すが,ここでは概念分類を指すことにすると,オントロジーと最も近い概念である.概念分類はis-aリンクやpart-ofリンクを用いて階層的になされる場合が多い.概略的にはTaxonomyにおいて各概念の意味定義と概念間のさらに詳細な制約を明確に記述したものがオントロジーといえる.

(4) Ontology(存在論)

Guarinoにならって哲学で議論されるオントロジーをそれ以外のオントロジーと区別するために,初めの"o"を大文字"O"にした"Ontology"という英語を使うことにする[Guarino, 95].Ontologyは,存在とは何か,存在を説明するために必要な概念は何か,そしてその概念は如何に存在を体系的に説明できるか,などの質問に応えるべき理論であり,哲学者はそれぞれ独自のOntologyを提案してきた.

(5) ontology(オントロジー)

基本的な方法論は哲学に従うが,考察の対象が存在一般という基本的なものだけではなく,人工物を含めた具体的なもの,例えば企業活動,熱力学,問題解決構造などを対象として考察したものであって,そこに現われる概念と関係を明示的に示し,明確な意味定義を与えたもの.従って,原理的にオントロジーは考察対象の数だけ存在し,英語では"ontologies"のように複数形を取りえる.必ずしも論理を使った定式化を行う必要はない.

(6) Formal ontology(形式的オントロジー)

オントロジーの記述を述語論理などを用いて公理化したもの.公理化することによって,オントロジーが持つ能力に関する質問に答えることができる.このことは形式化の意義である.

(7) Axiom(公理)

宣言的かつ厳密に表現された知識でその正しさを証明なしで受け入れるべきもの.論理の世界では推論の前提となる知識を表すので本質的な意味を持つ.一階述語論理で表現される場合にはその推論エンジンとしては汎用の証明系が想定されるが,余りにも当然のものであり,その存在が議論にのぼることはない.

オントロジー記述における公理には次の二つの役割がある.

オントロジーの能力に関する質問はオントロジーの評価に関して重要な役割を担っているが,大きく分けて次の二つに分類することができる.

前者はCompetenceに関する質問[Gruninger,94],後者はPerformanceに関する質問と言うことができる.Competenceに関しては述語論理などで形式化された公理を用いた記述が適していることは明らかであろう.しかし,Performanceに関する質問に対しては,本質的に手続き的な記述が必要な場合があり,形式的な公理と証明系では答えることができないことが多いのが現実である.そこで,必要となる概念が次の準公理である.

(8) Axiom equivalent(準公理)[Forbus, 95]

完全で普遍性のある述語論理の証明系を前提とした形式化された公理ではなく,Performanceに関する質問に答えるために必要な手続き的なエンジンの存在を前提として,本質的な情報は宣言的に公理として記述したもの.準公理は必ずしも形式化されている必要はなく,Performanceに関する質問には人間が解釈することによって答えを推論することができれば良しとする.

公理と準公理の差は公理の基盤となる表現体系が持つ性質の差と考えることができる.一般に「公理」という言葉には,「ある宣言的表現体系で表現され,それを前提として他の全ての事実を導きうる数少ない法則」というニュアンスがある.もちろん,理論が提供する能力を明確にするために全てを形式的に規定することは工学的にも理想であり,そこで使われる「形式」には体系として様々なオントロジーのバリエーションに対して普遍性と完全性があることが求められる.しかし,そういった理想論は現実を無視した議論でしかない.知識工学が対象とする「知識」の能力に対して十分な表現能力を持った宣言的表現体系を現実的に持ち得ないことを考えると,「公理」という概念をそのままの意味で用いることは強すぎる制約になる.例えば,完全で無矛盾な体系として一階述語論理に基づく表現体系を採用すると宣言した時点で,我々は「数学的帰納法が全ての述語に対して健全である」ということを,知識として扱うことを放棄しなければならなくなる.

形式的体系だけを公理の足場とせずに,自然言語での記述,あるいは解釈器として手続き的プログラムを前提とした「準公理」を認め,形式化された「公理」と「準公理」を積み上げてオントロジーの体系化を目指すことが,工学的に健全なアプローチと言えよう.

2.3 オントロジーに関する合意

2.3.1 合意の部分性

言うまでもなく,オントロジーの利用に際しては,「オントロジーへの合意」が前提となる.しかし,この合意はオントロジーの工学的利用を考える上では本質的に部分的であることに注意しなければならない.例えば,概念依存構造の表現に関するプリミティブを提案したCD理論について考えてみる[Schank,75].CD理論のプリミティブに合意した研究者がCD理論を利用したプログラムの作成にあたって,独自の手続き的公理をプログラム中で採用し,結果としてCD理論が明確に規定した以上の意味論を備えたプログラムが実現された.このことは,オントロジーの利用に際して事前の合意が部分的であることを如実に表している.オントロジー研究はこの合意の部分性を念頭にいれて,合意すべき内容のできるかぎり明示的な記述を試みなければならない.

2.3.2 合意のレベル

オントロジーの開発は各研究者によって独自に行なわれるのが通常であるが,同じ対象に関するオントロジーについて合意することは容易ではない.Skuceが指摘するように,合意のレベルにはつぎの4段階がある[Skuce,1995].

オントロジー構築の方法論が違うとはじめから全く議論が噛み合わない場合がある.オントロジーの利用目的を明確に規定せずに設計された場合,トップダウンに設計された場合,ボトムアップに設計された場合等立場の相違によって初めから受け入れられないことは理解できよう.

開発方式で合意が得た後,最も重要な点が概念の切り出しとその意味の確定である.この段階で必要な概念と関係が抽出され,それらの意味が定義される.言うまでもなく,この段階でオントロジーの本質が確定する.次に行われることが,概念の名前の確定である.問題によっては,有用な概念が検出されたとしても,用いる自然言語によってはそれに対応する語彙を持っていない場合があり得る.実際,筆者等は振る舞いの概念化においてそのような経験を持っている.また,開発者によって単語の意味定義が微妙に異なる場合があり,名前付けに関して合意を得るのは容易ではない.

そして,最後の難関が公理化である.既に議論したように,公理化の方法論には厳密な形式化を要求する立場と準公理の立場と対立する方式がある.特に,完全な形式化を行なうと表現できない意味が多く現われ,準公理の立場は細心の注意を払わなければ本質的な情報が推論手続きに埋もれてしまう可能性がある.この問題はオントロジー工学の学問上の本質的な課題であり,今後の検討を要する.

3.オントロジー工学の意義

Ontologyは「分かる」ことに貢献する.工学的な貢献は少ないが,それ自体意義深いことであり,それで十分である.しかし,オントロジー工学は工学である以上,オントロジーの具体的な意義を明確にしなければならない.

全てのソフトウェアにはオントロジーは存在しており,全ての経営者の頭の中には「企業オントロジー」はある.従って,オントロジーを議論する必要性が理解できないという意見がある.一見,その意見は正しいようにも思われるが,それらは「潜在」しているのであって,決して明示的には記述されてはいないことを指摘しておきたい.本節では,オントロジーの明示的な記述で得られるメリット,即ちオントロジー工学の意義を明確にする.

まず,オントロジー工学の究極の目的は,「実世界,厳密には情報科学が対象とし得る全ての対象のモデル構築の基盤を与えること」にあることを宣言しておこう.そしてそれは共有/再利用が可能で,人間とコンピュータの双方に理解可能でなければならない.

3.1 Design Rationaleとしてのオントロジー

設計問題を例にとる.設計における人工知能の研究で最近注目を集めている研究に,Design rationale(設計意図)の問題がある.設計の世界では,設計後しばらくして改良設計を行なうことや,他人が行なった設計を元にして新たな設計を行なう場合がしばしばある.そのような場合,ある部品が付加されている理由や特殊な構造に出くわしたとき,なぜそのようになっているか理由が分からない場合には,その既存の設計結果を再利用することができない.その「理由」はDesign rationale(以降,DRと呼ぶ)と呼ばれるが,通常の設計ではそのような情報が残されることは少ない.設計行為は,部品の選択,部品のパラメータの値の選択(決定),部品間の位相的接続関係の設定など,実に様々な,そして数多くの「決定」の集積であり,その全てには設計者の意図と合理的な理由が存在する.その情報はある意味では設計図と同じくらい重要な意味を持っている.設計物とそれが持つ有用な情報の再利用には,設計意図の理解が不可欠だからである.

知識ベースのオントロジーは正しくDRに対応する働きをする.他人が構築した知識ベースを理解するには,前提とされている条件や環境,解くべき問題が要求する仮定などの暗黙的な情報,そしてそれらを反映した対象の世界の概念化に関わる根本的な情報を知ることが必要である.しかしながら,設計と同様,これまで実に多くのシステム(知識ベース)が構築されてきたにもかかわらず,その様な情報が明示的に示されることはほとんどなかった言っても過言ではない.オントロジーはそのようなDR情報を提供し,知識ベースの構築を支えるバックボーンとしての役割を持っている.今後の知識処理は明示的に示されたオントロジーに基づいて行なわれなければならない.

3.2 オントロジー利用のレベル

これまで,オントロジーの開発は盛んに行なわれて来たが,オントロジーの利用の仕方や形態に関してはあまり議論されてこなかった.ここでは,明示的に記述されたオントロジーの利用の仕方を利用の深さが浅い順にまとめておこう.

レベル1:エージェントが会話をするときの語彙として用いる.語彙の意味は隠され,ラベル情報のみが用いられる.
レベル2: データベースの概念スキーマとして用いる.概念や関係の構造情報のみが用いられる.データベースにおける概念化は概念スキーマそのものである.即ち,対象世界のオブジェクトとその属性,そしてオブジェクト間の関係を明示的に示したものである.データベースの検索は概念スキーマに関する合意があれば,基本的には円滑に行なうことができる.
レベル3: 知識ベースの構築を支えるバックボーン(DR)情報を得る.オントロジーに関する合意を得る情報として用いる).このレベル以降が,オントロジーの本格的な,即ち内容に踏み込んだ利用の形態である.
レベル4: Competenceに関する質問に答える.オントロジー自身,及びオントロジーを利用して構築されたシステムの様々な性質を形式的に議論する.
レベル5: データベースの概念スキーマの意味を考慮した変換(EDIの理想型).本質的には同じ情報を持っているが,概念スキーマが異なったデータベース間のデータ交換では,単なる構造変換だけではなく,概念の意味を考慮して対応する概念を同定し,整合性のある対応関係を得る必要がある.
レベル6: バックボーン情報に基づいて知識ベースを再利用する.ここで言う再利用は4.1で述べる直接法の意味での再利用である.
レベル7: バックボーン情報に基づいて知識ベースを再構成する.最も高度な利用であり,オントロジー利用の究極とも言えるものである.一種の機械翻訳である.
以上の7つのレベルに加えて,それを横断する形で「標準化」としての役割がある. このように,オントロジーの利用のレベルは深く,多岐にわたっている.レベル3以降はこれまでになかった新しい知識処理の形態であり,知識工学の基礎を与えるオントロジー工学の意義が理解されよう.

3.3 標準化:ボルト&ナットプロジェクト

オントロジー工学の一つの主要な役割は標準化にあるが,標準化は両刃の刃である.理論をまとめるときには貢献するが,実行に移す時の抵抗は大きく,全ての努力が水泡と帰す可能性すらある.しかし,今後の知識処理の高度化,高能率化を考えるとき,標準化の問題を避けて通ることはできない.例えば,意味素の標準化は危険ではあるが,魅力的な課題である.レベル5以降の利用を考えると,意味表現の核となる意味素は不可欠であろう.即ち,構造の変換とは異なり,意味を考慮しス変換には個別の表現間の大量の変換規則の利用と意味素を介した少数の変換規則の利用との二つの方法があるが,後者の方が効率が高いことは明らかである.

工業製品の生産性の高さを考えれば明らかなように,必要な基本部品の標準化は生産性の高度化に貢献するところが大である.知識処理,特に今後の高度知識処理,モデル構築とそれを前提として行なわれる問題解決においても同様の標準化が行なわれなければならない.ボルトとナットに対応するような規格品を知識処理の世界でも作る必要がある.例えば定性モデルのためのパイプやポンプの規格であり,企業オントロジーであり,タスクオントロジーの標準化である.もちろん,ボルトやナットに多くの規格があるように,これらのオントロジーは唯一のものである必要はない.ある程度広い範囲の人々の合意が得られた標準部品の存在の意義は大きい.また,言うまでもないが,オントロジーの標準化が行なわれたからと言って全ての知識が規格品として表現されるわけではな「.これは今日の機械設計が規格品を部品として使いながら独創的な設計が行なわれていることを考えれば明らかであろう.

4.オントロジー再考

知識が如何に用いられるかを考察することによってオントロジーに関する理解が深まる.実は,これまでのオントロジーに関する議論の多くは,オントロジーをどのように用いるかに関する議論を行なわずに「利用」という単語を使っているため,議論が不透明になっている.ここでは,3.2でまとめた利用のレベルを念頭に置きながら,これまでとは違った観点からオントロジーに関する考察を行なう.

4.1 共有と再利用

まず初めに共有と再利用という言葉で語られる知識の利用の形態を明確にする.知識の利用に関しては以下の二つの方法がある.

さて,共有と再利用の問題は両者の明確な区別なく論じられることが一般的である.両者は共通する概念を多く含んでいるため,両者が同一の概念であると考えられる場合が多く,その相違点の認識は重要であるにも関わらず,必ずしも正しく理解されていないように思われる.再利用と共有と言う用語自身が持つ意味を詳しく論じることは有益ではないので,用語の問題以前の問題として考察する.上で述べた知識利用に関する2つの状況に注目してみよう.

直接法は,ソフトウェア工学における再利用と同じであることから「再利用」と呼ぶことに異存はあるまい.間接法の場合は複数のエージェントが他のエージェントの知識を間接的に利用することによって「共有」していると考えることができることから,「共有」と呼ぶことは自然であると思われる.用語の類似性に反してこの二つの状況は大きく異なっている.「共有」では知識を利用するエージェントは,依頼されて実際に問題解決を行なったエージェントがどのような知識を用いてどのように問題を解いたかには関心がなく,実際それに関して一切の知識を持っていない.一方「再利用」では,再利用の対象となる知識の目的,適用条件などの詳細な事柄に関する情報が必須となり,知識ベースの内部に立ち入った理解が要求される.即ち,「共有」では知識ベースはブラックボックスと見なし,「再利用」ではホワイトボックスと見なしているのである.

このように,「再利用」の立場を採ると,「共有」の立場とは異なり,オントロジーに関する合意を得るまでの過程や各概念や関係の意味するところ,即ち「内容指向」研究へ踏み込んでいくことが中心となる.

3.1で紹介したオントロジーの簡単な定義において,「概念化の明示的な記述」は中立的な定義の様ではあるが,「再利用」の意識は希薄である.一方,「人工システムを構築する際のビルディングブロックとして用いられる基本概念/語彙の体系」は「再利用」を意識した定義であり,その立場は大きく異なる.

4.2 オントロジーの分類[Mizoguchi, 95]

上で述べた知識利用への取り組みの相違に対応してオントロジーも自ずと異なってくる.それにもかかわらずこれまで行われてきたオントロジーに関する議論では,どのタイプのオントロジーを論じているのかが不明確であり,オントロジーに関する理解を混乱させていたように思われる.筆者等は次に示す4種類のオントロジーがあると考えている.

(1)Content ontology

再利用可能な知識ベースを構築することを考える際に必要となるオントロジーである.実際にコンピュータ上でオントロジーを(再)利用するので,3.2の最も深いレベルまでを想定して考察が行なわれる.複数のエージェントが意味の内容に関する合意を得る前の,オントロジーを設計する時の立場を強調したオントロジーということもできる.

(2)Communication(tell&ask)

ontology 分散協調による間接的な再利用を考える時に必要となるオントロジーである.エージェントの内部の詳細には関与せず,エージェント間での知識内容に関する合意が得られていることを前提とした,エージェント同志のコミュニケーションに必要最小限のオントロジーといえる[Gruber, 92][西田,94].このことから各概念の意味記述よりも,その意味を指示する語彙のラベルを与えることに議論の中心がおかれる傾向がある.データベースの概念スキーマとの類似性やオントロジーの移植性等が論じられるのはこのタイプのオントロジーである.

(3)Indexing ontology

知識ではなく,事例を対象にした事例ベースを構築することを目指し,個々の知識を直接扱うことの困難さを回避する知識利用も存在する.CBR,MBR等の推論手法を考慮にいれた新しい試みがその代表例である.このオントロジーは事例のインデックスの記述に用いられるオントロジーである.事例記述では事例の内容とそれを利用するのに適した問題(コンテキスト)を明示できるように工夫されるのが普通である.しかし,あくまでも検索が目的であるので,事例に関する詳細な記述を保証する概念化は要求されない.従って,オントロジーとしてはそれほど深くなく,程々に内容と問題解決との両方の概念を含むオントロジーとなる.

(4)Meta-ontology

オントロジー記述言語で提供しているオントロジ記述用のプリミティブ(オントロジー).Ontolingua [Gruber,92]で採用されているフレームオントロジーはその例である.メタという意味で上の3つとは明確に区別される.

上述のオントロジーの大分類の中の Content オントロジーを知識の再利用の立場から更に分類すると図1のようになる.

図1 オントロジーの分類

このようにオントロジーには多くの種類が存在することがわかるが,これはオントロジー研究が発散していることを意味するのではなく,オントロジーの考察対象としての実世界の知識の多様さを表していると考えるべきである.オントロジーの多様さ自体が考察の対象になる.即ち,この多様さを明確に捉えることによって知識に対する我々の理解が深まるのである.

この分類は想定する問題解決に依存するオントロジーと依存しないオントロジーに大別される.通常議論されるオントロジーは後者であるが,前者の考察が必要であることを主張するところは我々の立場の特色となっている.両者をつなぐ橋渡しをする役割はT-ドメインオントロジーが担っているが,十分ではなく,今後の研究が待たれる.

5.オントロジー研究の例

ここでは,オントロジー研究の例や新しい可能性を挙げて筆者らが考える内容指向研究の具体的なイメージを与える.

(1)知識表現の基礎

意味表現で基本的な役割を演じるのが「関係」である.意味ネットワークを見るまでもなく,is-a,instance-of,subset-of,part-of,member-ofなどの「関係」は最も頻繁に使われる基本的な関係であり,その「意味」に関しては完全に理解しているように思われている.しかし,次の簡単な例を考えてみれば分かるように,実際はそうではない.

これらの問いすべてに答えられるために必要十分な上述の5つの関係の意味の明確な定義がなされていないのが実状である.知識表現に用いられる関係の定義ノ曖昧さがあれば,そこに表現されている知識は共有・再利用ができるはずがない.概念の定義に揺らぎがあるという程度の問題ではなくなってしまう.筆者らの主張する内容指向の研究,特にオントロジー工学の基礎理論はこのような意味記述の根本に関わる定義を形式的に明確な定義を与えることもその重要な課題の一つになっている.

(2)EDIとBPR

EC(Electronic Commerce)とEDI(Electronic Data Interchange)はホットな話題であるが,現在は完全自動交換という理想からはかけ離れた状況にある.言うまでもなく,対象となるデータの意味には様々なものがあり,その上での自動処理は意味処理にまで踏み込まねばならない[Hawes,1994].

などの問題点を打破するためには,まさしくオントロジー研究の根幹の一つである,「意味素」の問題を扱うことは必須であろう.

BPR(Business Process Reengineering)の動きも一過性の流行に終わらせないためには,プロセスを対象としたオントロジーを確立する地道な作業が不可欠である[Gruninger, 1994][Ushhold, 1995].

(3)分散・協調システム

分散協調システムでは,協調するには「何を交信すべきか」即ち,交信の内容に踏み込んだ議論が不可欠である.この種の議論は,ドメイン依存性が高くなるにつれて議論の一般性が低下し,理論的色彩が弱まるため注意が必要であるが,極めて重要な課題である.とくに,協調自体をタスクと見なした立場からの深い理解,協調して解くべき問題の類型化,交信すべき内容の類型化,そして交信メッセージのオントロジーの検討などの研究課題は大変興味深いものであり,今後の成果が大いに期待される.

(4)メディア統合[溝口96b]

マルチメディア処理の本質は明らかに内容を理解することを通したメディア統合にある.これまで相互の関連を考慮することなく個別に利用されている多種多様なメディア、すなわちテキスト、音声、図、静止画像、動画像等によって表現されている知識を、各種メディア間での変換、要約、統合等を行う基盤技術が開発されなければならない.メディアの「内容」に踏み込んで,オントロジーを用いた「理解によるメディア統合」は緊急の課題であろう.

(5)筆者らの研究

(a) 概念レベルプログラミングとタスクオントロジー[Seta, 96]

筆者らは専門家とコンピュータとの概念ギャップを解消して,コンピュータに導かれながら専門家自身が自分の問題解決過程モデルを構築していくことを可能にするためにタスクオントロジーの概念を提唱し,それをMULTISとして実現した[テヘリノ,93].現在は,MULTISの考えをさらに発展させて,「エンドユーザプログラミングを指向したタスクオントロジーとその形式化」という課題に発展すると同時に,タスクオントロジー記述言語とその環境を開発している.

(b) 機能と振る舞いのオントロジー[笹島,96]

これまで多くの研究が行なわれて来たにもかかわらず振る舞いと機能に関する満足のいく定義は得られていない.モデルに基づく問題解決を考えるとき,定性モデル構築に用いることができる基本部品の標準化は必須の要件であり,また機能と振る舞いに関する深い理解は,科学的な興味にとどまらず,機能部品の標準化に貢献する極めて重要な意味を持つ.本研究のオントロジー工学から見た主眼点は,概念の形式的な公理化よりも,[1] 機能と振る舞いという二つの概念の深い理解,[2] 対象とする流体系のドメインにおける基本部品の標準化へ向けた記述言語の整備,そして[3] 機能と振る舞いの二つの空間の間の写像の自動化と,それに基づく対象システムの機能理解,そして再設計支援システム開発への展開である.

(c)定性推論と時間のオントロジー[来村,97]

定性推論を対象にして時間を考えると,通常の理解の仕方では不足することが分かる.推論エンジンが理解できる時間というものがどのようなものであり,通常の時間とどこが異なるのかということに関する厳密な定義が必要になってくる.これは対象の定性モデル構築における根本的な問題である.基本的には定性推論における時間は因果との関連において意味を持つので,時間概念の本質は人間の因果理解を反映した事象の同時性と順序づけにある.その観点に基づいて7種類の時間が進む単位を整理し,それらの関係を明確にすることによって,推論システムに埋もれていたオントロジー情報を明示的に示すと共に,推論系を実装して有効性を確認している.

6.オントロジー工学の研究課題

これまでオントロジーの重要性と有用性について述べてきた.筆者等の考える内容指向研究を今後の人工知能研究の一つの核となる研究にまで育てるためには,オントロジーの理論とそれを扱う技術をオントロジー工学という学問体系のもとに推進していく必要がある.既に述べたように,内容指向の研究はともすればad hocになりやすく,体系的な学問に成熟することが困難であるという性格を持っている.従って,オントロジー工学は哲学や論理などの基礎理論と実世界の知識を扱う技術までの間の連続性を保った幅の広い,奥が深い学問体系とすることが重要となる.以下に,筆者等が考えるオントロジー工学の研究課題とその役割を示す.オントロジー工学はまだ未成熟であり,今後の研究を通してその研究課題は洗練されなければならないことは言うまでもない.

7.むすび

人工知能研究における「形式」と「内容」は車の両輪であると同時に,また永遠の課題でもある.本論文で提唱したオントロジー工学は,内容指向研究の基礎(基盤技術)研究であり,内容の表現に必要な知識表現を考え,オントロジーの能力を形式化するための技術を考える学問分野である.様々なタスクとドメインについて系統的かつボトムアップに検討を進めてオントロジーとそれに関わる研究自体を体系化することが目的になっている.

本稿では,オントロジー工学に関する諸概念を系統的に整理し,内容指向アプローチの種類と形態,それが抱える問題点について包括的な議論を行った.オントロジー工学は,内容の核となる実体,事象,アクティビティ,時間,といった対象世界の概念化,各基本概念の意味の明確な定義,そしてそれに基づいて知識ベースの設計意図を明確化することに貢献する.そして最終的には,実世界の情報モデル構築のための合意を形成し,常識の表現,知識の共有・再利用の問題の解決に貢献することが期待される.

諸外国に目を向けると,情報科学と知識工学を「形式」と「内容」と位置づけて,それらを統合しようという気運の高まりが,特にEDIの分野で明確なってきている.この流れは,情報科学の一発展形として必然であり,知識工学が本来目指していた姿の一つでもある.我が国でも,今後の情報化社会の必然的ニーズの受け皿を作るという視点で,内容を対象とした体系的研究分野が知識工学の一分野として確立されることを期待したい.

参考文献