JP6282714B1 - 算出装置、算出方法、及び算出プログラム - Google Patents

算出装置、算出方法、及び算出プログラム Download PDF

Info

Publication number
JP6282714B1
JP6282714B1 JP2016229299A JP2016229299A JP6282714B1 JP 6282714 B1 JP6282714 B1 JP 6282714B1 JP 2016229299 A JP2016229299 A JP 2016229299A JP 2016229299 A JP2016229299 A JP 2016229299A JP 6282714 B1 JP6282714 B1 JP 6282714B1
Authority
JP
Japan
Prior art keywords
information
triple
triple information
calculation
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016229299A
Other languages
English (en)
Other versions
JP2018085056A (ja
Inventor
新田 清
清 新田
サブニック イズトック
サブニック イズトック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2016229299A priority Critical patent/JP6282714B1/ja
Priority to US15/693,677 priority patent/US10885453B2/en
Application granted granted Critical
Publication of JP6282714B1 publication Critical patent/JP6282714B1/ja
Publication of JP2018085056A publication Critical patent/JP2018085056A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/046Forward inferencing; Production systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数のトリプル情報における概念体系を統計的に把握可能にする。【解決手段】本願に係る算出装置は、取得部と、算出部とを有する。取得部は、3種類の要素に関する関係を示す複数の第1トリプル情報と、複数の第1トリプル情報における概念体系に基づく複数の第2トリプル情報とを取得する。算出部は、取得部により取得された複数の第2トリプル情報の各々に対応する第1トリプル情報の数に基づいて、複数の第1トリプル情報に関する統計的情報を算出する。【選択図】図3

Description

本発明は、算出装置、算出方法、及び算出プログラムに関する。
従来、ネットワーク上のリソースを記述する枠組みとして、RDF(Resource Description Framework)が知られている。また、RDFのデータモデルでは、トリプル(triple)と称される主語(subject)、述語(predicate)及び目的語(object)の3つの要素でリソースにおける関係を表現する。例えば、トリプルとしてエンコードされ格納されたグラフデータに対するトリプルデータ(トリプル情報)は、膨大な量になるため、複数のデータ記憶ユニットの間に情報を分散する技術が提供されている。
特開2015−099586号公報
しかしながら、上記の従来技術では、複数のトリプル情報における概念体系を統計的に把握可能にすることができるとは限らない。例えば、分散型ネットワークによりトリプル情報を格納するだけでは、格納した複数のトリプル情報がどのような概念的な分布になっているか等、複数のトリプル情報における概念体系を統計的に把握可能にすることが難しい場合がある。
本願は、上記に鑑みてなされたものであって、複数のトリプル情報における概念体系を統計的に把握可能にする算出装置、算出方法、及び算出プログラムを提供することを目的とする。
本願に係る算出装置は、3種類の要素に関する関係を示す複数の第1トリプル情報と、前記複数の第1トリプル情報における概念体系に基づく複数の第2トリプル情報とを取得する取得部と、前記取得部により取得された複数の第2トリプル情報の各々に対応する第1トリプル情報の数に基づいて、前記複数の第1トリプル情報に関する統計的情報を算出する算出部と、を備えたことを特徴とする。
実施形態の一態様によれば、複数のトリプル情報における概念体系を統計的に把握可能にすることができるという効果を奏する。
図1は、実施形態に係る算出処理の一例を示す図である。 図2は、実施形態に係る算出システムの構成例を示す図である。 図3は、実施形態に係る算出装置の構成例を示す図である。 図4は、実施形態に係る第1トリプル情報記憶部の一例を示す図である。 図5は、実施形態に係る第2トリプル情報記憶部の一例を示す図である。 図6は、実施形態に係るオントロジ情報記憶部の一例を示す図である。 図7は、実施形態に係る第2トリプル情報の抽出を示す図である。 図8は、実施形態に係る算出処理の一例を示すフローチャートである。 図9は、実施形態に係る一のトリプル情報に対する算出処理の一例を示すフローチャートである。 図10は、算出装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る算出装置、算出方法、及び算出プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る算出装置、算出方法、及び算出プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
(実施形態)
〔1.算出処理〕
図1を用いて、実施形態に係る算出処理の一例について説明する。図1は、実施形態に係る算出処理の一例を示す図である。図1では、算出装置100(図3参照)が第1トリプル情報記憶部121に記憶されたトリプル情報に関する統計的情報を算出する場合を示す。なお、ここでいうトリプル情報とは、RDF(Resource Description Framework)のデータモデルに基づく情報であって、主語(subject)、述語(predicate)及び目的語(object)の3つの要素(トリプル:triple)でリソースにおける関係を表現する情報である。また、以下では、第1トリプル情報記憶部121に記憶されたトリプル情報を第1トリプル情報とし、第2トリプル情報記憶部122に記憶されたトリプル情報を第2トリプル情報とし、オントロジ情報記憶部123に記憶されたトリプル情報をオントロジ情報と記載する場合がある。なお、第2トリプル情報記憶部122やオントロジ情報記憶部123についての詳細は後述する。
図1中の第1トリプル情報記憶部121には、統計的情報の算出対象となるトリプル情報群が格納される。図1の例では、算出装置100が第1トリプル情報記憶部121中のトリプル情報群のうち、第1トリプルID「FID11」により識別される第1トリプル情報FID11を対象に統計的情報を算出する場合を示す。なお、図1中の第1トリプル情報記憶部121は、図4中の第1トリプル情報記憶部121に対応し、図1の説明に関する箇所のみを図示する。
上述のように、「第1トリプル情報FID*(*は任意の数値)」と記載した場合、その第1トリプル情報は第1トリプルID「FID*」により識別されるトリプル情報であることを示す。例えば、「第1トリプル情報FID21」と記載した場合、そのトリプル情報は第1トリプルID「FID21」により識別されるトリプル情報である。
例えば、図1に示す第1トリプル情報記憶部121は、「第1トリプルID」、「Subject(主語)」、「Predicate(述語)」、「Object(目的語)」といった項目が含まれる。
「第1トリプルID」は、トリプル情報を識別するための識別情報を示す。また、「Subject(主語)」は、第1トリプルIDにより識別されるトリプル情報の主語に対応する値を示す。また、「Predicate(述語)」は、第1トリプルIDにより識別されるトリプル情報の述語に対応する値を示す。また、「Object(目的語)」は、第1トリプルIDにより識別されるトリプル情報の目的語に対応する値を示す。
例えば、図1の例では、第1トリプル情報FID11は、主語が「<Jim>」、すなわち所定の人間「ジム」であることを示す。また、例えば、図1に示す例において、第1トリプル情報FID11は、述語が「<worksAt>」、すなわち「〜で働いている」という意味の述語であることを示す。また、例えば、図1に示す例において、第1トリプル情報FID11は、目的語が「<HOGE.inc>」、すなわち所定の会社「HOGE.inc」であることを示す。すなわち、図1の例では、算出装置100は、「ジムはHOGE.incで働いている」という具体的な意味に対応する第1トリプル情報FID11を対象に統計的情報を算出する例を示す。例えば、「<」と「>」との間の文字列は、所定の対象を示す。
まず、図1に示すように、算出装置100は、対象とする第1トリプル情報のクラスに関する情報を抽出する(ステップS11)。図1の例では、算出装置100は、第1トリプル情報FID11のクラスに関する情報を抽出する。例えば、算出装置100は、第1トリプル情報FID11のクラスに関する情報をオントロジ情報記憶部123から抽出する。
図1中のオントロジ情報記憶部123には、所定のオントロジ(概念体系)における各エンティティ(実体)等の定義に関する情報等が格納される。例えば、オントロジ情報記憶部123には、いわゆるRDFスキーマ等の概念体系における語彙の定義に関する情報が記憶される。なお、図1中のオントロジ情報記憶部123は、図6中のオントロジ情報記憶部123に対応し、図1の説明に関する箇所のみを図示する。図1の例では、説明に対応する箇所のみを図示するために、オントロジ情報記憶部123−1、123−2として2つ図示するが、図1中のオントロジ情報記憶部123−1、123−2は、同じオントロジ情報記憶部123であるものとする。なお、オントロジ情報記憶部123−1、123−2を区別せずに説明する場合は、オントロジ情報記憶部123と記載する。
例えば、図1中のオントロジ情報記憶部123は、「オントロジID」、「Subject(主語)」、「Predicate(述語)」、「Object(目的語)」といった項目が含まれる。
また、図1中のオントロジ情報記憶部123−1に示すオントロジID「TID501」により識別されるオントロジ情報TID501は、主語が「<Jim>」であることを示す。また、例えば、図1中のオントロジ情報記憶部123−1に示すオントロジ情報TID501は、述語が「rdf:type」、すなわち所定のプロパティであることを示す。例えば、述語「rdf:type」は、主語に対応する値が目的語に対応するクラスのインスタンスであることを示す。また、例えば、図1中のオントロジ情報記憶部123−1に示すオントロジ情報TID501は、目的語が「<ceo>」、すなわち最高経営責任者であることを示す。このように、図1に示す例において、オントロジ情報TID501は、「<Jim>」は、「<ceo>」のインスタンスであること、すなわち「ジムは最高経営責任者である」ことを定義する。
また、図1中のオントロジ情報記憶部123−1に示すオントロジID「TID502」により識別されるオントロジ情報TID502は、主語が「<Jim>」であることを示す。また、例えば、図1中のオントロジ情報記憶部123−1に示すオントロジ情報TID502は、述語が「rdf:type」であることを示す。また、例えば、図1中のオントロジ情報記憶部123−1に示すオントロジ情報TID502は、目的語が「<father>」、すなわち父親であることを示す。このように、図1に示す例において、オントロジ情報TID502は、「<Jim>」は、「<father>」のインスタンスであること、すなわち「ジムは父親である」ことを定義する。
また、図1中のオントロジ情報記憶部123−1に示すオントロジID「TID505」により識別されるオントロジ情報TID505は、主語が「<HOGE.inc>」であることを示す。また、例えば、図1中のオントロジ情報記憶部123−1に示すオントロジ情報TID505は、述語が「rdf:type」であることを示す。また、例えば、図1中のオントロジ情報記憶部123−1に示すオントロジ情報TID505は、目的語が「<commercial company>」、すなわち営利企業であることを示す。このように、図1に示す例において、オントロジ情報TID505は、「<HOGE.inc>」は、「<commercial company>」のインスタンスであること、すなわち「HOGE.incは営利企業である」ことを定義する。なお、本明細書中の全角スペースは半角スペースに置き換えてもよい。
なお、上述のように、「オントロジ情報TID*(*は任意の数値)」と記載した場合、そのオントロジ情報はオントロジID「TID*」により識別されるトリプル情報であることを示す。例えば、「オントロジ情報TID502」と記載した場合、そのトリプル情報はオントロジID「TID502」により識別されるトリプル情報である。
また、オントロジ情報記憶部123に記憶されたオントロジ情報に含まれる対象(以下、「名辞」ともいう)は、図1中のグラフ情報ON11やグラフ情報ON21に示すような階層的な概念体系を示すグラフ構造を有する。なお、ここでいう名辞は、概念の言語的表現であればどのような対象であってもよく、例えば抽象的対象や具体的対象及びその言語的表現が対応する品詞等に関わらずどのような対象であってもよい。また、例えば、ここでいう「名辞」は、RDFのデータモデルにおいては、「URI(Universal Resource Identifier)」として定義される。例えば、RDFのデータモデルにおいては、各概念に識別子(機械的なアドレス等)を対応付けることで、セマンティックウェブ技術における概念の唯一性を実現する。図1中のグラフ情報ON11に示すノードND101〜ND113やグラフ情報ON21に示すノードND201〜ND212は、オントロジ情報記憶部123に記憶されたオントロジ情報の各名辞に対応する。以下、ノードND101〜ND113及びノードND201〜ND212を区別せずに説明する場合、「ノードND」と記載する。
また、図1では、主語「<Jim>」に関する探索を行うグラフ構造を示すグラフ情報ON11と目的語「<HOGE.inc>」に関する探索を行うグラフ構造を示すグラフ情報ON21とを分割して図示するが、グラフ情報ON11、ON21は、オントロジ情報記憶部123に記憶されたオントロジ情報に基づいて構成される概念体系の一部である。すなわち、グラフ情報ON11とグラフ情報ON21とには共通のノードNDが含まれてもよいし、グラフ情報ON11中のノードNDとグラフ情報ON21中のノードNDとは矢印により連結されてもよい。
図1中のグラフ情報ON11やグラフ情報ON21に示す各ノードND間を連結する矢印線は、連結されるノードに対応する名辞間に上位クラスと下位クラスとの関係があることを示す。具体的には、矢印線の始点側のノードに対応する名辞が下位クラスであり、矢先側のノードに対応する名辞が上位クラスであることを示す。例えば、ノードND110に対応する名辞「<person>」は、ノードND113に対応する名辞「<employee>」の上位クラスであることを示す。なお、図1中においては適宜「<>」の記載を省略する。また、図1中のグラフ情報ON11やグラフ情報ON21中のノードNDは、説明に必要な一部のみを図示する。例えば、名辞「<person>」に対応するノードND110には、ノードND109、ND113の2つのノードND以外にも種々の下位クラス(下位概念)に対応するノードNDが含まれてもよい。
例えば、オントロジ情報記憶部123(図6参照)に記憶されたオントロジ情報TID231は、主語が「<employee>」、すなわち従業員であることを示す。また、例えば、オントロジ情報TID231は、述語が「rdfs:subClassOf」、すなわち所定のプロパティであることを示す。例えば、述語「rdfs:subClassOf」は、主語に対応する値が目的語に対応するクラスのメンバー、つまりサブクラス(下位クラス)であることを示す。また、例えば、オントロジ情報TID231は、目的語が「<person>」であることを示す。すなわち、オントロジ情報TID231は、「<employee>」は、「<person>」の下位クラスであることを示す。言い換えると、オントロジ情報TID231は、「従業員」は、「人間」の下位概念であることを示す。
例えば、算出装置100は、上述したオントロジ情報TID231に基づいて、グラフ情報ON11中の名辞「<employee>」に対応するノードND113を始点とし、名辞「<person>」に対応するノードND110が矢先となる矢印の関係を抽出する。
また、例えば、オントロジ情報記憶部123(図6参照)に記憶されたオントロジ情報TID201は、主語が「<ceo>」、すなわち最高経営責任者であることを示す。また、例えば、オントロジ情報TID201は、述語が「rdfs:subClassOf」であることを示す。また、例えば、オントロジ情報TID201は、目的語が「<officer>」、すなわち役員であることを示す。すなわち、オントロジ情報TID201は、「<officer>」は、「<ceo>」の下位クラスであることを示す。言い換えると、オントロジ情報TID231は、「最高経営責任者」は、「役員」の下位概念であることを示す。
例えば、算出装置100は、上述したオントロジ情報TID201に基づいて、グラフ情報ON11中の名辞「<ceo>」に対応するノードND103を始点とし、名辞「<officer>」に対応するノードND108が矢先となる矢印の関係を抽出する。このように、算出装置100は、オントロジ情報記憶部123に記憶されたオントロジ情報に基づいて、グラフ情報ON11やグラフ情報ON21に示すようなグラフ構造を抽出する。
図1の例では、算出装置100は、第1トリプル情報FID11の主語「<Jim>」が主語であり、述語が「rdf:type」であるオントロジ情報をオントロジ情報記憶部123から抽出する。また、図1の例では、算出装置100は、第1トリプル情報FID11の目的語「<HOGE.inc>」が主語であり、述語が「rdf:type」であるオントロジ情報をオントロジ情報記憶部123から抽出する。具体的には、算出装置100は、オントロジ情報TID501、TID502、TID505等をオントロジ情報記憶部123から抽出する。
例えば、算出装置100は、抽出したオントロジ情報TID501に基づいて、「<Jim>」が「<ceo>」のインスタンスであると特定する。これにより、算出装置100は、オントロジ情報記憶部123から「<ceo>」が「<Jim>」のクラスであること示す情報を抽出する。また、例えば、算出装置100は、抽出したオントロジ情報TID502に基づいて、「<Jim>」が「<father>」のインスタンスであると特定する。これにより、算出装置100は、オントロジ情報記憶部123から「<father>」が「<Jim>」のクラスであること示す情報を抽出する。なお、図示を省略するが、算出装置100は、抽出した他のオントロジ情報に基づいて、例えば「<American>」すなわちアメリカ人が「<Jim>」のクラスであること等を特定する。
算出装置100は、「<Jim>」のクラスに関する情報に対応するノードNDを抽出する。図1の例では、算出装置100は、「<Jim>」のクラスである「<ceo>」や「<father>」等に対応するノードNDを抽出する。図1の例では、算出装置100は、グラフ情報ON11中の領域AR11に示すように名辞「<ceo>」に対応するノードND103や名辞「<father>」に対応するノードND102を含む4つのノードND101〜ND104を抽出する。
また、例えば、算出装置100は、抽出したオントロジ情報TID505に基づいて、「<HOGE.inc>」が「<commercial company>」のインスタンスであると特定する。これにより、算出装置100は、オントロジ情報記憶部123から「<commercial company>」が「<HOGE.inc>」のクラスであること示す情報を抽出する。
算出装置100は、「<HOGE.inc>」のクラスに関する情報に対応するノードNDを抽出する。図1の例では、算出装置100は、「<HOGE.inc>」のクラスである「<commercial company>」等に対応するノードNDを抽出する。図1の例では、算出装置100は、グラフ情報ON21中の領域AR21に示すように名辞「<commercial company>」に対応するノードND201を含む4つのノードND201〜ND204を抽出する。
そして、算出装置100は、グラフ情報ON11中の4つのノードND101〜ND104から上位クラスを辿ることにより「<Jim>」のクラスに関する情報を抽出する。また、算出装置100は、グラフ情報ON21中の4つのノードND201〜ND204から上位クラスを辿ることにより「<HOGE.inc>」のクラスに関する情報を抽出する。
ここで、算出装置100は、グラフ情報ON11中の4つのノードND101〜ND104やグラフ情報ON21中の4つのノードND201〜ND204から探索する範囲を特定するための情報をオントロジ情報記憶部123から抽出する(ステップS12)。図1の例では、算出装置100は、第1トリプル情報FID11の述語「<worksAt>」に基づいて、グラフ情報ON11中の4つのノードND101〜ND104やグラフ情報ON21中の4つのノードND201〜ND204から探索する範囲を特定するための情報を抽出する。
例えば、図1中のオントロジ情報記憶部123−2に示すようにオントロジ情報TID101は、主語が「<worksAt>」であることを示す。また、例えば、オントロジ情報TID101は、述語が「rdfs:domain」、すなわち定義域を示す所定のプロパティであることを示す。この場合、述語「rdfs:domain」は、「<worksAt>」の主語になり得るクラスを示す。また、例えば、オントロジ情報TID101は、目的語が「<person>」、すなわち人間であることを示す。すなわち、オントロジ情報TID101は、「<worksAt>」の主語には、クラス「<person>」以下のクラスがなり得ることを示す。すなわち、「<worksAt>」の主語としては、名辞「<person>」が最上位概念であることを示す。なお、主語が「<worksAt>」であり、述語が「rdfs:domain」であるオントロジ情報、すなわち「<worksAt>」の定義域を示すオントロジ情報は複数あってもよい。
そのため、算出装置100は、グラフ情報ON11中の4つのノードND101〜ND104から探索する範囲を名辞「<person>」に対応するノードND110までと決定する。すなわち、算出装置100は、グラフ情報ON11中の4つのノードND101〜ND104から名辞「<person>」に対応するノードND110までの間に位置するノードNDに対応する名辞を名辞「<Jim>」のクラスに関する情報として抽出する(ステップS13)。
図1の例では、ノードND103、ND104から、ノードND110に到達できるため、ノードND103、ND104からノードND110までの間に含まれるノードNDは、名辞「<Jim>」のクラスに関する情報として抽出される対象となる。具体的には、ノードND103、ND104、ND108〜ND113の8つのノードNDが名辞「<Jim>」のクラスに関する情報として抽出される対象となる。なお、図1の例では、算出装置100は、最上位概念である名辞「<person>」に対応するノードND110から2つ下のクラスまでを統計的情報の算出対象として抽出する。
すなわち、図1の例では、算出装置100は、ノードND108〜ND110、ND112及びND113の5つのノードNDに対応する名辞を統計的情報の算出対象として抽出する。なお、対象とするトリプル情報の主語に対応するとして抽出されたノードNDを「第1要素」と記載する場合がある。具体的には、算出装置100は、ノードND108に対応する名辞「<officer>」、ノードND109に対応する名辞「<owner>」、ノードND110に対応する名辞「<person>」、ノードND112に対応する名辞「<engineer>」及びノードND113に対応する名辞「<employee>」の5つを統計的情報の算出対象とする。
また、図1の例では、ノードND101、ND102からは、ノードND110に到達できないため、ノードND101、ND102やその上位のクラスに対応するノードND105〜ND107は、名辞「<Jim>」のクラスに関する情報として抽出されない。なお、グラフ情報ON11には、名辞「<person>」に対応するノードND110よりも上位のクラスに対応するノードが含まれてもよい。
また、例えば、図1中のオントロジ情報記憶部123−2に示すようにオントロジ情報TID102は、主語が「<worksAt>」であることを示す。また、例えば、オントロジ情報TID102は、述語が「rdfs:range」、すなわち値域を示す所定のプロパティであることを示す。この場合、述語「rdfs:range」は、「<worksAt>」の目的語になり得るクラスを示す。また、例えば、オントロジ情報TID102は、目的語が「<organization>」、すなわち組織であることを示す。すなわち、オントロジ情報TID102は、「<worksAt>」の目的語には、クラス「<organization>」以下のクラスがなり得ることを示す。すなわち、「<worksAt>」の目的語としては、名辞「<organization>」が最上位概念であることを示す。なお、主語が「<worksAt>」であり、述語が「rdfs:range」であるオントロジ情報、すなわち「<worksAt>」の値域を示すオントロジ情報は複数あってもよい。
そのため、算出装置100は、グラフ情報ON21中の4つのノードND201〜ND204から探索する範囲を名辞「<organization>」に対応するノードND207までと決定する。すなわち、算出装置100は、グラフ情報ON21中の4つのノードND201〜ND204から名辞「<organization>」に対応するノードND207までの間に位置するノードNDに対応する名辞を「<HOGE.inc>」のクラスに関する情報として抽出する(ステップS14)。
図1の例では、ノードND201から、ノードND207に到達できるため、ノードND201からノードND207までの間に含まれるノードNDは、名辞「<organization>」のクラスに関する情報として抽出される対象となる。具体的には、ノードND201、ND205〜ND207の4つのノードNDが名辞「<organization>」のクラスに関する情報として抽出される対象となる。なお、図1の例では、算出装置100は、最上位概念である名辞「<organization>」に対応するノードND207から2つ下のクラスまでを統計的情報の算出対象として抽出する。
すなわち、図1の例では、算出装置100は、ノードND205〜ND207の3つのノードNDに対応する名辞を統計的情報の算出対象として抽出する。なお、対象とするトリプル情報の目的後に対応するとして抽出されたノードNDを「第2要素」と記載する場合がある。具体的には、算出装置100は、ノードND205に対応する名辞「<company limited>」、ノードND206に対応する名辞「<company>」及びノードND207に対応する名辞「<organization>」の3つを統計的情報の算出対象とする。
また、図1の例では、ノードND202〜ND204からは、ノードND207に到達できないため、ノードND202〜ND204やその上位のクラスに対応するノードND208〜ND211は、名辞「<organization>」のクラスに関する情報として抽出されない。なお、グラフ情報ON21には、名辞「<organization>」に対応するノードND110よりも上位のクラスに対応するノードが含まれてもよい。
そして、算出装置100は、抽出した第1要素及び第2要素に基づく組合せを抽出する(ステップS15)。図1の例では、算出装置100は、第1要素であるノードND108〜ND110、ND112及びND113及び第2要素であるノードND205〜ND207に基づく組合せを抽出する。具体的には、算出装置100は、第1要素の各々を主語とし、名辞「<worksAt>」を述語とし、第2要素の各々を目的語とした場合にとり得る組合せを抽出する。
図1の例では、算出装置100は、ノードND108〜ND110、ND112及びND113の5つのノードに対応する名辞の各々を主語とし、名辞「<worksAt>」を述語とし、ノードND205〜ND207の3つのノードに対応する名辞の各々を目的語とした場合にとり得る組合せを抽出する。すなわち、算出装置100は、ノードND108〜ND110、ND112及びND113の5つのノードに対応する名辞の各々を主語とし、名辞「<worksAt>」を述語とし、ノードND205〜ND207の3つのノードに対応する名辞の各々を目的語とした15(=5×3)通りの組合せを抽出する。図1の例では、算出装置100は、組合せ情報CN21に示すような組合せを抽出する。
例えば、算出装置100は、組合せ情報CN21に示すように、主語が「<person>」であり、述語が「<worksAt>」であり、目的語が「<organization>」である組合せを抽出する。また、例えば、算出装置100は、組合せ情報CN21に示すように、主語が「<employee>」であり、述語が「<worksAt>」であり、目的語が「<organization>」である組合せを抽出する。また、算出装置100は、残りの13通りの組合せについても抽出する。
そして、算出装置100は、抽出した組合せに基づいて統計的情報を算出する(ステップS16)。図1の例では、算出装置100は、抽出した組合せに基づいて、第2トリプル情報記憶部122中の第2トリプル情報のカウント値を加算する。例えば、第2トリプル情報は、オントロジ情報記憶部123中のオントロジ情報に基づく概念的な分類構造を示すスキーマ情報である。例えば、第2トリプル情報は、オントロジ情報記憶部123中のオントロジ情報に基づくトリプル情報間における意味的な概念構造(グラフ構造)を示す情報である。なお、第2トリプル情報の抽出(生成)についての詳細は後述する。
例えば、図1中の第2トリプル情報記憶部122は、「第2トリプルID」、「Subject(主語)」、「Predicate(述語)」、「Object(目的語)」、「統計的情報」といった項目が含まれる。なお、図1中の第2トリプル情報記憶部122と図5中の第2トリプル情報記憶部122とは同じ第2トリプル情報記憶部122であり、図1中では、第2トリプル情報記憶部122の項目「階層情報」の図示を省略する。
「第2トリプルID」は、トリプル情報を識別するための識別情報を示す。また、「Subject(主語)」は、第2トリプルIDにより識別されるトリプル情報の主語に対応する値を示す。また、「Predicate(述語)」は、第2トリプルIDにより識別されるトリプル情報の述語に対応する値を示す。また、「Object(目的語)」は、第2トリプルIDにより識別されるトリプル情報の目的語に対応する値を示す。
また、「統計的情報」には、「階層」や「カウント値」といった項目が含まれる。例えば、「階層」は、第2トリプルIDにより識別されるトリプル情報の第2トリプル情報における階層が記憶される。例えば、「カウント値」は、第2トリプルIDにより識別されるトリプル情報のカウント値が記憶される。例えば、「カウント値」は、第2トリプルIDにより識別されるトリプル情報に対応する第1トリプル情報の数に基づくカウント値が記憶される。
例えば、図5に示す例においては、第2トリプル情報記憶部122には、第2トリプルID「SID21」により識別される第2トリプル情報SID21や第2トリプルID「SID41」により識別される第2トリプル情報SID41等のトリプル情報が記憶される。
なお、上述のように、「第2トリプル情報SID*(*は任意の数値)」と記載した場合、その第2トリプル情報SIDは第2トリプル情報ID「SID*」により識別されるトリプル情報であることを示す。例えば、「第2トリプル情報SID22」と記載した場合、そのトリプル情報は第2トリプルID「SID22」により識別されるトリプル情報である。
例えば、図1に示す例において、第2トリプルID「SID11」により識別される第2トリプル情報SID11は、主語が「<person>」、すなわち人間であることを示す。また、例えば、第2トリプル情報SID11は、述語が「<worksAt>」、すなわち「〜で働いている」という意味の述語であることを示す。また、例えば、第2トリプル情報SID11は、目的語が「<organization>」、すなわち組織であることを示す。このように、第2トリプル情報SID11は、「人間は組織で働いている」という抽象的な意味を示す。
例えば、図1に示す例において、第2トリプルID「SID41」により識別される第2トリプル情報SID41は、主語が「<engineer>」、すなわち技術者であることを示す。また、例えば、第2トリプル情報SID41は、述語が「<worksAt>」、すなわち「〜で働いている」という意味の述語であることを示す。また、例えば、第2トリプル情報SID41は、目的語が「<company>」、すなわち会社であることを示す。このように、第2トリプル情報SID41は、「技術者は会社で働いている」という抽象的な意味を示す。
図1の例では、算出装置100は、組合せ情報CN21に含まれる各組合せに対応する第2トリプル情報記憶部122中の第2トリプル情報に対応するカウント値を1増加させる。
例えば、算出装置100は、組合せ情報CN21中の主語が「<person>」であり、述語が「<worksAt>」であり、目的語が「<organization>」である組合せに対応する第2トリプル情報SID11のカウント値を1増加させる。図1の例では、算出装置100は、組合せ情報CN21中の主語が「<person>」であり、述語が「<worksAt>」であり、目的語が「<organization>」である組合せに対応する第2トリプル情報SID11のカウント値を「9999」から「100000」に増加させる。
また、例えば、算出装置100は、組合せ情報CN21中の主語が「<engineer>」であり、述語が「<worksAt>」であり、目的語が「<company>」である組合せに対応する第2トリプル情報SID41のカウント値を1増加させる。図1の例では、算出装置100は、組合せ情報CN21中の主語が「<engineer>」であり、述語が「<worksAt>」であり、目的語が「<company>」である組合せに対応する第2トリプル情報SID41のカウント値を「799」から「800」に増加させる。
算出装置100は、上述したような処理を第1トリプル情報記憶部121に格納された各第1トリプル情報に対して行うことにより、第1トリプル情報記憶部121に格納された第1トリプル情報群に関する統計的情報を算出する。例えば、算出装置100は、主語が「<Jim>」であり、述語が「<hasAge>」であり、目的語が「32」である第1トリプル情報FID21や第1トリプル情報FID201、FID1105(図4参照)等に対しても、上述したような処理を行うことにより、第1トリプル情報記憶部121に格納された第1トリプル情報群に関する統計的情報を算出する。
上述したように、算出装置100は、第2トリプル情報の各々に対応する第1トリプル情報の数に基づいて、第1トリプル情報に関する統計的情報を算出する。このように、算出装置100は、所定の概念体系に関する第2トリプル情報に基づいて第1トリプル情報群に含まれる第1トリプル情報の傾向を示す統計的情報を生成することにより、複数のトリプル情報における概念体系を統計的に把握可能にすることができる。なお、算出装置100は、生成した統計的情報を端末装置10(図2参照)に提供してもよい。例えば、算出装置100により算出された第1トリプル情報に関する統計的情報は、第1トリプル情報を分散して格納する場合において用いることができる。例えば、算出装置100は、算出した第1トリプル情報に関する統計的情報に基づいて、第1トリプル情報を第2トリプル情報の階層関係に応じて分散して複数の記憶装置に格納することにより、類似する概念に対応する第1トリプル情報を同じ記憶装置に格納することが可能となる。なお、上述した例では、述語を「<worksAt>」とした場合を一例として示したが、述語にも上位概念(上位クラス)や下位概念(下位クラス)等の階層構造に関するオントロジ情報があれば、述語についても上記と同様の処理を行うことにより、統計的情報を算出してもよい。例えば、述語である名辞「<worksAt>」の上位概念として名辞「<belongsTo>」が定義され、名辞「<belongsTo>」の下位概念として名辞「<worksAt>」に加えて名辞「<studiesAt>」(〜で学ぶ)が定義されている場合、算出装置100は、この概念体系に基づいて統計的情報を算出してもよい。例えば、算出装置100は、名辞「<belongsTo>」について、下位概念である名辞「<worksAt>」に対応する第1トリプル情報や名辞「<studiesAt>」に対応する第1トリプル情報に基づいて、カウント値を算出することにより統計的情報を算出してもよい。
〔2.算出システムの構成〕
図2に示すように、算出システム1は、端末装置10と、情報提供装置50と、算出装置100とが含まれる。端末装置10と、情報提供装置50と、算出装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続される。図2は、実施形態に係る算出システムの構成例を示す図である。なお、図2に示した算出システム1には、複数台の端末装置10や、複数台の情報提供装置50や、複数台の算出装置100が含まれてもよい。
端末装置10は、ユーザによって利用される情報処理装置である。端末装置10は、ユーザによる種々の操作を受け付ける。なお、以下では、端末装置10をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置10と読み替えることもできる。なお、上述した端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。
情報提供装置50は、ウェブサーバ等の種々の外部装置から収集した文字情報等に基づくトリプル情報が格納された情報処理装置である。例えば、情報提供装置50は、ウェブサーバ等の種々の外部装置から収集したリソースに関する情報に基づいてトリプル情報を生成する。また、例えば、情報提供装置50は、第1トリプル情報や第2トリプル情報やオントロジ情報を算出装置100へ提供する。
算出装置100は、複数の第2トリプル情報の各々に対応する第1トリプル情報の数に基づいて、複数の第1トリプル情報に関する統計的情報を算出するする情報処理装置である。また、本実施形態において算出装置100は、端末装置10に第1トリプル情報に関する統計的情報を提供する。なお、算出装置100は、ウェブサーバ等の種々の外部装置から収集したリソースに関する情報に基づいて、トリプル情報を生成してもよい。例えば、算出装置100は、ウェブサーバ等の種々の外部装置から収集したリソースに関する情報に基づいて、第1トリプル情報や第2トリプル情報やオントロジ情報を生成してもよい。
〔3.算出装置の構成〕
次に、図3を用いて、実施形態に係る算出装置100の構成について説明する。図3は、実施形態に係る算出装置100の構成例を示す図である。図3に示すように、算出装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、算出装置100は、算出装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワーク(例えば図2中のネットワークN)と有線または無線で接続され、端末装置10との間で情報の送受信を行う。
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図3に示すように、第1トリプル情報記憶部121と、第2トリプル情報記憶部122と、オントロジ情報記憶部123とを有する。
(第1トリプル情報記憶部121)
実施形態に係る第1トリプル情報記憶部121は、トリプルに関する各種情報を記憶する。例えば、第1トリプル情報記憶部121は、トリプル情報や関連付け情報を記憶する。図4は、実施形態に係る第1トリプル情報記憶部の一例を示す図である。図4に示す第1トリプル情報記憶部121は、「第1トリプルID」、「Subject(主語)」、「Predicate(述語)」、「Object(目的語)」といった項目が含まれる。
「第1トリプルID」は、トリプル情報を識別するための識別情報を示す。また、「Subject(主語)」は、第1トリプルIDにより識別されるトリプル情報の主語に対応する値を示す。また、「Predicate(述語)」は、第1トリプルIDにより識別されるトリプル情報の述語に対応する値を示す。また、「Object(目的語)」は、第1トリプルIDにより識別されるトリプル情報の目的語に対応する値を示す。
例えば、図4に示す例においては、第1トリプル情報記憶部121には、第1トリプルID「FID11」により識別される第1トリプル情報FID11や第1トリプルID「FID1105」により識別される第1トリプル情報FID1105等の多数(例えば、数十億や数百億等)のトリプル情報が記憶される。
例えば、図4に示す例において、第1トリプルID「FID11」により識別される第1トリプル情報FID11は、主語が「<Jim>」、すなわち所定の人間「ジム」であることを示す。また、例えば、図4に示す例において、第1トリプル情報FID11は、述語が「<worksAt>」、すなわち「〜で働いている」という意味の述語であることを示す。また、例えば、図4に示す例において、第1トリプル情報FID11は、目的語が「<HOGE.inc>」、すなわち所定の会社「HOGE.inc」であることを示す。このように、図4に示す例において、第1トリプル情報FID11は、「ジムはHOGE.incで働いている」という具体的な意味に対応するトリプル情報である。
また、例えば、図4に示す例において、第1トリプルID「FID21」により識別される第1トリプル情報FID21は、主語が「<Jim>」であることを示す。また、例えば、図4に示す例において、第1トリプル情報FID21は、述語が「<hasAge>」、すなわち「〜歳である」という意味の述語であることを示す。また、例えば、図4に示す例において、第1トリプル情報FID11は、目的語が「32」、すなわち数値「32」であることを示す。このように、図4に示す例において、第1トリプル情報FID21は、「ジムは32歳である」という具体的な意味に対応するトリプル情報である。
なお、第1トリプル情報記憶部121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、第1トリプル情報記憶部121には、抽象的な意味に対応するトリプル情報が記憶されてもよい。例えば、第1トリプル情報記憶部121は、「Subject(主語)」、「Predicate(述語)」、「Object(目的語)」には、所定のプロパティが格納されてもよい。
(第2トリプル情報記憶部122)
実施形態に係る第2トリプル情報記憶部122は、第1トリプル情報記憶部121に記憶されたトリプル情報の参照に用いる各種情報を記憶する。図5は、実施形態に係る第2トリプル情報記憶部の一例を示す図である。図5に示す第2トリプル情報記憶部122は、「第2トリプルID」、「Subject(主語)」、「Predicate(述語)」、「Object(目的語)」、「階層情報」、「統計的情報」といった項目が含まれる。
「第2トリプルID」は、トリプル情報を識別するための識別情報を示す。また、「Subject(主語)」は、第2トリプルIDにより識別されるトリプル情報の主語に対応する値を示す。また、「Predicate(述語)」は、第2トリプルIDにより識別されるトリプル情報の述語に対応する値を示す。また、「Object(目的語)」は、第2トリプルIDにより識別されるトリプル情報の目的語に対応する値を示す。
また、「階層情報」には、「上位1」や「上位2」といった項目が含まれる。例えば、「上位1」や「上位2」は、第2トリプルIDにより識別されるトリプル情報の上位概念(上位クラス)に対応するトリプル情報を識別する情報が記憶される。なお、図5では、「上位1」及び「上位2」のみを図示するが、トリプル情報の上位クラスに対応する全トリプル情報が記憶されるように「上位3」や「上位4」等が含まれてもよい。
また、「統計的情報」には、「階層」や「カウント値」といった項目が含まれる。例えば、「階層」は、第2トリプルIDにより識別されるトリプル情報の第2トリプル情報における階層が記憶される。例えば、「カウント値」は、第2トリプルIDにより識別されるトリプル情報のカウント値が記憶される。例えば、「カウント値」は、第2トリプルIDにより識別されるトリプル情報に対応する第1トリプル情報の数に基づくカウント値が記憶される。
例えば、図5に示す例においては、第2トリプル情報記憶部122には、第2トリプルID「SID21」により識別される第2トリプル情報SID21や第2トリプルID「SID41」により識別される第2トリプル情報SID41等のトリプル情報が記憶される。
例えば、図5に示す例において、第2トリプルID「SID11」により識別される第2トリプル情報SID11は、主語が「<person>」、すなわち人間であることを示す。また、例えば、図5に示す例において、第2トリプル情報SID11は、述語が「<worksAt>」、すなわち「〜で働いている」という意味の述語であることを示す。また、例えば、図5に示す例において、第2トリプル情報SID11は、目的語が「<organization>」、すなわち組織であることを示す。このように、図5に示す例において、第2トリプル情報SID11は、「人間は組織で働いている」という抽象的な意味に対応するトリプル情報である。
例えば、図5に示す例において、第2トリプルID「SID41」により識別される第2トリプル情報SID41は、主語が「<engineer>」、すなわち技術者であることを示す。また、例えば、図5に示す例において、第2トリプル情報SID41は、述語が「<worksAt>」、すなわち「〜で働いている」という意味の述語であることを示す。また、例えば、図5に示す例において、第2トリプル情報SID41は、目的語が「<company>」、すなわち会社であることを示す。このように、図5に示す例において、第2トリプル情報SID41は、「技術者は会社で働いている」という抽象的な意味に対応するトリプル情報である。
なお、第2トリプル情報記憶部122は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、第2トリプル情報記憶部122には、具体的な意味に対応するトリプル情報が記憶されてもよい。例えば、第2トリプル情報記憶部122は、「Subject(主語)」、「Predicate(述語)」、「Object(目的語)」には、所定のプロパティが格納されてもよい。また、例えば、第2トリプル情報記憶部122は、「階層情報」に、「下位1」や「下位2」といったそのトリプル情報に対応する下位概念(下位クラス)を示す項目が含まれてもよい。
(オントロジ情報記憶部123)
実施形態に係るオントロジ情報記憶部123は、所定の概念体系(オントロジ)に関する各種情報を記憶する。例えば、オントロジ情報記憶部123は、各エンティティ(実体)等の定義に関する情報等を記憶する。図6は、実施形態に係るオントロジ情報記憶部の一例を示す図である。図6に示すオントロジ情報記憶部123は、「オントロジID」、「Subject(主語)」、「Predicate(述語)」、「Object(目的語)」といった項目が含まれる。
「オントロジID」は、トリプル情報を識別するための識別情報を示す。また、「Subject(主語)」は、オントロジIDにより識別されるトリプル情報の主語に対応する値を示す。また、「Predicate(述語)」は、オントロジIDにより識別されるトリプル情報の述語に対応する値を示す。また、「Object(目的語)」は、オントロジIDにより識別されるトリプル情報の目的語に対応する値を示す。
例えば、図6に示す例において、オントロジID「TID101」により識別されるオントロジ情報TID101は、主語が「<worksAt>」であることを示す。また、例えば、図6に示す例において、オントロジ情報TID101は、述語が「rdfs:domain」、すなわち定義域を示す所定のプロパティであることを示す。この場合、述語「rdfs:domain」は、「<worksAt>」の主語になり得るクラスを示す。また、例えば、図6に示す例において、オントロジ情報TID101は、目的語が「<person>」、すなわち人間であることを示す。このように、図6に示す例において、オントロジ情報TID101は、「<worksAt>」の主語には、クラス「<person>」以下のクラスがなり得ることを定義する。
例えば、図6に示す例において、オントロジID「TID102」により識別されるオントロジ情報TID102は、主語が「<worksAt>」であることを示す。また、例えば、図6に示す例において、オントロジ情報TID102は、述語が「rdfs:range」、すなわち値域を示す所定のプロパティであることを示す。この場合、述語「rdfs:range」は、「<worksAt>」の目的語になり得るクラスを示す。また、例えば、図6に示す例において、オントロジ情報TID102は、目的語が「<organization>」、すなわち組織であることを示す。このように、図6に示す例において、オントロジ情報TID102は、「<worksAt>」の目的語には、クラス「<organization>」以下のクラスがなり得ることを定義する。
また、例えば、図6に示す例において、オントロジID「TID201」により識別されるオントロジ情報TID201は、主語が「<ceo>」、すなわち最高経営責任者であることを示す。また、例えば、図6に示す例において、オントロジ情報TID201は、述語が「rdfs:subClassOf」、すなわち所定のプロパティであることを示す。例えば、述語「rdfs:subClassOf」は、主語に対応する値が目的語に対応するクラスのメンバー、つまりサブクラス(下位クラス)であることを示す。また、例えば、図6に示す例において、オントロジ情報TID201は、目的語が「<officer>」、すなわち役員であることを示す。このように、図6に示す例において、オントロジ情報TID201は、「<officer>」は、「<ceo>」の下位クラス(下位概念)であることを定義する。
また、例えば、図6に示す例において、オントロジID「TID501」により識別されるオントロジ情報TID501は、主語が「<Jim>」、すなわち所定の人間「ジム」であることを示す。また、例えば、図6に示す例において、オントロジ情報TID501は、述語が「rdf:type」、すなわち所定のプロパティであることを示す。例えば、述語「rdf:type」は、主語に対応する値が目的語に対応するクラスのインスタンスであることを示す。また、例えば、図6に示す例において、オントロジ情報TID501は、目的語が「<ceo>」、すなわち最高経営責任者であることを示す。このように、図6に示す例において、オントロジ情報TID501は、「<Jim>」は、「<ceo>」のインスタンスであること、すなわち「ジムは最高経営責任者である」ことを定義する。
なお、オントロジ情報記憶部123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、オントロジ情報記憶部123には、具体的な意味に対応するトリプル情報が記憶されてもよい。
(制御部130)
図3の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、算出装置100内部の記憶装置に記憶されている各種プログラム(算出プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図3に示すように、制御部130は、取得部131と、抽出部132と、算出部133と、提供部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
(取得部131)
取得部131は、各種情報を取得する。例えば、取得部131は、第1トリプル情報記憶部121、第2トリプル情報記憶部122、オントロジ情報記憶部123等から各種情報を取得する。また、取得部131は、各種情報を外部の情報処理装置から取得してもよい。また、取得部131は、各トリプル情報に関する情報を情報提供装置50から取得してもよい。
例えば、取得部131は、3種類の要素に関する関係を示す複数の第1トリプル情報と、複数の第1トリプル情報における概念体系に基づく複数の第2トリプル情報とを取得する。例えば、取得部131は、第1トリプル情報記憶部121から複数の第1トリプル情報を取得する。また、例えば、取得部131は、第2トリプル情報記憶部122から複数の第2トリプル情報を取得する。例えば、取得部131は、所定の概念体系に関する情報に基づいて階層化された複数の第2トリプル情報を取得する。
(抽出部132)
抽出部132は、各種情報を抽出する。例えば、抽出部132は、トリプル情報を抽出する。例えば、抽出部132は、取得部131により取得された要素の指定に関する情報に対応するトリプル情報群を抽出する。例えば、抽出部132は、3種類の要素のうち1以上の要素に関する指定に基づいて、トリプル情報群を抽出する。
例えば、抽出部132は、オントロジ情報に基づいて、各クラスから定義域までの間に含まれる各第1要素を抽出する。例えば、抽出部132は、オントロジ情報に基づいて、各クラスから値域までの間に含まれる各第2要素を抽出する。
(算出部133)
算出部133は、各種情報を算出する。例えば、算出部133は、取得部131により取得された複数の第1トリプル情報に関する統計的情報を算出する。例えば、算出部133は、複数の第2トリプル情報の各々に対応する第1トリプル情報の数に基づいて、複数の第1トリプル情報に関する統計的情報を算出する。
例えば、算出部133は、一の第1トリプル情報における3種類の要素の各々のクラスまたは上位クラスである3種類の要素に関する関係を示す第2トリプル情報を、一の第1トリプル情報に対応する第2トリプル情報として、統計的情報を算出する。また、例えば、算出部133は、一の第1トリプル情報における一の要素のクラスであって、他の2つの要素の各々のクラスまたは上位クラスである3種類の要素に関する関係を示す第2トリプル情報を、一の第1トリプル情報に対応する第2トリプル情報として、統計的情報を算出する。
例えば、算出部133は、一の第1トリプル情報における述語の要素のクラスであって、主語及び目的語の要素の各々のクラスまたは上位クラスである3種類の要素に関する関係を示す第2トリプル情報を、一の第1トリプル情報に対応する第2トリプル情報として、統計的情報を算出する。例えば、算出部133は、一の第1トリプル情報における述語に関する定義域及び値域を示す第3トリプル情報に基づいて、主語の要素が一の第1トリプル情報の主語のクラスから定義域の間に含まれ、目的語の要素が一の第1トリプル情報の目的語のクラスから値域の間に含まれる第2トリプル情報を、一の第1トリプル情報に対応する第2トリプル情報として、統計的情報を算出する。
例えば、算出部133は、一の第1トリプル情報の主語の要素に対応するノードを含む複数のノードであって、各ノード間の階層関係に応じて連結された複数のノードのうち、主語の要素に対応するノードから定義域に対応するノードまでの間に含まれる各ノードに基づいて、複数の第1トリプル情報に関する統計的情報を算出する。また、例えば、算出部133は、各ノードのうち、定義域に対応するノードから所定の段数までに含まれるノードに基づいて、複数の第1トリプル情報に関する統計的情報を算出する。
例えば、算出部133は、一の第1トリプル情報の目的語の要素に対応するノードを含む複数のノードであって、各ノード間の階層関係に応じて連結された複数のノードのうち、目的語の要素に対応するノードから値域に対応するノードまでの間に含まれる各ノードに基づいて、複数の第1トリプル情報に関する統計的情報を算出する。また、例えば、算出部133は、各ノードのうち、値域に対応するノードから所定の段数までに含まれるノードに基づいて、複数の第1トリプル情報に関する統計的情報を算出する。
(提供部134)
提供部134は、各種情報を提供する。例えば、提供部134は、端末装置10に各種情報を提供する。例えば、提供部134は、算出部133により算出された統計的情報を端末装置10へ提供する。
〔4.第2トリプル情報の抽出について〕
例えば、算出装置100は、種々の情報を適宜用いて、第2トリプル情報を抽出してもよい。この点について、図7を用いて説明する。図7は、実施形態に係る第2トリプル情報の抽出を示す図である。例えば、算出装置100は、オントロジ情報記憶部123に記憶された情報に基づいて、第2トリプル情報を抽出してもよい。
図7では、述語が「<worksAt>」とした場合を例に、オントロジ情報記憶部123に記憶された情報に基づいて、第2トリプル情報を抽出する例を示す。
図7に示すように、算出装置100は、述語「<worksAt>」の定義域を示すオントロジ情報TID101や述語「<worksAt>」の値域を示すオントロジ情報TID102やクラス情報CL11に示すような情報を用いて第2トリプル情報を抽出する(ステップS21)。
例えば、算出装置100は、「<worksAt>」の主語としては、名辞「<person>」が最上位概念であることを示すオントロジ情報TID101を用いて、述語が「<worksAt>」とした場合の主語を特定する。例えば、算出装置100は、「<worksAt>」の目的語としては、名辞「<organization>」が最上位概念であることを示すオントロジ情報TID102を用いて、述語が「<worksAt>」とした場合の目的語を特定する。
そして、算出装置100は、クラス情報CL11に示すような述語が「rdfs:subClassOf」であるオントロジ情報TID222、TID231、TID321等の種々の情報を用いて、名辞「<person>」の下位クラス(下位概念)や名辞「<organization>」の下位クラス(下位概念)と特定する。
そして、算出装置100は、上述のように特定した情報に基づいて第2トリプル情報を抽出する。図7の例では、算出装置100は、スキーマトリプル情報STP11に示すような階層構造を有する第2トリプル情報を抽出する。
図7中のスキーマトリプル情報STP11に示す各第2トリプル情報間を連結する矢印線は、連結される第2トリプル情報間に上位概念と下位概念との関係があることを示す。具体的には、矢印線の始点側のノードに対応する第2トリプル情報が下位概念であり、矢先側のノードに対応する第2トリプル情報が上位概念であることを示す。なお、図7中においては適宜「<>」の記載を省略する。
例えば、図7中のスキーマトリプル情報STP11においては、「人間は組織で働いている」という抽象的な意味を示す第2トリプル情報SID11が最上位概念に位置する。第2トリプル情報SID11は、オントロジ情報TID101に定義された「<worksAt>」の定義域(domain)である名辞「<person>」に対応し、オントロジ情報TID102に定義された「<worksAt>」の値域(range)である名辞「<organization>」に対応する。
また、例えば、図7中のスキーマトリプル情報STP11においては、第2トリプル情報SID11の下位概念には、主語が「<person>」、述語が「<worksAt>」、及び目的語が「<company>」である第2トリプル情報SID21が位置する。このように、第2トリプル情報SID11の下位概念には、主語及び述語が共通し、目的語が「<organization>」の下位クラスの「<company>」である第2トリプル情報SID21が位置する。
また、例えば、図7中のスキーマトリプル情報STP11においては、第2トリプル情報SID11の下位概念には、主語が「<employee>」、述語が「<worksAt>」、及び目的語が「<organization>」である第2トリプル情報SID22が位置する。このように、第2トリプル情報SID11の下位概念には、述語及び目的語が共通し、主語が「<person>」の下位クラスの「<employee>」である第2トリプル情報SID22が位置する。なお、図7においては、説明を簡単にするために、第2トリプル情報SID11、SID21、SID22、SID31、SID32、SID41の6個の第2トリプル情報のみを図示するが、図7中のスキーマトリプル情報STP11には多数の第2トリプル情報が含まれてもよい。
〔5.算出処理のフロー〕
次に、図8を用いて、実施形態に係る算出システム1による算出処理の手順について説明する。図8は、実施形態に係る算出処理の一例を示すフローチャートである。
図8に示すように、算出装置100は、複数の第1トリプル情報を取得する(ステップS101)。例えば、算出装置100は、第1トリプル情報記憶部121から複数の第1トリプル情報を取得する。また、算出装置100は、複数の第2トリプル情報を取得する(ステップS102)。例えば、算出装置100は、第2トリプル情報記憶部122から複数の第2トリプル情報を取得する。
その後、算出装置100は、複数の第2トリプル情報の各々に対応する第1トリプル情報の数に基づいて、複数の第1トリプル情報に関する統計的情報を算出する(ステップS103)。例えば、算出装置100は、複数の第2トリプル情報の各々に対応する第1トリプル情報の数に基づいて、図1中の第2トリプル情報記憶部122に示すような統計的情報を算出する。
〔6.情報提供の処理のフロー〕
次に、図9を用いて、一(1つ)の第1トリプル情報を対象とした場合における第2トリプル情報のカウント値を加算する処理の手順について説明する。図9は、実施形態に係る一のトリプル情報に対する算出処理の一例を示すフローチャートである。
図9に示すように、算出装置100は、一の第1トリプル情報を取得する(ステップS201)。図1の例では、算出装置100は、第1トリプル情報記憶部121中のトリプル情報群のうち、第1トリプル情報FID11を取得する。
その後、算出装置100は、オントロジ情報に基づいて、一の第1トリプル情報の主語の要素に関する各クラスを取得する(ステップS202)。図1の例では、算出装置100は、第1トリプル情報FID11の主語「<Jim>」が主語であり、述語が「rdf:type」であるオントロジ情報をオントロジ情報記憶部123から抽出する。そして、算出装置100は、一の第1トリプル情報の述語の要素に関する定義域を取得する(ステップS203)。図1の例では、算出装置100は、オントロジ情報記憶部123から、主語が「<worksAt>」であり、述語が「rdfs:domain」すなわち定義域を示す所定のプロパティであるオントロジ情報TID101を取得する。
そして、算出装置100は、オントロジ情報に基づいて、各クラスから定義域までの間に含まれる各第1要素を抽出する(ステップS204)。図1の例では、算出装置100は、グラフ情報ON11中の4つのノードND101〜ND104から名辞「<person>」に対応するノードND110までの間に位置するノードNDに対応する名辞を名辞「<Jim>」のクラスに関する情報として抽出する。
また、算出装置100は、オントロジ情報に基づいて、一の第1トリプル情報の目的語の要素に関する各クラスを取得する(ステップS205)。図1の例では、算出装置100は、第1トリプル情報FID11の目的語「<HOGE.inc>」が主語であり、述語が「rdf:type」であるオントロジ情報をオントロジ情報記憶部123から抽出する。そして、算出装置100は、一の第1トリプル情報の述語の要素に関する値域を取得する(ステップS206)。図1の例では、算出装置100は、オントロジ情報記憶部123から、主語が「<worksAt>」であり、述語が「rdfs:range」、すなわち値域を示す所定のプロパティであるオントロジ情報TID102を取得する。
そして、算出装置100は、オントロジ情報に基づいて、各クラスから値域までの間に含まれる各第2要素を抽出する(ステップS207)。図1の例では、算出装置100は、グラフ情報ON21中の4つのノードND201〜ND204から名辞「<organization>」に対応するノードND207までの間に位置するノードNDに対応する名辞を「<HOGE.inc>」のクラスに関する情報として抽出する。
そして、算出装置100は、各第1要素と述語と各第2要素との組合せの各々に対応する第2トリプル情報のカウント値を加算する(ステップS208)。図1の例では、算出装置100は、ノードND108〜ND110、ND112及びND113の5つのノードに対応する名辞の各々を主語とし、名辞「<worksAt>」を述語とし、ノードND205〜ND207の3つのノードに対応する名辞の各々を目的語とした15通りの組合せの各々に対応する第2トリプル情報のカウント値を加算する。
〔7.効果〕
上述してきたように、実施形態に係る算出装置100は、取得部131と、算出部133とを有する。取得部131は、3種類の要素に関する関係を示す複数の第1トリプル情報と、複数の第1トリプル情報における概念体系に基づく複数の第2トリプル情報とを取得する。算出部133は、取得部131により取得された複数の第2トリプル情報の各々に対応する第1トリプル情報の数に基づいて、複数の第1トリプル情報に関する統計的情報を算出する。
これにより、実施形態に係る算出装置100は、複数の第2トリプル情報の各々に対応する第1トリプル情報の数に基づいて、複数の第1トリプル情報に関する統計的情報を算出することにより、複数のトリプル情報における概念体系を統計的に把握可能にすることができる。
また、実施形態に係る算出装置100において、取得部131は、所定の概念体系に関する情報に基づいて階層化された複数の第2トリプル情報を取得する。
これにより、実施形態に係る算出装置100は、所定の概念体系に関する情報に基づいて階層化された複数の第2トリプル情報を取得することにより、複数のトリプル情報における概念体系を統計的に把握可能にすることができる。
また、実施形態に係る算出装置100において、算出部133は、一の第1トリプル情報における3種類の要素の各々のクラスまたは上位クラスである3種類の要素に関する関係を示す第2トリプル情報を、一の第1トリプル情報に対応する第2トリプル情報として、統計的情報を算出する。
これにより、実施形態に係る算出装置100は、一の第1トリプル情報における3種類の要素の各々のクラスまたは上位クラスである3種類の要素に関する関係を示す第2トリプル情報を、一の第1トリプル情報に対応する第2トリプル情報として、統計的情報を算出することにより、複数のトリプル情報における概念体系を統計的に把握可能にすることができる。
また、実施形態に係る算出装置100において、算出部133は、一の第1トリプル情報における一の要素のクラスであって、他の2つの要素の各々のクラスまたは上位クラスである3種類の要素に関する関係を示す第2トリプル情報を、一の第1トリプル情報に対応する第2トリプル情報として、統計的情報を算出する。
これにより、実施形態に係る算出装置100は、一の第1トリプル情報における一の要素のクラスであって、他の2つの要素の各々のクラスまたは上位クラスである3種類の要素に関する関係を示す第2トリプル情報を、一の第1トリプル情報に対応する第2トリプル情報として、統計的情報を算出することにより、複数のトリプル情報における概念体系を統計的に把握可能にすることができる。
また、実施形態に係る算出装置100において、算出部133は、一の第1トリプル情報における述語の要素のクラスであって、主語及び目的語の要素の各々のクラスまたは上位クラスである3種類の要素に関する関係を示す第2トリプル情報を、一の第1トリプル情報に対応する第2トリプル情報として、統計的情報を算出する。
これにより、実施形態に係る算出装置100は、一の第1トリプル情報における述語の要素のクラスであって、主語及び目的語の要素の各々のクラスまたは上位クラスである3種類の要素に関する関係を示す第2トリプル情報を、一の第1トリプル情報に対応する第2トリプル情報として、統計的情報を算出することにより、複数のトリプル情報における概念体系を統計的に把握可能にすることができる。
また、実施形態に係る算出装置100において、算出部133は、一の第1トリプル情報における述語に関する定義域及び値域を示す第3トリプル情報に基づいて、主語の要素が一の第1トリプル情報の主語のクラスから定義域の間に含まれ、目的語の要素が一の第1トリプル情報の目的語のクラスから値域の間に含まれる第2トリプル情報を、一の第1トリプル情報に対応する第2トリプル情報として、統計的情報を算出する。
これにより、実施形態に係る算出装置100は、一の第1トリプル情報における述語に関する定義域及び値域を示す第3トリプル情報に基づいて、主語の要素が一の第1トリプル情報の主語のクラスから定義域の間に含まれ、目的語の要素が一の第1トリプル情報の目的語のクラスから値域の間に含まれる第2トリプル情報を、一の第1トリプル情報に対応する第2トリプル情報として、統計的情報を算出することにより、複数のトリプル情報における概念体系を統計的に把握可能にすることができる。また、算出装置100は、定義域及び値域に関する情報を用いることにより、定義域及び値域に関する情報を用いない場合と比較して、統計的情報を算出の処理を効率化することができる。例えば、算出装置100は、定義域により主語の要素に関する探索範囲を限定したり、値域により目的語の要素に関する探索範囲を限定したりすることにより、各第1トリプル情報に対する処理において対象となる概念体系(空間)の限定(例えば枝刈り)を行うことができるため、統計的情報を算出の処理を効率化することができる。
また、実施形態に係る算出装置100において、算出部133は、一の第1トリプル情報の主語の要素に対応するノードを含む複数のノードであって、各ノード間の階層関係に応じて連結された複数のノードのうち、主語の要素に対応するノードから定義域に対応するノードまでの間に含まれる各ノードに基づいて、複数の第1トリプル情報に関する統計的情報を算出する。
これにより、実施形態に係る算出装置100は、一の第1トリプル情報の主語の要素に対応するノードを含む複数のノードであって、各ノード間の階層関係に応じて連結された複数のノードのうち、主語の要素に対応するノードから定義域に対応するノードまでの間に含まれる各ノードに基づいて、複数の第1トリプル情報に関する統計的情報を算出することにより、複数のトリプル情報における概念体系を統計的に把握可能にすることができる。例えば、算出装置100は、主語の要素に関して探索する範囲を定義域までの間に限定することにより、各第1トリプル情報に対する処理において対象となる概念体系(空間)の限定を行うことができるため、統計的情報を算出の処理を効率化することができる。
また、実施形態に係る算出装置100において、算出部133は、各ノードのうち、定義域に対応するノードから所定の段数までに含まれるノードに基づいて、複数の第1トリプル情報に関する統計的情報を算出する。
これにより、実施形態に係る算出装置100は、各ノードのうち、定義域に対応するノードから所定の段数までに含まれるノードに基づいて、複数の第1トリプル情報に関する統計的情報を算出することにより、複数のトリプル情報における概念体系を統計的に把握可能にすることができる。例えば、算出装置100は、主語の要素に関して探索する範囲を定義域に対応するノードから所定の段数までに限定することにより各第1トリプル情報に対する処理において対象となる概念体系(空間)の限定を行うことができるため、統計的情報を算出の処理を効率化することができる。
また、実施形態に係る算出装置100において、算出部133は、一の第1トリプル情報の目的語の要素に対応するノードを含む複数のノードであって、各ノード間の階層関係に応じて連結された複数のノードのうち、目的語の要素に対応するノードから値域に対応するノードまでの間に含まれる各ノードに基づいて、複数の第1トリプル情報に関する統計的情報を算出する。
これにより、実施形態に係る算出装置100は、一の第1トリプル情報の目的語の要素に対応するノードを含む複数のノードであって、各ノード間の階層関係に応じて連結された複数のノードのうち、目的語の要素に対応するノードから値域に対応するノードまでの間に含まれる各ノードに基づいて、複数の第1トリプル情報に関する統計的情報を算出することにより、複数のトリプル情報における概念体系を統計的に把握可能にすることができる。例えば、算出装置100は、目的語の要素に関して探索する範囲を値域までの間に限定することにより、各第1トリプル情報に対する処理において対象となる概念体系(空間)の限定を行うことができるため、統計的情報を算出の処理を効率化することができる。
また、実施形態に係る算出装置100において、算出部133は、各ノードのうち、値域に対応するノードから所定の段数までに含まれるノードに基づいて、複数の第1トリプル情報に関する統計的情報を算出する。
これにより、実施形態に係る算出装置100は、各ノードのうち、値域に対応するノードから所定の段数までに含まれるノードに基づいて、複数の第1トリプル情報に関する統計的情報を算出することにより、複数のトリプル情報における概念体系を統計的に把握可能にすることができる。また、例えば、算出装置100は、目的語の要素に関して探索する範囲を値域に対応するノードから所定の段数までに限定することにより、各第1トリプル情報に対する処理において対象となる概念体系(空間)の限定を行うことができるため、統計的情報を算出の処理を効率化することができる。
また、実施形態に係る算出装置100は、提供部134を有する。提供部134は、算出部133により算出された統計的情報を提供する。
これにより、実施形態に係る算出装置100は、算出した統計的情報を提供することにより、統計的情報の提供先が複数のトリプル情報における概念体系を統計的に把握可能にすることができる。
〔8.ハードウェア構成〕
上述してきた実施形態に係る算出装置100は、例えば図10に示すような構成のコンピュータ1000によって実現される。図10は、算出装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータをネットワークNを介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る算出装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
〔9.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上述してきた各実施形態に記載された各処理は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
1 算出システム
100 算出装置
121 第1トリプル情報記憶部
122 第2トリプル情報記憶部
123 オントロジ情報記憶部
130 制御部
131 取得部
132 抽出部
133 算出部
134 提供部
10 端末装置
50 情報提供装置
N ネットワーク

Claims (13)

  1. 3種類の要素に関する関係を示す複数の第1トリプル情報と、前記複数の第1トリプル情報における概念体系に基づく複数の第2トリプル情報とを取得する取得部と、
    前記取得部により取得された複数の第2トリプル情報の各々に対応する第1トリプル情報の数に基づいて、前記複数の第1トリプル情報に関する統計的情報を算出する算出部と、
    を備えることを特徴とする算出装置。
  2. 前記取得部は、
    所定の概念体系に関する情報に基づいて階層化された前記複数の第2トリプル情報を取得する
    ことを特徴とする請求項1に記載の算出装置。
  3. 前記算出部は、
    一の第1トリプル情報における3種類の要素の各々のクラスまたは上位クラスである3種類の要素に関する関係を示す第2トリプル情報を、前記一の第1トリプル情報に対応する第2トリプル情報として、前記統計的情報を算出する
    ことを特徴とする請求項1または請求項2に記載の算出装置。
  4. 前記算出部は、
    一の第1トリプル情報における一の要素のクラスであって、他の2つの要素の各々のクラスまたは上位クラスである3種類の要素に関する関係を示す第2トリプル情報を、前記一の第1トリプル情報に対応する第2トリプル情報として、前記統計的情報を算出する
    ことを特徴とする請求項1〜3のいずれか1項に記載の算出装置。
  5. 前記算出部は、
    一の第1トリプル情報における述語の要素のクラスであって、主語及び目的語の要素の各々のクラスまたは上位クラスである3種類の要素に関する関係を示す第2トリプル情報を、前記一の第1トリプル情報に対応する第2トリプル情報として、前記統計的情報を算出する
    ことを特徴とする請求項1〜4のいずれか1項に記載の算出装置。
  6. 前記算出部は、
    一の第1トリプル情報における述語に関する定義域及び値域を示す第3トリプル情報に基づいて、主語の要素が前記一の第1トリプル情報の主語のクラスから前記定義域の間に含まれ、目的語の要素が前記一の第1トリプル情報の目的語のクラスから前記値域の間に含まれる第2トリプル情報を、前記一の第1トリプル情報に対応する第2トリプル情報として、前記統計的情報を算出する
    ことを特徴とする請求項1〜5のいずれか1項に記載の算出装置。
  7. 前記算出部は、
    一の第1トリプル情報の主語の要素に対応するノードを含む複数のノードであって、各ノード間の階層関係に応じて連結された複数のノードのうち、前記主語の要素に対応するノードから前記定義域に対応するノードまでの間に含まれる各ノードに基づいて、前記複数の第1トリプル情報に関する統計的情報を算出する
    ことを特徴とする請求項6に記載の算出装置。
  8. 前記算出部は、
    前記各ノードのうち、前記定義域に対応するノードから所定の段数までに含まれるノードに基づいて、前記複数の第1トリプル情報に関する統計的情報を算出する
    ことを特徴とする請求項7に記載の算出装置。
  9. 前記算出部は、
    一の第1トリプル情報の目的語の要素に対応するノードを含む複数のノードであって、各ノード間の階層関係に応じて連結された複数のノードのうち、前記目的語の要素に対応するノードから前記値域に対応するノードまでの間に含まれる各ノードに基づいて、前記複数の第1トリプル情報に関する統計的情報を算出する
    ことを特徴とする請求項6〜8のいずれか1項に記載の算出装置。
  10. 前記算出部は、
    前記各ノードのうち、前記値域に対応するノードから所定の段数までに含まれるノードに基づいて、前記複数の第1トリプル情報に関する統計的情報を算出する
    ことを特徴とする請求項9に記載の算出装置。
  11. 前記算出部により算出された前記統計的情報を提供する提供部、
    をさらに備えたことを特徴とする請求項1〜10のいずれか1項に記載の算出装置。
  12. コンピュータが実行する算出方法であって、
    3種類の要素に関する関係を示す複数の第1トリプル情報と、前記複数の第1トリプル情報における概念体系に基づく複数の第2トリプル情報とを取得する取得工程と、
    前記取得工程により取得された複数の第2トリプル情報の各々に対応する第1トリプル情報の数に基づいて、前記複数の第1トリプル情報に関する統計的情報を算出する算出工程と、
    を含むことを特徴とする算出方法。
  13. 3種類の要素に関する関係を示す複数の第1トリプル情報と、前記複数の第1トリプル情報における概念体系に基づく複数の第2トリプル情報とを取得する取得手順と、
    前記取得手順により取得された複数の第2トリプル情報の各々に対応する第1トリプル情報の数に基づいて、前記複数の第1トリプル情報に関する統計的情報を算出する算出手順と、
    をコンピュータに実行させることを特徴とする算出プログラム。
JP2016229299A 2016-11-25 2016-11-25 算出装置、算出方法、及び算出プログラム Active JP6282714B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016229299A JP6282714B1 (ja) 2016-11-25 2016-11-25 算出装置、算出方法、及び算出プログラム
US15/693,677 US10885453B2 (en) 2016-11-25 2017-09-01 Calculation device, calculation method, and non-transitory computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016229299A JP6282714B1 (ja) 2016-11-25 2016-11-25 算出装置、算出方法、及び算出プログラム

Publications (2)

Publication Number Publication Date
JP6282714B1 true JP6282714B1 (ja) 2018-02-21
JP2018085056A JP2018085056A (ja) 2018-05-31

Family

ID=61231429

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016229299A Active JP6282714B1 (ja) 2016-11-25 2016-11-25 算出装置、算出方法、及び算出プログラム

Country Status (2)

Country Link
US (1) US10885453B2 (ja)
JP (1) JP6282714B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11468065B2 (en) 2018-06-13 2022-10-11 Yahoo Japan Corporation Information processing apparatus, information processing method, and non-transitory computer-readable recording medium

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7087904B2 (ja) * 2018-10-10 2022-06-21 富士通株式会社 ノード探索方法及びノード探索プログラム
US11880379B1 (en) * 2022-04-28 2024-01-23 Wells Fargo Bank, N.A. Identity resolution in knowledge graph databases

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080195570A1 (en) * 2005-03-31 2008-08-14 Koninklijke Philips Electronics, N.V. System and Method for Collecting Evidence Pertaining to Relationships Between Biomolecules and Diseases
JP2010205265A (ja) * 2009-03-05 2010-09-16 Nhn Corp オントロジを用いたコンテンツ検索システムおよび方法
US20110238610A1 (en) * 2008-12-15 2011-09-29 Korea Institute Of Science & Technology Informatio System and method for efficient reasoning using view in dbms-based rdf triple store
JP2014232532A (ja) * 2013-05-29 2014-12-11 富士通株式会社 範囲クエリを処理するデータベース制御部、方法及びプログラム
JP2015225371A (ja) * 2014-05-26 2015-12-14 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 関連ノードを探索する方法、並びに、そのコンピュータ、及びコンピュータ・プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8458191B2 (en) * 2010-03-15 2013-06-04 International Business Machines Corporation Method and system to store RDF data in a relational store
EP2784697A1 (en) * 2013-03-28 2014-10-01 Fujitsu Limited Graph database query handling method and apparatus
US9031933B2 (en) * 2013-04-03 2015-05-12 International Business Machines Corporation Method and apparatus for optimizing the evaluation of semantic web queries
EP2874073A1 (en) * 2013-11-18 2015-05-20 Fujitsu Limited System, apparatus, program and method for data aggregation
US11080295B2 (en) * 2014-11-11 2021-08-03 Adobe Inc. Collecting, organizing, and searching knowledge about a dataset

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080195570A1 (en) * 2005-03-31 2008-08-14 Koninklijke Philips Electronics, N.V. System and Method for Collecting Evidence Pertaining to Relationships Between Biomolecules and Diseases
JP2008537821A (ja) * 2005-03-31 2008-09-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 生体分子及び疾患の間の関係に関する証拠を収集するシステム及び方法
US20110238610A1 (en) * 2008-12-15 2011-09-29 Korea Institute Of Science & Technology Informatio System and method for efficient reasoning using view in dbms-based rdf triple store
JP2010205265A (ja) * 2009-03-05 2010-09-16 Nhn Corp オントロジを用いたコンテンツ検索システムおよび方法
JP2014232532A (ja) * 2013-05-29 2014-12-11 富士通株式会社 範囲クエリを処理するデータベース制御部、方法及びプログラム
JP2015225371A (ja) * 2014-05-26 2015-12-14 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 関連ノードを探索する方法、並びに、そのコンピュータ、及びコンピュータ・プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11468065B2 (en) 2018-06-13 2022-10-11 Yahoo Japan Corporation Information processing apparatus, information processing method, and non-transitory computer-readable recording medium

Also Published As

Publication number Publication date
US20180150759A1 (en) 2018-05-31
US10885453B2 (en) 2021-01-05
JP2018085056A (ja) 2018-05-31

Similar Documents

Publication Publication Date Title
US11423082B2 (en) Methods and apparatus for subgraph matching in big data analysis
US20170116203A1 (en) Method of automated discovery of topic relatedness
US10162892B2 (en) Identifying information assets within an enterprise using a semantic graph created using feedback re-enforced search and navigation
US8751487B2 (en) Generating a semantic graph relating information assets using feedback re-enforced search and navigation
US9646110B2 (en) Managing information assets using feedback re-enforced search and navigation
US8661004B2 (en) Representing incomplete and uncertain information in graph data
TW202029079A (zh) 異常群體識別方法及裝置
JP6282714B1 (ja) 算出装置、算出方法、及び算出プログラム
Bernard et al. Discovering customer journeys from evidence: a genetic approach inspired by process mining
US8694918B2 (en) Conveying hierarchical elements of a user interface
Gupta et al. Efficient query analysis and performance evaluation of the NoSQL data store for bigdata
CN116186337A (zh) 一种业务场景数据处理方法、***及电子设备
CN110019357B (zh) 数据库查询脚本生成方法及装置
US11468065B2 (en) Information processing apparatus, information processing method, and non-transitory computer-readable recording medium
JP4745993B2 (ja) 意識体系構築装置および意識体系構築プログラム
JP5555238B2 (ja) ベイジアンネットワーク構造学習のための情報処理装置及びプログラム
JP6310532B1 (ja) 生成装置、生成方法、及び生成プログラム
Dalal et al. An ontology-based approach for test case reuse
TW201619852A (zh) 用於感知情境並推薦資訊之電子計算裝置、其方法及其電腦程式產品
JP6855401B2 (ja) 生成装置、生成方法、及び生成プログラム
JP2012194900A (ja) プロフィールマッチング装置及び方法
Sravani et al. BIGDATA ANALYSIS ON METHODS AND TOOLS
Sharma et al. Duplicate resource detection in RDF datasets using Hadoop and MapReduce
Torreno et al. Pairwise genome comparison workflow in the cloud using Galaxy
JP2015079382A (ja) 文書分類装置、文書分類方法および文書分類プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180124

R150 Certificate of patent or registration of utility model

Ref document number: 6282714

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250