JP2007317189A - 3要素モデルに基づく検索情報加工方法 - Google Patents

3要素モデルに基づく検索情報加工方法 Download PDF

Info

Publication number
JP2007317189A
JP2007317189A JP2007132175A JP2007132175A JP2007317189A JP 2007317189 A JP2007317189 A JP 2007317189A JP 2007132175 A JP2007132175 A JP 2007132175A JP 2007132175 A JP2007132175 A JP 2007132175A JP 2007317189 A JP2007317189 A JP 2007317189A
Authority
JP
Japan
Prior art keywords
keyword
relationship
file
keywords
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007132175A
Other languages
English (en)
Inventor
Kaihao Zhao
趙開▲コウ▼
Xiaofan Wen
文小凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of JP2007317189A publication Critical patent/JP2007317189A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複雑な検索要求も解決可能とする3要素モデルに基づく検索情報加工方法を提供する。
【解決手段】本発明は3要素モデルに基づく検索情報加工方法に関するものであり、そのステップは、ソースファイル情報に入力されるキーワードを使用し、キーワードがファイル中の位置に出現する辞書を製作し、3要素関係モデルを構築し、上記3要素関係モデル中の関係(Kaはキーワードaを表し、Kbはキーワードbを表し、Krはキーワードaとキーワードbとの関係情報を表している。Kr’はKrのKrを根拠として導き出した関係を表し、これからKa’キーワードとKb’キーワードは新たな関係Kr’をもつ)の入力に対し、これらの関係情報を検索データベースに登録し、登録したキーワードと関係に基づいてキーワード間の新たな関係を自動的に導き出すとともに、キーワードと関係を辞書に記録する。即ち、Ka’のキーワードとKb’のキーワードの新たな関係Kr’を自動的に導き出すとともに、キーワードと関係を対応付けて辞書に記録する。
【選択図】図1

Description

本発明は、検索情報加工方法、特に3要素モデルに基づく検索情報加工方法に関するものである。
従来、データ情報とテキストファイルの効果的な検索及び加工は、データベースの応用分野において中心及び重要事項であり、各種電子データ、文献、商業用データベースソースとインターネットにおける情報検索に広汎に応用されている。
現在、この分野におけるデータ情報検索技術は、キーワードによる統計方法が一般的であり、キーワードのブーリアン演算式を用いて語句検索を行っている。ファイルデータベースについては、キーワードを使用してキーワードがファイル中の所定位置に出現するように構成された辞書であり、検索語句のキーワードとファイルデータベース中のキーワードとを比較する辞書を用いて、対応するファイルを探し出すようになされている。また他のものは、ファジィ論理モデル、ベクトル空間モデル及び確率検索モデル等を採用するように改良したものも知られている。
インテリジェント処理においては、現在、操作はすべてテーマインデックス、個別のキーワード注釈、テキストファイルのアブストラクト方式によって、テキストファイル全体に対し属性表示を行って検索過程の検索キーワードとしており、このような方式ではテキストファイル全体の情報内容を完全に反映させることはできず、最終的な検索結果中に該当するテキストファイルが欠落する虞れがある。
特許文献1には、関連ある属性同士を属性階層ツリーとして更新・追加・削除して管理すると共に、属性の選択の場合には、単一階層属性ツリーからユーザが任意の順序で属性を選択して絞り込み、情報に任意の個数だけ属性値を直接付与した属性階層ツリーの任意の階層から属性を選択し、上位、同位、下位、いずれの階層の属性も選択、展開してユーザ本位の検索を行うものが示されている。
2004-94634号公報
上記の問題を解決するために、本発明は“隠れた代替・指示”などの複雑な検索要求も解決可能とする3要素モデルに基づく検索情報加工方法を提供する。
本発明は以下の処理によって実現される。
3要素モデルに基づく検索情報加工方法であって、次のステップを含んでいる
(1) ソースファイル情報に入力されるキーワードを使用してキーワードが上記ファイル中の所定位置に出現するように構成された辞書を作製する。
(2) 3要素関係モデルを構築して、3要素グループKa、Kr、Kb形式を採用する。ここでKaはキーワードaを表し、Kbはキーワードbを表し、Krはキーワードaとキーワードbとの関係情報を表す。前記3要素グループの形式はキーワード間の3種類のタイプの関連関係を表示並びに対応付けを実行する。Krは関係情報間の関係を示す情報、例えば逆関係、二段反復、同一主語、対称などを表し、Kr’はKrのKrを根拠として導き出した関係を表し、これからKa’のキーワードとKb’のキーワードは新たな関係Kr’をもつことになる。
(3) 上記3要素関係モデル中のKr、Kr、Kr’を対応付けた入力に対し、Kr、Kr、Kr’を対応付けた情報を検索データベースに登録する。
(4) ステップ(1)中のキーワードとステップ(3)中の関係に基づいて、キーワード間の新たな関係、即ち、Ka’のキーワードとKb’のキーワードの新たな関係Kr’を自動的に導き出すとともに、キーワードと関係を対応付けて辞書に記録する。
上記3要素の関係は、構成要素の主従関係、等価別名関係及び背景参考関係を含む。上記3要素の関係モデルの方法は複数回応用、組み合わせて応用することで、より多くの論理的な結果を生み出すことができる。
上記検索情報加工方法により作成されたデータベースの検索過程では、検索キーワードを入力した後、従来の方法でキーワード辞書を用いて探し出す内容を検索できるばかりでなく、上記3要素の関係に基づいてソースファイルには記録がないが実際には存在するもの、即ち“隠れた代替・指示”を検索することもできる。
上記検索情報加工方法により作成された索システムは、既存の検索システムと比較して、上記方法には次のような効果を有する。
1. 基礎データ量を大幅に削減することができる。現在存在する検索システムは、様々な検索要求を満足するために基礎データを完備しなければならず、推論される全ての結論を基礎データとしてシステムに加える必要があるが、本願の方法では基礎データは少なくて済み、大量のデータの結果を推論して検索に供することができる。
2. 検索データを大幅に増加できる。ユーザが検索できるデータは、基礎データ量だけに依存するわけではなく、関係3要素グループの数に関係する。関係3要素グループは高い汎用性をもつため、関係3要素グループが一つ増えると、それに伴う検索可能データは、倍、または幾何級数的に倍増する。
3. データの関係一致性がより強まる。大量の結論はシステムが論理的推論を行って得られるものであるため、厳密な論理性を有している。現在存在する検索システムでは、基礎データは独立してデータベースに加わるため、データの一致性を保障できない。
4. 関係の拡張性を有する。論理的な関係3要素グループに適合さえすればシステム中で定義することができ、その意義としては、このシステムによって、生活経験及び現有のテクノロジーの発展情況に基づいて総括された関係を実現することができ、また、社会、テクノロジーのとどまることのない進歩にともなって新たな関係も次々に生まれるが、このような新たな関係も同様にシステムにおいて実現可能であることであり、さらに、新たに定義された関連3要素グループに対しても、以前の全てのデータは対応するグループを即時に得て検索に用いることができる。
以下、図面と具体的な実施例を組み合わせて本発明を更に詳細に説明する。本発明では、高い融通性と知能をもつインデックスの仕組みを構成するために、自己包括、自己構成の3要素関係モデルを構築した。一般的に各種言語には主要な文法構造があり(主語、述語、目的語)、本発明はこのような3要素関係を比較し、3要素関係モデルに基づくデータの表現、記憶及び検索を実現する。本発明に関わるシステム及び方法は、コンピュータの単体、局域のインターネット、企業内部のイントラネット(Intranet)、インターネット(Internet)等多くの環境の下に応用することができ、システムユーザは情報内容検索を求める任意の人達に広く発展できる。
図1に示すように、本発明の3要素関係モデルは3要素グループKa、Kr、Kb形式を採用している。ここで、Kaはキーワードaを表し、Kbはキーワードbを表し、Krはキーワードaとキーワードbとの関係情報を表している。前記3要素グループの形式は、キーワード間の主従関係、等価別名関係及び背景参考関係を含む3種類のタイプの関連関係を表示並びに対応付けを実行する。システムは、ソースファイル情報に入力されるキーワードを使用してキーワードがファイル中の所定位置に出現するように構成された辞書を作製する。
どのタイプも更に細かに分類することができ、また各種の関係の間であっても3種類のタイプの関連関係として対応付けを実現することができる。このような3要素関係モデルを基礎として検索を行うことで、単純な個々のキーワードの組合せの検索方法とは異なり、論理的な含みもカバーする検索を行うことができる。
Krは関係キーワード間の関係、例えば逆関係、二段反復、同一主語、対称等を表し、Kr’はKrのKrを根拠として導き出した関係を表し、これからKa’キーワードとKb’キーワードは新たな関係Kr’をもつことになる。上記3要素関係モデル中のKr、Kr、Kr’を対応付けた入力に対し、システムは、Kr、Kr、Kr’を対応付けた情報を検索データベースに登録する。システムは、登録された上記関係に基づいて、キーワード間の新たな関係、即ち、Ka’のキーワードとKb’のキーワードの新たな関係Kr’を自動的に導き出すとともに、キーワードと関係を対応付けて辞書に記録する。
図2は人物インデックスキーワード間の関係について、本発明の実施例に係る検索情報加工方法を用いて検索システムを実現した一例である。システム中の人物キーワードには以下の3つの3要素グループが含まれる。
(田中祖父、息子、田中父);(田中父、息子、田中子1);(田中父、息子、田中子2)
更に、図3に示すように、システムには以下の関係キーワードに対する3要素グループも定義されている。
(息子、逆関係、父親);(息子、二段反復、孫);(息子、同一主語、兄弟);(兄弟、対称、兄弟)
このようにすると、作成されたシステムはその他の情報を追加しなくとも以下の結論を自動的に導き出すことができる。
図4に示すようにシステムは、“逆関係”を根拠として(田中父、父親、田中祖父);(田中子1、父親、田中父);(田中子2、父親、田中父)を推論する。
図5に示すようにシステムは、“二段反復”関係を根拠として(田中祖父、孫、田中子1);(田中祖父、孫、田中子2)を推論する。
図6、図7に示すようにシステムは、“同一主語”関係を根拠として(田中子1、兄弟、田中子2)を推論するとともに、これを基礎とし“対称”関係を根拠として(田中子2、兄弟、田中子1)を推論する。注意すべきは、推論する順序の前後は実際の情況に応じて異なることもある点である。
以上の結果は、関係キーワード3要素グループを一度だけ応用した場合の結論であり、複数回応用、組合せて応用した場合にはより多くの論理的結果が得られる。
本発明はキーワードの3要素モデルに類似するインデックス方法を採用し、次のような検索システムを実現可能である。インデックスは(C、R、K)グループと(Ca、R、Cb)3要素グループを採り入れて表示並びに対応付けられて実現されており、それにおけるCはファイルの内容を表し、Kはキーワードを表し、Rはファイルとキーワードとの関係を表している。Caはファイルaの内容を表し、Cbはファイルbの内容を表し、Rはファイルaとファイルbとの関係を表している。ここではファイル中のキーワードの位置、長さ、関係の程度等およびファイル間の相互引用等の関連知識を表示可能に検索システムに記録するものとする。このように構築されたインデックスによって、ファイルを構造的に示してユーザの関連情報への要求を満たすことができるほか、知識のリソースの初期モードに従って示すこともできる。
また、(C、R、K)の3要素グループによるインデックス方法は、ファイル中の“代替・指示”関係を有効に解決することができ、例えば一つのファイルに存在する代名詞“彼”に対して、3要素グループ中で実際の代替・指示の対象を確定することにより、システムは、文字の異同や類似だけでなく、代替・指示の対象に対する検索結果をユーザに提供することができる。
本発明の上記実施例によって発明内容をすでに詳細に説明している。この分野の技術者が本発明の原理を逸脱しない前提で為す容易に想到し得る各種の変更は、本出願が請求する権利の保護範囲内であることは言うまでもない。
本発明の3要素関係モデルを示す図。 本発明の実施例中の人物インデックスキーワード間の関係を示す図。 本発明の実施例中の関係キーワード間の関係を示す図。 本発明の実施例中の“逆関係”の推論ルートを示す図。 本発明の実施例中の“二段反復”の推論ルートを示す図。 本発明の実施例中の“同一主語”の推論ルートを示す図。 本発明の実施例中の“対称”の推論ルートを示す図。
符号の説明
Ka、Kb キーワード
Kr キーワードとキーワードとの関係情報
Ka’、Kb’ キーワード
Kr’ キーワードとキーワードとの関係情報
Kr 関係情報間の関係を示す情報

Claims (4)

  1. 3要素モデルに基づく検索情報加工方法であって、
    ソースファイル情報に入力されるキーワードを使用してキーワードが前記ファイル中の所定位置に出現するように構成された辞書を作製する第1のステップと、
    Kaはキーワードaを表し、Kbはキーワードbを表し、Krはキーワードaとキーワードbとの関係を表す3要素関係モデルを構築して、前記3要素グループの形式によりキーワード間の3種類のタイプの関連関係を表示並びに対応付けを行う第2のステップと、
    上記3要素関係モデル中のKr、Kr、Kr’を対応付けた入力に対し、Kr、Kr、Kr’を対応付けた情報を検索データベースに登録する第3のステップと、
    第1のステップ中のキーワードと第3のステップにより設定された関係に基づいて、キーワード間の新たな関係、即ち、Ka’のキーワードとKb’のキーワードの新たな関係Kr’を自動的に導き出すとともに、キーワードと関係を対応付けて辞書に記録する第4のステップと
    を具備することを特徴とする検索情報加工方法。
  2. 上記3要素の関係は、構成要素の主従関係、等価別名関係及び背景参考関係を含むことを特徴とする請求項1に記載の3要素モデルに基づく検索情報加工方法。
  3. 上記3要素関係モデルを複数回応用、組み合わせて応用することを特徴とする請求項1又は2に記載の3要素関係モデルに基づく検索情報加工方法。
  4. Cはファイルの内容を表し、Kはキーワードを表し、Rはファイルとキーワードとの関係を表し、Caはファイルaの内容を表し、Cbはファイルbの内容を表し、Rはファイルaとファイルbとの関係を表す場合に、(C、R、K)グループと(Ca、R、Cb)の3要素グループにより表示並びに対応付けを実現させたインデックス方法を採り入れ、ファイル中のキーワードの位置、長さ、関係の程度等およびファイル間の相互引用等の関連知識を表示可能に記録することを特徴とする請求項1乃至3のいずれか1項に記載の3要素関係モデルに基づく検索情報加工方法。
JP2007132175A 2006-05-22 2007-05-17 3要素モデルに基づく検索情報加工方法 Withdrawn JP2007317189A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2006100813680A CN1845105A (zh) 2006-05-22 2006-05-22 基于三元模型的信息检索加工的方法

Publications (1)

Publication Number Publication Date
JP2007317189A true JP2007317189A (ja) 2007-12-06

Family

ID=37064033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007132175A Withdrawn JP2007317189A (ja) 2006-05-22 2007-05-17 3要素モデルに基づく検索情報加工方法

Country Status (7)

Country Link
US (1) US20100030761A1 (ja)
JP (1) JP2007317189A (ja)
KR (1) KR100911910B1 (ja)
CN (1) CN1845105A (ja)
DE (1) DE112007000051T5 (ja)
SM (1) SMAP200800031A (ja)
WO (1) WO2007143898A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622363A (zh) * 2011-01-28 2012-08-01 鸿富锦精密工业(深圳)有限公司 关联词汇搜索***及方法
CN102693320B (zh) * 2012-06-01 2015-03-25 中国科学技术大学 一种搜索方法及装置
CN103544223A (zh) * 2013-10-07 2014-01-29 宁波芝立软件有限公司 一种基本亲缘关系信息存储表示方法、***及设备
CN103544224A (zh) * 2013-10-07 2014-01-29 宁波芝立软件有限公司 一种收养关系信息存储表示方法、***及设备
CN103544222A (zh) * 2013-10-07 2014-01-29 宁波芝立软件有限公司 一种通用亲缘关系信息存储表示方法、***及设备
CN103544225A (zh) * 2013-10-07 2014-01-29 宁波芝立软件有限公司 一种抚养关系信息存储表示方法、***及设备
CN103544236A (zh) * 2013-10-07 2014-01-29 宁波芝立软件有限公司 一种通过确定未知关系人来推导亲缘关系方法
CN103544233A (zh) * 2013-10-07 2014-01-29 宁波芝立软件有限公司 一种完全亲缘关系信息库存储组织方法、***及设备
CN105117115B (zh) * 2015-08-07 2018-05-08 小米科技有限责任公司 一种显示电子文档的方法和装置
US10410123B2 (en) 2015-11-18 2019-09-10 International Business Machines Corporation System, method, and recording medium for modeling a correlation and a causation link of hidden evidence

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001006997A (ja) * 1999-06-22 2001-01-12 Nec Kyushu Ltd 目合わせ露光装置システム及び目合わせ露光方法
JP2003040297A (ja) * 2001-08-06 2003-02-13 Toppan Printing Co Ltd オーバーキャップ付封緘キャップ
US20030110158A1 (en) * 2001-11-13 2003-06-12 Seals Michael P. Search engine visibility system
CN1696933A (zh) * 2005-05-27 2005-11-16 清华大学 基于动态规划的文本概念关系自动提取方法

Also Published As

Publication number Publication date
CN1845105A (zh) 2006-10-11
KR20070112729A (ko) 2007-11-27
SMP200800031B (it) 2008-05-14
SMAP200800031A (it) 2008-05-14
KR100911910B1 (ko) 2009-08-13
US20100030761A1 (en) 2010-02-04
WO2007143898A1 (fr) 2007-12-21
DE112007000051T5 (de) 2008-08-28

Similar Documents

Publication Publication Date Title
JP2007317189A (ja) 3要素モデルに基づく検索情報加工方法
US20200019869A1 (en) Systems and methods for semantic inference and reasoniing
US8510327B2 (en) Method and process for semantic or faceted search over unstructured and annotated data
JP2007317188A (ja) データインテリジェント加工システム及びその方法
US20140115001A1 (en) Structured query generation
JPS61220027A (ja) 文書ファイリングシステム及び情報記憶検索システム
Ambrus et al. Konduit vqb: a visual query builder for sparql on the social semantic desktop
Chuprina et al. Using ontology-based adaptable scientific visualization and cognitive graphics tools to transform traditional information systems into intelligent systems
US10592557B2 (en) Phantom results in graph queries
Karger The semantic web and end users: What's wrong and how to fix it
US20180129951A1 (en) Contextual analysis of isolated collections based on differential ontologies
EP3499379B1 (en) Computer implemented and computer controlled method, computer program product and platform for manipulating data arranged for processing and storage at a data storage engine
Staar et al. Corpus processing service: a knowledge graph platform to perform deep data exploration on corpora
Suissa et al. Question answering with deep neural networks for semi-structured heterogeneous genealogical knowledge graphs
Drakopoulos et al. A semantically annotated JSON metadata structure for open linked cultural data in Neo4j
Cellary et al. Interactive 3D multimedia content
US20160196347A1 (en) Efficient Dataset Search
Voß Describing data patterns. A general deconstruction of metadata standards
Meimaris et al. RDF resource search and exploration with LinkZoo
Voß Describing data patterns
Prasojo et al. News: News event walker and summarizer
Bao et al. A semantic wiki based light-weight web application model
Ferré Reconciling expressivity and usability in information access
Khokale et al. Intelligent interface for Web information retrieval with document understanding
Issertial et al. Data management and user interface for a call for paper manager

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100415

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110426

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20110426

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110426