JP2005251091A

JP2005251091A - データ処理装置、データ処理方法およびデータ処理プログラム

Info

Publication number: JP2005251091A
Application number: JP2004064172A
Authority: JP
Inventors: Kosuke Sasai; 浩介笹井; Naoaki Suganuma; 直昭菅沼
Original assignee: Konica Minolta Inc
Current assignee: Konica Minolta Inc
Priority date: 2004-03-08
Filing date: 2004-03-08
Publication date: 2005-09-15

Abstract

【課題】検索対象のデータの分類に関する情報をデータ検索や検索対象のデータの蓄積に有効に活用可能なデータ検索装置に利用可能なデータ処理装置を提供する。
【解決手段】キーワード生成部１６１は、日本語解析エンジン１７を利用してデータ群１１１の各データからキーワードを生成し、キーワード分類部１６２へ出力する。キーワード分類部１６２は、キーワードをクラスタリングして分類項目を決定し、決定した分類項目に基づいてキーワードをデータストア１１に格納する。キーワード分類部１６２におけるクラスタリングは、分類されたデータ群１１１に基づいて行われる。
【選択図】図６

Description

本発明は、データ処理装置、データ処理方法およびデータ処理プログラムに関する。

クエリを用いて多数のデータに対する検索を行うデータ検索装置が広範に使用されている。このようなデータ検索装置では、検索に使用するクエリが適切であれば、所望のデータを含む比較的少数のデータを検索出力として得ることができる。しかし、適切なクエリの選択には、所望のデータに対する予備知識が必要であるとともに、データ検索装置におけるデータ検索のアルゴリズムにもある程度通じている必要がある。このため、データ検索装置において、不適切なキーワードを含むクエリがデータ検索に使用されて、膨大なノイズを含む検索結果が出力されたり、検索出力に所望のデータが含まれなかったりすることも多い。

この問題を解決するため、単語に関する知識をデータ検索や検索対象のデータの蓄積に利用する技術が知られている。

例えば、特許文献１には、単語に関する知識を含むグラフを利用して、入力された単語の関連語を提示する技術が開示されている。また、特許文献２には、単語に関する知識を格納した領域オントロジを利用して、データを分類して蓄積する技術が開示されている。さらに、特許文献３には、単語に関する知識を含むオントロジ辞書を利用して、データを分類して蓄積する技術が開示されている。

特開２０００−３２３９４号公報特開２０００−２７６４８７号公報特開２００１−２２９１７７号公報

しかし、特許文献１〜３の技術では、検索対象のデータが複数の分類項目を含む分類項目群に分類されている場合に、その分類の情報をデータ検索や検索対象のデータの蓄積に利用することができなかった。

本発明は、この問題を解決するためになされたもので、検索対象のデータの分類に関する情報をデータ検索や検索対象のデータの蓄積に有効に活用可能なデータ処理装置を提供することを目的とする。

上記課題を解決するため、請求項１の発明は、データ処理装置であって、複数の分類項目を含む分類項目群に分類された第１データ群から第２データ群を生成する生成手段と、分類された前記第１データ群に基づいて、前記分類項目群に前記第２データ群を分類する分類手段と、前記第１データ群および前記第２データ群に含まれない新規データが属する前記分類項目群の中の分類項目を、分類された前記第２データ群に基づいて決定する決定手段とを備えることを特徴とする。

請求項２の発明は、請求項１に記載のデータ処理装置において、前記第１データ群の各データがテキストデータであり、前記第２データ群の各データが前記第１データ群のテキストデータの索引に相当するテキストデータであることを特徴とする。

請求項３の発明は、請求項２に記載のデータ処理装置において、前記第１データ群が文献に係るデータ群であり、前記第２データ群が前記文献の索引に係るデータ群であることを特徴とする。

請求項４の発明は、請求項２に記載のデータ処理装置において、前記第１データ群が医療行為によって発生したインシデントに係るデータ群であり、前記第２データ群が前記インシデントの索引に係るデータ群であることを特徴とする。

請求項５の発明は、請求項１ないし請求項４のいずれかに記載のデータ処理装置において、前記第２データ群が前記第１データ群の部分データであることを特徴とする。

請求項６の発明は、請求項２に記載のデータ処理装置において、前記生成手段が、前記テキストデータに記述された文字列を単語群に分割する形態素解析手段と、前記単語群から前記第２データ群を構築する構築手段とを備えることを特徴とする。

請求項７の発明は、請求項６に記載のデータ処理装置において、前記構築手段が、前記単語群の中の重複語を除去する手段を有することを特徴とする。

請求項８の発明は、請求項６または請求項７に記載のデータ処理装置において、前記構築手段が、所定の不要語特定規則に従って前記単語群の中の不要語を特定し、当該不要語を除去する手段を有することを特徴とする。

請求項９の発明は、請求項６ないし請求項８のいずれかに記載のデータ処理装置において、前記分類手段が、前記第１データ群の各データにおける前記第２データ群の各データの重みを所定の重み算出規則に従って算出する算出手段を備え、前記第２データ群の分類に前記重みを利用することを特徴とする。

請求項１０の発明は、請求項９に記載のデータ処理装置において、前記重みが所定の重要度判定規則によって定まるデータの重要度であることを特徴とする。

請求項１１の発明は、請求項１０に記載のデータ処理装置において、前記重要度が、索引語の出現頻度と、当該索引語を含む文書の数の逆数との積であることを特徴とする。

請求項１２の発明は、請求項１ないし請求項１１のいずれかに記載のデータ処理装置において、前記分類手段が、前記第２データ群の各データを、前記第１データ群の分類項目に対応する成分を有するベクトルへ変換するベクトル化手段を備え、前記第２データ群の分類に前記ベクトルを利用することを特徴とする。

請求項１３の発明は、請求項１２に記載のデータ処理装置において、前記第２データ群の各データについて、前記第１データ群の各分類項目への関連性の程度を表現した重みに基づいて、前記ベクトルの各成分をそれぞれ定めることを特徴とする。

請求項１４の発明は、請求項１ないし請求項１３のいずれかに記載のデータ処理装置において、前記分類手段が、分類にニューラルネットワークを使用することを特徴とする。

請求項１５の発明は、請求項１４に記載のデータ処理装置において、前記ニューラルネットワークが自己組織化マップであることを特徴とする。

請求項１６の発明は、請求項１ないし請求項１５のいずれかに記載のデータ処理装置において、前記新規データが前記第１データ群に追加されるデータであることを特徴とする。

請求項１７の発明は、請求項１ないし請求項１５のいずれかに記載のデータ処理装置において、前記新規データが前記第１データ群に対する検索に使用されるクエリから生成されることを特徴とする。

請求項１８の発明は、請求項１７に記載のデータ処理装置において、前記新規データが属する分類項目に属する他の前記第２データ群のデータを抽出する抽出手段をさらに備えることを特徴とする。

請求項１９の発明は、請求項１８に記載のデータ処理装置において、前記新規データに関する補助情報を出力する出力手段をさらに備え、前記補助情報が前記新規データが属する分類項目に含まれる他の前記第２データ群のデータに基づいて作成されることを特徴とする。

請求項２０の発明は、請求項１に記載のデータ処理装置において、前記新規データを操作者に入力させる入力手段をさらに備えることを特徴とする。

請求項２１の発明は、データ処理方法であって、複数の分類項目を含む分類項目群に分類された第１データ群から第２データ群を生成する工程と、分類された前記第１データ群に基づいて、前記分類項目群に前記第２データ群を分類する分類行程と、前記第１データ群および前記第２データ群に含まれない新規データが属する前記分類項目群の中の分類項目を、分類された前記第２データ群に基づいて決定する決定行程とを備えることを特徴とする。

請求項２２の発明は、データ処理プログラムであって、前記プログラムのコンピュータによる実行は、前記コンピュータに、複数の分類項目を含む分類項目群に分類された第１データ群から第２データ群を生成する生成工程と、分類された前記第１データ群に基づいて、前記分類項目群に前記第２データ群を分類する分類行程と、前記第１データ群および前記第２データ群に含まれない新規データが属する前記分類項目群の中の分類項目を、分類された前記第２データ群に基づいて決定する決定行程とを実行させることを特徴とする。

請求項１ないし請求項２２の発明によれば、分類された前記第１データ群に基づいて、第２データ群が分類され、分類された第２データ群に基づいて新規データが属する分類項目が特定されるので、新規データの処理に第１データ群の分類の情報を有効に利用可能になる。

請求項３の発明によれば、新規データが属する文献の分類項目が決定されるので、新規データの処理に文献の分類項目を利用可能になる。

請求項４の発明によれば、新規データが属するインシデントの分類項目が決定されるので、新規データの処理にインシデントの分類項目を利用可能になる。

請求項９ないし請求項１３の発明によれば、第２データ群の各データが数値化されるので、第２データ群の分類処理が容易になる。

請求項１２または請求項１３の発明によれば、第２データ群の各データがベクトル化されるので、第２データ群の分類処理が容易になる。

請求項１８または請求項１９の発明によれば、新規データが属する分類項目に含まれる他の第２データ群のデータが抽出されるので、抽出されたデータを利用可能になる。

請求項１９の発明によれば、新規データが属する分類項目に含まれる他の第２データ群のデータに基づいて作成された補助情報が出力されるので、操作者は当該補助情報を利用可能になる。

請求項２０の発明によれば、操作者が入力した新規データの処理が可能になる。

本実施形態のデータ検索装置１は、入力されたクエリを用いて、データストア１１に格納されたデータ群１１１に対する検索を実行する。図２に示すように、データ検索装置１では、複数の分類項目に分類された状態でデータ群１１１がデータストア１１に格納される。また、データ検索装置１のデータストア１１には、データ群１１１と同様の分類項目に分類された状態で、データ群１１１から抽出されたキーワード群１１２が格納される。

さらに、データ処理装置でもあるデータ検索装置１は、データ群１１１に追加データを登録する場合に分類項目が指定されなくても、追加データが属する分類項目を追加データに含まれるキーワードを用いて決定可能である。また、データ検索装置１は、クエリが入力された場合に、クエリに含まれるキーワードを用いてクエリに関する補助情報であるヒントを生成可能である。なお、データ検索装置１は、テキストデータおよびバイナリデータ（イメージデータやムービーデータ等）のいずれも処理対象とすることができるが、以下では、データ群１１１が日本語の文字列を記述したテキストデータの集合であるとして説明を進める。

＜ハードウエア構成＞
図１は、本実施形態のデータ検索装置１を実現するためのコンピュータ４のハードウエア構成を示すブロック図である。

コンピュータ４は、バス４１等で接続されたＣＰＵ４２、メモリ４３、グラフィックスアダプタ４４、入力デバイス４５および記憶装置４６を備える。グラフィックスアダプタ４４には、ユーザインターフェース１２を提供する出力デバイスとなるディスプレイ４７が接続される。また、ユーザインターフェース１２を提供する入力デバイス４５は、キーボード４５１およびポインティングデバイス４５２を含む。

ハードディスクドライブ等で構成される記憶装置４６には、コンピュータ４の基本動作を規定するオペレーティングシステム（以下では、「ＯＳ」とも称する）４６１がインストールされる。記憶装置４６には、ＯＳ４６１の管理下で実行されるデータ検索プログラム４６２もインストールされる。データ検索装置１では、コンピュータ４がデータ検索プログラム４６２を実行することにより、後述する図２、５〜６および８〜９における各機能ブロックの機能が実現される。

なお、単一のコンピュータ４によってデータ検索装置１が実現される例を上記で示したが、データ検索装置１がネットワーク接続された複数のコンピュータによって実現されることも妨げられない。

＜機能構成＞
○全体構成；
図２は、データ検索装置１の全体の機能構成を示すブロック図である。

記憶装置４６を用いて実現されるデータ検索装置１のデータストア１１には、データ群１１１およびキーワード群１１２が格納される。データ群１１１は、データ検索装置１において検索対象となるデータの集合である。キーワード群１１２は、データ群１１１を構成する各データのキーワードの集合であり、データ群１１１とは異なるデータの体系となっている。キーワードは、データを特徴付ける索引ないしはインデックスであり、好ましくはデータ群１１１を構成するデータの部分データである。これにより、データ群１１１の各データからキーワードを抽出可能となるので、キーワードの生成が容易になる。データ群１１１およびキーワード群１１２は、分類項目Ｇ₀,Ｇ₁，・・・，Ｇ_Nc-1を含む分類項目群に分類された状態でデータストア１１に格納される。図３には、データ群１１１｛Ｄ₀，Ｄ₁，・・・，Ｄ_p｝が分類項目Ｇ₀,Ｇ₁，・・・，Ｇ_Nc-1に分類された状態の例が示されている。また、図４には、キーワード群１１２｛Ｋ₀，Ｋ₁，・・・，Ｋ_Nk｝が分類項目Ｇ₀,Ｇ₁，・・・，Ｇ_Nc-1に分類された状態の例が示されている。なお、データ群１１１およびキーワード群１１２のデータモデルは、リレーショナル型に制限されず、階層型またはネットワーク型でもよい。

データ検索装置１は、操作者等の外部から新規に与えられる入力データの取得および操作者等の外部への出力データの提示を行うユーザインターフェース１２を備える。入力データには、データ群１１１に対する検索に使用されるクエリおよびデータ群１１１に追加される追加データが含まれる。出力データには、データ群１１１に対する検索により得られた検索結果およびクエリに関するヒントが含まれる。ユーザインターフェース１２が取得したクエリおよび追加データは、それぞれ、クエリ処理エンジン１３および追加データ処理エンジン１４へ出力される。

クエリ処理エンジン１３は、与えられたクエリを解析してキーワードを生成し、データ検索エンジン１５へ出力する。また、クエリ処理エンジン１３は、データストア１１にアクセスして生成したキーワードが属する分類項目に属する他のキーワード（以下では、「同一分類キーワード」とも称する）を取得する。さらに、クエリ処理エンジン１３は、同一分類キーワードに基づいて上述のヒントを生成してユーザインターフェース１２へ出力する。

データ検索エンジン１５は、データストア１１にアクセスして、与えられたキーワードを含むデータを取得する。さらに、データ検索エンジン１５は、取得したデータを検索結果としてユーザインターフェース１２へ出力する。

追加データ処理エンジン１４は、与えられた追加データを解析してキーワードを生成する。また、追加データ処理エンジン１４は、データストア１１にアクセスして、生成したキーワードが属する分類項目を特定し、追加データが属する分類項目を決定する。分類項目が決定された追加データは、当該分類項目に従ってデータストア１１に格納される。

データ処理エンジン１６は、データ群１１１からキーワード群１１２を生成し、分類されたデータ群１１１に基づいてキーワード群１１２の分類を行う。キーワードの生成および分類は、データストア１１にデータが追加されるごとに行われる。

さらに、データ検索装置１は、データ検索装置１の内部の日本語処理に使用される日本語解析エンジン１７を備える。

以下では、上述の各機能ブロックについてさらに詳細に説明する。

○日本語解析エンジン；
図５は、入力された自然文からキーワードを抽出して出力する日本語解析エンジン１７の機能構成を示すブロック図である。

日本語解析エンジン１７は、形態素解析部１７１、不要語除去部１７２および重複語除去部１７３を備える。形態素解析部１７１は、与えられた自然文を単語に分割して品詞情報とともに不要語除去部１７２へ出力する。不要語除去部１７２は、品詞情報や頻出辞書１７４を参照し、所定の規則に基づいて不要語を特定して、与えられた単語をフィルタリングし、キーワードとして適切な単語のみを抽出する。重複語除去部１７３は、不要語除去部１７２が抽出したキーワードに含まれる重複語を除去して出力する。

このような日本語解析エンジン１７は、クエリ処理エンジン１３、追加データ処理エンジン１４およびデータ処理エンジン１６におけるキーワード生成時に使用される。

なお、日本語解析エンジン１７は、データ検索装置１が処理対象とするデータで使用されている言語によって適宜変更される。すなわち、処理対象とするデータで日本語以外の言語が使用される場合は、当該言語用の言語解析エンジンが日本語解析エンジン１７に代わって使用される。もちろん、複数言語に対応した言語解析エンジンが日本語解析エンジン１７に代わってデータ検索装置１に搭載されることも妨げられない。

○データ処理エンジン；
図６は、データ処理エンジン１６の機能構成を示すブロック図である。

データ処理エンジン１６は、キーワード生成部１６１およびキーワード分類部１６２を備える。キーワード生成部１６１は、日本語解析エンジン１７を利用してデータ群１１１の各データからキーワードを生成し、キーワード分類部１６２へ出力する。ひとつのデータから生成されるキーワードはひとつに制限されず、複数であってもよい。また、異なるデータから重複するキーワードが生成されることも妨げられない。

キーワード分類部１６２は、キーワードをクラスタリングして分類項目を決定し、決定した分類項目に従ってキーワードをデータストア１１に格納する。キーワード分類部１６２におけるクラスタリングは、分類されたデータ群１１１に基づいて行われる。換言すれば、キーワード分類部１６２におけるクラスタリングは、データ群１１１の分類の情報を用いて行われる。クラスタリングの方法は制限されないが、ニューラルネットワーク、遺伝アルゴリズムおよびリンク分析等を利用した方法が適用可能である。以下では、これらの方法等のうち、ニューラルネットワークの一形態である自己組織化マップをクラスタリングに利用する例を説明する。

なお、クラスタリングの方法によっては、キーワードを数値で表現する必要がある場合やキーワードを数値で表現した方が処理が容易になる場合もある。このような場合において、キーワードを表現する数値は、単一の数値のみならず、複数の数値の組であってもよい（キーワードを複数の数値の組で表現することを以下では「ベクトル化」とも称する）。数値化の方法には、データ群の各データにおけるキーワードの重みに基づいて数値化する方法や、データ群１１１の各データにおけるキーワードの共起度に基づいて数値化する方法等がある。以下では、前者の一例として、データ群の各データにおけるキーワードのＴＦ×ＩＤＦ値に基づいて、キーワードを数値化する方法が採用されているものとして説明を進める。ここで、「ＴＦ（Term Frequency）」とは、キーワードのデータにおける出現頻度（索引語頻度）であり、「ＩＤＦ（Inverse Document Frequency）」とは、キーワードを含むデータ数の逆数である。ＴＦ×ＩＤＦ値は、局所的重み付けと大域的重み付けとの積であり、各データにおけるキーワードの重要性を示す指標となっている。

キーワードの数値化（ベクトル化）にあたっては、まず、データＤ_mにおけるキーワードＫ_nのＴＦ×ＩＤＦ値Ｌ（ｍ，ｎ）が算出される。そして、キーワードＫ_nは、算出されたＴＦ×ＩＤＦ値Ｌ（ｍ，ｎ）を用いて、式１に示すＮｃ次元のベクトルで表現される。

式１に示すベクトルの各成分における表記ｍ∈Ｇ_i（ｉ＝１，２，・・・，Ｎｃ−１）は、分類項目Ｇ_iに属するデータＤ_mについて、ＴＦ×ＩＤＦ値Ｌ（ｍ，ｎ）を加算することを意味する。換言すれば、式１に示すベクトルの各成分は、ＴＦ×ＩＤＦ値Ｌ（ｍ，ｎ）をデータが属する分類項目ごとに集計したものに相当する。このようにして得られたベクトルＫ_nの組は正規化される。具体的には、式２に示す行列の要素の最大値が１、最小値が０となるように正規化が行われる。

この正規化後においては、キーワードを表現したベクトル（以下では、「キーワードベクトル」とも称する）の成分の大きさは、当該成分に対応する分類項目における当該キーワードの重要度、換言すれば関連性の程度となっている。

正規化後のＮｋ個のベクトルは図７に例示す自己組織化マップＳＯＭに入力され、キーワードのカテゴライズに利用される。自己組織化マップＳＯＭの入力層ＩＬはＮｃ個（図７では、Ｎｃ＝４の例が示されている）のユニットＵ１１〜Ｕ１４から構成される。ユニットＵ１１〜Ｕ１４は，自己組織化マップＳＯＭの入力データとなるキーワードベクトルＫｉの各成分に対応している。自己組織化マップＳＯＭの出力層ＯＬはＮｇ個（図７では、Ｎｇ＝９の例が示されている）のユニットＵ２１〜Ｕ２９から構成される。ユニットＵ２１〜Ｕ２９は、一辺に（Ｎｇ）^1/2個のユニットが存在するマトリクス状に配置される。出力層ＯＬの各ユニットＵ２１〜Ｕ２９は、入力層ＩＬの各ユニットＵ１１〜Ｕ１４と伝搬係数Ｓ_ijで結合されている。ここで、インデックスｉは入力層ＩＬのユニット（キーワードベクトルＫ_nの成分）を特定するインデックスであり、インデックスｊは出力層ＯＬのユニット（分類項目）を特定するインデックスである。

なお、上述の説明では、キーワードがデータストア１１に追加されるとしたが、キーワードに代えて複数の単語からなるキーセンテンスがデータストア１１に格納されるようにしてもよい。

○クエリ処理エンジン；
図８はクエリ処理エンジン１３の機能構成を示すブロック図である。

クエリ処理エンジン１３は、クエリ解析部１３１を備える。クエリ解析部１３１は、日本語解析エンジン１７を利用してクエリからキーワードを生成し、キーワード検索エンジン１３２およびデータ検索エンジン１５へ出力する。クエリ解析部１３１で生成されたキーワードは、データ群１１１およびキーワード群１１２とは異なる新規データの一例となっている。

キーワード検索エンジン１３２は、データストア１１にアクセスして、同一分類キーワードを取得する。例えば、キーワードの分類が図４に示す状態である場合、キーワード検索エンジン１３２は、キーワードＫ₈が与えられると、キーワードＫ₂₀，・・・，Ｋ₅₀，・・・を同一分類キーワードとしてデータストア１１から取得する。換言すれば、キーワード検索エンジン１３２は、分類されたキーワード群１１２に基づいて（キーワード群１１２の分類の情報を利用して）、与えられたキーワードが属する分類項目を特定している。すなわち、データ検索装置１は、キーワード群１１２の分類の情報を介して、データ群１１１の分類の情報を、生成したキーワードの処理（同一分類キーワードの取得やヒントの生成）に有効に利用可能となっている。なお、同じ分類項目に属するキーワードは、データ群１１１に対する重要度の傾向が類似しているので、同一分類キーワードをクエリに用いることにより適切な検索結果が得られる可能性は高いと言える。

ヒント生成部１３３は、与えられた同一分類キーワードに基づいてクエリに関する補助情報であるヒントを生成して、ユーザインターフェース１２へ出力する。具体的には、ヒント生成部１３３は、与えられたキーワードを含むクエリを入力するように操作者に促すヒントを生成する等の処理を行い、ユーザインターフェース１２へ出力する。このようなヒントの実例は後述する実施例で示される。これにより、操作者は、同一分類キーワードを利用して適切な検索結果を導くクエリをデータ検索装置１へ入力可能となる。

○追加データ処理エンジン；
図９は、追加データ処理エンジン１４の機能構成を示すブロック図である。

追加データ処理エンジン１４は、追加データ解析部１４１および追加データ分類部１４２を備える。

追加データ解析部１４１は、日本語解析エンジン１７を利用して追加データからキーワードを生成し、追加データ分類部１４２へ出力する。追加データ解析部１４１で生成されたキーワードは、データ群１１１およびキーワード群１１２とは異なる新規データの一例となっている。

追加データ分類部１４２は、データベースにアクセスして、分類されたキーワード群１１２に基づいて（キーワード群１１２の分類の情報を利用して）、生成したキーワードが属する分類項目を特定し、追加データが属する分類項目を特定した分類項目に決定する。分類項目が決定された追加データは、当該分類項目に従ってデータストア１１に格納される。つまり、追加データの分類項目が指定されなくても、データ検索装置１は、追加データに含まれるキーワードを利用して追加データの分類処理を自律的に実行可能となっている。すなわち、データ検索装置１は、データ群１１１の分類の情報を生成したキーワードの処理（生成元の追加データの分類）に有効に利用可能となっている。

＜動作＞
○全体動作；
図１０は、データ検索装置１の全体の動作フローを示すフローチャートである。

動作フローの最初のステップＳ１では、検索およびデータ追加のいずれかが選択される。検索が選択された場合、動作フローはステップＳ２へ移行して検索動作のサブルーチンが実行される。一方、データ追加が選択された場合、動作フローはステップＳ３へ移行してデータ追加動作のサブルーチンが実行される。ステップＳ２またはＳ３終了後、動作フローは終了する。なお、ステップＳ１における選択の具体的方法は、後述する実施例において例示される。

○検索動作；
図１１は、検索動作のサブルーチンの動作フローを示すフローチャートである。

動作フローの最初のステップＳ１０１では、クエリ入力の検出が行われる。クエリ入力が検出された場合、動作フローは次のステップＳ１０２へ移行する。クエリ入力が検出されない場合、動作フローはステップＳ１０１へ戻り、クエリ入力の待機状態が継続する。なお、クエリ入力の具体的方法は、後述する実施例において例示される。

ステップＳ１０２では、クエリ解析部１３１がクエリからキーワードを生成して、キーワード検索エンジン１３２およびデータ検索エンジン１５へ出力する。

続いて、データ検索エンジン１５がデータ検索を行い、検索結果をユーザインターフェース１２へ出力する（ステップＳ１０３）。

さらに続いて、キーワード検索エンジン１３２がキーワード検索を行い、同一分類キーワードを抽出し（ステップＳ１０４）、ヒント生成部１３３がヒントを生成してユーザインターフェース１２へ出力する（ステップＳ１０５）。

ステップＳ１０５に続くステップＳ１０６では、検索結果およびヒントがユーザインターフェース１２を用いて操作者に提示される。しかる後に、検索動作のサブルーチンの動作フローが終了する。なお、検索結果およびヒントの提示の具体的方法は後述する実施例において例示される。

以上の動作フローにより、操作者は入力したクエリを用いた検索結果を取得するとともに、当該クエリに関するヒントを得たことになる。

○データ追加動作；
図１２は、データ追加動作のサブルーチンの動作フローを示すフローチャートである。

動作フローの最初のステップＳ２０１では、追加データの入力の検出が行われる。追加データの入力が検出された場合、動作フローは次のステップＳ２０２へ移行する。追加データの入力が検出されない場合、動作フローはステップＳ２０１へ戻り、追加データの入力の待機状態が継続する。なお、追加データの入力の具体的方法は、後述する実施例において例示される。

ステップＳ２０２では、追加データ解析部１４１が追加データからキーワードを生成して、追加データ分類部１４２へ出力する。

続いて、追加データ分類部１４２がデータ検索を行い与えられたキーワードが属する分類項目を特定し（ステップＳ２０３）、追加データ分類部１４２が特定した分類項目に基づいて追加データをデータストア１１に格納する（ステップＳ２０４）。しかる後に、動作フローはステップへ移行する。

ステップＳ２０１〜Ｓ２０４により、データ検索装置１は、分類項目が指定されない追加データを自動的に分類してデータストア１１に格納したことになる。

ステップＳ２０５は、キーワードの分類のためのデータ処理のサブルーチンである。ステップＳ２０５終了後、データ追加動作のサブルーチンの動作フローは終了する。

○データ処理動作；
図１３は、データ処理動作のサブルーチンの動作フローを示すフローチャートである。

動作フローの最初のステップＳ３０１では、キーワード生成部１６１がデータ群１１１の各データからキーワードを生成する。

続いて、キーワード分類部１６２は所定の方法で伝搬係数Ｓ_ijを初期化し、伝搬係数Ｓ_ijの修正回数ｓを初期化（ｓ＝０）する（ステップＳ３０２）。

さらに続いて、キーワード分類部１６２は、全てのキーワードＫ_nをベクトル化して（ステップＳ３０３）、自己組織化マップＳＯＭへ順次入力する（ステップＳ３０４）。

ステップＳ３０４に続くステップＳ３０５では、キーワード分類部１６２は、伝搬係数Ｓ_ijの修正を行う（ステップＳ３０５）。具体的には、キーワード分類部１６２は、出力層ＯＬの全てのユニットＵ２１〜Ｕ２９について、入力層ＩＬのユニットＵ１〜Ｕ４が保持する値（キーワードベクトルＫ_nの成分値Ｋ_ni）と伝搬係数Ｓ_ijとの誤差の総和Ｔ（式３参照）を計算し、誤差の総和Ｔが最小となる勝者ユニットを特定する。

そして、キーワード分類部１６２は、勝者ユニットを中心とする近傍領域内のユニットについて、誤差の総和Ｔが小さくなるように一定の割合で伝搬係数Ｓ_ijを修正する。これにより、自己組織化マップＳＯＭにおける学習が進行したことになる。

続いて、修正回数ｓがインクリメント（ｓ←ｓ＋１）される（ステップＳ３０６）。

続くステップ３０７では、修正回数ｓが所定回数Ｎに達しているかどうかによって分岐処理が行われる。達している場合は動作フローはステップＳ３０９へ移行する。一方、達していない場合は動作フローはステップＳ３０８へ移行する。

ステップ３０８では、誤差修正割合が削減されるとともに近傍領域が縮小され、動作フローはステップＳ３０４へ戻る。これにより、修正回数ｓが所定回数Ｎに達するまで、学習の進行を順次に抑制しつつ、自己組織化マップＳＯＭの学習が継続されることになる。

自己組織化マップＳＯＭの学習終了後のステップＳ３０９では、キーワード分類部１６２がキーワードベクトルｋ_nを自己組織化マップＳＯＭへ入力する。さらに、キーワード分類部１６２は、ステップＳ３０４と同様に勝者ユニットを特定する（ステップＳ３１１）。この勝者ユニットに対応する分類項目がキーワードｋ_nが属する分類項目となる。

ステップＳ３１２では、ステップＳ３１１で決定された分類項目に基づいてキーワードｋｎがデータストア１１に格納される。

このような動作フローにより、データ群１１１から抽出されたキーワード群１１２がデータ群１１１の分類の情報に基づいて自動的に分類されたことになる。

実施例１は、データ検索装置１の論文検索システムへの適用例を示す実施例である。実施例２は、データ検索装置１の医療支援システムへの適用例を示す実施例である。論文検索システムおよび医療支援システムでは、データストア１１に格納されるデータ群１１１およびキーワード群１１２が、各々のシステムが処理対象とする具体的なデータ群およびキーワード群となっている。また、論文検索システムおよび医療支援システムでは、各々のシステムの利用目的に適合するユーザインターフェース１２が提供される。以下では、これらのデータ群１１１、キーワード群１１２およびユーザインターフェース１２について説明する。なお、実施例１および実施例２は、データ検索装置１の適用方法の例示に過ぎない。したがって、データ検索装置１の適用方法や適用対象は、実施例１および実施例２によっては制限されず、特許請求の範囲の記載内で任意に変更可能である。

［実施例１］
実施例１は論文検索システムに関する。論文検索システムでは、データ群１１１が、医学分野の学術論文（以下では、「論文」とも称する）に係るテキストデータ（以下では、「論文データ」とも称する）の集合となっている。論文検索システムは、入力されたクエリを用いてデータ群１１１に対する検索を行い、当該クエリに合致する論文データを検索結果として操作者に提示する。また、論文検索システムは、入力された追加論文データをデータストア１１に格納する。

さらに、論文検索システムは、検索実行時に、所望の論文データが検索出力される可能性を高めるためのクエリ変更のヒントを操作者に提示する。また、論文検索システムは、論文データ追加時に分類項目が指定されなくても、当該論文データが属する分類項目を決定可能である。これらの操作者の支援機能は、複数の分類項目群に分類されたデータ群１１の分類の情報を利用して実現される。

論文検索システムでは、データ群１１を分類するための分類基準には、著者氏名、対象部位、病名およびセッションが採用される。ただし、これらの分類基準は例であり、これらの分類基準を他の分類基準に変更することや、これらの分類基準に他の分類基準を追加することも妨げられない。

論文検索システムでは、ユーザインターフェース１２として、ディスプレイ４７への表示を利用したＧＵＩ（Graphical User Interface）が採用される。このため、論文検索システムの操作者は、ディスプレイ４７に表示された画面を参照しながら入力デバイス４５で所定の操作を行うことにより、論文検索システムに指示を付与可能である。

＜画面遷移＞
図１４は、論文検索システムのディスプレイ４７に表示される画面の遷移を示す画面遷移図である。以下では、図１４の画面遷移図および図１５〜図２２の画面例を参照しながら、論文検索システムの動作を説明する。

○メニュー画面；
図１５に例示するメニュー画面ＳＣ１１は、論文検索システム起動時に表示される。メニュー画面ＳＣ１１には、検索画面ＳＣ１２および登録画面ＳＣ１３への遷移リンク２０１および２０２が含まれる。遷移リンク２０１および２０２のいずれかを選択する操作がメニュー画面ＳＣ１１で行われると、ディスプレイ４７の表示は選択された遷移リンクに対応する画面（検索画面ＳＣ１２または登録画面ＳＣ１３）へ切り替わる。なお、メニュー画面ＳＣ１１における遷移リンクの選択が図１０のフローチャートのステップＳ１の選択に対応する。

○検索画面；
図１６に例示する検索画面ＳＣ１２は、クエリ入力用の画面である。検索画面ＳＣ１２は、クエリ入力用のテキストエリア２１１および検索ボタン２１２を含む。操作者は、テキストエリア２１１へのクエリ入力後に検索ボタン２１２を押下することにより、当該クエリを用いた論文データ検索を論文検索システムに実行させる。すなわち、論文検索システムでは、検索画面ＳＣ１２において検索ボタン２１２の押下が検出されると、図１１のフローチャートに従って論文データ検索およびヒント生成が行われる。論文データ検索およびヒント生成の処理終了後、ディスプレイ４７の表示は検索結果一覧表示画面ＳＣ１４に切り替わる。なお、検索ボタン２１２の押下は、図１１のフローチャートのステップＳ１０１のクエリ入力に対応している。

○検索結果一覧表示画面；
図１７に例示する検索結果一覧表示画面ＳＣ１４は、検索結果の一覧表示を行う画面である。検索結果一覧表示画面ＳＣ１４は、検索結果一覧テーブル２２１および再検索ボタン２２３を含む。検索結果一覧テーブル２２１には、検索出力された論文のタイトルおよびカテゴリのリストが表示される。リストアップされた各論文のタイトル２２２ａ〜２２２ｇは、各論文に対応する詳細情報表示画面ＳＣ１５への遷移リンクでもある。したがって、操作者は、所望の論文に対応する遷移リンクを選択することにより、所望の論文の詳細情報表示画面ＳＣ１５をディスプレイ４７に呼出可能である。また、再検索ボタン２２３は、再検索画面ＳＣ１６の呼出指示を論文検索システムに与えるためのＧＵＩ指示部材である。

○詳細表示画面；
図１８に例示する詳細情報表示画面ＳＣ１５は、検索結果一覧表示画面ＳＣ１４で選択された遷移リンクに対応する論文の詳細情報を表示する画面である。詳細情報表示画面ＳＣ１５は、詳細表示テーブル２３１、再検索ボタン２３２および全文表示ボタン２３３を含む。詳細表示テーブル２３１には、タイトル、カテゴリ、著者、キーワード、妙録およびページ数が表示される。再検索ボタン２３２および全文表示ボタン２３３は、それぞれ、再検索画面ＳＣ１６および全文表示画面ＳＣ１７の呼出指示を論文検索システムに与えるためのＧＵＩ指示部材である。

○全文表示画面；
図１９に例示する全文表示画面ＳＣ１７は、詳細情報表示画面ＳＣ１５で表示された論文の全文を表示する画面である。当該全文は、書式情報を含まないプレーンテキスト、書式情報を含むテキストまたはイメージ等で記述されたドキュメントであり、ＰＤＦ（登録商標）等であってもよい。全文表示画面ＳＣ１７は、論文の全文２４１および戻るボタン２４２を含む。戻るボタン２４２は、詳細情報表示画面ＳＣ１５の呼出指示を論文検索システムに与えるためのＧＵＩ指示部材である。

○再検索画面；
図２０に例示される再検索画面ＳＣ１６は、再検索のクエリ入力用の画面である。再検索画面ＳＣ１６は、検索画面ＳＣ１２と同様のテキストエリア２５１および検索ボタン２５２を含む。テキストエリア２５１には前回の検索で用いたクエリ２５１ａがデフォルトで表示されるが、操作者は所定の操作により当該クエリ２５１ａを編集可能である。

さらに、再検索画面ＳＣ１６のテキストエリア２５１の下方には、クエリ変更のヒントＨＴ１〜ＨＴ５が表示される。ヒントＨＴ１〜ＨＴ５は、前回の検索で使用したクエリ２５１ａに含まれるキーワード（「青木」、「大腸」、「ガン」、「再発率」および「大腸ガン」）の変更を促すヒントとなっている。

ヒントＨＴ１は、著者氏名の分類項目に係る、「青木」の同一分類キーワード（「青木知美」および「青木豊」）から生成されたヒントである。ヒントＨＴ２は、対象部位の分類項目に係る、「大腸」の同一分類キーワード（「結腸」および「直腸」）から生成されたヒントである。ヒントＨＴ３は、病名の分類項目に係る、「ガン」の同一分類キーワード（「悪性腫瘍」、「腫瘍マーカー」および「放射線」）から生成されたヒントである。ヒントＨＴ４は、セッションの分類項目に係る、「再発率」の同一分類キーワード（「生存率」および「余命」）から生成されたヒントである。ヒントＨＴ５は、セッションの分類項目に係る、「大腸ガン」の同一分類キーワード（「大腸ガン」および「大腸ガン」）から生成されたヒントである。ヒントＨＴ１〜ＨＴ５に含まれるキーワードは、前回の検索で使用したクエリに含まれるキーワード（以下では、「前回キーワード」とも称する）とデータ群１１１における出現傾向が類似しているので、前回キーワードの代替キーワードとして利用可能である。したがって、操作者はヒントを参照してクエリを変更することにより、より適切な検索出力を得る可能性がある。

さらに、再検索画面ＳＣ１６は終了ボタン２５３を含む。終了ボタン２５３は、メニュー画面ＳＣ１１への移行を論文検索システムに指示するためのＧＵＩ指示部材である。操作者は、終了ボタン２５３を押下することにより、ディスプレイ４７の表示を再びメニュー画面ＳＣ１１に切り替えることができる。

○登録画面；
図２１に例示する登録画面ＳＣ１３は、論文登録用の画面である。登録画面ＳＣ１３は、テキストボックス２６１、参照ボタン２６２および登録ボタン２６３を含む。操作者は、テキストボックス２６１へ登録論文のファイル場所（パス）を入力後（あるいは、ファイル参照ボタン２６２を押下して登録論文を選択するＧＵＩ操作後）に登録ボタン２６３を押下することにより、論文データのデータストア１１への登録を論文検索システムに実行させる。すなわち、登録画面ＳＣ１３において登録ボタン２６３の押下が検出されると、テキストボックス２６１に入力されたパスの論文データが、図１２に示すフローチャートに従って追加データとしてデータストア１１に格納される。なお、図２１には、論文データの分類項目を指定するためのＧＵＩ操作部材は含まれないが、論文検索システムは入力された論文データを自動的に分類可能である。また、登録ボタン２６３の押下は、図１２のフローチャートのステップＳ２０１における追加データ入力に対応する。

登録ボタン２６３の押下後、論文の登録が完了するとディスプレイ４７の表示は登録成功画面ＳＣ１８へ切り替わる。

○登録成功画面；
図２２に例示される登録成功画面ＳＣ１８は、論文登録の成功を操作者に通知する画面である。

登録成功画面ＳＣ１８には、操作者に論文登録の成功を通知する文字列２７１と、登録画面ＳＣ１３およびメニュー画面ＳＣ１１への遷移リンク２７２および２７３とが含まれる。遷移リンク２７２および２７３のいずれかを選択する操作が登録成功画面ＳＣ１８で行われると、ディスプレイ４７の表示は選択された遷移リンクに対応する画面へ移行する。

［実施例２］
実施例２は医療支援システムに関する。医療支援システムでは、データ群１１１が、医療従事者が医療行為実行時に経験したインシデントに係るテキストデータ（以下では、「インシデントデータ」とも称する）の集合となっている。医療支援システムは、入力されたクエリを用いてデータ群１１１に対する検索を行い、当該クエリに合致するインシデントデータを検索結果として操作者に提示する。また、医療支援システムは、入力された追加インシデントデータをデータストア１１に格納する。医療支援システムにおけるクエリはコンディション入力画面ＳＣ２１のテンプレートを用いて医療従事者が入力したコンディション情報に基づいて生成される。

さらに、医療支援システムは、検索実行時に、当該クエリに含まれるキーワードと関連が深いキーワードをヒントとして操作者に提示する。また、医療支援システムは、インシデントデータ追加時に分類項目が指定されなくても、当該インシデントデータが属する分類項目を決定可能である。これらの操作者の支援機能は、複数の分類項目群に分類されたデータ群１１１の分類の情報を利用して実現される。

データ群１１１を分類するための分類基準には、インシデントを経験した医療従事者の所属科（内科、外科および耳鼻科等）および経験年数（一般的には属性）と、インシデントの発生時刻と、インシデント発生時の天候とが採用される。ただし、これらの分類基準は例であり、これらの分類基準を他の分類基準に変更することや、これらの分類基準に他の分類基準を追加することも妨げられない。

医療支援システムでは、論文検索システムと同様に、ユーザインターフェース１２として、ディスプレイ４７への表示を利用したＧＵＩが採用される。このため、医療支援システムの操作者は、ディスプレイ４７に表示された画面を参照しながら入力デバイス４５で所定の操作を行うことにより、医療支援システムに指示を付与可能である。

＜画面遷移＞
図２３は、医療支援システムのディスプレイ４７に表示される画面の遷移を示す画面遷移図である。以下では、図２３の画面遷移図および図２４〜図２９の画面例を参照しながら、医療支援システムの動作を説明する。

○メニュー画面；
図２４に例示するメニュー画面ＳＣ２２は、医療支援システム起動時に表示される。メニュー画面ＳＣ２２は、コンディション入力画面ＳＣ２１およびインシデント登録画面ＳＣ２３への遷移リンク３０１および３０２を含む。遷移リンク３０１および３０２のいずれかを選択する操作がメニュー画面ＳＣ２２で行われると、ディスプレイ４７の表示は選択された遷移リンクに対応する画面（コンディション入力画面ＳＣ２１またはインシデント登録画面ＳＣ２３）へ切り替わる。なお、メニュー画面ＳＣ２２における遷移リンクの選択が図１０のフローチャートのステップＳ１の選択に対応する。

○コンディション入力画面；
図２５に例示するコンディション入力画面ＳＣ２１は、医療従事者のコンディション入力用の画面である。

コンディション入力画面ＳＣ２１は、複数の入力項目の枠組みを有するテンプレートとなっている。テンプレートには、インシデントを経験した医療従事者の所属科および経験年数と、インシデントの発生時刻と、インシデント発生時の天候と、インシデントに係る医療行為（図２５では、看護師が患者に対して実行するケアとなっている）の内容とを入力するためのテキストエリア３１１〜３１５および検索ボタン３１６を備える。ただし、図２５に例示する入力項目は例であり、当該入力項目に他の入力項目を追加することや当該入力項目を他の入力項目に変更することも妨げられない。操作者は、テキストエリア３１１〜３１５への入力後に検索ボタン３１６を押下することにより、当該入力内容に対応するインシデントデータの検索を医療支援システムに実行させる。すなわち、コンディション入力画面ＳＣ２１において検索ボタン３１６の押下が検出されると、図１１のフローチャートに従ってインシデントデータ検索およびヒント生成が行われる。なお、医療支援システムでは、キーワードはテンプレートを用いて入力された複数の文字列から生成される。キーワードの生成にあたっては日本語解析に加えて、テンプレートにおける入力項目の情報も利用される。インシデントデータ検索およびヒント生成後、ディスプレイ４７の表示は検索結果一覧表示画面ＳＣ２４に切り替わる。なお、検索ボタン３１６の押下は、図１１のフローチャートのステップＳ１０１のクエリ入力に対応する。

○検索結果一覧表示画面；
図２６に例示する検索結果一覧表示画面ＳＣ２４は、検索結果の一覧表示を行う画面である。検索結果一覧表示画面ＳＣ２４は、検索結果一覧３２１および関連キーワード一覧３２２を含む。関連キーワード一覧３２２には、クエリに関するヒントである関連キーワードのリストが表示される。ヒントは、キーワード検索エンジン１３２が抽出した同一分類キーワードである。すなわち、医療支援システムのヒント生成部１３３は、与えられた同一分類キーワードに特別な変換を行わないでユーザインターフェース１２へ出力している。

検索結果一覧３２１には、検索出力されたインシデントデータのケア内容のリストが表示される。検索出力は、コンディション入力画面ＳＣ２１の入力から直接生成されたキーワードと当該キーワードの同一分類キーワードを用いて検索を行った検索出力となっている。このように同一分類キーワード（関連キーワード）をも検索に利用することにより、重要なインシデントデータが検索出力から抜け落ちることを防止可能である。なお、検索結果一覧でリストアップされた各インシデントデータのケア内容は、各インシデントデータに対応する詳細情報表示画面ＳＣ２５への遷移リンクでもある。したがって、操作者は、所望のインシデントデータに対応する遷移リンクを選択することにより、所望のインシデントデータの詳細情報表示画面ＳＣ２５をディスプレイ４７に呼出可能である。

また、検索結果一覧表示画面ＳＣ２４は、戻るボタン３２３を含む。戻るボタン３２３は、コンディション入力画面ＳＣ２１の呼出指示を医療支援検索システムに与えるためのＧＵＩ指示部材である。

○詳細表示画面；
図２７に例示する詳細情報表示画面ＳＣ２５は、検索結果一覧表示画面ＳＣ２４で選択された遷移リンクに対応するインシデントデータの詳細情報を表示する画面である。詳細情報表示画面ＳＣ２５は、詳細表示テーブル３３１および戻るボタン３３２を含む。詳細表示テーブル３３１には、インシデントを経験した医療従事者の所属科および経験年数と、インシデントの発生時刻と、インシデント発生時の天候と、インシデントに係る医療行為の内容と、インシデントの内容とが表示される。戻るボタン３３２は、検索結果一覧表示画面ＳＣ２４の呼出指示を医療支援システムに与えるためのＧＵＩ指示部材である。

○インシデント登録画面；
図２８に例示するインシデント登録画面ＳＣ２３は、インシデント登録用の画面である。インシデント登録画面ＳＣ２３は、コンディション入力画面ＳＣ２１と同様に、テンプレートとなっている。テンプレートには、詳細表示画面ＳＣ２５と同じ項目の入力のためのテキストエリア３４１〜３４６を含む。操作者は、テキストエリア３４１〜３４６への入力後に登録ボタン３４７を押下することにより、インシデントデータのデータストア１１への追加を医療支援システムに実行させる。すなわち、インシデント登録画面ＳＣ２３において登録ボタン３４７の押下が検出されると、テンプレートに入力されたインシデントデータが追加データとしてデータストア１１に格納される。なお、図２８には、インシデントデータの分類項目を指定するためのＧＵＩ操作部材は含まれないが、医療支援システムは入力されたインシデントデータを自動的に分類可能である。

登録ボタンの押下後、インシデントデータの登録が完了するとディスプレイ４７の表示は登録成功画面ＳＣ２６へ移行する。また、登録ボタン３４７の押下は、図１２のフローチャートのステップＳ２０１における追加データ入力に対応する。

○登録成功画面；
図２９に例示される登録成功画面ＳＣ２６は、インシデント登録の成功を操作者に通知する画面である。登録成功画面ＳＣ２６には、操作者にインシデントデータ登録の成功を通知するための文字列３５１と、戻るボタン３５２とが含まれる。戻るボタン３５２の押下操作が登録成功画面ＳＣ２６で行われると、ディスプレイ４７の表示はインシデントデータ登録画面ＳＣ２３へ移行する。

データ検索装置１を実現するためのコンピュータ４のハードウエア構成を示すブロック図である。データ検索装置１の全体の機能構成を示すブロック図である。データ群１１１｛Ｄ₀，Ｄ₁，・・・，Ｄ_p｝が分類項目Ｇ₀,Ｇ₁，・・・，Ｇ_Nc-1に分類された状態の例を示す図である。キーワード群１１２｛Ｋ₀，Ｋ₁，・・・，Ｋ_Nk｝が分類項目Ｇ₀,Ｇ₁，・・・，Ｇ_Nc-1に分類された状態の例を示す図である。日本語解析エンジン１７の機能構成を示すブロック図である。データ処理エンジン１６の機能構成を示すブロック図である。自己組織化マップＳＯＭを例示する図である。クエリ処理エンジン１３の機能構成を示すブロック図である。追加データ処理エンジン１４の機能構成を示すブロック図である。データ検索装置１の全体の動作フローを示すフローチャートである。検索動作のサブルーチンの動作フローを示すフローチャートである。データ追加動作のサブルーチンの動作フローを示すフローチャートである。データ処理動作のサブルーチンの動作フローを示すフローチャートである。論文検索システムのディスプレイ４７に表示される画面の遷移を示す画面遷移図である。メニュー画面ＳＣ１１を例示する図である。検索画面ＳＣ１２を例示する図である。検索結果一覧表示画面ＳＣ１４を例示する図である。詳細情報表示画面ＳＣ１５を例示する図である。全文表示画面ＳＣ１７を例示する図である。再検索画面ＳＣ１６を例示する図である。登録画面ＳＣ１３を例示する図である。登録成功画面ＳＣ１８を例示する図である。医療支援システムのディスプレイ４７に表示される画面の遷移を示す画面遷移図である。メニュー画面ＳＣ２２を例示する図である。コンディション入力画面ＳＣ２１を例示する図である。検索結果一覧表示画面ＳＣ２４を例示する図である。詳細情報表示画面ＳＣ２５を例示する図である。インシデント登録画面ＳＣ２３を例示する図である。登録成功画面ＳＣ２６を例示する図である。

符号の説明

ＩＬ入力層
ＯＬ出力層
Ｕ１１〜Ｕ１４,Ｕ２１〜Ｕ２９ユニット
ＳＯＭ自己組織化マップ
ＨＴ１〜ＨＴ５ヒント

Claims

データ処理装置であって、
複数の分類項目を含む分類項目群に分類された第１データ群から第２データ群を生成する生成手段と、
分類された前記第１データ群に基づいて、前記分類項目群に前記第２データ群を分類する分類手段と、
前記第１データ群および前記第２データ群に含まれない新規データが属する前記分類項目群の中の分類項目を、分類された前記第２データ群に基づいて決定する決定手段と、
を備えることを特徴とするデータ処理装置。
請求項１に記載のデータ処理装置において、
前記第１データ群の各データがテキストデータであり、
前記第２データ群の各データが前記第１データ群のテキストデータの索引に相当するテキストデータであることを特徴とするデータ処理装置。
請求項２に記載のデータ処理装置において、
前記第１データ群が文献に係るデータ群であり、前記第２データ群が前記文献の索引に係るデータ群であることを特徴とするデータ処理装置。
請求項２に記載のデータ処理装置において、
前記第１データ群が医療行為によって発生したインシデントに係るデータ群であり、前記第２データ群が前記インシデントの索引に係るデータ群であることを特徴とするデータ処理装置。
請求項１ないし請求項４のいずれかに記載のデータ処理装置において、
前記第２データ群が前記第１データ群の部分データであることを特徴とするデータ処理装置。
請求項２に記載のデータ処理装置において、
前記生成手段が、
前記テキストデータに記述された文字列を単語群に分割する形態素解析手段と、
前記単語群から前記第２データ群を構築する構築手段と、
を備えることを特徴とするデータ処理装置。
請求項６に記載のデータ処理装置において、
前記構築手段が、
前記単語群の中の重複語を除去する手段を有することを特徴とするデータ処理装置。
請求項６または請求項７に記載のデータ処理装置において、
前記構築手段が、
所定の不要語特定規則に従って前記単語群の中の不要語を特定し、当該不要語を除去する手段を有することを特徴とするデータ処理装置。
請求項６ないし請求項８のいずれかに記載のデータ処理装置において、
前記分類手段が、
前記第１データ群の各データにおける前記第２データ群の各データの重みを所定の重み算出規則に従って算出する算出手段を備え、
前記第２データ群の分類に前記重みを利用することを特徴とするデータ処理装置。
請求項９に記載のデータ処理装置において、
前記重みが所定の重要度判定規則によって定まるデータの重要度であることを特徴とするデータ処理装置。
請求項１０に記載のデータ処理装置において、
前記重要度が、索引語の出現頻度と、当該索引語を含む文書の数の逆数との積であることを特徴とするデータ処理装置。
請求項１ないし請求項１１のいずれかに記載のデータ処理装置において、
前記分類手段が、
前記第２データ群の各データを、前記第１データ群の分類項目に対応する成分を有するベクトルへ変換するベクトル化手段を備え、
前記第２データ群の分類に前記ベクトルを利用することを特徴とするデータ処理装置。
請求項１２に記載のデータ処理装置において、
前記第２データ群の各データについて、前記第１データ群の各分類項目への関連性の程度を表現した重みに基づいて、前記ベクトルの各成分をそれぞれ定めることを特徴とするデータ処理装置。
請求項１ないし請求項１３のいずれかに記載のデータ処理装置において、
前記分類手段が、分類にニューラルネットワークを使用することを特徴とするデータ処理装置。
請求項１４に記載のデータ処理装置において、
前記ニューラルネットワークが自己組織化マップであることを特徴とするデータ処理装置。
請求項１ないし請求項１５のいずれかに記載のデータ処理装置において、
前記新規データが前記第１データ群に追加されるデータであることを特徴とするデータ処理装置。
請求項１ないし請求項１５のいずれかに記載のデータ処理装置において、
前記新規データが前記第１データ群に対する検索に使用されるクエリから生成されることを特徴とするデータ処理装置。
請求項１７に記載のデータ処理装置において、
前記新規データが属する分類項目に属する他の前記第２データ群のデータを抽出する抽出手段をさらに備えることを特徴とするデータ処理装置。
請求項１８に記載のデータ処理装置において、
前記新規データに関する補助情報を出力する出力手段をさらに備え、
前記補助情報が前記新規データが属する分類項目に含まれる他の前記第２データ群のデータに基づいて作成されることを特徴とするデータ処理装置。
請求項１に記載のデータ処理装置において、
前記新規データを操作者に入力させる入力手段をさらに備えることを特徴とするデータ処理装置。
データ処理方法であって、
複数の分類項目を含む分類項目群に分類された第１データ群から第２データ群を生成する工程と、
分類された前記第１データ群に基づいて、前記分類項目群に前記第２データ群を分類する分類行程と、
前記第１データ群および前記第２データ群に含まれない新規データが属する前記分類項目群の中の分類項目を、分類された前記第２データ群に基づいて決定する決定行程と、
を備えることを特徴とするデータ処理方法。
データ処理プログラムであって、前記プログラムのコンピュータによる実行は、前記コンピュータに、
複数の分類項目を含む分類項目群に分類された第１データ群から第２データ群を生成する生成工程と、
分類された前記第１データ群に基づいて、前記分類項目群に前記第２データ群を分類する分類行程と、
前記第１データ群および前記第２データ群に含まれない新規データが属する前記分類項目群の中の分類項目を、分類された前記第２データ群に基づいて決定する決定行程と、
を実行させることを特徴とするデータ処理プログラム。