JP2006313428A - データベース評価装置 - Google Patents

データベース評価装置 Download PDF

Info

Publication number
JP2006313428A
JP2006313428A JP2005135215A JP2005135215A JP2006313428A JP 2006313428 A JP2006313428 A JP 2006313428A JP 2005135215 A JP2005135215 A JP 2005135215A JP 2005135215 A JP2005135215 A JP 2005135215A JP 2006313428 A JP2006313428 A JP 2006313428A
Authority
JP
Japan
Prior art keywords
data
database
cluster
density
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005135215A
Other languages
English (en)
Inventor
Toshiki Kanemichi
敏樹 金道
Kazuaki Aso
和昭 麻生
Naoya Nakajo
直也 中條
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2005135215A priority Critical patent/JP2006313428A/ja
Publication of JP2006313428A publication Critical patent/JP2006313428A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 データベースのデータ分布に偏りに対処する。
【解決手段】 通信制御部11は、端末装置からデータベースを受信すると、そのデータベースを記憶部20に格納する。データ処理部15は、データベースに対してクラスター分析を行ってから、各クラスターについてデータの密集度を評価する。ここで、データ処理部15は、データの密集度が過剰であると判定すると、記憶部20に格納されたデータベースに含まれるデータの一部を削除する。そして、データ処理装置10は、更新されたデータベースを端末装置に送信し、さらに端末装置に対して課金する。
【選択図】 図2

Description

本発明は、データベースのデータ分布の評価を行うためのデータベース評価装置に関する。
特許文献1には、画像データの集合を階層的に表現するための技術が提示されている。特許文献1では、画像データの集合を階層的に表現するための手法として、主成分分析とクラスタリングとが使用されている。すなわち、画像データのデータベクトルに対して主成分分析を行い、その主成分で近似できない残差をクラスタリングする。さらに、各クラスターごとに局所的に主成分分析を行い、再度、残差に対してクラスタリングを行う。
特開2004−54957号公報
多数のデータからなるデータベースにおいて、データ分布に偏りの無いことが求められる場合がある。例えば、多数の学習用データからなる学習用データベースを予め有し、当該学習用データベースを処理して学習を行う機械学習装置では、データ分布に偏りの無い学習用データを用意することは、有効な学習結果を得るために重要である。仮に、学習用データベースのデータ分布に偏りがあると、現実に起こり得る状況を十分に反映することができず、機械学習装置の学習結果が実際の適用現場で有効でなくなってしまう場合がある。また、データベースのデータ分布に偏りがあると、無駄な計算処理が行われる場合があり、また、記憶装置に無駄な記憶領域を必要としてしまう。
なお、上記の特許文献1では、画像データの集合を階層的に表現しているのみであり、データベースのデータ分布の偏りに対処する処理は行われていない。
本発明は、上述した課題を鑑みてなされたものであり、データベースのデータ分布に偏りがある場合に、当該データ分布の偏りを修正することが可能なデータベース評価装置を提供することである。
上述した目的を達成するために、本発明に係るデータベース評価装置は、データベースに含まれる複数のデータをクラスター分析して、複数のクラスターを生成するデータ分析手段と、複数のクラスターのそれぞれについて、クラスターに含まれるデータの密集度が所定閾値より大きいか否かを判定する密集度評価手段と、いずれかのクラスターについてデータの密集度が所定閾値より大きいと判定された場合に、当該クラスターに含まれるデータの全部又は一部を削除する削除手段と、を備えたことを特徴とする。
この構成によれば、データベースに含まれる複数のデータがクラスター分析されて複数のクラスターが生成されると、各クラスターに含まれるデータの密集度が所定閾値と比較される。ここで、いずれかのクラスターに含まれるデータの密集度が所定閾値より大きい場合には、当該クラスターに含まれるデータの全部又は一部が削除される。これにより、データが過剰に密集しているクラスターについてはデータが削減されるため、データベースのデータ分布の偏りを修正して、データベースのデータ分布を良好なものとすることができる。
上記の所定閾値とは、クラスターに含まれるデータが過剰に密集しているか否かを判定するための閾値である。この閾値は、いかなる状況においても変化しない固定値としてもよいし、状況に応じて変化する可変値としてもよい。また、クラスターに含まれるデータの密集度は、例えば、2つのデータ間の距離の平均値や、データの分散で表される。なお、「データの密集度が所定閾値より大きい」ことは、2つのデータ間の距離の平均値が所定閾値より小さいことと等価であり、また、データの分散が所定閾値より小さいことと等価である。
また、上述した目的を達成するために、本発明に係るデータベース評価装置は、端末装置との間で通信を行って、当該端末装置からデータベースを受信するデータ受信手段と、データベースに含まれる複数のデータをクラスター分析して、複数のクラスターを生成するデータ分析手段と、複数のクラスターのそれぞれについて、クラスターに含まれるデータの密集度が所定閾値より大きいか否かを判定する密集度評価手段と、を備え、いずれかのクラスターについてデータの密集度が所定閾値より大きいと判定された場合に、当該クラスターに含まれるデータの全部又は一部が削除されたデータベースを、端末装置に提供することを特徴とする。
この構成によれば、端末装置からのデータベースが受信されると、データベースに含まれる複数のデータがクラスター分析され、各クラスターに含まれるデータの密集度が所定閾値と比較される。ここで、いずれかのクラスターに含まれるデータの密集度が所定閾値より大きい場合には、クラスターに含まれるデータの全部又は一部が削除されたデータベースが端末装置に提供される。これにより、端末装置がデータベースを評価する機能を備えなくても、端末装置では、データ分布が良好なものとされたデータベースを利用することができる。
なお、上述したように、クラスターに含まれるデータの全部又は一部が削除されたデータベースを端末装置に利用可能に提供するためには、データベース評価装置は、いずれかのクラスターについてデータの密集度が所定閾値より大きいと判定された場合に、当該クラスターに含まれるデータの全部又は一部を削除する削除手段と、削除手段によりデータが削除されたデータベースを、端末装置に送信するデータ送信手段と、を更に備えたことが好ましい。
また、上述したように、クラスターに含まれるデータの全部又は一部が削除されたデータベースを端末装置に利用可能に提供するためには、データベース評価装置は、いずれかのクラスターについてデータの密集度が所定閾値より大きいと判定された場合に、当該クラスターから削除すべきデータを選択する選択手段と、選択手段により選択されたデータを特定する情報を、端末装置に送信するデータ送信手段と、を更に備え、端末装置に、選択手段により選択されたデータを削除させてもよい。
また、上述したデータベース評価装置は、端末装置にデータベースを出力する場合に、端末装置に対して課金を行う課金処理手段を、更に備えたことが好ましい。この構成によれば、データベースを評価したことの対価を徴収することができる。
また、上述した目的を達成するために、本発明に係るデータベース評価装置は、データベースに含まれる複数のデータの相互の距離を算出するデータ分析手段と、2つのデータ間の距離が所定閾値よりも小さいと判定された場合、2つのデータのうちの一方又は両方を削除する削除手段と、を備えたことを特徴とする。このように構成しても、過剰に密集したデータが削減されるため、データベースのデータ分布の偏りを修正して、データベースのデータ分布を良好なものとすることができる。
本発明のデータベース評価装置によれば、データベースのデータ分布に偏りがある場合に、当該データ分布の偏りを修正することができる。
以下に、図面を参照して、本発明のデータベース評価装置に係る好適な実施形態について説明する。
図1には、データベース評価装置を含む通信システム1の概要が示されている。通信システム1は、一つのデータ処理装置10と、複数の端末装置30A〜30Cと、で構成されている。ここで、データ処理装置10は、各端末装置30A〜30Cと無線通信を行う通信サーバであり、各端末装置30A〜30Cとの間でデータを送受信可能である。また、データ処理装置10は、各端末装置30A〜30Cからデータベースを受信して、そのデータベースの評価を行うデータベース評価装置として機能する。データ処理装置10の構成及び機能については、後に詳述する。
各端末装置30A〜30Cは、データ処理装置10との間で無線通信を行う通信制御部と、データベースを利用した処理を行うデータ処理部と、データベースを格納するデータ記憶部と、を備えている。このような端末装置30A〜30Cとしては、例えば、予め設定登録された学習用データベースに基づいて学習を行う学習機械、データベースに基づき制御処理を行う自動車やロボットなどである。また、データベースとしては、例えば、画像認識処理や音声認識処理に際して参照するマッピングデータを生成するための多数の画像データや音声データを含むデータベースであったり、自動車やロボットの制御処理に際して参照するデータベースである。
図2には、データ処理装置10の内部構成が示されている。データ処理装置10は、物理的には、端末装置30A〜30Cとの間で無線通信を行う通信制御部11と、CPUやRAMを有しており各種処理を実行するデータ処理部15と、プログラムやデータベースなどを格納する記憶部20と、を備えている。また、通信制御部11は、電波を送受信するアンテナ12と、アンテナ12を介して無線通信を行うデータ送受信部13と、データを一時的に格納するデータバッファ14と、を有している。
通信制御部11は、無線通信により端末装置30A〜30Cからデータベース等が送られてきたときには、そのデータベースを受信して、データバッファ14に一時的に格納する。データバッファ14に格納されたデータベースは、直ちに記憶部20に転送されて格納される。また、通信制御部11は、無線通信により端末装置30A〜30Cにデータベース等を送信するときには、データベースをデータバッファ14に一時的に格納して、データバッファ14に格納されたデータベースを送信する。
データ処理部15は、機能的には、データベースを評価するための複数の構成を有している。すなわち、データ処理部15は、データベースに含まれる複数のデータに対してクラスター分析を行うデータ分析部16と、クラスターについてデータの密集度を評価する密集度評価部17と、データの密集度が過剰である場合にデータの一部を削除するデータ削除部18と、端末装置30A〜30Cに対して課金を行う課金処理部19と、を有している。なお、これらの機能は、データ処理部15が、データベースを評価するためのプログラムを実行することにより実現される。
データ分析部16は、データベースに含まれる複数のデータに対してクラスター分析を行って、複数のクラスターを生成する。ここで、クラスター分析は、階層的又は非階層的な手法が用いられる。階層的なクラスター分析の手法としては、重心法、最短距離法、最長距離法、群間平均法、Ward法などである。また、非階層的なクラスター分析の手法としては、k−means法などである。
密集度評価部17は、各クラスターについて、クラスターに含まれるデータの密集度の評価を行う。データの密集度の評価では、先ず、密集度評価部17は、各クラスターについてデータの密集度の指標となる数値を算出する。ここで、データの密集度とは、クラスター内でデータが密集して存在している度合いである。データの密集度の指標となる数値は、クラスターに含まれるデータの分散を算出することで求められる。つまり、データの分散が大きいほどデータが散らばっていることがわかり、データの分散が小さいほどデータが密集していることがわかる。
なお、データの密集度の指標となる数値として、データの分散に代えて、データ間の距離を用いてもよい。データ間の距離を求めるためには、先ず、クラスターから2つのデータを抽出し、これら2つのデータ間の距離を算出する。続いて、クラスターから別の2つのデータを抽出し、同様に2つのデータ間の距離を算出する。このような距離を算出する処理を、クラスター内の2つのデータの全ての組み合わせについて行う。そして、全ての距離の和を求めてから、2つのデータの組み合わせ数で除して、データ間の距離の平均値を算出する。データ間の距離の平均値が大きいほどデータが散らばっていることがわかり、データ間の距離の平均値が小さいほどデータが密集していることがわかる。
密集度評価部17は、上述したようにデータの密集度の指標となる数値を算出してから、その数値を所定の閾値と比較する。ここで、所定の閾値とは、クラスターに含まれるデータが過剰に密集しているか否かを判定するための閾値である。この閾値は、いかなる状況においても変化しない固定値としてもよいし、状況に応じて変化する可変値としてもよい。データの密集度の指標となる数値を、このような閾値と比較することで、クラスターにおいてデータが過剰に密集しているか否かを判定することができる。
データ削除部18は、データが過剰に密集していると判定されたクラスターについて、データの一部を削除する。これにより、データの密集度を低減して、データベースをデータ分布を適度に調節することができる。ここで、クラスターから削除するデータは、複数のデータの中からランダムに選択してもよいし、データベースに登録された順に削除してもよい。データ削除部18によりデータの一部が削除されることにより、記憶部20に格納されているデータベースが更新される。
次に、図3を参照して、データ処理装置10が実行する処理について説明する。図3には、データ処理装置10により実行されるデータベース評価処理のプログラムのフローが示されている。
データ処理装置10は、端末装置30A〜30Cからデータベースを受信すると、データベースを記憶部20に格納する(S301)。次に、データ処理部15は、記憶部20に格納されたデータベースを読み出して、このデータベースに対してクラスター分析を行う(S302)。ここで、データ処理部15により行われるクラスター分析を、図4を参照して説明する。図4は、データベースの各パラメータを軸x1,x2,・・・にとり、各データDを点として表した散布図である。データ処理部15は、このように散らばって存在するデータDに対して、階層的又は非階層的なクラスター分析を行い、データベースを分割して複数のクラスター♯1〜♯5を生成する。
なお、図4では、データベースの各パラメータを軸x1,x2,・・・としているが、データベースに含まれるデータに対して主成分分析を行い、第1主成分〜第n主成分を軸x1,x2,・・・としてもよい。また、データベースに含まれるデータが画像データや音声データなどである場合には、それらの画像データや音声データなどについて複数の特徴量を算出し、各特徴量を軸x1,x2,・・・としてもよい。さらに、画像データや音声データなどについて複数の特徴量を算出し、それらの特徴量に対して主成分分析を行い、特徴量の第1主成分〜第n主成分を軸x1,x2,・・・としてもよい。
次に、データ処理部15は、各クラスター♯1〜♯5についてデータDの密集度を評価する。データDの密集度の評価を、図5を参照して説明する。データ処理部15は、各クラスター♯1〜♯5についてデータDの分散を算出する。そして、各クラスター♯1〜♯5のデータDの分散を、密集度評価用の閾値Tと比較する(S303)。ここで、いずれかのクラスター♯1〜♯5のデータDの分散が閾値Tよりも小さい場合には、そのクラスター♯1〜♯5についてはデータDの密集度が過剰であることが判定される。一方、いずれかのクラスター♯1〜♯5のデータDの分散が閾値Tより大きい場合には、そのクラスター♯1〜♯5についてはデータDの密集度が標準的であることが判定される。図5では、第二のクラスター♯2の分散が閾値Tより小さく、データDの密集度が過剰であることが判定される。
続いて、いずれかのクラスター♯1〜♯5についてデータDの密集度が過剰であることが判定された場合には、データ処理部15は、そのクラスター♯1〜♯5に含まれるデータの一部を削除する(S304)。そして、データ処理部15は、通信制御部11に、更新されたデータベースを送信させる(S305)。一方、いずれかのクラスター♯1〜♯5についてデータDの密集度が標準的であることが判定された場合には、データ処理部15は、データベースを更新しないまま、通信制御部11にデータベースを送信させる(S305)。そして、データベース評価処理を終了する。データ処理部15は、上述したようにデータベースを端末装置30A〜30Cに送信してから、その端末装置30A〜30Cに対して課金処理を行う(S306)。
本実施形態では、上述したように、クラスター♯1〜♯5のデータの密集度が過剰である場合に、そのクラスター♯1〜♯5についてデータDの一部を削除している。これにより、データベースにおいてクラスター♯1〜♯5のデータDが過剰に密集した状態を解消して、データベースのデータ分布を好適にすることができる。なお、上述した処理では、クラスター♯1〜♯5に含まれるデータDの一部を削除しているが、クラスター♯1〜♯5に含まれるデータDの全てを削除してもよい。このようにしても、データベースにおいてデータDが過剰に密集した状態を解消することができる。また、上述したデータ処理装置10によれば、データ分布を解析する機能を持たない端末装置30A〜30Cであっても、データベースのデータ分布を好適な状態に保つことができる。
上述した実施形態のステップ303〜ステップ305の処理に代えて、次の処理を行ってもよい。すなわち、いずれかのクラスター♯1〜♯5についてデータDの密集度が過剰であることが判定された場合には、データ処理部15は、そのクラスター♯1〜♯5から削除すべきデータDを選択する。そして、データ処理部15は、通信制御部11に、選択されたデータDを特定する情報を送信させる。一方、いずれかのクラスター♯1〜♯5についてデータDの密集度が標準的であることが判定された場合には、データ処理部15は、通信制御部11に、データDを削除する必要がないことを意味する情報を送信させる。なお、上述した処理を行う場合、データ処理部15の密集度評価部17が、クラスター♯1〜♯5から削除すべきデータDを選択するデータ選択部として機能する。
次に、上述したデータ処理装置10の処理を簡略化した変形例について説明する。この変形例に係るデータ処理装置10は、図2に示したデータ処理装置10と同様な構成を備えるが、データ処理部15が以下の処理を行う点で異なっている。
データ分析部16は、先ず、データベースに含まれる複数のデータから2つのデータを抽出し、これら2つのデータ間の距離を算出する。続いて、データベースに含まれる複数のデータから別の2つのデータを抽出し、同様に2つのデータ間の距離を算出する。このようなデータの相互の距離を算出する処理を、データベースに含まれる2つのデータの全ての組み合わせについて行う。密集度評価部17は、データ分析部16により算出された2つのデータ間の距離のそれぞれについて、密集度評価用の閾値より小さいか否かを判定する。
ここで、2つのデータ間の距離が閾値より大きいと判定された場合には、2つのデータは離れているため、何ら処理を行わない。一方、2つのデータ間の距離が閾値より小さいと判定された場合には、2つのデータは近づき過ぎているため、データ削除部18は2つのデータの一方を削除する。このようにすることで、過剰に密集したデータが削減されるため、データベースのデータ分布の偏りを修正して、データベースのデータ分布を良好なものとすることができる。なお、上述した処理で、データ削除部は2つのデータの両方を削除してもよい。
次に、本発明の関連技術に係るデータ処理装置10について説明する。この関連技術に係るデータ処理装置10は、図2に示したデータ処理装置10と同様な構成を備えるが、データ処理部15が以下の処理を行う点で異なっている。
端末装置30A〜30Cは、データベースに追加すべきデータを取得する。ここで、端末装置30A〜30Cは、例えば、ユーザによる入力を受け付けてデータを取得したり、センサの検出値を取り込むことでデータを取得する。そして、端末装置30A〜30Cは、取得したデータと、当該データの追加対象であるデータベースを、データ処理装置10に送信する。
データ処理装置10は、端末装置30A〜30Cから上記のデータとデータベースを受信すると、受信したデータをデータベースに追加すべきか否かを判定する処理を行う。具体的には、データ処理部15は、データを追加した後のデータベースに対してクラスター分析を行い、追加されたデータが属するクラスターCの特性値(平均座標、分散、重心など)を算出する。また、データ処理部15は、データを追加する前のデータベースに対してクラスター分析を行い、上記のクラスターCに対応するクラスターCの特性値(平均座標、分散、重心など)を算出する。そして、データを追加する前後におけるクラスターの特性値の変化量を算出する。
ここで、クラスターの特性値の変化量が所定閾値より小さい場合には、そのクラスターについては十分なサンプリング数のデータが得られており、データが飽和していることが判定される。よって、データ処理装置10は、端末装置30A〜30Cに対して、データベースにデータを追加すべきでないことを意味する情報を送信する。一方、クラスターの特性値の変化量が所定閾値より大きい場合には、そのクラスターについてはデータのサンプリング数が不十分であり、データが飽和していないことが判定される。よって、データ処理装置10は、端末装置30A〜30Cに対して、データベースにデータを追加すべきであることを意味する情報を送信する。
この関連技術に係るデータ処理装置10によれば、上述したように、データベースにデータを追加すべきか否かを判定し、データを追加すべきと判定された場合にのみデータを追加する。これにより、データベースに不必要なデータを追加することがなく、データベースのデータ数が過剰になることを防止して、データベースのデータ分布を好適な状態に保つことができる。また、上述したデータ処理装置10によれば、データを取り込んでデータベースを構築する機能を持ちながら、データ分布を解析する機能を持たない端末装置30A〜30Cであっても、データベースのデータ分布を好適な状態に保つことができる。
また、上述したデータ処理装置10では、端末装置30A〜30Cに対して、データベースにデータを追加すべきであることを意味する情報、又はデータベースにデータを追加すべきでないことを意味する情報を送信すると同時に、データが飽和していないクラスターを特定する情報を送信してもよい。これにより、端末装置30A〜30Cにそのクラスターへのデータ入力を促して、データベースの構築期間を短縮することができる。また、データ処理装置10は、端末装置30A〜30Cに対して信号を送信すると同時に、その端末装置30A〜30Cに対して課金処理を行ってもよい。
また、上述したデータ処理装置10では、クラスターC,Cの平均座標、分散、重心などの特性値を算出したが、クラスターC,Cの特性値は、クラスターC,Cを主成分分析して求められた主成分の方向を用いてもよいし、クラスターC,Cを因子分析して求められた因子の方向を用いてもよい。
ここで、クラスターC,Cの特性値として主成分方向を用いた場合について具体的に説明する。データ処理部15は、データを追加した後のデータベースに対してクラスター分析を行い、追加されたデータが属するクラスターCについて主成分分析を行い、第1主成分の方向を算出する。また、データ処理部15は、データを追加する前のデータベースに対してクラスター分析を行い、上記のクラスターCに対応するクラスターCについて主成分分析を行い、第1主成分の方向を算出する。そして、データを追加する前後における第1主成分の方向の変化量を所定閾値を比較する。ここで、第1主成分の方向の変化量が所定閾値より大きい場合には、データが飽和していないことが判定される。一方、第1主成分の方向の変化量が所定閾値より小さくなった場合には、データが飽和していることが判定される。なお、クラスターC,Cの特性値として、第1主成分の方向に代えて、第2〜第n主成分の方向を用いてもよい。
また、クラスターC,Cの特性値として因子の方向を用いる場合には、上述した処理で、主成分分析に代えて因子分析を行えばよい。これにより、クラスターC,Cの因子の方向を算出して、データを追加する前後における因子の方向の変化量を所定閾値を比較することで、データが飽和しているか否かを判定することができる。
通信システムの概要を示すシステム構成図である。 データ処理装置の構成を示す機能ブロック図である。 データ処理装置により行われるデータベース評価処理を示すフローチャートである。 データベースのクラスター分析を説明するためのデータ散布図である。 クラスター内におけるデータ密集度の判定処理を説明するための折れ線図である。
符号の説明
1…通信システム、10…データ処理装置、11…通信制御部、12…アンテナ、13…データ入出力部、14…データバッファ、15…データ処理部、16…データ分析部、17…密集度評価部、18…データ削除部、19…課金処理部、20…記憶部、30A〜30C…端末装置。

Claims (6)

  1. データベースに含まれる複数のデータをクラスター分析して、複数のクラスターを生成するデータ分析手段と、
    複数の前記クラスターのそれぞれについて、前記クラスターに含まれるデータの密集度が所定閾値より大きいか否かを判定する密集度評価手段と、
    いずれかの前記クラスターについてデータの密集度が所定閾値より大きいと判定された場合に、当該クラスターに含まれるデータの全部又は一部を削除する削除手段と、
    を備えたことを特徴とするデータベース評価装置。
  2. 端末装置との間で通信を行って、当該端末装置からデータベースを受信するデータ受信手段と、
    前記データベースに含まれる複数のデータをクラスター分析して、複数のクラスターを生成するデータ分析手段と、
    複数の前記クラスターのそれぞれについて、前記クラスターに含まれるデータの密集度が所定閾値より大きいか否かを判定する密集度評価手段と、を備え、
    いずれかの前記クラスターについてデータの密集度が所定閾値より大きいと判定された場合に、当該クラスターに含まれるデータの全部又は一部が削除されたデータベースを、前記端末装置に提供することを特徴とするデータベース評価装置。
  3. いずれかの前記クラスターについてデータの密集度が所定閾値より大きいと判定された場合に、当該クラスターに含まれるデータの全部又は一部を削除する削除手段と、
    前記削除手段によりデータが削除されたデータベースを、前記端末装置に送信するデータ送信手段と、
    を更に備えたことを特徴とする請求項2に記載のデータベース評価装置。
  4. いずれかの前記クラスターについてデータの密集度が所定閾値より大きいと判定された場合に、当該クラスターから削除すべきデータを選択する選択手段と、
    前記選択手段により選択されたデータを特定する情報を、前記端末装置に送信するデータ送信手段と、
    を更に備えたことを特徴とする請求項2に記載のデータベース評価装置。
  5. 前記端末装置にデータベースを出力する場合に、前記端末装置に対して課金を行う課金処理手段を、更に備えたことを特徴とする請求項2〜4のいずれか一項に記載のデータベース評価装置。
  6. データベースに含まれる複数のデータの相互の距離を算出するデータ分析手段と、
    2つのデータ間の距離が所定閾値よりも小さいと判定された場合、当該2つのデータのうちの一方又は両方を削除する削除手段と、
    を備えたことを特徴とするデータベース評価装置。
JP2005135215A 2005-05-06 2005-05-06 データベース評価装置 Pending JP2006313428A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005135215A JP2006313428A (ja) 2005-05-06 2005-05-06 データベース評価装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005135215A JP2006313428A (ja) 2005-05-06 2005-05-06 データベース評価装置

Publications (1)

Publication Number Publication Date
JP2006313428A true JP2006313428A (ja) 2006-11-16

Family

ID=37534901

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005135215A Pending JP2006313428A (ja) 2005-05-06 2005-05-06 データベース評価装置

Country Status (1)

Country Link
JP (1) JP2006313428A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055303A (ja) * 2008-08-27 2010-03-11 Denso It Laboratory Inc 学習データ管理装置、学習データ管理方法及び車両用空調装置ならびに機器の制御装置
JP2010191564A (ja) * 2009-02-17 2010-09-02 Sharp Corp 特性解析方法および装置、特性分類方法および装置、上記特性解析方法または特性分類方法をコンピュータに実行させるためのプログラム、上記プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2014526755A (ja) * 2011-09-27 2014-10-06 インテル・コーポレーション メモリが制限された環境における顔認識性能を改善するべく基準顔データベースを管理するための方法、装置およびコンピュータ可読記録媒体
CN114896825A (zh) * 2022-07-13 2022-08-12 江苏中安建设集团有限公司 一种建筑节能给排水***智能控制方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0883340A (ja) * 1994-09-12 1996-03-26 Toshiba Corp クラスタリング装置および画像認識装置
JPH0934862A (ja) * 1995-07-19 1997-02-07 Hitachi Ltd パターン学習方法および装置
JPH1166029A (ja) * 1997-08-21 1999-03-09 Sharp Corp 多層辞書作成方法および多層辞書作成装置
JP2001188992A (ja) * 1999-12-27 2001-07-10 Nippon Telegr & Teleph Corp <Ntt> 情報提供方法及び情報提供システム
JP2002233976A (ja) * 2001-02-05 2002-08-20 Tetsuya Fujihiro 通信により知識情報を更新するロボット、ロボットシステム
JP2004145727A (ja) * 2002-10-25 2004-05-20 Mazda Motor Corp 自動車エネルギ消費予測システム、自動車エネルギ消費予測サーバ、自動車エネルギ消費予測方法及び自動車エネルギ消費予測プログラム
JP2004318862A (ja) * 2003-03-28 2004-11-11 Sony Corp 情報提供装置及び方法、並びに情報提供システム
US20040250188A1 (en) * 2003-06-09 2004-12-09 International Business Machines Corporation Method and apparatus for generating test data sets in accordance with user feedback

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0883340A (ja) * 1994-09-12 1996-03-26 Toshiba Corp クラスタリング装置および画像認識装置
JPH0934862A (ja) * 1995-07-19 1997-02-07 Hitachi Ltd パターン学習方法および装置
JPH1166029A (ja) * 1997-08-21 1999-03-09 Sharp Corp 多層辞書作成方法および多層辞書作成装置
JP2001188992A (ja) * 1999-12-27 2001-07-10 Nippon Telegr & Teleph Corp <Ntt> 情報提供方法及び情報提供システム
JP2002233976A (ja) * 2001-02-05 2002-08-20 Tetsuya Fujihiro 通信により知識情報を更新するロボット、ロボットシステム
JP2004145727A (ja) * 2002-10-25 2004-05-20 Mazda Motor Corp 自動車エネルギ消費予測システム、自動車エネルギ消費予測サーバ、自動車エネルギ消費予測方法及び自動車エネルギ消費予測プログラム
JP2004318862A (ja) * 2003-03-28 2004-11-11 Sony Corp 情報提供装置及び方法、並びに情報提供システム
US20040250188A1 (en) * 2003-06-09 2004-12-09 International Business Machines Corporation Method and apparatus for generating test data sets in accordance with user feedback

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055303A (ja) * 2008-08-27 2010-03-11 Denso It Laboratory Inc 学習データ管理装置、学習データ管理方法及び車両用空調装置ならびに機器の制御装置
JP2010191564A (ja) * 2009-02-17 2010-09-02 Sharp Corp 特性解析方法および装置、特性分類方法および装置、上記特性解析方法または特性分類方法をコンピュータに実行させるためのプログラム、上記プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2014526755A (ja) * 2011-09-27 2014-10-06 インテル・コーポレーション メモリが制限された環境における顔認識性能を改善するべく基準顔データベースを管理するための方法、装置およびコンピュータ可読記録媒体
US9298976B2 (en) 2011-09-27 2016-03-29 Intel Corporation Method, apparatus and computer readable recording medium for managing a reference face database to improve face recognition performance under a restricted memory environment
CN114896825A (zh) * 2022-07-13 2022-08-12 江苏中安建设集团有限公司 一种建筑节能给排水***智能控制方法
CN114896825B (zh) * 2022-07-13 2022-09-30 江苏中安建设集团有限公司 一种建筑节能给排水***智能控制方法

Similar Documents

Publication Publication Date Title
US7738884B2 (en) Positioning service utilizing existing radio base stations
CN110610242A (zh) 一种联邦学习中参与者权重的设置方法及装置
JP6093792B2 (ja) 測位装置、測位方法、測位プログラム、および、測位システム
CN112364439A (zh) 自动驾驶***的仿真测试方法、装置以及存储介质
CN110457413B (zh) 行驶方向的确定方法、装置、设备及存储介质
CN111289998A (zh) 障碍物检测方法、装置、存储介质以及车辆
CN109657539B (zh) 人脸颜值评价方法、装置、可读存储介质及电子设备
CN107582061B (zh) 一种识别人体运动状态的方法及智能移动设备
US20170184410A1 (en) Method and electronic device for personalized navigation
JP2022540101A (ja) ポジショニング方法及び装置、電子機器、コンピュータ読み取り可能な記憶媒体
CN108764369B (zh) 基于数据融合的人物识别方法、装置和计算机存储介质
CN112084959B (zh) 一种人群图像处理方法及装置
CN115296984B (zh) 异常网络节点的检测方法及装置、设备、存储介质
JP2006313428A (ja) データベース評価装置
CN115238582A (zh) 知识图谱三元组的可靠性评估方法、***、设备及介质
CN112214677A (zh) 一种兴趣点推荐方法、装置、电子设备及存储介质
CN110782472A (zh) 点云地面点的识别方法及装置
CN112991008A (zh) 一种位置推荐方法、装置及电子设备
US11640553B2 (en) Method for analyzing time-series data based on machine learning and information processing apparatus
CN110956800B (zh) 一种路段交通数据预处理方法、装置及电子设备
CN111329735A (zh) 一种导盲方法、装置及***
WO2019069905A1 (ja) 情報処理装置、制御方法、及びプログラム
CN110958565B (zh) 计算信号距离的方法、装置、计算机设备和存储介质
US11308082B2 (en) Analysis apparatus, analysis method, and storage medium
CN114748099A (zh) 偏移检测方法、装置、设备以及计算机可读存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110809

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111006

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111129