JP4716796B2 - 多次元式(multidimensionalexpressions)とデータ・マイニング拡張(dataminingextensions)を組み合わせたolapキューブ(olapcubes)のマイニング - Google Patents

多次元式(multidimensionalexpressions)とデータ・マイニング拡張(dataminingextensions)を組み合わせたolapキューブ(olapcubes)のマイニング Download PDF

Info

Publication number
JP4716796B2
JP4716796B2 JP2005167100A JP2005167100A JP4716796B2 JP 4716796 B2 JP4716796 B2 JP 4716796B2 JP 2005167100 A JP2005167100 A JP 2005167100A JP 2005167100 A JP2005167100 A JP 2005167100A JP 4716796 B2 JP4716796 B2 JP 4716796B2
Authority
JP
Japan
Prior art keywords
data
multidimensional
data mining
query
mining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005167100A
Other languages
English (en)
Other versions
JP2006012143A (ja
Inventor
マクレナン シー.ジェイムズ
キム ピュンチュル
タン チャオフイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2006012143A publication Critical patent/JP2006012143A/ja
Application granted granted Critical
Publication of JP4716796B2 publication Critical patent/JP4716796B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • EFIXED CONSTRUCTIONS
    • E06DOORS, WINDOWS, SHUTTERS, OR ROLLER BLINDS IN GENERAL; LADDERS
    • E06CLADDERS
    • E06C1/00Ladders in general
    • E06C1/02Ladders in general with rigid longitudinal member or members
    • E06C1/14Ladders capable of standing by themselves
    • E06C1/16Ladders capable of standing by themselves with hinged struts which rest on the ground
    • E06C1/18Ladders capable of standing by themselves with hinged struts which rest on the ground with supporting struts formed as ladders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/244Grouping and aggregation
    • EFIXED CONSTRUCTIONS
    • E06DOORS, WINDOWS, SHUTTERS, OR ROLLER BLINDS IN GENERAL; LADDERS
    • E06CLADDERS
    • E06C7/00Component parts, supporting parts, or accessories
    • E06C7/02Extending means
    • E06C7/04Hand-operated extending means carried by the ladder
    • EFIXED CONSTRUCTIONS
    • E06DOORS, WINDOWS, SHUTTERS, OR ROLLER BLINDS IN GENERAL; LADDERS
    • E06CLADDERS
    • E06C7/00Component parts, supporting parts, or accessories
    • E06C7/06Securing devices or hooks for parts of extensible ladders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Mechanical Engineering (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は一般にデータベースに関し、より詳細にはこうしたデータベースを検索し、分析する方法に関する。
インターネットなどのグローバル通信ネットワークの到来により、膨大な量の情報が絶え間なく交換されるようになってきている。さらに、こうした情報を格納および維持するためのコストが低下しており、その結果、そこにアクセスすることが必要になる大規模なデータ・ストレージ構造が生じた。膨大な量のデータは、一般に組織のビジネス履歴を表すデータベースであるデータウェアハウスとして格納されることになる。この履歴データは、戦略的な計画から個々の組織単位の業績評価まで、多くのレベルでビジネス上の意思決定をサポートする分析に使用される。この履歴データを、クエリと分析のためのより効果的なツールにするために、リレーショナル・データベースの形態で格納されるデータを取得し、こうしたデータを処理する必要がある。データウェアハウスをより小規模でより効率的に管理するために、データ内の目標とされる部分集合(subset)だけが管理されるデータ・マートの概念が使用される。
SQL(Structured Query Language:構造化照会言語)など、データ定義と操作に使用される多くの言語は、2次元の形態でデータを取り出すように設計されているが、一方、多次元データは3次元以上の構造によって表現されることになる。こうした多次元構造はキューブと呼ばれている。キューブは、リレーショナル・データベースでなく3次元のスプレッド・シートと同様にデータを表現する多次元データベースである。キューブは、データに関するさまざまなビューを、次元(dimensions)とメジャー(measures)の概念を使用して迅速に表示することを可能にする。次元はキューブの構造を定義し(たとえば、地理的な場所や製品の種類)、メジャーはエンドユーザにとって関心のある定量的な値(たとえば、販売価格(sales dollars)、在庫数量、費用総額)を表す。キューブ内のセルの位置は、次元の要素の論理績(intersection)で定義され、メジャー値は集計されてセル内の値を提供する。
データウェアハウス内またはデータ・マート内の情報は、オンライン分析処理(OLAP:online analytical processing)を使用して処理できる。OLAPでは、データはキューブと見なされる。OLAPは、データウェアハウスとデータ・マートがオンライン分析に効果的に使用され、反復する複雑な分析クエリに対して迅速な応答を提供することを可能にする。OLAPシステムは、リアル・タイムの分析をサポートするために速さと柔軟性を提供する。
多次元のクエリと分析のためのOLAPを容易にさせる(facilitate)従来のアーキテクチャの1つはMDX(Multi-Dimensional eXpressions:多次元式)である。MDXは、多次元オブジェクトおよび多次元データの定義と操作をサポートし、多次元データへのアクセスをより容易かつ直感的なものになることを容易にするする構文である。MDXは、いろいろな意味でSQL(Structured Query Language:構造化照会言語)構文に似ている(しかし、SQL言語の拡張ではない)。SQLクエリと同様に、MDXクエリにもデータ要求(SELECT句)、開始点(FROM句)、フィルタ(WHERE句)が必要である。こうしたキーワードやその他のキーワードは、分析の対象となるキューブからデータの特定の部分を抽出するのに使用されるツールを提供する。さらに、MDXは、取り出されたデータを操作する堅牢な(robust)機能群に加えて、MDXをユーザ定義の機能で拡張する能力を提供する。
データ・マイニングとは、データに関するナレッジ(knowledge)と解釈できる、あるいはデータに関するイベントの予測に利用できる、興味深いデータ構造(たとえば、パターンやルール)を見つけ出すこと、である。こうした構造は、データセットを簡潔に説明するパターンの形態をとる。データ・マイニングは、大規模なデータベースの探索(exploration)や利用(exploitation)を、データを所有しているが統計やデータ分析において長年のトレーニングを積んでいないユーザにとって、簡単で、便利で、また実用的なものにする。データ・マイニング・アルゴリズムによって抽出された「ナレッジ」は、さまざまな形態を取り、さまざまに利用できる。多数の他の可能性の中でも、ナレッジは、ルール・セット、デシジョンツリー、回帰モデル、関連(associations)セット、の形態とすることができる。ナレッジは、データの要約を作成すること、あるいはそれまでの未知の相関を洞察する(get insight into)こと、もできる。そのデータに関連するイベント、たとえば欠落した値や一部の情報が不明のレコード、などの予測に利用することもできる。さまざまなデータ・マイニング技術が存在し、その多くは機械学習、統計、データベース・プログラミングの分野に、その起源がある。
米国特許出願公開第2004−0122820号公報 米国特許第6,687,693号公報 米国特許第6,4737,64号公報 米国特許第6,205,447号公報 WOLFGANG HUMMER, et al., XCUBE-XML For Data Warehouses, DOLAP'03, November 7, 2003, pp. 33-40, New Orleans, Louisiana, USA. TAPIO NIEMI, et al., Constructing an OLAP Cube from Distributed XML Data, DOLAP'02, November 8, 2002, pp. 22-27, McLean, Virginia, USA. OLE DB for Data Mining Specification, Version 1.0, Microsoft Corporation, July 2000, pp. 1-133. JAYAVEL SHANMUGASUNDARAM et al., Compressed Data Cubes for OLAP Aggregate Query Approximation on Continuous Dimensions, KDD-99, 1999, pp. 223-232, San Diego, California, USA.
求められているのは、OLAPキューブ全体にわたるデータ・マイニング・オペレーションの対話(interaction)を容易にさせる(facilitate)スキーマである。
本発明のいくつかの態様について基本的な理解が得られるように、本発明の概要について以下に簡単に説明する。以下の説明は、本発明の広範囲におよぶ概要を示すものではない。本発明の重要/不可欠な要素を特定したり、本発明の範囲を限定したりするものでもない。唯一の目的は、後述の「発明を実施するための最良の形態」に関する説明の準備として、本発明に関するいくつかの概念を簡略化した形で示すことである。
ここに開示し、請求する発明は、その1つの態様において、OLAPキューブ内のデータ・マイニング・オペレーションを実行する多次元拡張(multidimensional extensions)(たとえばMDX)とデータ・マイニング拡張(たとえばDMX)を一体化する形式的言語(formal language)を備えている。データ・マイニング・オペレーションは、一般に<source−data−query>で指定されたソース・データ・セットに関するオペレーションを実行する。現在に至るまで、<source−data−query>要素は、リレーショナル・データベースに対して直接動作するリレーショナル・クエリか、リレーショナル・クエリを取得してそれを入れ子構造の(nested)行(row)セットに構成するSHAPEステートメントに限定されてきていた。本発明で提供される<source−data−query>は、リレーショナル・クエリだけでなく、たとえばMDXを使用して形成された多次元クエリとすることができる。
本発明の別の態様においては、データ・マイニング・モデルは、OLAPキューブに格納されたデータに対する予測を実行するのに使用される。
本発明のさらに別の態様において、本発明は、モデルの作成に関して、ソース・データ・タイプは、作成時に不明であり、トレーニング・フェーズ(training phase)まで設定されない、ことを述べている。従来のシステムでは、作成時にモデルの「タイプ」、すなわちリレーショナル・ソース・モデルかOLAPソース・モデルかが指定されていた。
さらに、マイニング・モデルは、任意のデータ・ソースから、その特性がリレーショナルか多次元かにかかわらず、トレーニング(trained)されることができる。カラム・バインディング(column binding)は、従来のシステムのカラム・バインディングがマイニング・モデルとOLAPキューブとの名前の一致によって指定されるのとは異なり、リレーショナルと多次元の両方のソースにおいて、明示的なカラムの順序で一貫して操作される。
さらに、マイニング・モデルは、予測のためのデータ・ソースとして任意のデータ・ソースを、その特性がリレーショナルか多次元かにかかわらず、利用できる。開示されたアーキテクチャは、DMXを使用して予測を生成することを可能にし、OLAPキューブが、任意のモデルを、それがどのように作成されたかあるいはトレーニングされたかにかかわらず、予測のソースとすることができる。従来、OLAPキューブに格納されたデータに対する予測は、MDX内で実行され、同じキューブに関してトレーニングされたデータ・マイニング・モデルのみを使用していた。
前述の目的および関連する目的を達成するために、ここで本発明の特定の例示的な態様について、以下の実施形態と添付の図面に関連付けながら説明する。ただし、このような態様は例を示すものであり、本発明の原理を使用するさまざまな方法の一部にすぎない。また、本発明はこうしたすべての態様やその均等物のすべてを含むことを意図している。本発明のその他の利点と新規な機能は、以下に示す本発明の実施形態から、添付の図面を関連付けて考察することで明らかになるであろう。
本発明について添付の図面に関連付けながら詳細に説明するが、全体にわたって同類の要素には似かよった参照番号を使用する。以下の説明において、説明を目的として、本発明に関する理解を深めるために、さまざまな具体的な細部が説明される。ただし、本発明は以下に示す個々の具体的な細部(specific details)がなくても実施できることは明らかである。他の例では、本発明の説明を容易にさせる(facilitate)ために、よく知られている構造やデバイスがブロック図の形で示されている。
本出願で使用する限り、「コンポーネント」および「システム」という用語は、コンピュータ関連のエンティティを表すものとし、ハードウェア、ハードウェアとソフトウェアの組合せ、ソフトウェア、実行中のソフトウェア(software in execution)のいずれでもよい。たとえば、コンポーネントは、プロセッサで実行するプロセス、プロセッサ、オブジェクト、実行可能ファイル、実行中のスレッド、プログラム、および/またはコンピュータのいずれでもよいが、これらに限定はされない。たとえば、サーバ上で動作するアプリケーションとサーバはいずれもコンポーネントと言える。実行中のプロセスおよび/またはスレッド内には、1つまたは複数のコンポーネントが存在してもよい。また、コンポーネントは1台のコンピュータに集中したり、かつ/または2台またはそれ以上のコンピューに分散したりしてもよい。
本発明は、OLAPキューブ内に常駐するデータに関してデータ・マイニング操作を実行する多次元拡張とデータ・マイニング拡張を一体化するためのアーキテクチャを提供する。現在、<source−data−query>要素は、リレーショナル・データベースに対して直接動作するリレーショナル・クエリ、またはリレーショナル・クエリを取得してそれを入れ子構造の(nested)行(row)セットに構成するSHAPEステートメントに限定されてきていた。本発明が提供する<source−data−query>は、リレーショナル・クエリだけでなく、多次元拡張を使用して構成した多次元クエリとすることができる。
これを実現する1つの方法は、MDXとDMXを使用することである。MDXは、Microsoft CorporationのOLE DB for OLAP仕様で定義される、MultiDimensional eXpressions(多次元式)の頭辞語であり、その全体は参照によって組み込まれている。DMXは、Microsoft CorporationのOLE DB for Data Mining仕様で定義される、Data Mining eXtensions(データ・マイニング拡張)の頭辞語であり、その全体は、参照によって組み込まれている。この説明の目的のために、モデルの作成、モデルのトレーニング、新しいデータに対する予測の各オペレーションについて説明する。
DMXでは、こうしたオペレーションは、CREATE MINING MODEL、INSERT INTO、SELECT…PREDICTION JOINの各ステートメントを使用して実行される。次に例を示す。
Figure 0004716796
Figure 0004716796
ここで図1を参照すると、本発明に従って多次元式とデータ・マイニング拡張の一体化を容易にさせる(facilitate)システムが示されている。データ・マイニングの対象となる多次元データ・ソース(たとえば、OLAP(On-Line Analytical Processing:オンライン分析処理)キューブ)102が提供される。データ・マイニング・コンポーネント104には、多次元式コンポーネント106(たとえばMDX)とデータ・マイニング拡張コンポーネント108が含まれており、これらが連動してOLAPキューブ102のデータ・マイニングを容易にさせる(facilitate)。データ・マイニング・コンポーネントの出力は、データ・マイニング・モデルの作成、トレーニング、予測への入力として使用するデータである。
代替の実装では、多次元式のコンポーネント106とデータ・マイニング拡張のコンポーネント108が共に1つの全体データ・マイニング・コンポーネント104内に存在する必要はなく、いずれかのコンポーネントがデータ・マイニング・コンポーネント104から独立した外部のエンティティでもよいことが理解されるべきである。このように、2つのコンポーネント(106と108)は一方が他方に入力する形で独立していてもよい。
ここで図2を参照すると、本発明による多次元データ・マイニングの1つの方法を示す流れ図が示されている。説明を簡単にするために、ここに示す1つまたは複数の方法は、たとえば流れ図の形で、一連の動作(acts)として図示され、説明されているが、本発明がこの動作の順序に限定されないことを理解されたい。たとえば、いくつかの動作は、本発明に従って以下に説明するものとは異なる順序で行われてもよく、かつ/またはここに図示し、説明する他の動作と同時に行われてもよい。たとえば、方法は相互に関連する一連の状態またはイベントとしても(状態図のように)表現できることを当業者は理解されたい。また、本発明による方法を実装するために、図示されたすべての動作が必要なわけではない。
200では、データ・マイニングの対象として多次元データが提供される。202では、多次元拡張とデータ・マイニング拡張を一体化し、多次元データを操作する言語スキーマが提供される。204では、多次元データからデータ・マイニング・モデルが作成される。206では、データ・マイニング・モデルがデータに関してトレーニングされる。208では、データ・マイニング拡張を使用して新しいデータに関する予測が行われる。ここで、プロセスはStopブロックに到達する。
次に図3を参照すると、本発明に従ってデータ・マイニング拡張の入力として多次元式を使用する例示的な方法を示す流れ図が示されている。データ・マイニング拡張のクエリでは、従来からそのデータ・ソースとしてリレーショナル・テーブルが期待されている。こうしたクエリは、入力としてフラット・テーブルを、またはSHAPEディレクティブを使用して作成された入れ子構造のテーブルを、受け入れることができる。バインディングは、INSERT INTOステートメントのようにカラム順で実行されるか、またはSELECT…PREDICTION JOINステートメントのようにON句を使用した明示的なマッピングによって実行される。次に例を示す。
Figure 0004716796
開示された発明は、データ・マイニング拡張ステートメント(例えば、DMX)への入力として、多次元拡張のクエリ(multidimensional extensions queries)(たとえばMDX)を使用した複数の方法に適用できる。たとえば、限定はしないが、以下の説明では本発明を実施する1つの方法としてMDXとDMXを使用する。300で、第1の方法は、単にリレーショナル・クエリをMDXクエリで置き換えることによる方法である。たとえば、次のクエリ、
Figure 0004716796
はMDXキューブ内では次のように表現できる。
Figure 0004716796
別の例では、次のクエリ、
Figure 0004716796
は次のように表現できる。
Figure 0004716796
このように、この第1の形態ではリレーショナル・クエリをMDXの式で置き換えることができる。
302で、第2の形態では、そのキューブの固有な多次元構造を利用することでSHAPE構造を消去できる。前述のSHAPE(shaped)リレーショナル・クエリは、MDXでは次のように記述できる。
Figure 0004716796
追加の入れ子構造をとるテーブルは、追加の軸上に配置できる。
304で、本発明の第3の形態には、名前のみでバインドするステートメント、たとえばSELECT、PREDICTION、およびJOINが含まれる。この形態では、データ・マイニング拡張プロセッサはキューブ構造を利用して単純なクエリを作成し、ON句を展開してMDXクエリから情報を抽出する。次に例を示す。
Figure 0004716796
モデルの作成に関して、本発明では作成時にソース・データ・タイプが不明であり、トレーニング・フェーズ(training phase)まで設定されないことを表明(states)している。従来のシステムでは、そのモデルの「タイプ」、すなわちリレーショナル・ソース・モデルか、あるいはOLAPソース・モデルか、が作成時に指定される。
マイニング・モデルは、任意のデータ・ソースから、その特性がリレーショナルか多次元かにかかわらず、トレーニングできる。カラムのバインディングは、マイニング・モデルとOLAPキューブとの名前の一致によって示される従来のシステムとは異なり、リレーショナルと多次元のいずれのソースにおいても、明示的なカラムの順序で一貫して操作される。
マイニング・モデルは、その特性がリレーショナルか多次元かにかかわらず、予測のためのデータ・ソースとして任意のデータ・ソースを利用することができる。従来、OLAPキューブに格納されたデータに対する予測は、MDXで実行することができるだけであり、同じキューブに関してトレーニングされデータ・マイニング・モデルを使用するだけである。開示されたアーキテクチャによって、DMXを使用して予測を生成でき、OLAPキューブは、その作成やトレーニングの方法にかかわらず、任意のモデルを予測のソースとすることができる。
さらに図4を参照すると、開示されたアーキテクチャを実現するために動作できるコンピュータを示すブロック図が示されている。本発明のさまざまな態様のための追加の文脈を提供するために、図4と以下の説明は、本発明のさまざまな態様を実装できる適切なコンピューティング環境400について簡単かつ一般的に説明することを目的としている。本発明について、1つまたは複数のコンピュータで動作するコンピュータ実行可能命令の一般的な文脈で説明してきたが、本発明を他のプログラム・モジュールとの組合せでも、かつ/またはハードウェアとソフトウェアの組合せでも実装できることは当業者には言うまでもない。
一般に、プログラム・モジュールには、特定のタスクを実行し、または特定の抽象データ型を実装するルーチン、プログラム、コンポーネント、データ構造などがある。さらに、本発明による方法がそれぞれ1つまたは複数の関連デバイスに結合することができる、シングル・プロセッサまたはマルチ・プロセッサによるコンピュータ・システム、ミニ・コンピュータ、メインフレーム・コンピュータ、ならびにパーソナル・コンピュータ、ハンドヘルド・コンピューティング・デバイス、マイクロ・プロセッサ・ベースの家電製品またはプログラム可能な家電製品など、他のコンピュータ・システム構成でも実施できることは、当業者には言うまでもない。
本発明の図示された態様は、通信ネットワークを介してリンクするリモート処理装置で特定のタスクを実行する分散コンピューティング環境でも実施できる。分散コンピューティング環境では、プログラム・モジュールはローカルとリモートのいずれのメモリ記憶装置内にも配置できる。
コンピュータは、通常はさまざまなコンピュータ可読媒体を備えている。コンピュータ可読媒体は、コンピュータからアクセスできる任意の使用可能な媒体でよい。揮発性と不揮発性の両方、および取り外し可能と不可能の両方の媒体が含まれる。例として、コンピュータ可読媒体にはコンピュータ記憶媒体および通信媒体を含めてもよいが、これらに限定はされない。コンピュータ記憶媒体には、コンピュータ可読の命令、データ構造、プログラム・モジュール、またはその他のデータなどの情報を記憶する任意の方法または技術で実施された、揮発性と不揮発性の両方、および取り外し可能と不可能の両方の媒体が含まれる。コンピュータ記憶媒体には、RAM、ROM、EEPROM、フラッシュメモリなどのメモリ技術、CD−ROM、デジタル・ビデオ・ディスク(DVD:digital video disk)などの光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスクなどの磁気記憶装置、または必要な情報を格納でき、コンピュータからアクセスできる他の任意の媒体が含まれるが、これらに限定はされない。
通信媒体は、搬送波やその他の搬送メカニズムのような変調データ信号に含まれるコンピュータ可読の命令、データ構造、プログラム・モジュール、またはその他のデータなどを具体化したものであり、任意の情報伝達媒体を含む。「変調データ信号」という用語は、信号に情報を符号化するようにその特性の1つまたは複数が設定または変更された信号を意味する。例として、通信媒体には、有線ネットワーク、直接配線接続などの有線媒体と、音響、RF、赤外線などの無線媒体が含まれるが、これらに限定はされない。上記の任意の組合せも、コンピュータ可読媒体の範囲内に含まれるものとする。
もう一度図4を参照すると、本発明のさまざまな態様を実装する例示的な環境400の要素となるコンピュータ402が示されており、コンピュータ402は処理装置404、システム・メモリ406、システム・バス408を備えている。システム・バス408は、それだけには限らないがシステム・メモリ406を含むシステム・コンポーネントを処理装置404に結合する。処理装置404は、市販のさまざまなプロセッサのいずれでもよい。デュアル・マイクロ・プロセッサやその他のマルチ・プロセッサ・アーキテクチャも処理装置404として利用できる。
システム・バス408は、市販のさまざまなバス・アーキテクチャの任意の1つを使用したメモリ・バス(メモリ・コントローラを伴っても伴わなくてもよい)、周辺バス、ローカルバスにさらに相互接続する各種バス構造のいずれでもよい。システム・メモリ406には、読み取り専用メモリ(ROM)410とランダム・アクセス・メモリ(RAM)412が含まれる。起動時などにコンピュータ402内の要素間の情報転送を支援する基本ルーチンを含む基本入出力システム(BIOS)410は、ROM、EPROM、EEPROMなどの不揮発性メモリ410に格納される。また、RAM 412はデータをキャッシングするスタティックRAMなどの高速のRAMを備えていてもよい。
コンピュータ402は、さらに内蔵のハードディスク・ドライブ(HDD)414(内蔵ハードディスク・ドライブ414は、適切な筐体(図示せず)に収納し、外付けで使用するように構成してもよい)、磁気フロッピー(登録商標)ディスク・ドライブ(FDD)416(取り外し可能なディスケット418に対する読み出しまたは書き込みを行う)、光ディスク・ドライブ420(たとえば、CD−ROMディスク422の読み出し、またはDVDなどの他の大容量光媒体に対する読み出しまたは書き込みを行う)を備えている。ハードディスク・ドライブ414、磁気ディスク・ドライブ416、および光ディスク・ドライブ420は、それぞれハードディスク・ドライブ・インターフェース424、磁気ディスク・ドライブ・インターフェース426、および光ディスク・ドライブ・インターフェース428を介してシステム・バス408に接続する。外付けドライブを実装するインターフェース424には、ユニバーサル・シリアル・バス(USB)とIEEE 1394の少なくとも1つまたは両方の技術が含まれる。
ドライブとこれに関連付けられたコンピュータ可読媒体は、データ、データ構造、コンピュータ実行可能命令を格納する不揮発性ストレージとして利用できる。コンピュータ402の場合は、ドライブと媒体は任意のデータを適切なデジタル形式で格納できる。前述のコンピュータ可読媒体の説明は、HDD、取り外し可能な磁気ディスケット、取り外し可能な光ディスク(CDまたはDVDなど)を表しているが、zipドライブ、磁気カセット、フラッシュメモリカード、カートリッジなど、その他のコンピュータ可読媒体も例示的な動作環境で利用でき、さらにこうした任意の媒体に本発明の方法を実行するためのコンピュータ実行可能命令を格納できることを当業者は理解されたい。
オペレーティング・システム430、1つまたは複数のアプリケーションプログラム432、その他のプログラム・モジュール434、およびプログラムデータ436を含む多くのプログラム・モジュールは、ドライブおよびRAM 412に格納できる。オペレーティング・システム、アプリケーション、モジュール、および/またはデータは、RAM 412にキャッシングできる。
本発明が市販のさまざまなオペレーティング・システムまたは複数のオペレーティング・システムの組合せで実装できることを理解されたい。
ユーザは、1つまたは複数の有線/無線の入力装置(キーボード438やマウス440などのポインティング・デバイス)を使用してコンピュータ402にコマンドや情報を入力できる。他の入力装置(図示せず)には、マイクロフォン、IRリモート・コントロール、ジョイスティック、ゲームパッド、スタイラス・ペン、タッチ・スクリーンなどを含めてもよい。これらの入力装置および他の入力装置は、多くの場合にシステム・バス408に接続された入力装置インターフェース442を介して処理装置404に接続するが、パラレル・ポート、IEEE 1394シリアル・ポート、ゲーム・ポート、USBポート、IRインターフェースなどのような他のインターフェースを介して接続してもよい。
モニタ444または他のタイプの表示装置も、ビデオ・アダプタ446のようなインターフェースを介してシステム・バス408に接続される。コンピュータには、一般にモニタ444以外にもスピーカーやプリンタなどの周辺出力装置(図示せず)が接続されている。
コンピュータ402は、リモート・コンピュータ448のような1台または複数台のリモート・コンピュータへの有線および/または無線の通信を介した論理接続を使用してネットワーク環境で動作できる。リモート・コンピュータ448は、ワークステーション、サーバ・コンピュータ、ルーター、パーソナル・コンピュータ、ポータブル・コンピュータ、マイクロ・プロセッサ・ベースのエンターテイメント家電、ピア・デバイス、または他の一般的なネットワーク・ノー・ドでよい。通常は、コンピュータ402に関連して上で説明した要素の多くまたはすべてが含まれるが、簡単にするためにメモリ記憶装置450のみを示している。図示された論理接続には、ローカル・エリア・ネットワーク(LAN)452および/またはさらに大規模なネットワーク、たとえばワイド・エリア・ネットワーク(WAN)454が含まれる。このようなLANおよびWANネットワーキング環境は、オフィスや企業では一般的であり、イントラネットなどの事業体規模のコンピュータ・ネットワークを容易にさせる(facilitate)。こうしたネットワークのすべては、インターネットなどのグローバル通信ネットワークに接続できる。
LANネットワーキング環境で使用する場合、コンピュータ402は有線および/または無線通信ネットワーク・インターフェースまたはネットワーク・アダプタ456を介してローカル・ネットワーク452に接続する。アダプタ456は、LAN 452に対する有線または無線の通信を容易にさせる(facilitate)。LAN 452には、無線アダプタ456と通信するための無線アクセス・ポイントを含めてもよい。WANネットワーキング環境で使用する場合、コンピュータ402はモデム458を備えているか、LAN上の通信サーバに接続する。あるいは、インターネットなどのWAN 454を介して通信を確立するその他の手段を備えている。モデム458(内蔵でも外付けでもよいし、有線でも無線でもよい)は、シリアル・ポート・インターフェース442を介してシステム・バス408に接続される。ネットワーク環境では、コンピュータ402またはその一部に関連して記述したプログラム・モジュールをリモートメモリ/記憶装置450に格納できる。図示されたネットワーク接続は例示的なものであり、コンピュータ間の通信リンクを確立する他の手段を使用してもよいことは言うまでもない。
コンピュータ402は、任意の無線デバイスまたは無線通信に対応できるエンティティ(たとえば、プリンタ、スキャナ、デスクトップおよび/またはポータブル・コンピュータ、PDA(portable data assistant:携帯情報端末)、無線で検出できるタグに関連付けられた任意の装置または場所(たとえば、kiosk、ニュース・スタンド、化粧室)、および電話と通信できる。これには、少なくともWi−FiとBluetooth(商標)の無線技術が含まれる。このように、通信は従来のネットワークと同様に事前に定義された構造でもよいし、単に少なくとも2台のデバイス間におけるその場限りの通信でもよい。
Wi−Fi(Wireless Fidelity)すなわちワイヤレス・フィディリティーを使用すると、自宅のソファ(couch)、ホテルのベッド、あるいは職場の会議室から無線でインターネットに接続できる。Wi−Fiは、たとえばコンピュータなどのデバイスが屋内と屋外を問わず、基地局の担当範囲内のあらゆる場所でデータを送受信できる携帯電話(cell phone)と同様の無線技術である。Wi−Fiネットワークでは、IEEE 802.11(a、b、gなど)と呼ばれる電波(radio)技術を使用して安全で信頼性の高い高速の無線接続を提供している。Wi−Fiネットワークを使用すると、コンピュータの相互接続、インターネット接続、無線ネットワークへの接続が可能になる(IEEE 802.3またはEthernet(登録商標)などを使用)。Wi−Fiネットワークは、許可されていない2.4および5 GHzの電波帯域で11 Mbps(802.11b)または54 Mbps(802.11a)のデータ転送速度で動作し、あるいは2つの帯域(デュアル・バンド(dual band))に対応する製品で動作するので、このネットワークは現実社会の多くのオフィスで使用されている基本的な10BaseT有線Ethernet(登録商標)ネットワーと同等のパフォーマンスを提供できる。
図5を参照すると、本発明による例示的なコンピュータ環境500の概略的なブロック図が示されている。システム500には、クライアント(1つまたは複数)502が含まれる。クライアント502は、ハードウェアおよび/またはソフトウェア(たとえばスレッド、プロセス、コンピューティング・デバイス)でよい。クライアント502には、たとえば本発明を使用することでcookieおよび/または関連のコンテクスト情報を格納できる。システム500には、サーバ(1台または複数台)504も含まれる。サーバ504は、ハードウェアおよび/またはソフトウェア(たとえばスレッド、プロセス、コンピューティング・デバイス)でよい。サーバ504には、たとえば本発明を使用することによって変換を実行するスレッドを格納できる。クライアント502とサーバ504の間で可能な1つの通信の例は、2つ以上のコンピュータ・プロセス間で送信できるデータパケットの形態でもよい。データパケットには、たとえばcookieおよび/または関連のコンテクスト情報を含めてもよい。システム500には、クライアント502とサーバ504の間の通信を容易にさせる(facilitate)通信フレームワーク506(たとえばインターネットなどのグローバル通信ネットワーク)を備えている。
有線(光ファイバーを含む)および/または無線の技術を使用する通信は、容易化されて(facilitated)きている。クライアント502は、クライアント502のローカルな情報(たとえばcookieおよび/または関連のコンテクスト情報)を格納するための1つまたは複数のデータ・ストア(store(s))508に接続して機能する。同様に、サーバ504はサーバ504のローカルな情報を格納するための1つまたは複数のデータ・ストア510に接続して機能する。
以上の説明には、本発明の例が含まれる。本発明について説明するためにコンポーネントまたは方法のあらゆる組合せについて説明するのはもちろん不可能であるが、他にも本発明の多くの組合せや置き換えが可能であることは当業者なら理解することができる。したがって、本発明には添付の特許請求の範囲の精神および範囲内にある代替、修正、変形のすべてが含まれるものとする。さらに、発明の実施の形態と特許請求の範囲のいずれかで使用する「含む」という用語およびその変形の範囲は、「備える」が特許請求の範囲で転換語として使用された場合に解釈される用語「備える」と同様に包括的な意味を表す。
本発明に従って多次元式(multidimensional expressions)とデータ・マイニング拡張の一体化を容易にさせる(facilitate)システムを示す図である。 本発明による多次元データ・マイニングの1つの方法を示す流れ図である。 本発明に従ってデータ・マイニング拡張の入力として多次元式を使用する例示的な方法を示す流れ図である。 開示されたアーキテクチャを実現するために動作できるコンピュータを示すブロック図である。 本発明による例示的なコンピュータ環境の概略を示すブロック図である。
符号の説明
100 多次元式(multidimensional expressions)とデータ・マイニング拡張の一体化を容易にさせる(facilitate)システム
102 データ・キューブ
104 データ・マイニング・コンポーネント
106 多次元式コンポーネント
108 データ・マイニング拡張コンポーネント
404 処理装置
406 システム・メモリ
408 バス
414 内蔵ハードディスク・ドライブ
414 外付けハードディスク・ドライブ
418 ディスク
420 CDドライブ
422 ディスク
424 インターフェース
426 インターフェース
428 インターフェース
430 オペレーティング・システム
432 アプリケーション
434 モジュール
436 データ
438 キーボード
440 マウス
442 入力装置インターフェース
444 モニタ
446 ビデオ・アダプタ
448 リモート・コンピュータ
450 メモリ/ストレージ
456 ネットワーク・アダプタ
458 モデム
502 クライアント
504 サーバ
506 通信フレームワーク
508 クライアント・データ・ストア
510 サーバ・データ・ストア

Claims (16)

  1. 多次元データ・キューブに対してデータ・マイニングを行うためのシステムであって、
    メモリと、
    前記メモリに格納された、データ・マイニングすべき多次元データ・キューブにアクセスし、前記多次元データ・キューブに対して実行すべきデータ・マイニング・オペレーションを記述するデータ・マイニング拡張を、前記多次元データ・キューブに含まれる多次元データに対するクエリを定義する多次元クエリと一体化して、前記多次元データ・キューブのデータ・マイニング・モデルの入力を作成し、該入力から前記データ・マイニング・モデルを作成して、該作成されたデータ・マイニング・モデルに従って前記多次元データ・キューブに対するデータ・マイニングを実行す、データ・マイニング・コンポーネント
    を備え、
    前記データ・マイニング・コンポーネントは、前記データ・マイニング拡張の前記データ・マイニング・オペレーションを前記多次元クエリの要素で表すことにより、前記データ・マイニング拡張を前記多次元クエリと一体化して、前記入力を作成するように構成され、
    前記データ・マイニング・コンポーネントは、前記作成されたデータ・マイニング・モデルに従って前記多次元データ・キューブに対するデータ・マイニングを実行することによって、前記多次元データ・キューブ内に含まれる多次元データに対するデータ予測を行うように構成され、前記データ・マイニングを実行することは、前記多次元クエリの要素に従って前記多次元データ・キューブ内の前記多次元データの一部に対して前記データ・マイニング・オペレーションを実行することを含むことを特徴とするシステム。
  2. 前記多次元データ・キューブは、オンライン分析処理(OLAP:on-line analytical processing)キューブであることを特徴とする請求項1に記載のシステム。
  3. 前記データ・マイニング・コンポーネントは、前記データ・マイニング・モデルを作成した後に、前記データ・マイニング・モデルをトレーニングするトレーニング・フェーズにおいて前記データ・マイニング・モデルを構成するソース・データのタイプを設定するように構成され、前記ソース・データのタイプは、リレーショナル・ソース、OLAPソースのいずれか一方に設定されることを特徴とする請求項1に記載のシステム。
  4. 前記データ・マイニング・コンポーネントは、前記データ・マイニング・モデルのソース・データの構造が、リレーショナル構造であるか、多次元構造であるかに関わらず、前記データ・マイニング・モデルをトレーニングするように構成されることを特徴とする請求項1に記載のシステム。
  5. 前記データ・マイニング・コンポーネントは、前記データ・マイニング・モデルのソース・データがリレーショナル・ソースおよび多次元ソースのいずれであっても、カラムの順序によって処理されるカラム・バインディングを用いて前記データ・マイニング・モデルをトレーニングするように構成されることを特徴とする請求項1に記載のシステム。
  6. 前記データ・マイニング・コンポーネントは、前記データ・マイニング拡張の前記データ・マイニング・オペレーションを記述しているリレーショナル・クエリを前記多次元クエリで置き換えることによって、前記データ・マイニング拡張を前記多次元クエリと一体化して、前記入力を作成することを特徴とする請求項に記載のシステム。
  7. 前記データ・マイニング・コンポーネントは、前記データ・マイニング拡張においてSHAPEディレクトリを使用して記述されているSHAPEクエリを、入れ子構造のテーブルの前記多次元クエリで書き換えることによって、前記データ・マイニング拡張を前記多次元クエリと一体化して、前記入力を作成することを特徴とする請求項に記載のシステム。
  8. 前記データ・マイニング・コンポーネントは、前記データ・マイニング拡張において記述されている名前のみでバインドするステートメントを、前記多次元クエリを用いて定義することによって、前記データ・マイニング拡張を前記多次元クエリと一体化して、前記入力を作成することを特徴とする請求項に記載のシステム。
  9. 少なくともプロセッサとメモリとを備えるコンピュータシステムにおいて、前記メモリ内の多次元データ・キューブに対してデータ・マイニングを行うための方法であって、前記プロセッサが、
    前記メモリに格納された、データ・マイニングすべき多次元データ・キューブにアクセスするステップと
    前記多次元データ・キューブに対して実行すべきデータ・マイニング・オペレーションを記述するデータ・マイニング拡張と、前記多次元データ・キューブ内の多次元データに対するクエリを定義する多次元クエリを一体化して、前記多次元データ・キューブのデータ・マイニング・モデルのための入力を作成するステップであって、前記データ・マイニング拡張を前記多次元クエリと一体化することは、前記データ・マイニング拡張の前記データ・マイニング・オペレーションを前記多次元クエリの要素で表すことを含む、入力を作成するステップと、
    前記入力から、前記データ・マイニング・モデルを作成するステップと、
    前記データ・マイニング・モデルに従って前記多次元データ・キューブに対するデータ・マイニングを実行することによって、前記多次元データ・キューブ内に含まれる多次元データに対するデータ予測を行うステップであって、前記データ・マイニングを実行することは、前記多次元クエリの要素に従って前記多次元データ・キューブに含まれる前記多次元データの一部に対して前記データ・マイニング・オペレーションを実行することを含む、データ予測を実行するステップと
    含むことを特徴とする方法
  10. 前記多次元式クエリ、Microsoft(登録商標) OLE DB for OLAP仕様に準拠する多次元式で定義され、前記データ・マイニング拡張は、Microsoft(登録商標) OLE DB for Data Mining仕様に準拠することを特徴とする請求項に記載の方法。
  11. 前記データ・マイニング・モデルを構成するソース・データのタイプは、前記データ・マイニング・モデルを作成した後に、前記データ・マイニング・モデルをトレーニングするトレーニング・フェーズにおいて設定され、前記ソース・データのタイプは、リレーショナル・ソース、またはOLAPソースのいずれかであることを特徴とする請求項に記載の方法。
  12. 任意のデータ・ソースから前記作成されたデータ・マイニング・モデルをトレーニングするステップをさらに含み、前記データ・ソースはリレーショナルと多次元のうちの1つであることを特徴とする請求項に記載の方法。
  13. 前記データ・マイニング拡張と前記多次元クエリとを一体化して、前記データ・マイニング・モデルのための入力を作成するステップは、前記データ・マイニング拡張の前記データ・マイニング・オペレーションを記述しているリレーショナル・クエリを、前記多次元クエリで置き換えることによって、前記データ・マイニング拡張と前記前記多次元クエリとを一体化して、前記データ・マイニング・モデルを作成するための入力することを含むことを特徴とする請求項に記載の方法。
  14. 前記データ・マイニング拡張と前記多次元クエリとを一体化して、前記データ・マイニング・モデルのための入力を作成するステップは、前記データ・マイニング拡張においてSHAPEディレクティブを使用して記述されているSHAPEクエリを、前記多次元クエリで書き換えることによって、前記データ・マイニング拡張と前記前記多次元クエリとを一体化して、前記データ・マイニング・モデルのための入力を作成することを含むことを特徴とする請求項に記載の方法。
  15. 前記データ・マイニング拡張と前記多次元クエリとを一体化して、前記データ・マイニング・モデルのための入力を作成するステップは、前記データ・マイニング拡張に記述されている名前のみバインドするステートメントを、前記多次元クエリを用いて定義することによって前記データ・マイニング拡張と前記前記多次元クエリとを一体化して、前記データ・マイニング・モデルのための入力を作成することを含むことを特徴とする請求項に記載の方法。
  16. 多次元データ・キューブに対するデータ・マイニングのために、コンピュータシステムに、
    前記コンピュータシステムのメモリに格納された、データ・マイニングすべき多次元データ・キューブにアクセスするステップと
    前記多次元データ・キューブに対して実行すべきデータ・マイニング・オペレーションを記述するデータ・マイニング拡張と、前記多次元データ・キューブ内の多次元データに対するクエリを定義する多次元クエリを一体化して、前記多次元データ・キューブのデータ・マイニング・モデルのための入力を作成するステップであって、前記データ・マイニング拡張を前記多次元クエリと一体化することは、前記データ・マイニング拡張の前記データ・マイニング・オペレーションを前記多次元クエリの要素で表すことを含む、入力を作成するステップと、
    前記入力から、前記データ・マイニング・モデルを作成するステップと、
    前記データ・マイニング・モデルに従って前記多次元データ・キューブに対するデータ・マイニングを実行することによって、前記多次元データ・キューブ内に含まれる多次元データに対するデータ予測を行うステップであって、前記データ・マイニングを実行することは、前記多次元クエリの要素に従って前記多次元データ・キューブに含まれる前記多次元データの一部に対して前記データ・マイニング・オペレーションを実行することを含む、データ予測を行うステップと
    を実行させることを特徴とするプログラム。
JP2005167100A 2004-06-22 2005-06-07 多次元式(multidimensionalexpressions)とデータ・マイニング拡張(dataminingextensions)を組み合わせたolapキューブ(olapcubes)のマイニング Expired - Fee Related JP4716796B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/873,676 US7627555B2 (en) 2004-06-22 2004-06-22 Combining multidimensional expressions and data mining extensions to mine OLAP cubes
US10/873,676 2004-06-22

Publications (2)

Publication Number Publication Date
JP2006012143A JP2006012143A (ja) 2006-01-12
JP4716796B2 true JP4716796B2 (ja) 2011-07-06

Family

ID=34981588

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005167100A Expired - Fee Related JP4716796B2 (ja) 2004-06-22 2005-06-07 多次元式(multidimensionalexpressions)とデータ・マイニング拡張(dataminingextensions)を組み合わせたolapキューブ(olapcubes)のマイニング

Country Status (10)

Country Link
US (1) US7627555B2 (ja)
EP (1) EP1610237A3 (ja)
JP (1) JP4716796B2 (ja)
KR (1) KR101034428B1 (ja)
CN (1) CN1713180B (ja)
AU (1) AU2005201996B2 (ja)
BR (1) BRPI0502063A (ja)
CA (1) CA2506135A1 (ja)
MX (1) MXPA05005536A (ja)
RU (1) RU2398273C2 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7937401B2 (en) * 2004-07-09 2011-05-03 Microsoft Corporation Multidimensional database query extension systems and methods
US20060036939A1 (en) * 2004-08-13 2006-02-16 Microsoft Corporation Support for user-specified spreadsheet functions
US8095499B2 (en) * 2004-10-19 2012-01-10 Microsoft Corporation Query consolidation for structured reports
US7899776B2 (en) * 2007-07-02 2011-03-01 Microsoft Corporation Explaining changes in measures thru data mining
ES2593955T3 (es) * 2008-07-21 2016-12-14 Idt Electronic Products Limited Equipo de recuperación de datos
US8229923B2 (en) * 2008-09-26 2012-07-24 Microsoft Corporation Multidimensional data space queries with expression evaluation
CA2708911C (en) 2009-07-09 2016-06-28 Accenture Global Services Gmbh Marketing model determination system
GB2484644B (en) * 2009-07-22 2016-05-18 Univ Of Ontario Inst Of Tech System, method and computer program for multi-dimensional temporal data mining
JP5175903B2 (ja) 2009-08-31 2013-04-03 アクセンチュア グローバル サービスィズ ゲーエムベーハー 適応分析多次元処理システム
KR101117649B1 (ko) * 2010-10-13 2012-03-20 세종대학교산학협력단 Olap 기반의 3차원 공간에서 데이터 분석 객체의 선택 방법 및 시스템
CN102306176B (zh) * 2011-08-25 2013-09-25 浙江鸿程计算机***有限公司 一种基于数据仓库内在特征的olap关键词查询方法
CN102789488B (zh) * 2012-06-29 2016-05-04 用友网络科技股份有限公司 数据查询处理***和数据查询处理方法
CN103164222A (zh) * 2013-02-25 2013-06-19 用友软件股份有限公司 多维建模***和多维建模方法
CN103235793A (zh) * 2013-04-01 2013-08-07 华为技术有限公司 联机处理数据的方法、设备及***
US10275484B2 (en) * 2013-07-22 2019-04-30 International Business Machines Corporation Managing sparsity in a multidimensional data structure
US9442977B2 (en) 2013-09-06 2016-09-13 Sap Se Database language extended to accommodate entity-relationship models
US9176801B2 (en) 2013-09-06 2015-11-03 Sap Se Advanced data models containing declarative and programmatic constraints
US9361407B2 (en) 2013-09-06 2016-06-07 Sap Se SQL extended with transient fields for calculation expressions in enhanced data models
US9639572B2 (en) 2013-09-06 2017-05-02 Sap Se SQL enhancements simplifying database querying
US9354948B2 (en) 2013-09-06 2016-05-31 Sap Se Data models containing host language embedded constraints
US9575819B2 (en) 2013-09-06 2017-02-21 Sap Se Local buffers for event handlers
US9430523B2 (en) 2013-09-06 2016-08-30 Sap Se Entity-relationship model extensions using annotations
US9619552B2 (en) 2013-09-06 2017-04-11 Sap Se Core data services extensibility for entity-relationship models
CN106528795B (zh) * 2016-11-10 2023-10-13 中国农业银行股份有限公司 一种数据挖掘方法及装置
KR102058124B1 (ko) * 2019-01-25 2019-12-23 (주)비아이매트릭스 피벗 테이블 구조의 olap 결과를 이용한 딥러닝 예측 데이터 반영 시스템
US11868329B2 (en) 2022-05-20 2024-01-09 International Business Machines Corporation Multidimensional cube multivariate regression

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6205447B1 (en) 1997-06-30 2001-03-20 International Business Machines Corporation Relational database management of multi-dimensional data
US6473764B1 (en) 1999-10-15 2002-10-29 Microsoft Corporation Virtual dimensions in databases and method therefor
US7822629B2 (en) * 1999-12-15 2010-10-26 Hewlett-Packard Development Company, L.P. Customer profiling apparatus for conducting customer behavior pattern analysis, and method for comparing customer behavior patterns
US7007020B1 (en) * 2000-03-10 2006-02-28 Hewlett-Packard Development Company, L.P. Distributed OLAP-based association rule generation method and system
US6917940B1 (en) * 2000-03-10 2005-07-12 Hewlett-Packard Development Company, L.P. Olap-based customer behavior profiling method and system
US6687693B2 (en) 2000-12-18 2004-02-03 Ncr Corporation Architecture for distributed relational data mining systems
US7099880B2 (en) 2002-01-31 2006-08-29 International Business Machines Corporation System and method of using data mining prediction methodology
US6931391B2 (en) 2002-06-21 2005-08-16 Microsoft Corporation Systems and methods for generating prediction queries
US7472127B2 (en) 2002-12-18 2008-12-30 International Business Machines Corporation Methods to identify related data in a multidimensional database
CN100359495C (zh) * 2003-09-04 2008-01-02 上海格尔软件股份有限公司 基于数据仓库的信息安全审计方法
CA2540336C (en) * 2003-10-17 2013-05-14 Hydralift Amclyde, Inc. Equipment component monitoring and replacement management system

Also Published As

Publication number Publication date
RU2398273C2 (ru) 2010-08-27
EP1610237A2 (en) 2005-12-28
KR101034428B1 (ko) 2011-05-12
JP2006012143A (ja) 2006-01-12
CN1713180A (zh) 2005-12-28
CA2506135A1 (en) 2005-12-22
EP1610237A3 (en) 2006-12-13
US20050283459A1 (en) 2005-12-22
US7627555B2 (en) 2009-12-01
MXPA05005536A (es) 2006-01-11
CN1713180B (zh) 2013-05-08
AU2005201996A1 (en) 2006-01-12
RU2005119376A (ru) 2006-12-27
AU2005201996B2 (en) 2010-07-08
BRPI0502063A (pt) 2006-01-10
KR20060047700A (ko) 2006-05-18

Similar Documents

Publication Publication Date Title
JP4716796B2 (ja) 多次元式(multidimensionalexpressions)とデータ・マイニング拡張(dataminingextensions)を組み合わせたolapキューブ(olapcubes)のマイニング
JP7273045B2 (ja) Sqlクエリプランを最適化するための次元コンテキスト伝搬技術
EP3435257B1 (en) Metadata-based general request translator for distributed computer systems
US8447721B2 (en) Interest-driven business intelligence systems and methods of data analysis using interest-driven data pipelines
US20180210934A1 (en) Systems and methods for interest-driven business intelligence systems including event-oriented data
US7831617B2 (en) Re-categorization of aggregate data as detail data and automated re-categorization based on data usage context
US20140122413A1 (en) Bulk read and write between multi-dimensional data structures
Chavan et al. Survey paper on big data
US20150081353A1 (en) Systems and Methods for Interest-Driven Business Intelligence Systems Including Segment Data
CN104823185A (zh) 用于兴趣驱动的商业智能***中的兴趣驱动的数据共享的***和方法
US20160162521A1 (en) Systems and Methods for Data Ingest in Interest-Driven Business Intelligence Systems
US20200387542A1 (en) Contract library data structures and uses thereof
Skhiri et al. Large graph mining: recent developments, challenges and potential solutions
US20160379148A1 (en) System and Methods for Interest-Driven Business Intelligence Systems with Enhanced Data Pipelines
US20200311076A1 (en) Database partition pruning using dependency graph
US20200311067A1 (en) Database partition pruning using dependency graph
Atif A detailed analysis on data warehousing
El Gebaly et al. Portable in-browser data cube exploration
Ward New Application Scenarios with T-SQL
Guller et al. Spark SQL
Akhtar et al. Tools & Tuning
Tocci A comparison of leading database storage engines in support of online analytical processing in an open source environment
Liao et al. FIND-A Data Cloud Platform for Financial Data Services
Berger Oracle Life Sciences Platform and 10g Overview
Kiryakov et al. 7 Storing the Semantic

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110318

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110329

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4716796

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140408

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees