JP4993339B2 - 潜在クラス抽出方法および装置ならびに潜在クラス抽出プログラムおよびその記録媒体 - Google Patents
潜在クラス抽出方法および装置ならびに潜在クラス抽出プログラムおよびその記録媒体 Download PDFInfo
- Publication number
- JP4993339B2 JP4993339B2 JP2006093842A JP2006093842A JP4993339B2 JP 4993339 B2 JP4993339 B2 JP 4993339B2 JP 2006093842 A JP2006093842 A JP 2006093842A JP 2006093842 A JP2006093842 A JP 2006093842A JP 4993339 B2 JP4993339 B2 JP 4993339B2
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- singular value
- latent
- latent class
- discretization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 28
- 239000011159 matrix material Substances 0.000 claims description 86
- 238000000354 decomposition reaction Methods 0.000 claims description 31
- 238000000605 extraction Methods 0.000 claims description 26
- 238000004422 calculation algorithm Methods 0.000 claims description 24
- 230000006835 compression Effects 0.000 claims description 15
- 238000007906 compression Methods 0.000 claims description 15
- 238000000137 annealing Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims 3
- 238000004458 analytical method Methods 0.000 description 29
- 238000010586 diagram Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
A.P. Dempster, N.M. Laird, D.B. Rubin: Maximum likelihood from incomplete data via the EM algorithm, Journal of Royal Statistic Society, Series B39, pp. 1-38, 1976. 上田、中野:確定的アニーリングEMアルゴリズム、信学論D-II、Vol. J80-D-II, No. 1, pp. 267-276, 1997.
(1)多次元行列で表現された分析対象のデータ行列を次元圧縮する次元圧縮手段と、前記次元圧縮により得られた近似行列の各成分を離散化する離散化手段と、前記離散化後の近似行列から潜在クラスを抽出する潜在クラス抽出手段とを含むことを特徴とする。
(2)分析対象のデータ行列を特異値分解する特異値分解手段をさらに含み、次元圧縮手段は、特異値分解の結果に基づいてデータ行列を次元圧縮することを特徴とする。
(3)離散化手段が、特異値の大きい成分ほど存在確率が高くなるように各成分を離散化することを特徴とする。
上記した特徴(1)によれば、分析対象のデータ行列に予め次元圧縮が実施されて近似行列に圧縮され、データ量を削減された後に潜在クラス抽出が行われるので、潜在クラス抽出に要する処理時間を短縮できる。
A=UΣVt (1)
A'= UkΣkVkT (2)
αj=(σj/σ1)×αref (3)
Claims (10)
- 測定可能な顕在変数が二次元行列で表現された分析対象のデータ行列から、当該顕在変数の隠れた要因となる潜在変数を推測し、当該潜在変数に基づいて前記データ行列に潜在的に存在する複数の潜在クラスを抽出する潜在クラス抽出装置において、
分析対象のデータ行列を特異値分解する特異値分解手段と、
前記特異値分解の結果に基づいて前記分析対象のデータ行列を次元圧縮することで近似行列を求める次元圧縮手段と、
前記近似行列の各成分を「0」または「1」へ離散化する離散化手段と、
前記離散化後の近似行列から潜在クラスを抽出する潜在クラス抽出手段とを含み、
前記離散化手段は、前記近似行列の各成分を、前記特異値分解で得られた特異値が大きい成分ほど高い存在確率で「1」に離散化することを特徴とする潜在クラス抽出装置。 - 前記潜在クラス抽出手段は、前記離散化後の近似行列からEMアルゴリズム又は確定的アニーリングEMアルゴリズムによって潜在クラスを抽出することを特徴とする請求項1に記載の潜在クラス抽出装置。
- 前記離散化手段は、値が大きい順がj番目の特異値σjおよび所定の基準発生率αrefの関数として、前記近似行列における前記特異値分解で得られた特異値σjに対応する成分における前記存在確率αjを次式(3)に基づいて求め、値が大きい側の上位から当該存在確率αjに等しい割合の成分を「1」へ、それ以外を全て「0」へと離散化することを特徴とする請求項1または2に記載の潜在クラス抽出装置。
αj=(σj/σ1)×αref (3) - 測定可能な顕在変数からなる二次元行列で表現された分析対象のデータ行列から当該顕在変数の隠れた要因となる潜在変数を推測し、当該潜在変数に基づいて前記データ行列に潜在的に存在する複数の潜在クラスを抽出する潜在クラス抽出方法において、
コンピュータが分析対象のデータ行列を特異値分解する手順と、
コンピュータが前記特異値分解の結果に基づいて前記分析対象のデータ行列を次元圧縮することで近似行列を求める手順と、
コンピュータが前記近似行列の各成分を「0」または「1」へ離散化する手順と、
コンピュータが前記離散化後の近似行列から潜在クラスを抽出する手順とを含み、
前記離散化する手順では、前記近似行列の各成分を、前記特異値分解で得られた特異値が大きい成分ほど高い存在確率で「1」に離散化することを特徴とする潜在クラス抽出方法。 - 前記潜在クラスを抽出する手順では、前記離散化後の近似行列からEMアルゴリズム又は確定的アニーリングEMアルゴリズムによって潜在クラスを抽出することを特徴とする請求項4に記載の潜在クラス抽出方法。
- 前記離散化する手順では、値が大きい順がj番目の特異値σjおよび所定の基準発生率αrefの関数として、前記近似行列における前記特異値分解で得られた特異値σjに対応する成分における前記存在確率αjを次式(3)に基づいて求め、値が大きい側の上位から当該存在確率αjに等しい割合の成分を「1」へ、それ以外を全て「0」へと離散化することを特徴とする請求項4または5に記載の潜在クラス抽出方法。
αj=(σj/σ1)×αref (3) - 測定可能な顕在変数が二次元行列で表現された分析対象のデータ行列から、当該顕在変数の隠れた要因となる潜在変数を推測し、当該潜在変数に基づいて前記データ行列に潜在的に存在する複数の潜在クラスを抽出する潜在クラス抽出プログラムにおいて、
分析対象のデータ行列を特異値分解する手順と、
前記特異値分解の結果に基づいて前記分析対象のデータ行列を次元圧縮することで近似行列を求める手順と、
前記近似行列の各成分を「0」または「1」へ離散化する手順と、
前記離散化後の近似行列から潜在クラスを抽出する手順とを、コンピュータに実行させ、
前記離散化する手順では、前記近似行列の各成分を、前記特異値分解で得られた特異値が大きい成分ほど高い存在確率で「1」に離散化する潜在クラス抽出プログラム。 - 前記潜在クラスを抽出する手順では、前記離散化後の近似行列からEMアルゴリズム又は確定的アニーリングEMアルゴリズムによって潜在クラスを抽出することを特徴とする請求項7に記載の潜在クラス抽出プログラム。
- 前記離散化する手順では、値が大きい順がj番目の特異値σjおよび所定の基準発生率αrefの関数として、前記近似行列における前記特異値分解で得られた特異値σjに対応する成分における前記存在確率αjを次式(3)に基づいて求め、値が大きい側の上位から当該存在確率αjに等しい割合の成分を「1」へ、それ以外を全て「0」へと離散化することを特徴とする請求項7または8に記載の潜在クラス抽出プログラム。
αj=(σj/σ1)×αref (3) - 前記請求項7ないし9のいずれかに記載の潜在クラス抽出プログラムが記録されたコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006093842A JP4993339B2 (ja) | 2006-03-30 | 2006-03-30 | 潜在クラス抽出方法および装置ならびに潜在クラス抽出プログラムおよびその記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006093842A JP4993339B2 (ja) | 2006-03-30 | 2006-03-30 | 潜在クラス抽出方法および装置ならびに潜在クラス抽出プログラムおよびその記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007272291A JP2007272291A (ja) | 2007-10-18 |
JP4993339B2 true JP4993339B2 (ja) | 2012-08-08 |
Family
ID=38675073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006093842A Active JP4993339B2 (ja) | 2006-03-30 | 2006-03-30 | 潜在クラス抽出方法および装置ならびに潜在クラス抽出プログラムおよびその記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4993339B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5603678B2 (ja) * | 2010-06-30 | 2014-10-08 | 株式会社Nttドコモ | 需要予測装置及び需要予測方法 |
JP6175036B2 (ja) * | 2014-07-29 | 2017-08-02 | 日本電信電話株式会社 | クラスタ抽出装置、クラスタ抽出方法、及びクラスタ抽出プログラム |
JP6691646B2 (ja) * | 2018-07-10 | 2020-05-13 | データ・ケーキベーカ株式会社 | マッチング・マインド・マップを生成するデータ分析方法、システム、およびプログラム |
JP7096218B2 (ja) * | 2019-09-04 | 2022-07-05 | Kddi株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11296552A (ja) * | 1998-04-13 | 1999-10-29 | Ricoh Co Ltd | 文書分類装置、文書分類方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP3870043B2 (ja) * | 2001-07-05 | 2007-01-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 大規模データベースにおける主要クラスタおよびアウトライア・クラスタの検索、検出および同定のためのシステム、コンピュータ・プログラム、およびサーバ |
JP4266584B2 (ja) * | 2002-07-24 | 2009-05-20 | 株式会社リコー | テキストデータ群生成装置、テキストデータ群生成方法、プログラムおよび記録媒体 |
JP2004326465A (ja) * | 2003-04-24 | 2004-11-18 | Matsushita Electric Ind Co Ltd | 文書分類用の学習装置、及びこれを用いた文書分類方法並びに文書分類装置 |
-
2006
- 2006-03-30 JP JP2006093842A patent/JP4993339B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2007272291A (ja) | 2007-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xie et al. | Kronecker-basis-representation based tensor sparsity and its applications to tensor recovery | |
JP4394020B2 (ja) | データ分析装置及び方法 | |
US11620474B2 (en) | Model reselection for accommodating unsatisfactory training data | |
JP4993339B2 (ja) | 潜在クラス抽出方法および装置ならびに潜在クラス抽出プログラムおよびその記録媒体 | |
Mansingh et al. | Profiling internet banking users: A knowledge discovery in data mining process model based approach | |
Huang et al. | A pseudo-nearest-neighbor approach for missing data recovery on Gaussian random data sets | |
JP3600611B2 (ja) | 情報処理装置および情報処理方法、並びに情報処理プログラム | |
Isa et al. | Market basket analysis of customer buying patterns at corm café | |
CN103597485A (zh) | 模式提取装置及其方法 | |
CN109977977B (zh) | 一种识别***的方法及对应装置 | |
CN113763031A (zh) | 一种商品推荐方法、装置、电子设备及存储介质 | |
US20170351973A1 (en) | Quantifying creativity in auditory and visual mediums | |
US9619757B2 (en) | Nominal feature transformation using likelihood of outcome | |
JP7092202B2 (ja) | データ解析装置、データ解析方法及びプログラム | |
Smirlis et al. | Relaxing the impact of extreme units in data envelopment analysis | |
Han et al. | Empirical investigation of code and process metrics for defect prediction | |
Kurniawan et al. | Sentiment Analysis on Users' Satisfaction for Mobile Banking Apps in Malaysia | |
JP7235269B2 (ja) | データ項目名推定装置、データ項目名推定プログラム、及びデータ項目名推定方法 | |
Doulamis et al. | Collective intelligence in cultural heritage protection | |
JP2010198246A (ja) | 意味解析装置、方法、およびプログラム | |
JP7066988B2 (ja) | 情報抽出装置、情報抽出プログラムおよび情報抽出方法 | |
US20210365522A1 (en) | Storage medium, conversion method, and information processing apparatus | |
US20240104477A1 (en) | Waiting time prediction system, waiting time prediction method, and non-transitory storage medium | |
Tri Basuki et al. | Sentiment Analysis on Users' Satisfaction for Mobile Banking Apps in Malaysia | |
Badruddoza et al. | School of Economic Sciences |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080821 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110824 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120425 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120427 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4993339 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |