JPWO2006087854A1 - 情報分類装置、情報分類方法、情報分類プログラム、情報分類システム - Google Patents
情報分類装置、情報分類方法、情報分類プログラム、情報分類システム Download PDFInfo
- Publication number
- JPWO2006087854A1 JPWO2006087854A1 JP2007503580A JP2007503580A JPWO2006087854A1 JP WO2006087854 A1 JPWO2006087854 A1 JP WO2006087854A1 JP 2007503580 A JP2007503580 A JP 2007503580A JP 2007503580 A JP2007503580 A JP 2007503580A JP WO2006087854 A1 JPWO2006087854 A1 JP WO2006087854A1
- Authority
- JP
- Japan
- Prior art keywords
- information
- population
- distance
- classification
- statistical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 431
- 238000011156 evaluation Methods 0.000 claims abstract description 522
- 230000005484 gravity Effects 0.000 claims abstract description 92
- 238000004364 calculation method Methods 0.000 claims description 213
- 239000013598 vector Substances 0.000 claims description 178
- 239000011159 matrix material Substances 0.000 claims description 133
- 238000004458 analytical method Methods 0.000 claims description 79
- 238000004891 communication Methods 0.000 claims description 58
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 description 355
- 238000009826 distribution Methods 0.000 description 180
- 238000012360 testing method Methods 0.000 description 143
- 230000010365 information processing Effects 0.000 description 129
- 238000012545 processing Methods 0.000 description 129
- 230000008569 process Effects 0.000 description 53
- 230000013016 learning Effects 0.000 description 49
- 238000002474 experimental method Methods 0.000 description 40
- 238000003860 storage Methods 0.000 description 37
- 238000004422 calculation algorithm Methods 0.000 description 30
- 230000007704 transition Effects 0.000 description 29
- 238000013528 artificial neural network Methods 0.000 description 28
- 238000007726 management method Methods 0.000 description 28
- 230000008859 change Effects 0.000 description 26
- 230000009471 action Effects 0.000 description 23
- 230000006399 behavior Effects 0.000 description 22
- 230000007423 decrease Effects 0.000 description 19
- 230000014509 gene expression Effects 0.000 description 17
- 239000010410 layer Substances 0.000 description 17
- 230000001965 increasing effect Effects 0.000 description 16
- 230000002829 reductive effect Effects 0.000 description 16
- 238000013139 quantization Methods 0.000 description 15
- 239000000126 substance Substances 0.000 description 15
- 230000000875 corresponding effect Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 235000008694 Humulus lupulus Nutrition 0.000 description 13
- 238000000354 decomposition reaction Methods 0.000 description 13
- 230000002123 temporal effect Effects 0.000 description 13
- 238000010276 construction Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 12
- 230000006872 improvement Effects 0.000 description 12
- 238000012986 modification Methods 0.000 description 12
- 230000004048 modification Effects 0.000 description 12
- 238000012706 support-vector machine Methods 0.000 description 12
- 230000009466 transformation Effects 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 11
- 238000012937 correction Methods 0.000 description 11
- 102000053602 DNA Human genes 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 10
- 230000001976 improved effect Effects 0.000 description 10
- 238000000528 statistical test Methods 0.000 description 10
- 239000000463 material Substances 0.000 description 9
- 235000019645 odor Nutrition 0.000 description 9
- 230000002596 correlated effect Effects 0.000 description 8
- 230000003247 decreasing effect Effects 0.000 description 8
- 230000004069 differentiation Effects 0.000 description 8
- 238000007619 statistical method Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000002349 favourable effect Effects 0.000 description 7
- 238000001325 log-rank test Methods 0.000 description 7
- 238000013077 scoring method Methods 0.000 description 7
- 230000035807 sensation Effects 0.000 description 7
- 235000019615 sensations Nutrition 0.000 description 7
- 238000012313 Kruskal-Wallis test Methods 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 238000001787 Wald–Wolfowitz test Methods 0.000 description 6
- 238000000546 chi-square test Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 230000008451 emotion Effects 0.000 description 6
- 206010016256 fatigue Diseases 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 238000009499 grossing Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000000513 principal component analysis Methods 0.000 description 6
- 238000007639 printing Methods 0.000 description 6
- 238000011002 quantification Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 6
- 208000024891 symptom Diseases 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 238000001276 Kolmogorov–Smirnov test Methods 0.000 description 5
- 238000001604 Rao's score test Methods 0.000 description 5
- 238000010162 Tukey test Methods 0.000 description 5
- 239000000654 additive Substances 0.000 description 5
- 230000000996 additive effect Effects 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 238000003672 processing method Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000012093 association test Methods 0.000 description 4
- 238000013398 bayesian method Methods 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000007621 cluster analysis Methods 0.000 description 4
- 230000002860 competitive effect Effects 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 230000008030 elimination Effects 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 4
- 238000000556 factor analysis Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000000491 multivariate analysis Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 229920001690 polydopamine Polymers 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000000611 regression analysis Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000013515 script Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 239000002356 single layer Substances 0.000 description 4
- 230000004083 survival effect Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000000846 Bartlett's test Methods 0.000 description 3
- 238000001078 Durbin test Methods 0.000 description 3
- 244000187656 Eucalyptus cornuta Species 0.000 description 3
- 238000001134 F-test Methods 0.000 description 3
- 238000000729 Fisher's exact test Methods 0.000 description 3
- 238000003657 Likelihood-ratio test Methods 0.000 description 3
- 238000000585 Mann–Whitney U test Methods 0.000 description 3
- 238000000692 Student's t-test Methods 0.000 description 3
- 238000001772 Wald test Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000036651 mood Effects 0.000 description 3
- 230000000474 nursing effect Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000010422 painting Methods 0.000 description 3
- 238000011867 re-evaluation Methods 0.000 description 3
- 229940064684 relifor Drugs 0.000 description 3
- 230000001953 sensory effect Effects 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 238000012353 t test Methods 0.000 description 3
- 238000010998 test method Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 2
- 206010016275 Fear Diseases 0.000 description 2
- 238000001135 Friedman test Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 238000001545 Page's trend test Methods 0.000 description 2
- 238000001358 Pearson's chi-squared test Methods 0.000 description 2
- 241000228740 Procrustes Species 0.000 description 2
- 238000011869 Shapiro-Wilk test Methods 0.000 description 2
- 238000000367 ab initio method Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000036772 blood pressure Effects 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 230000036760 body temperature Effects 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 239000000306 component Substances 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000009223 counseling Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 2
- 230000004064 dysfunction Effects 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000013210 evaluation model Methods 0.000 description 2
- 238000010304 firing Methods 0.000 description 2
- 238000012880 independent component analysis Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 238000001543 one-way ANOVA Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 238000012892 rational function Methods 0.000 description 2
- 230000001373 regressive effect Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 238000013432 robust analysis Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 210000000697 sensory organ Anatomy 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000012731 temporal analysis Methods 0.000 description 2
- 238000004613 tight binding model Methods 0.000 description 2
- 238000000700 time series analysis Methods 0.000 description 2
- 230000003867 tiredness Effects 0.000 description 2
- 208000016255 tiredness Diseases 0.000 description 2
- 238000012876 topography Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000007492 two-way ANOVA Methods 0.000 description 2
- 238000009827 uniform distribution Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000005428 wave function Effects 0.000 description 2
- 206010063659 Aversion Diseases 0.000 description 1
- 230000011748 cell maturation Effects 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000008786 sensory perception of smell Effects 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23211—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with adaptive number of clusters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
好ましくは、距離算出部は、固有値および固有ベクトルに基づいて、統計的距離を算出する。
好ましくは、距離算出部は、統計的距離としてベイズ識別関数による距離を算出する。
この発明に従えば、情報分類装置によって、統計的距離が正規化される。その結果、情報分類装置によって、統計的距離を容易に取扱うことができるようになる。
図1を参照して、情報分類装置100は、PC(Personal Computer)などのコンピュータで構成され、処理部110と、記憶部120と、入力部130と、出力部140とを含む。処理部110、記憶部120、入力部130、および、出力部140は、バスで接続され、バスを介して、必要なデータをやり取りする。
なお、この距離関数において引数
kは標本の識別値を表す。
Dikは距離関数
μは標本情報から得た平均ベクトルを示す。
数5および数9におけるViは母集団iの共分散行列を示す。
φiは母集団の共分散行列の固有ベクトルを示す。
λiは母集団の共分散行列の固有値を示す。
また、別の式表現として、
次に、ステップS12で、処理部110が、ステップS11で構築した距離関数で標本情報を評価し、評価距離を算出する。また、ステップS13で、処理部110は、ステップS12で算出した評価距離の平均値、分散値、および、標準偏差値を導出する。
数22もしくは数23のように平均として用いて、標本群の重心からの距離に対する標準偏差を求め、前述の手法における境界基準としてもよい。この場合、距離平均ではなく、母集団重心からの距離を評価基準とするため、固有値に基づく定数から求められた平均μDaとその平均に基づいた標準偏差σDaに従って、統計的確率密度関数により求められる出現確率もしくは帰属確率もしくは所属確率とすることで帰属境界となる距離を決めてもよい。
この実験は、あくまでも分類困難であった自然情報の一例として、人の音声情報を標本情報に用いることで、本実施形態により事前分類と認識結果に基づく事後分類の一致率が向上し分類数が減少する点から効率的な分類が実現できていることを確認するための実験である。
情報分類装置100は、記憶部120の母集団により分類された標本情報に対し処理部110を用いて、平均と分散を求め、共分散行列を構成し、記憶部120に保存する。
この実験に用いられる3σ範囲は母集団の99.7%程度を内包する範囲であり、統計的予測では検定境界である98%となる2σ付近の値がよい分類を実施できることも予想できる。
また、母集団における標本の尤度分布や出現確率分布、距離分布に基づく局所解を仮中心とみなし、その仮中心から各々の標本の距離を求め、得られた距離の平均と分散、標準偏差値により統計的に有意な範囲かどうかを弁別し母集団を分割や結合、変更してもよい。
たとえば、ロボットなどの動作機械における情報の関連付けに基づく動作学習においてある動作を構成するための変数と姿勢の名称との分類に本発明を用いてもよいし、その際姿勢の名称のみを通信回線を経由してロボットなどの装置に対して送信し、ロボットの遠隔ダンスサービス等の動作を分析的に処理し再利用する遠隔ロボット制御サービスを実施する情報処理システムや任意の駆動系機能を含む装置の運転および/もしくは制御方法の特徴学習による運転制御システムやサービスが考えられ、これらを用いた工作ロボットや整理ロボット、搬送ロボット、介護ロボット、愛玩ロボット、手伝いロボット、対話ロボット、家事ロボット、農業ロボットなどを作成しても良い。
また、音楽と音楽に基づいて想起される単語の関係を分析し関連情報を統計的に分類して任意の情報や商品、サービスを選択する情報処理システムが考えられる。
図6を参照して、情報分類システムは、情報処理装置100A,100B、および、情報端末200A〜200Cを含む。情報処理装置100A,100B、および、情報端末200A〜200Cは、それぞれ、インターネットや電話回線網などのネットワーク500を介して接続される。
情報分類装置100は、ある母集団Aに帰属するk個の標本akと母集団Aとの距離算出部を構成し、その距離算出部に基づいて距離Dkを求め、求められた各標本akの母集団Aとの距離を標本akと母集団Aの距離平均値μaと標準偏差値σaといった統計情報算出部を用いて得た値にしたがって、統計的な正規分布の出現確率により母集団への帰属度合を評価する。
次に、本実施の形態の変形例について説明する。例えば、図2のステップS12の距離評価において、評価用サンプルである
このような変換を行なう場合、過剰であるx3、x8は項目から削除し、z5には評価関数側でiとラベル付けされた評価関数構築時のサンプルにおける対称要素であるiラベルの平均値若しくは0を代入することで、評価関数と被評価ベクトルとの構成要素が異なっていても評価を可能とする。
[技術分野]
[0001]
本発明は、情報分類装置、情報認識装置、情報検索装置、情報分類方法、情報分類プログラム、情報分類システム、情報分類システムを用いた情報提供サービス、情報分類システムによって分類された分類後母集団を記録するコンピュータ読取可能な記録媒体、および、情報分類システムを用いて分類対象標本情報が帰属する母集団を検索するための任意数の母集団を記憶するデータベースに関し、特に、統計的に情報を分類するのに適した情報分類装置、情報認識装置、情報検索装置、情報分類方法、情報分類プログラム、情報分類システム、情報分類システムを用いた情報提供サービス、情報分類システムによって分類された分類後母集団を記録するコンピュータ読取可能な記録媒体、および、情報分類システムを用いて分類対象標本情報が帰属する母集団を検索するための任意数の母集団を記憶するデータベースに関する。
[背景技術]
[0002]
情報の認識や分類においての分類方法は、一般的には行列情報群を直交分解し複数の行列情報群によって最適解を求めたり、尤度推定法であるバウムウェルチアルゴリズムや最小誤差分類などの最適解を算術的に求めたりするアルゴリズムが用いられている。
[0003]
また、ニューラルネットワークにおける中間層の最適値を求める際に、マハラノビス距離が任意の一定距離になるようにニューラルネットワークを補正する方法がある(たとえば、特開2003−76976号公報(以下「特許文献1」という)参照)。
[0004]
また、ベクトル量子化方法として、Kミーンズ手法と呼ばれる母集団に任意の重心を与え、その重心が最適な位置に移動するまで再帰的に分類する方法がある。
[0017]
また、非特許文献2は、マハラノビス距離を用いた音声分析に高い相関性が見られるという分析結果と考察であり、具体的な課題や課題の解決方法と実証を提示しているわけではない。
[0018]
また、このような情報分類システムにおいて、特徴構成要素の順序や項目が異なるベクトル及び/若しくはマトリクス及び/若しくはテンソル同士や評価関数は互いに評価できないという課題があった。
[0019]
この発明は上述の課題を解決するためになされたもので、この発明の目的の1つは、母集団への標本情報の自律的かつ安定的な分類が可能な情報分類装置、情報認識装置、情報検索装置、情報分類方法、情報分類プログラム、および、情報分類システムを提供することである。
[0020]
この発明の他の目的は、構成要素態様が異なる標本情報同士を互いに評価することが可能な情報分類装置、情報認識装置、情報検索装置、情報分類方法、情報分類プログラム、および、情報分類システムを提供することである。
[課題を解決するための手段]
[0021]
上述した課題を解決するために、この発明のある局面によれば、情報分類装置は、距離算出部と、統計情報算出部と、帰属度合評価部と、帰属先決定部と、標本情報分類部とを備える。
[0022]
距離算出部は、距離評価関数を用いて任意数の標本情報を含む任意数の母集団それぞれの重心との距離情報を算出する。統計情報算出部は、各母集団に帰属する標本情報それぞれに関連付けられた距離算出部によって算出された距離情報により構成された各距離情報群それぞれに基づいた標本距離の平均および標本距離の平均を中心とする標本距離の分散を用いて統計情報を算出する。
[0023]
帰属度合評価部は、距離算出部によって各母集団の重心と分類対象標本情報との距離を算出し、算出された距離に対して統計情報算出部によって算出された統計情報を用いた統計的検定を施すことで帰属度合を評価する。帰属先決定部は、帰属度合評価部によって評価された帰属度合に応じて、分類対象標本情報をいずれの母集団に帰属させるかを決定する。標本情報分類部は、帰属先決定部によって決定された母集団に分類対象標本情報を帰属させ分類する。
[0024]
この発明に従えば、情報分類装置によって、
距離評価関数が用いられて任意数の標本情報を含む任意数の母集団それぞれの重心との距離情報が算出され、算出された各母集団に帰属する標本情報それぞれに関連付けられた距離情報により構成された各距離情報群それぞれに基づいた標本距離の平均および標本距離の平均を中心とする標本距離の分散を用いて統計情報が算出され、各母集団の重心と分類対象標本情報との距離が算出され、算出された距離に対して算出された統計情報を用いた統計的検定を施すことで帰属度合が評価され、評価された帰属度合に応じて、分類対象標本情報をいずれの母集団に帰属させるかが決定され、決定された母集団に分類対象標本情報が帰属され分類される。
[0025]
このため、情報分類装置によって、分類対象標本情報が各母集団への帰属度合に応じたいずれかの母集団に帰属され分類きれる。その結果、母集団への標本情報の自律的かつ安定的な分類が可能な情報分類装置を提供することができる。
[0026]
好ましくは、統計情報は、各母集団に帰属する距離情報群それぞれに基づいた標本距離の標準偏差(S13)をさらに加えて構成される統計情報であり、帰属度合評価部は、距離算出部によって前記距離評価関数を用いて算出された各母集団の重心と分類対象標本情報との距離を算出し、算出された距離と統計情報算出部によって算出された統計情報とを用いることにより前記各分類対象標本情報の距離を標準偏差で正規化(S14)して算定される各母集団への帰属確率によって、分類対象標本情報の各母集団への帰属度合を評価する。
[0027]
好ましくは、距離算出部は、標本情報分類部によって分類対象標本情報に基づく標本情報群が更新された更新母集団を構成し、構成された更新母集団ごとに分類された標本情報群に応じて距離算出部によって用いられる距離評価関数を再構築する距離評価関数再構築部をさらに備え、
距離算出部は、距離評価関数再構築部により再構築された距離評価関数を用いて更新母集団のそれぞれに帰属する分類対象標本情報と更新母集団の重心との距離情報群をさらに算出する。
[0028]
この発明に従えば、情報分類装置によって、分類対象標本情報に基づく標本情報群が更新された更新母集団が構成され、構成された更新母集団ごとに分類された標本情報群に応じて距離評価関数が再構築され、再構築された距離評価関数が用いられて更新母集団のそれぞれに帰属する分類対象標本情報と更新母集団の重心との距離情報群がさらに算出され、算出された距離情報群に基づいて、さらに、分類対象標本情報が帰属度合に応じたいずれかの母集団に帰属され分類される。
[0029]
このため、情報分類装置によって、さらに、母集団へ標本情報を再帰的に分類することができる。
[0030]
好ましくは、帰属先決定部は、いずれの母集団への帰属度合も所定の度合の範囲外であるときに、新たに母集団を生成する母集団生成部を含み、生成した母集団に分類対象標本情報を帰属させることを決定する。
[0031]
この発明に従えば、情報分類装置によって、いずれの母集団への帰属度合も所定の度合の範囲外であるときに、新たに母集団が生成され、生成された母集団に分類対象標本情報が帰属され分類される。
[0032]
このため、母集団に帰属する標本情報は、帰属度合が所定の度合で範囲内の標本情報となる。その結果、情報分類装置によって、母集団に対して所定の度合の範囲内に標本情報を分類することができる。
[0033]
さらに好ましくは、帰属度合は、その母集団に対する距離情報群の平均値からの偏差値であり、所定の度合は、偏差値が平均値から所定倍の標準偏差値の範囲である。
[0034]
この発明に従えば、情報分類装置によって、いずれの母集団への距離情報群の平均値からの偏差値も、所定倍の標準偏差値の範囲外であるときに、新たに母集団が生成され、生成された母集団に分類対象標本情報が帰属される。
[0035]
このため、情報分類装置によって、母集団に対して距離情報群の平均値からの偏差値が所定倍の標準偏差値の範囲内に標本情報を分類することができる。その結果、母集団に帰属する標本情報のうちの一定割合が平均値から所定倍の標準偏差値の範囲内に分布する正規分布に近くなるように、標本情報を母集団に分類することができる。
[0036]
また、好ましくは、情報分類装置は、所定数の標本情報が帰属されない母集団を削除し、削除した母集団に帰属する標本情報を他の母集団に帰属させる母集団削除部をさらに備える。
[0037]
この発明に従えば、情報分類装置によって、所定数の標本情報が帰属されない母集団が削除され、削除された母集団に帰属する標本情報が他の母集団に帰属される。このため、妥当でない母集団は淘汰される。
[0038]
好ましくは、帰属先決定部は、帰属度合評価部によって評価された帰属度合が最も良い母集団に分類対象標本情報を帰属させることを決定する。
[0039]
この発明に従えば、情報分類装置によって、評価された帰属度合が最も良い母集団に分類対象標本情報を帰属させることが決定され、決定された母集団に分類対象標本情報が帰属される。
[0040]
このため、情報分類装置によって、分類対象標本情報にとって帰属度合が最も良い母集団に帰属される。その結果、母集団へ標本情報を最適に分類することができる。
[0041]
好ましくは、距離算出部は、共分散構造分析に基づいて、距離情報を算出する。
好ましくは、距離算出部は、固有値および固有ベクトルに基づいて、距離情報を
算出する。
[0042]
好ましくは、距離算出部は、距離情報としてマハラノビス距離を算出する。
好ましくは、距離算出部は、距離情報としてベイズ識別関数による距離を算出する。
[0043]
好ましくは、距離算出部は、算出した距離情報を正規化する距離正規化部を含む。
この発明に従えば、情報分類装置によって、距離情報が正規化される。その結果、情報分類装置によって、距離情報を容易に取扱うことができるようになる。
この発明の他の局面によれば、情報認識装置は、情報分類装置と、距離評価関数再構築部により再構築された距離評価関数を用いて自然情報から抽出された特徴最に対応した識別情報の認識処理を行なう認識処理部とを備える。
この発明のさらに他の局面によれば、情報検索装置は、情報分類装置と、距離評価関数再構築部により再構築された距離評価関数を用いて自然情報から抽出された特徴量に対応した識別情報の認識処理を行なう認識処理部と、認識処理部による認識結果を用いた検索を行なう検索部とを備える。
[0044]
この発明のさらに他の局面によれば、情報分類方法は、コンピュータによって実行され、距離評価関数を用いて任意数の標本情報と標本情報を含む任意数の母集団それぞれの重心との距離情報を算出するステップと、各母集団に帰属する標本情報それぞれに関連付けられた算出された距離情報により構成された各距離情報群それぞれに基づいた標本情報の平均および標本距離の平均を中心とする標本距離の分散を用いて統計情報を算出するステップと、各母集団の重心と分類対象標本情報との距離を算出し、算出された距離に対して算出された統計情報を用いた統計的検定を施すことで帰属度合を評価するステップと、評価された帰属度合に応じて、分類対象標本情報をいずれの母集団に帰属させるかを決定するステップと、決定された母集団に分類対象標本情報を帰属させ分類するステップとを含む。
[0045]
この発明に従えば、母集団への標本情報の自律的かつ安定的な分類が可能な情報分類方法を提供することができる。
[0046]
この発明のさらに他の局面によれば、情報分類プログラムは、コンピュータで実行され、距離評価関数を用いて任意数の標本情報と標本情報を含む任意数の母集団それぞれの重心との距離情報を算出するステップと、各母集団に帰属する標本情報それぞれに関連付けられた算出された距離情報により構成された各距離情報群それぞれに基づいた標本情報の平均および標本距離の平均を中心とする標本距離の分散を用いて統計情報を算出するステップと、各母集団の重心と分類対象標本情報との距離を算出し、算出された距離に対して算出された統計情報を用いた統計的検定を施すことで帰属度合を評価するステップと、評価された帰属度合に応じて、分類対象標本情報をいずれの母集団に帰属させるかを決定するステップと、決定された母集団に分類対象標本情報を帰属させ分類するステップとをコンピュータに実行させる。
[0047]
この発明に従えば、母集団への標本情報の自律的かつ安定的な分類が可能な情報分類プログラムを提供することができる。
[0048]
この発明のさらに他の局面によれば、情報分類システムは、情報分類装置と、情報分類装置と通信回線を介して接続される情報端末とを含む。情報分類装置は、母集団受取部と、距離算出部と、統計情報算出部と、帰属度合評価部と、帰属先決定部と、標本情報分類部と、分類後母集団受渡部とを備える。情報端末は、母集団受渡部と、分類後母集団受取部とを備える。
[0049]
母集団受渡部は、情報分類装置に標本情報が含まれる任意数の母集団を受渡す。母集団受取部は、情報端末から標本情報が含まれる任意数の母集団を受取る。距離算出部は、母集団受取部によって受取られた母集団に含まれる任意数の標本情報と任意数の母集団のそれぞれの重心との距離情報を距離評価関数を用いて算出する。
[0050]
統計情報算出部は、各母集団に帰属する標本情報それぞれに関連付けられた距離算出部によって算出された距離情報により構成された各距離情報群それぞれに基づいた標本距離の平均および標本距離の平均を中心とする標本距離の分散を用いて統計情報を算出する。帰属度合評価部は、距離算出部によって各母集団の重心と分類対象標本情報との距離を算出し、算出された距離に対して統計情報算出部によって算出された統計情報を用いた統計的検定を施すことで帰属度合を評価する。
[0051]
帰属先決定部は、帰属度合評価部によって評価された帰属度合に応じて、分類対象標本情報をいずれの母集団に帰属させるかを決定する。標本情報分類部は、帰属先決定部によって決定された母集団に分類対象標本情報を帰属させ分類する。
[0052]
分類後母集団受渡部は、標本情報分類部によって分類対象標本情報が帰属され分類された分類後母集団を情報端末に受渡す。分類後母集団受取部は、情報分類装置から分類後母集団を受取る。
[0053]
この発明に従えば、標本情報を自律的かつ安定的に分類した母集団を与えることが可能な情報分類システムを提供することができる。
[0054]
この発明のさらに他の局面によれば、情報分類システムは、情報分類装置と、情報分類装置と通信回線を介して接続される情報端末とを含む。情報分類装置は、標本情報受取部と、距離算出部と、統計情報算出部と、帰属度合評価部と、帰属先決定部と、母集団識別情報受渡部とを備える。情報端末は、標本情報受渡部と、母集団識別情報受取部とを備える。
[0055]
標本情報受渡部は、情報分類装置に分類対象標本情報を受渡す。標本情報受取部は、情報端末から分類対象標本情報を受取る。距離算出部は、標本情報
受取部によって受取られた分類対象標本情報を含む任意数の標本情報と標本情報を含む任意数の母集団それぞれの重心との距離情報を距離評価関数を用いて算出する。
[0056]
統計情報算出部は、各母集団に帰属する標本情報それぞれに関連付けられた距離算出部によって算出された距離情報により構成された各距離情報群それぞれに基づいた標本距離の平均および標本距離の平均を中心とする標本距離の分散を用いて統計情報を算出する。帰属度合評価部は、距離算出部によって各母集団の重心と分類対象標本情報との距離を算出し、算出された距離に対して統計情報算出部によって算出された統計情報を用いた統計的検定を施すことで帰属度合を評価する。
[0057]
帰属先決定部は、帰属度合評価部によって評価された帰属度合に応じて、分類対象標本情報をいずれの母集団に帰属させるかを決定する。母集団識別情報受渡部は、帰属先決定部によって決定された母集団を識別する母集団識別情報を情報端末に受渡す。母集団識別情報受取部は、情報分類装置から母集団識別情報を受取る。
[0058]
この発明に従えば、分類対象標本情報が帰属する母集団を識別する情報を自律的かつ安定的に与えることが可能な情報分類システムを提供することができる。
[0059]
この発明のさらに他の局面によれば、情報提供サービスに用いられる情報提供システムは、情報分類装置と、情報分類装置と通信回線を介して接続される情報端末とを含む。情報分類装置は、標本情報受取部と、距離算出部と、統計情報算出部と、帰属度合評価部と、帰属先決定部と、母集団識別情報受渡部とを備える。情報端末は、標本情報受渡部と、母集団識別情報受取部とを備える。
[0060]
標本情報受渡部は、情報分類装置に分類対象標本情報を受渡す。標本情報受取部は、情報端末から分類対象標本情報を受取る。距離算出部は、標本情報受取部によって受取られた分類対象標本情報を含む任意数の標本情報と標本情報を含む任意数の母集団それぞれの重心との距離情報を距離評価関数を用いて算出する。
[0061]
統計情報算出部は、各母集団に帰属する標本情報それぞれに関連付けられた距離算出部によって算出された距離情報により構成された各距離情報群それぞれに基づいた標本距離の平均および標本距離の平均を中心とする標本距離の分散を用いて統計情報を算出する。帰属度合評価部は、距離算出部によって各母集団の重心と分類対象標本情報との距離を算出し、算出された距離に対して統計情報算出部によって算出された統計情報を用いた統計的検定を施すことで帰属度合を評価する。
[0062]
帰属先決定部は、帰属度合評価部によって評価された帰属度合に応じて、分類対象標本情報をいずれの母集団に帰属させるかを決定する。母集団識別情報受渡部は、帰属先決定部によって決定された母集団を識別する母集団識別情報を情報端末に
受渡す。母集団識別情報受取部は、情報分類装置から母集団識別情報を受取る。
[0063]
この発明に従えば、分類対象標本情報が帰属する母集団を識別する情報を自律的かつ安定的に与えることが可能な情報分類システムを用いた情報提供サービスを提供することができる。
[0064]
この発明のさらに他の局面によれば、コンピュータ読取可能な記録媒体に記録される分類後母集団を分類する情報分類システムは、情報分類装置と、情報分類装置と通信回線を介して接続される情報端末とを含む。情報分類装置は、母集団受取部と、距離算出部と、統計情報算出部と、帰属度合評価部と、帰属先決定部と、標本情報分類部と、分類後母集団受渡部とを備える。情報端末は、母集団受渡部と、分類後母集団受取部とを備える。
[0065]
母集団受渡部は、情報分類装置に標本情報が含まれる任意数の母集団を受渡す。母集団受取部は、情報端末から標本情報が含まれる任意数の母集団を受取る。距離算出部は、母集団受取部によって受取られた母集団に含まれる任意数の標本情報と任意数の母集団のそれぞれの重心との距離情報を距離評価関数を用いて算出する。
[0066]
統計情報算出部は、各母集団に帰属する標本情報それぞれに関連付けられた距離算出部によって算出された距離情報により構成された各距離情報群それぞれに基づいた標本距離の平均および標本距離の平均を中心とする標本距離の分散を用いて統計情報を算出する。帰属度合評価部は、距離算出部によって各母集団の重心と分類対象標本情報との距離を算出し、算出された距離に対して統計情報算出部によって算出された統計情報を用いた統計的検定を施すことで帰属度合を評価する。
[0067]
帰属先決定部は、帰属度合評価部によって評価された帰属度合に応じて、分類対象標本情報をいずれの母集団に帰属させるかを決定する。標本情報分類部は、帰属先決定部によって決定された母集団に分類対象標本情報を帰属させ分類する。
[0068]
分類後母集団受渡部は、標本情報分類部によって分類対象標本情報が帰属され分類された分類後母集団を情報端末に受渡す。分類後母集団受取部は、情報分類装置から分類後母集団を受取る。
[0069]
この発明に従えば、標本情報を自律的かつ安定的に分類した母集団を与えることが可能な情報分類システムによって分類された分類後母集団を記録するコンピュータ読取可能な記録媒体を提供することができる。
[0070]
この発明のさらに他の局面によれば、データベースに記憶された任意数の母集団
から分類対象標本情報が帰属する母集団を検索するために用いられる情報分類システムは、情報分類装置と、情報分類装置と通信回線を介して接続される情報端末とを含む。情報分類装置は、標本情報受取部と、距離算出部と、統計情報算出部と、帰属度合評価部と、帰属先決定部と、母集団識別情報受渡部とを備える。情報端末は、標本情報受渡部と、母集団識別情報受取部とを備える。
[0071]
標本情報受渡部は、情報分類装置に分類対象標本情報を受渡す。標本情報受取部は、情報端末から分類対象標本情報を受取る。距離算出部は、標本情報受取部によって受取られた分類対象標本情報を含む任意数の標本情報と前記標本情報を含む任意数の母集団それぞれの重心との距離情報を距離評価関数を用いて算出する。
[0072]
統計情報算出部は、各母集団に帰属する標本情報それぞれに関連付けられた距離算出部によって算出された距離情報により構成された各距離情報群それぞれに基づいた標本距離の平均および標本距離の平均を中心とする標本距離の分散を用いて統計情報を算出する。帰属度合評価部は、距離算出部によって各母集団の重心と分類対象標本情報との距離を算出し、算出された距離に対して統計情報算出部によって算出された統計情報を用いた統計的検定を施すことで帰属度合を評価する。
[0073]
帰属先決定部は、帰属度合評価部によって評価された帰属度合に応じて、分類対象標本情報をいずれの母集団に帰属させるかを決定する。母集団識別情報受渡部は、帰属先決定部によって決定された母集団を識別する母集団識別情報を情報端末に受渡す。
[0074]
母集団識別情報受取部は、情報分類装置から母集団識別情報を受取る。
[0075]
この発明に従えば、標本情報を自律的かつ安定的に分類した母集団を与えることが可能な情報分類システムを用いて前記分類対象標本情報が帰属する母集団を検索するための前記任意数の母集団を記憶するデータベースを提供することができる。
[0076]
好ましくは、分類対象標本情報は、それぞれの要素に予め識別子が与えられた任意のベクトル情報、マトリクス情報またはテンソル情報であり、距離評価関数は、それぞれの要素に予め識別子が与えられた所定の構成要素態様のベクトル情報、マトリクス情報またはテンソル情報を入力とする関数であり、距離算出部は、任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素の識別子が所定の構
成要素態様の要素の識別子のそれぞれに対して同一の識別子となるように任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素を再構成して、距離評価関数に入力することによって距離情報を算出する。
[0077]
この発明に従えば、任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素の識別子が、距離評価関数へ入力されるベクトル情報、マトリクス情報またはテンソル情報の所定の構成要素態様の要素の識別子のそれぞれに対して同一の識別子となるように再構成されて距離評価関数に入力される。このため、構成要素態様が異なる標本情報同士を互いに評価することが可能な情報分類装置、情報分類システム、情報分類システムを用いた情報提供サービス、情報分類システムによって分類された分類後母集団を記録するコンピュータ読取可能な記録媒体、および、情報分類システムを用いて前記分類対象標本情報が帰属する母集団を検索するための前記任意数の母集団を記憶するデータベースを提供することができる。
[0078]
また、それらの要素に任意の分野における特徴量や名称、識別子を用いて評価関数や標本を構成し、標本の母集団への帰属状態を評価するようにしてもよいし、それらの評価関数を構成または再構成するようにしてもよい。
[0079]
好ましくは、分類対象標本情報は、それぞれの要素に予め識別子が与えられた任意のベクトル情報、マトリクス情報またはテンソル情報であり、距離評価関数は、それぞれの要素に予め識別子が与えられた所定の構成要素態様のベクトル情報、マトリクス情報またはテンソル情報を入力とする関数であり、統計情報を算出するステップは、任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素の識別子が所定の構成要素態様の要素の識別子のそれぞれに対して同一の識別子となるように任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素を再構成して、距離評価関数に入力することによって距離情報を算出する。
[0080]
この発明に従えば、任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素の識別子が、距離評価関数へ入力されるベクトル情報、マトリクス情報またはテンソル情報の所定の構成要素態様の要素の識別子のそれぞれに対して同一の識別子となるように再構成されて距離評価関数に入力される。このため、構成要素態様が異なる標本情報同士を互いに評価することが可能な情報分類方法、およ
[0117]
加して、ベイズ識別関数による多次元距離計算関数を構成できるが、この場合は
[0118]
[数9]
[0119]
という形で表現できる。
また、別の式表現として、
[0120]
[数10]
[0121]
補正のため、性能改善を目的として削除することにより、どの母集団に対しても均一の確率で評価されるようにしたり、前後の距離評価状況に基づいて評価結果を調節をするために遷移確率や出力確率に基づいた補正値を与えてもよい。
[0122]
そして
[0123]
[数11]
[0124]
という形で母集団重心からの距離に相当する値を導き出すことができる。
次に、ステップS12で、処理部110が、ステップS11で構築した距離関数で標本情報を評価し、評価距離を算出する。また、ステップS13で、処理部110は、ステップS12で算出した評価距離群それぞれの標本平均、標本分散、および、標本標準偏差を導出する。
[0125]
具体的には、構成された距離関数
[0126]
[数12]
[0127]
[0128]
[数13]
[0129]
離情報Da1,Da2,・・・,Dan,Db1,Db2,・・・,Dbmが求められる。このようにして求められ
,μDbと距離標準偏差σDa,σDbからなる統計情報が求められる。この際、a,bの群を識別する値は前述の式のiに代入される。
[0130]
[数14]
[0131]
[数15]
[0132]
次に、ステップS14で、処理部110は、ステップS12で算出された母集ごとの評価距離を正規化する。
[0133]
具体的には、距離関数
[0134]
[数16]
[0135]
[0136]
[数17]
[0137]
にも標本情報群a1,a2,・・・,an,b1,b2,・・・,bmを入力し得られた評価距離群である
[0225]
また、距離算出方法においては、マハラノビス距離ばかりではなくユークリッド距離やシティブロック距離、チェスボード距離、オクタゴナル距離、ヘクス距離、ミンコフスキー距離、類似度やそれらの距離に重み付け処理をした距離といった任意の距離算出方法や、固有値、固有ベクトルのどちらかだけを用いたり、どちらかの値を算術的に変化させることで統計的特徴を任意に変更した距離算出を行ったり、固有値自体や固有ベクトルのノルム、最大成分などを距離算出に用いてもよい。
[0226]
また、ヤコビ法、ランチョス法、標準固有値問題、固有値計算の解法、ハウスホルダー法、アーノルディ法、QR複合方式、シングルQR法、ダブルQR法、ガウス・ザイデル法、ガウス・ジョルダン法といった任意の方法で固有値や固有ベクトルを導出してもよい。
[0227]
また、この複数の母集団から得られる複数の距離情報自体を標本ベクトル情報と捕らえ、再度、固有値、固有ベクトル、固有ベクトルのノルムを得ることで、2次、3次のマハラノビス距離を導出することや複数の母集団の固有値や固有ベクトルを標本ベクトルとして捉えた場合のノルムや固有値、固有ベクトル、平均、分散、標準偏差といった情報を用いた距離算出も可能であり、これらの内容を再帰的、階層的に実施することでベイジアンネットワークのような構造を持たせたりする方法も容易に考えられる。
[0228]
また、分類前に母集団がなく母集団付けされていない時系列情報や形状情報においては、べき乗法などを用いた最大固有値と最大固有ベクトルの導出手段を用いて、過去の時系列情報や別形状情報から得られる固有値や固有ベクトルに基づいた平均やノルム、標準偏差値などの指標により最近の時系列情報や別形状情報における入力情報自体とのマハラノビス距離を評価することができる。
[0229]
また、最近の時系列情報や別形状情報から得られる固有値や固有ベクトルに基づいた平均やノルム、標準偏差値などの指標によりマハラノビス距離を評価することができる。
[0230]
このように評価された距離の平均や標準偏差値に基づいて情報を分類しながら、新規に母集団を構成し母集団付けを実施する方法を用いてもよい。
[0231]
また、距離算出にともなう条件分岐において、境界付近の値を乱数などにより確率
用いてもよい。
[0248]
また、検定手法である、グッドマン・クラスカルの係数を用いた検定、クラスカル・ワリス(Kruskal−Wallis)検定、片側検定、χ2検定、両側限定、正規分布の母平均の検定(母分散既知)、正規分布の母平均の検定(母分散未知)、t−検定、正規分布の母分散の検定、独立性の検定、分散に関する検定、平均値に関する検定、連の検定(runs test)、分散共分散行列に関する検定、多群判別の有効性の検定、Wilksのlambda統計量検定、多群判別での変数の寄与の検定、偏Λ統計量検定、Adichie−Koul検定、アンサリ・ブラッドレー(Ansari−Bradley)検定、コーエンのカッパ(Cohen’s Kappa)重み付きカッパ(Weighted Kappa)ダービン検定、ダービン・ワトソンの検定、固有値の検定(Bartlett)、Kolmogorov−Smirnov検定、コルモゴロフ・スミルノフの1標本検定、Lepage型検定、リリフォー検定、ログランク検定、Ansari−Bradley検定、Fisher(フィッシャー)の精密検定、Friedman(フリードマン)検定、F−検定、ホッジス・レーマン推定(Hodges−Lehmann Estimation)、Hotelling(ホテリング)のT2検定、Jonckheere検定、k×c分割表の(独立性の)カイ2乗検定、Klotzの正規スコア検定、Kolmogorov−Smirnov検定、Kruskal−Wallis検定、k個の母比率の均一性の検定、Mood検定、Moses検定、Page検定、ラン検定(Runs Test)、Linear by Linear連関検定(Linear by Linear Association Test)、層別データのCMH検定(CMH Test for Stratified Data)、ログランク検定(Logrank Test)、タロン・ウェアの傾向検定(Tarone−Ware Test for Trend)、フィッシャー・フリーマン・ホルトン検定(Fisher−Freeman−Halton Test)、ビアソンの積率相関係数(Pearson’s Product−Moment Correlation Coefficient)、ビアソンのカイ二乗検定(Pearson’s Chi−Square Test)、尤度比検定(Likelihood Ratio Test)、サベジのスコア検定(Savage Scores Test)、シャビロ・ウィルク検定(Shapiro−Wilk Test)、Siegal−Tukey検定、Tukey(チューキー)の加法性の検定、Wald検定、Watson検定、Wilcoxon型検定、Wilcoxon−Mann−Whitney検定、バートレット(Bartlett)の検定、Yatesの補正、Mann−Whitney(マン・フィットニー)検定といった各種標本検定,分割表の関連性の検定,独立性の検定,適合度検定といった任意の方法を、本実施形態における距離算出や帰属評価に用いてもよく、本発明は統計的確率的に距離評価関数を構成し、
を再度スコアリングしたりしても良い。
[0256]
このように、既知の関数や統計方法、スコアリング方法、分類方法、検定方法、最適化方法、統計的手法と組合わせることで、それぞれの方法の特性を利用した各種応用や性能改善、機能改善などが容易に考えられる。
[0257]
次に、各種サービスを実施する情報処理システムについて説明する。
たとえば、ロボットなどの動作機械における情報の関連付けに基づく動作学習においてある動作を構成するための変数と姿勢の名称との分類に本発明を用いてもよいし、その際姿勢の名称のみを通信回線を経由してロボットなどの装置に対して送信し、ロボットの遠隔ダンスサービス等の動作を分析的に処理し再利用する遠隔ロボット制御サービスを実施する情報処理システムや任意の駆動系機能を含む装置の運転および/もしくは制御方法の特徴学習による運転制御システムやサービスが考えられ、これらを用いた工作ロボットや整理ロボット、搬送ロボット、介護ロボット、愛玩ロボット、手伝いロボット、対話ロボット、家事ロボット、農業ロボットなどを作成しても良い。
[0258]
たとえば、本発明をロボットの思考や行動、判断に応用する場合、ロボットの行動によって得られるエネルギーを「過剰、適度、平衡、減衰、喪失」といった具合に消費されるエネルギーや摂取されるエネルギーや利用者の好評価に基づいて分類し、それらの分類にともなう周囲の画像や音声、温度、湿度、空気成分や匂い、液体・素材成分や味、重さや加速度、衝撃、圧力などのセンサ入力値や分析値といった特徴量と特徴量の遷移状態に基づく二次特徴量、二次特徴量の遷移状態に基づく三次特徴量といった特徴量の多次元的な組合わせによる高次特徴量を収集し本発明を用いて分類してもよい。この場合、前述の五つの分類はその分類の間をアナログに遷移してもよいし、より細かく分類して評価関数を構成してもよいし、1つもしくは任意数の変数による正負の値で表現してもよい。
[0259]
また、ロボットの思考や行動、判断における色々な評価関数の構成方法において、これらの変数が1つの変数であれば0付近、複数の変数であれば平衡状態を示す値である場合に、過去の分類においてエネルギーが取得された手順情報やエネルギーや利用者の好評価を獲得するコストを低減させる手順に分類された手順情報が入力された特徴量、つまり、エネルギーの獲得に成功した手順情報との距離が近い場
[0295]
また、想起される単語を言葉でない記号や分類コード、例えば、文字コードのような形容詞や副詞などを分類する感覚を分類する感覚コードや感性を分類する感性コード、感情を分類する感情コード、主観を分離する主観コード、視覚的形状を分類する形状コード番号などを構成して、そのコードと他の任意の情報を関連付けたり、複数の任意の情報同士、例えば、特徴量や認識された記号をそのようなコードを用いて関連付けたりすることで共起行列や文字数や単語数、管理番号、時間的位置的関係による共起距離の定義方法を構築する。そして、それらを用いて構築した概念辞書や概念素引を記憶媒体に記録する情報処理システムが考えられる。
[0296]
このように、情報選択、情報配信、情報提供、情報抽出、情報加工、情報分析、情報予測、情報伝達、情報分類、情報分離、情報翻訳、情報変換、情報要約、情報検素、情報探索、情報比較、情報評価、情報調査といった方法を応用し、任意の情報と任意の情報の関連付けをすることで、任意の情報や任意の商品、任意のサービスを提供もしくは支援する情報処理システムが構成できる。
[0297]
より具体的には、任意の特徴量を用いて前述の情報処理システム例に必要な情報の標本情報群を生成する。この標本は、音声や音楽であったり、絵画や写真、動画であったり、味覚や嗅覚を刺激する化学成分であったり、体感する温度や触覚であったり、計量可能な長さや重さや速度や位置といった情報であったり、文章であれば単語の出現頻度や共起確率であったり、文章特徴である出現文字頻度であったり、目的とする任意の情報を組合せて表現したり、それらを組合せたり加工したりすることで構成された特徴量であったり、それらの特徴量の構成比率であったりしてもよい。
[0298]
この際、これらの情報や特徴量などは最初の段階で人手によって、任意のID(Identification Data)やラベル、コードを分類された母集団に対し指定してもよいし、本実施形態を用いて全ての標本情報群の平均と分散から事前に分類していてもよい。
[0299]
このようにして任意の変数や係数で分類された標本情報は、母集団の数が安定するまで本実施形態の分類を再帰的に繰返し母集団が安定するまで実施した結果得られるラベルやID、コード、分類番号、整理番号、管理番号を、人の主観や任意の情報処理方法により再度特定のラベルやID、コード、分類番号、整理番号、管理番号にする。ラベルやID、コード、分類番号、整理番号、管理番号をデータベースの検
距離算出部は、距離評価関数再構築部により再構築された距離評価関数を用いて更新母集団のそれぞれに帰属する分類対象標本情報と更新母集団の重心との距離情報群をさらに算出する。
好ましくは、距離算出部は、固有値および固有ベクトルに基づいて、距離情報を算出する。
好ましくは、距離算出部は、距離情報としてベイズ識別関数による距離を算出する。
この発明に従えば、情報分類装置によって、距離情報が正規化される。その結果、情報分類装置によって、距離情報を容易に取扱うことができるようになる。
この発明に従えば、標本情報を自律的かつ安定的に分類した母集団を与えることが可能な情報分類システムを用いて前記分類対象標本情報が帰属する母集団を検索するための前記任意数の母集団を記憶するデータベースを提供することができる。
図1を参照して、情報分類装置100は、PC(Personal Computer)などのコンピュータで構成され、処理部110と、記憶部120と、入力部130と、出力部140とを含む。処理部110、記憶部120、入力部130、および、出力部140は、バスで接続され、バスを介して、必要なデータをやり取りする。
なお、この距離関数において引数
kは標本の識別値を表す。
Dikは距離関数
μは標本情報から得た平均ベクトルを示す。
数5および数9におけるViは母集団iの共分散行列を示す。
φiは母集団の共分散行列の固有ベクトルを示す。
λiは母集団の共分散行列の固有値を示す。
また、別の式表現として、
次に、ステップS12で、処理部110が、ステップS11で構築した距離関数で標本情報を評価し、評価距離を算出する。また、ステップS13で、処理部110は、ステップS12で算出した評価距離群それぞれの標本平均、標本分散、および、標本標準偏差を導出する。
数22もしくは数23のように平均として用いて、標本群の重心からの距離に対する標準偏差を求め、前述の手法における境界基準としてもよい。この場合、距離平均ではなく、母集団重心からの距離を評価基準とするため、固有値に基づく定数から求められた平均μDaとその平均に基づいた標準偏差σDaに従って、統計的確率密度関数により求められる出現確率もしくは帰属確率もしくは所属確率とすることで帰属境界となる距離を決めてもよい。
この実験は、あくまでも分類困難であった自然情報の一例として、人の音声情報を標本情報に用いることで、本実施形態により事前分類と認識結果に基づく事後分類の一致率が向上し分類数が減少する点から効率的な分類が実現できていることを確認するための実験である。
情報分類装置100は、記憶部120の母集団により分類された標本情報に対し処理部110を用いて、平均と分散を求め、共分散行列を構成し、記憶部120に保存する。
この実験に用いられる3σ範囲は母集団の99.7%程度を内包する範囲であり、統計的予測では検定境界である98%となる2σ付近の値がよい分類を実施できることも予想できる。
また、母集団における標本の尤度分布や出現確率分布、距離分布に基づく局所解を仮中心とみなし、その仮中心から各々の標本の距離を求め、得られた距離の平均と分散、標準偏差値により統計的に有意な範囲かどうかを弁別し母集団を分割や結合、変更してもよい。
たとえば、ロボットなどの動作機械における情報の関連付けに基づく動作学習においてある動作を構成するための変数と姿勢の名称との分類に本発明を用いてもよいし、その際姿勢の名称のみを通信回線を経由してロボットなどの装置に対して送信し、ロボットの遠隔ダンスサービス等の動作を分析的に処理し再利用する遠隔ロボット制御サービスを実施する情報処理システムや任意の駆動系機能を含む装置の運転および/もしくは制御方法の特徴学習による運転制御システムやサービスが考えられ、これらを用いた工作ロボットや整理ロボット、搬送ロボット、介護ロボット、愛玩ロボット、手伝いロボット、対話ロボット、家事ロボット、農業ロボットなどを作成しても良い。
また、音楽と音楽に基づいて想起される単語の関係を分析し関連情報を統計的に分類して任意の情報や商品、サービスを選択する情報処理システムが考えられる。
図6を参照して、情報分類システムは、情報処理装置100A,100B、および、情報端末200A〜200Cを含む。情報処理装置100A,100B、および、情報端末200A〜200Cは、それぞれ、インターネットや電話回線網などのネットワーク500を介して接続される。
情報分類装置100は、ある母集団Aに帰属するk個の標本akと母集団Aとの距離算出部を構成し、その距離算出部に基づいて距離Dkを求め、求められた各標本akの母集団Aとの距離を標本akと母集団Aの距離平均値μaと標準偏差値σaといった統計情報算出部を用いて得た値にしたがって、統計的な正規分布の出現確率により母集団への帰属度合を評価する。
次に、本実施の形態の変形例について説明する。例えば、図2のステップS12の距離評価において、評価用サンプルである
このような変換を行なう場合、過剰であるx3、x8は項目から削除し、z5には評価関数側でiとラベル付けされた評価関数構築時のサンプルにおける対称要素であるiラベルの平均値若しくは0を代入することで、評価関数と被評価ベクトルとの構成要素が異なっていても評価を可能とする。
Claims (26)
- 標本情報が含まれる任意数の母集団のそれぞれに帰属する標本情報の前記母集団ごとの重心と、分類対象標本情報との統計的距離を算出する距離算出手段(S11,S12,S14)と、
前記距離算出手段によって算出された統計的距離についての前記母集団ごとの統計情報を算出する統計情報算出手段(S13)と、
前記距離算出手段によって算出された統計的距離と前記統計情報算出手段によって算出された統計情報とに基づいて、分類対象標本情報の前記母集団への帰属度合を評価する帰属度合評価手段(S21,S25)と、
前記帰属度合評価手段によって評価された帰属度合に応じて、前記分類対象標本情報をいずれの母集団に帰属させるかを決定する帰属決定手段(S22,S26)と、
前記帰属決定手段によって決定された母集団に前記分類対象標本情報を帰属させる標本情報帰属手段(S23,S27)とを備える、情報分類装置。 - 前記統計情報は、前記距離算出手段によって算出された統計的距離の前記母集団ごとの平均値および標準偏差値である、請求項1に記載の情報分類装置。
- 前記距離算出手段は、前記標本情報帰属手段によって前記分類対象標本情報が帰属された更新母集団ごとの重心と、前記更新母集団のそれぞれに帰属する分類対象標本情報との統計的距離をさらに算出する(S33)、請求項1に記載の情報分類装置。
- 前記帰属決定手段は、いずれの母集団への帰属度合も所定の度合の範囲外であるときに、新たに母集団を生成する母集団生成手段を含み、生成した母集団に前記分類対象標本情報を帰属させることを決定する(S26,S27)、請求項1に記載の情報分類装置。
- 前記統計情報は、前記距離算出手段によって算出された統計的距離の前記母集団ごとの平均値および標準偏差値であり、
前記帰属度合は、その母集団に対する統計的距離の平均値からの偏差値であり、
前記所定の度合は、前記偏差値が前記平均値から所定倍の標準偏差値の範囲である、請求項4に記載の情報分類装置。 - 所定数の標本情報が帰属されない母集団を削除し、削除した母集団に帰属する標本情報を他の母集団に帰属させる母集団削除手段(S31)をさらに備える、請求項4に記載の情報分類装置。
- 前記帰属決定手段は、前記帰属度合評価手段によって評価された帰属度合が最も良い母集団に前記分類対象標本情報に帰属させることを決定する、請求項1に記載の情報分類装置。
- 前記距離算出手段は、共分散構造分析に基づいて、前記統計的距離を算出する、請求項1に記載の情報分類装置。
- 前記距離算出手段は、固有値および固有ベクトルに基づいて、前記統計的距離を算出する、請求項1に記載の情報分類装置。
- 前記距離算出手段は、前記統計的距離としてマハラノビス距離を算出する、請求項1に記載の情報分類装置。
- 前記距離算出手段は、前記統計的距離としてベイズ識別関数による距離を算出する、請求項1に記載の情報分類装置。
- 前記距離算出手段は、算出した統計的距離を正規化する距離正規化手段(S14)を含む、請求項1に記載の情報分類装置。
- コンピュータによって実行される情報分類方法であって、
標本情報が含まれる任意数の母集団のそれぞれに帰属する標本情報の前記母集団ごとの重心と、分類対象標本情報との統計的距離を算出するステップ(S11,S12,S14)と、
算出された統計的距離についての前記母集団ごとの統計情報を算出するステップ(S13)と、
算出された統計的距離と統計情報とに基づいて、分類対象標本情報の前記母集団への帰属度合を評価するステップ(S21,S25)と、
評価された帰属度合に応じて、前記分類対象標本情報をいずれの母集団に帰属させるかを決定するステップ(S22,S26)と、
決定された母集団に前記分類対象標本情報を帰属させるステップ(S23,S27)とを含む、情報分類方法。 - コンピュータで実行される情報分類プログラムであって、
標本情報が含まれる任意数の母集団のそれぞれに帰属する標本情報の前記母集団ごとの重心と、分類対象標本情報との統計的距離を算出するステップ(S11,S12,S14)と、
算出された統計的距離についての前記母集団ごとの統計情報を算出するステップ(S13)と、
算出された統計的距離と統計情報とに基づいて、分類対象標本情報の前記母集団への帰属度合を評価するステップ(S21,S25)と、
評価された帰属度合に応じて、前記分類対象標本情報をいずれの母集団に帰属させるかを決定するステップ(S22,S26)と、
決定された母集団に前記分類対象標本情報を帰属させるステップ(S23,S27)とをコンピュータに実行させる、情報分類プログラム。 - 情報分類装置(100A,100B)と、前記情報分類装置と通信回線(500)を介して接続される情報端末(200A,200B,200C)とを含み、
前記情報分類装置は、
前記情報端末から標本情報が含まれる任意数の母集団を受取る母集団受取手段と、
前記母集団受付手段によって受付けられた母集団のそれぞれに帰属する標本情報の前記母集団ごとの重心と、分類対象標本情報との統計的距離を算出する距離算出手段(S11,S12,S14)と、
前記距離算出手段によって算出された統計的距離についての前記母集団ごとの統計情報を算出する統計情報算出手段(S13)と、
前記距離算出手段によって算出された統計的距離と前記統計情報算出手段によって算出された統計情報とに基づいて、分類対象標本情報の前記母集団への帰属度合を評価する帰属度合評価手段(S21,S25)と、
前記帰属度合評価手段によって評価された帰属度合に応じて、前記分類対象標本情報をいずれの母集団に帰属させるかを決定する帰属決定手段(S22,S26)と、
前記帰属決定手段によって決定された母集団に前記分類対象標本情報を帰属させる標本情報帰属手段(S23,S27)と、
前記標本情報帰属手段によって前記分類対象標本情報が帰属された分類後母集団を前記情報端末に受渡す分類後母集団受渡手段とを備え、
前記情報端末は、
前記情報分類装置に前記任意数の母集団を受渡す母集団受渡手段と、
前記情報分類装置から前記分類後母集団を受取る分類後母集団受取手段とを備える、情報分類システム。 - 情報分類装置(100A,100B)と、前記情報分類装置と通信回線(500)を介して接続される情報端末(200A,200B,200C)とを含み、
前記情報分類装置は、
前記情報端末から分類対象標本情報を受取る標本情報受取手段と、
標本情報が含まれる任意数の母集団のそれぞれに帰属する標本情報の前記母集団ごとの重心と、前記母集団受取手段によって受取られた分類対象標本情報との統計的距離を算出する距離算出手段(S11,S12,S14)と、
前記距離算出手段によって算出された統計的距離についての前記母集団ごとの統計情報を算出する統計情報算出手段(S13)と、
前記距離算出手段によって算出された統計的距離と前記統計情報算出手段によって算出された統計情報とに基づいて、分類対象標本情報の前記母集団への帰属度合を評価する帰属度合評価手段(S21,S25)と、
前記帰属度合評価手段によって評価された帰属度合に応じて、前記分類対象標本情報をいずれの母集団に帰属させるかを決定する帰属決定手段(S22,S26)と、
前記帰属決定手段によって決定された母集団を識別する母集団識別情報を前記情報端末に受渡す母集団識別情報受渡手段とを備え、
前記情報端末は、
前記情報分類装置に前記分類対象標本情報を受渡す標本情報受渡手段と、
前記情報分類装置から前記母集団識別情報を受取る母集団識別情報受取手段とを備える、情報分類システム。 - 情報分類装置(100A,100B)と、前記情報分類装置と通信回線(500)を介して接続される情報端末(200A,200B,200C)とを含み、
前記情報分類装置は、
前記情報端末から分類対象標本情報を受取る標本情報受取手段と、
標本情報が含まれる任意数の母集団のそれぞれに帰属する標本情報の前記母集団ごとの重心と、前記母集団受取手段によって受取られた分類対象標本情報との統計的距離を算出する距離算出手段(S11,S12,S14)と、
前記距離算出手段によって算出された統計的距離についての前記母集団ごとの統計情報を算出する統計情報算出手段(S13)と、
前記距離算出手段によって算出された統計的距離と前記統計情報算出手段によって算出された統計情報とに基づいて、分類対象標本情報の前記母集団への帰属度合を評価する帰属度合評価手段(S21,S25)と、
前記帰属度合評価手段によって評価された帰属度合に応じて、前記分類対象標本情報をいずれの母集団に帰属させるかを決定する帰属決定手段(S22,S26)と、
前記帰属決定手段によって決定された母集団を識別する母集団識別情報を前記情報端末に受渡す母集団識別情報受渡手段とを備え、
前記情報端末は、
前記情報分類装置に前記分類対象標本情報を受渡す標本情報受渡手段と、
前記情報分類装置から前記母集団識別情報を受取る母集団識別情報受取手段とを備える、情報分類システムを用いた情報提供サービス。 - 情報分類装置(100A,100B)と、前記情報分類装置と通信回線(500)を介して接続される情報端末(200A,200B,200C)とを含み、
前記情報分類装置は、
前記情報端末から標本情報が含まれる任意数の母集団を受取る母集団受取手段と、
前記母集団受付手段によって受付けられた母集団のそれぞれに帰属する標本情報の前記母集団ごとの重心と、分類対象標本情報との統計的距離を算出する距離算出手段(S11,S12,S14)と、
前記距離算出手段によって算出された統計的距離についての前記母集団ごとの統計情報を算出する統計情報算出手段(S13)と、
前記距離算出手段によって算出された統計的距離と前記統計情報算出手段によって算出された統計情報とに基づいて、分類対象標本情報の前記母集団への帰属度合を評価する帰属度合評価手段(S21,S25)と、
前記帰属度合評価手段によって評価された帰属度合に応じて、前記分類対象標本情報をいずれの母集団に帰属させるかを決定する帰属決定手段(S22,S26)と、
前記帰属決定手段によって決定された母集団に前記分類対象標本情報を帰属させる標本情報帰属手段(S23,S27)と、
前記標本情報帰属手段によって前記分類対象標本情報が帰属された分類後母集団を前記情報端末に受渡す分類後母集団受渡手段とを備え、
前記情報端末は、
前記情報分類装置に前記任意数の母集団を受渡す母集団受渡手段と、
前記情報分類装置から前記分類後母集団を受取る分類後母集団受取手段とを備える、情報分類システムによって分類された分類後母集団を記録するコンピュータ読取可能な記録媒体。 - 情報分類装置(100A,100B)と、前記情報分類装置と通信回線(500)を介して接続される情報端末(200A,200B,200C)とを含み、
前記情報分類装置は、
前記情報端末から分類対象標本情報を受取る標本情報受取手段と、
標本情報が含まれる任意数の母集団のそれぞれに帰属する標本情報の前記母集団ごとの重心と、前記母集団受取手段によって受取られた分類対象標本情報との統計的距離を算出する距離算出手段(S11,S12,S14)と、
前記距離算出手段によって算出された統計的距離についての前記母集団ごとの統計情報を算出する統計情報算出手段(S13)と、
前記距離算出手段によって算出された統計的距離と前記統計情報算出手段によって算出された統計情報とに基づいて、分類対象標本情報の前記母集団への帰属度合を評価する帰属度合評価手段(S21,S25)と、
前記帰属度合評価手段によって評価された帰属度合に応じて、前記分類対象標本情報をいずれの母集団に帰属させるかを決定する帰属決定手段(S22,S26)と、
前記帰属決定手段によって決定された母集団を識別する母集団識別情報を前記情報端末に受渡す母集団識別情報受渡手段とを備え、
前記情報端末は、
前記情報分類装置に前記分類対象標本情報を受渡す標本情報受渡手段と、
前記情報分類装置から前記母集団識別情報を受取る母集団識別情報受取手段とを備える、情報分類システムを用いて前記分類対象標本情報が帰属する母集団を検索するための前記任意数の母集団を記憶するデータベース。 - 前記分類対象標本情報は、それぞれの要素に予め識別子が与えられた任意のベクトル情報、マトリクス情報またはテンソル情報であり、
所定の評価関数は、それぞれの要素に予め識別子が与えられた所定の構成要素態様のベクトル情報、マトリクス情報またはテンソル情報を入力とする関数であり、
前記距離算出手段は、前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素の識別子が前記所定の構成要素態様の要素の識別子のそれぞれに対して同一の識別子となるように前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素を再構成して、前記所定の評価関数に入力することによって前記統計的距離を算出することを特徴とする、請求項1に記載の情報分類装置。 - 前記分類対象標本情報は、それぞれの要素に予め識別子が与えられた任意のベクトル情報、マトリクス情報またはテンソル情報であり、
所定の評価関数は、それぞれの要素に予め識別子が与えられた所定の構成要素態様のベクトル情報、マトリクス情報またはテンソル情報を入力とする関数であり、
前記統計的距離を算出するステップは、前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素の識別子が前記所定の構成要素態様の要素の識別子のそれぞれに対して同一の識別子となるように前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素を再構成して、前記所定の評価関数に入力することによって前記統計的距離を算出することを特徴とする、請求項13に記載の情報分類方法。 - 前記分類対象標本情報は、それぞれの要素に予め識別子が与えられた任意のベクトル情報、マトリクス情報またはテンソル情報であり、
所定の評価関数は、それぞれの要素に予め識別子が与えられた所定の構成要素態様のベクトル情報、マトリクス情報またはテンソル情報を入力とする関数であり、
前記統計的距離を算出するステップは、前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素の識別子が前記所定の構成要素態様の要素の識別子のそれぞれに対して同一の識別子となるように前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素を再構成して、前記所定の評価関数に入力することによって前記統計的距離を算出することを特徴とする、請求項14に記載の情報分類プログラム。 - 前記分類対象標本情報は、それぞれの要素に予め識別子が与えられた任意のベクトル情報、マトリクス情報またはテンソル情報であり、
所定の評価関数は、それぞれの要素に予め識別子が与えられた所定の構成要素態様のベクトル情報、マトリクス情報またはテンソル情報を入力とする関数であり、
前記距離算出手段は、前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素の識別子が前記所定の構成要素態様の要素の識別子のそれぞれに対して同一の識別子となるように前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素を再構成して、前記所定の評価関数に入力することによって前記統計的距離を算出することを特徴とする、請求項15または請求項16に記載の情報分類システム。 - 前記分類対象標本情報は、それぞれの要素に予め識別子が与えられた任意のベクトル情報、マトリクス情報またはテンソル情報であり、
所定の評価関数は、それぞれの要素に予め識別子が与えられた所定の構成要素態様のベクトル情報、マトリクス情報またはテンソル情報を入力とする関数であり、
前記距離算出手段は、前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素の識別子が前記所定の構成要素態様の要素の識別子のそれぞれに対して同一の識別子となるように前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素を再構成して、前記所定の評価関数に入力することによって前記統計的距離を算出することを特徴とする、請求項17に記載の情報分類システムを用いた情報提供サービス。 - 前記分類対象標本情報は、それぞれの要素に予め識別子が与えられた任意のベクトル情報、マトリクス情報またはテンソル情報であり、
所定の評価関数は、それぞれの要素に予め識別子が与えられた所定の構成要素態様のベクトル情報、マトリクス情報またはテンソル情報を入力とする関数であり、
前記距離算出手段は、前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素の識別子が前記所定の構成要素態様の要素の識別子のそれぞれに対して同一の識別子となるように前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素を再構成して、前記所定の評価関数に入力することによって前記統計的距離を算出することを特徴とする、請求項18に記載の情報分類システムによって分類された分類後母集団を記録するコンピュータ読取可能な記録媒体。 - 前記分類対象標本情報は、それぞれの要素に予め識別子が与えられた任意のベクトル情報、マトリクス情報またはテンソル情報であり、
所定の評価関数は、それぞれの要素に予め識別子が与えられた所定の構成要素態様のベクトル情報、マトリクス情報またはテンソル情報を入力とする関数であり、
前記距離算出手段は、前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素の識別子が前記所定の構成要素態様の要素の識別子のそれぞれに対して同一の識別子となるように前記任意のベクトル情報、マトリクス情報またはテンソル情報のそれぞれの要素を再構成して、前記所定の評価関数に入力することによって前記統計的距離を算出することを特徴とする、請求項19に記載の情報分類システムを用いて前記分類対象標本情報が帰属する母集団を検索するための前記任意数の母集団を記憶するデータベース。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004340723 | 2004-11-25 | ||
JP2004340723 | 2004-11-25 | ||
JP2005147048 | 2005-05-19 | ||
JP2005147048 | 2005-05-19 | ||
PCT/JP2005/021095 WO2006087854A1 (ja) | 2004-11-25 | 2005-11-17 | 情報分類装置、情報分類方法、情報分類プログラム、情報分類システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2006087854A1 true JPWO2006087854A1 (ja) | 2008-08-07 |
JP4550882B2 JP4550882B2 (ja) | 2010-09-22 |
Family
ID=36916267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007503580A Expired - Fee Related JP4550882B2 (ja) | 2004-11-25 | 2005-11-17 | 情報分類装置、情報分類方法、情報分類プログラム、情報分類システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US7693683B2 (ja) |
JP (1) | JP4550882B2 (ja) |
WO (1) | WO2006087854A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016071419A (ja) * | 2014-09-26 | 2016-05-09 | 大日本印刷株式会社 | 変動データ管理システム及びその特異性検出方法 |
Families Citing this family (176)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7245923B2 (en) * | 2003-11-20 | 2007-07-17 | Intelligent Spatial Technologies | Mobile device and geographic information system background and summary of the related art |
US8060112B2 (en) * | 2003-11-20 | 2011-11-15 | Intellient Spatial Technologies, Inc. | Mobile device and geographic information system background and summary of the related art |
DE102004008225B4 (de) * | 2004-02-19 | 2006-02-16 | Infineon Technologies Ag | Verfahren und Einrichtung zum Ermitteln von Merkmalsvektoren aus einem Signal zur Mustererkennung, Verfahren und Einrichtung zur Mustererkennung sowie computerlesbare Speichermedien |
US7880154B2 (en) | 2005-07-25 | 2011-02-01 | Karl Otto | Methods and apparatus for the planning and delivery of radiation treatments |
JP5074394B2 (ja) * | 2005-07-25 | 2012-11-14 | オットー、カール | 放射線治療の計画及び照射方法並びに装置 |
US7418341B2 (en) * | 2005-09-12 | 2008-08-26 | Intelligent Spatial Technologies | System and method for the selection of a unique geographic feature |
US20070179970A1 (en) * | 2006-01-31 | 2007-08-02 | Carli Connally | Methods and apparatus for storing and formatting data |
US7603351B2 (en) * | 2006-04-19 | 2009-10-13 | Apple Inc. | Semantic reconstruction |
EP3336765A1 (en) * | 2006-05-10 | 2018-06-20 | Nikon Corporation | Object recognition device, object recognition program, and image search service providing method |
US8694302B1 (en) * | 2006-05-31 | 2014-04-08 | Worldwide Pro Ltd. | Solving a hierarchical circuit network using a Barycenter compact model |
US8538676B2 (en) * | 2006-06-30 | 2013-09-17 | IPointer, Inc. | Mobile geographic information system and method |
US7707533B2 (en) * | 2006-07-21 | 2010-04-27 | Solido Design Automation Inc. | Data-mining-based knowledge extraction and visualization of analog/mixed-signal/custom digital circuit design flow |
US10957217B2 (en) | 2006-08-25 | 2021-03-23 | Ronald A. Weitzman | Population-sample regression in the estimation of population proportions |
US11151895B2 (en) * | 2006-08-25 | 2021-10-19 | Ronald Weitzman | Population-sample regression in the estimation of population proportions |
JP4824518B2 (ja) * | 2006-10-05 | 2011-11-30 | 株式会社日立製作所 | ガスタービンの性能診断システムと診断方法及び表示画面 |
US8744883B2 (en) * | 2006-12-19 | 2014-06-03 | Yahoo! Inc. | System and method for labeling a content item based on a posterior probability distribution |
US20080154811A1 (en) * | 2006-12-21 | 2008-06-26 | Caterpillar Inc. | Method and system for verifying virtual sensors |
US7880621B2 (en) * | 2006-12-22 | 2011-02-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Distraction estimator |
JP2008203935A (ja) * | 2007-02-16 | 2008-09-04 | Nagoya Institute Of Technology | 迷惑メール判別方法 |
USRE46953E1 (en) | 2007-04-20 | 2018-07-17 | University Of Maryland, Baltimore | Single-arc dose painting for precision radiation therapy |
JP5024668B2 (ja) * | 2007-07-10 | 2012-09-12 | 富士ゼロックス株式会社 | 画像形成装置および情報処理装置 |
JP4967928B2 (ja) * | 2007-08-27 | 2012-07-04 | ヤマハ株式会社 | 音声処理装置およびプログラム |
US8224468B2 (en) * | 2007-11-02 | 2012-07-17 | Caterpillar Inc. | Calibration certificate for virtual sensor network (VSN) |
US8036764B2 (en) * | 2007-11-02 | 2011-10-11 | Caterpillar Inc. | Virtual sensor network (VSN) system and method |
JP2009151540A (ja) * | 2007-12-20 | 2009-07-09 | Fuji Xerox Co Ltd | 関連要素検索装置、及び関連要素検索プログラム |
WO2010013472A1 (ja) | 2008-07-30 | 2010-02-04 | 日本電気株式会社 | データ分類システム、データ分類方法、及びデータ分類プログラム |
WO2010013473A1 (ja) * | 2008-07-30 | 2010-02-04 | 日本電気株式会社 | データ分類システム、データ分類方法、及びデータ分類プログラム |
US7917333B2 (en) | 2008-08-20 | 2011-03-29 | Caterpillar Inc. | Virtual sensor network (VSN) based control system and method |
TW201009627A (en) * | 2008-08-20 | 2010-03-01 | Inotera Memories Inc | Method for diagnosing tool capability |
US20100129780A1 (en) * | 2008-09-12 | 2010-05-27 | Nike, Inc. | Athletic performance rating system |
US20130079907A1 (en) * | 2008-09-12 | 2013-03-28 | Kristopher L Homsi | Golf athleticism rating system |
US7809195B1 (en) * | 2008-09-18 | 2010-10-05 | Ernest Greene | Encoding system providing discrimination, classification, and recognition of shapes and patterns |
WO2010051414A1 (en) * | 2008-10-30 | 2010-05-06 | Ford Global Technologies, Llc | Vehicle and method for advising driver of same |
US8549016B2 (en) * | 2008-11-14 | 2013-10-01 | Palo Alto Research Center Incorporated | System and method for providing robust topic identification in social indexes |
US20100145990A1 (en) * | 2008-12-09 | 2010-06-10 | Washington University In St. Louis | Selection and performance of hosted and distributed imaging analysis services |
WO2010075456A1 (en) * | 2008-12-22 | 2010-07-01 | Intelligent Spatial Technologies, Inc. | System and method for initiating actions and providing feedback by pointing at object of interest |
US8412493B2 (en) * | 2008-12-22 | 2013-04-02 | International Business Machines Corporation | Multi-dimensional model generation for determining service performance |
WO2010075455A1 (en) | 2008-12-22 | 2010-07-01 | Intelligent Spatial Technologies, Inc. | System and method for exploring 3d scenes by pointing at a reference object |
JP5436574B2 (ja) | 2008-12-22 | 2014-03-05 | インテリジェント スペイシャル テクノロジーズ,インク. | ポインティングによって現実世界のオブジェクトとオブジェクト表現とをリンクさせるシステム及び方法 |
US8483519B2 (en) | 2008-12-22 | 2013-07-09 | Ipointer Inc. | Mobile image search and indexing system and method |
US8443278B2 (en) | 2009-01-02 | 2013-05-14 | Apple Inc. | Identification of tables in an unstructured document |
US9672293B2 (en) * | 2009-01-12 | 2017-06-06 | Namesforlife, Llc | Systems and methods for automatically identifying and linking names in digital resources |
JP5412531B2 (ja) * | 2009-01-29 | 2014-02-12 | ナイキ インターナショナル リミテッド | アスレチック能力評価システム及びコンピュータストレージ媒体 |
US20100205034A1 (en) * | 2009-02-09 | 2010-08-12 | William Kelly Zimmerman | Methods and apparatus to model consumer awareness for changing products in a consumer purchase model |
US8972899B2 (en) | 2009-02-10 | 2015-03-03 | Ayasdi, Inc. | Systems and methods for visualization of data analysis |
US20100211894A1 (en) * | 2009-02-18 | 2010-08-19 | Google Inc. | Identifying Object Using Generative Model |
US8285414B2 (en) * | 2009-03-31 | 2012-10-09 | International Business Machines Corporation | Method and system for evaluating a machine tool operating characteristics |
WO2010117581A1 (en) * | 2009-04-08 | 2010-10-14 | Google Inc. | Similarity-based feature set supplementation for classification |
BRPI1014970A2 (pt) * | 2009-04-16 | 2017-03-28 | Noke Int Ltd | sistema de ranqueamento de desempenho atlético. |
CN102413881A (zh) * | 2009-05-01 | 2012-04-11 | 耐克国际有限公司 | 一种运动能力评级*** |
US20100306028A1 (en) * | 2009-06-02 | 2010-12-02 | Wagner John G | Methods and apparatus to model with ghost groups |
US8566258B2 (en) * | 2009-07-10 | 2013-10-22 | Sony Corporation | Markovian-sequence generator and new methods of generating Markovian sequences |
US9092668B2 (en) * | 2009-07-18 | 2015-07-28 | ABBYY Development | Identifying picture areas based on gradient image analysis |
DE102009057583A1 (de) * | 2009-09-04 | 2011-03-10 | Siemens Aktiengesellschaft | Vorrichtung und Verfahren zur Erzeugung einer zielgerichteten realitätsnahen Bewegung von Teilchen entlang kürzester Wege bezüglich beliebiger Abstandsgewichtungen für Personen- und Objektstromsimulationen |
US20110071874A1 (en) * | 2009-09-21 | 2011-03-24 | Noemie Schneersohn | Methods and apparatus to perform choice modeling with substitutability data |
US8738228B2 (en) * | 2009-10-30 | 2014-05-27 | Ford Global Technologies, Llc | Vehicle and method of tuning performance of same |
DE112009005330T5 (de) | 2009-10-30 | 2012-11-22 | Ford Global Technologies, Llc | Fahrzeug mit Identifikationssystem |
US8886365B2 (en) * | 2009-10-30 | 2014-11-11 | Ford Global Technologies, Llc | Vehicle and method for advising driver of same |
US8258934B2 (en) * | 2009-10-30 | 2012-09-04 | Ford Global Technologies, Llc | Vehicle and method of advising a driver therein |
JP2011138194A (ja) * | 2009-12-25 | 2011-07-14 | Sony Corp | 情報処理装置、情報処理方法およびプログラム |
JP5250576B2 (ja) * | 2010-02-25 | 2013-07-31 | 日本電信電話株式会社 | ユーザ判定装置、方法、プログラム及びコンテンツ配信システム |
US8543598B2 (en) * | 2010-03-01 | 2013-09-24 | Microsoft Corporation | Semantic object characterization and search |
US8903837B2 (en) * | 2010-04-13 | 2014-12-02 | Yahoo!, Inc. | Incorporating geographical locations in a search process |
US8548255B2 (en) * | 2010-04-15 | 2013-10-01 | Nokia Corporation | Method and apparatus for visual search stability |
US8490056B2 (en) * | 2010-04-28 | 2013-07-16 | International Business Machines Corporation | Automatic identification of subroutines from test scripts |
WO2011160235A1 (en) | 2010-06-22 | 2011-12-29 | Karl Otto | System and method for estimating and manipulating estimated radiation dose |
TWI537845B (zh) * | 2010-10-20 | 2016-06-11 | 華亞科技股份有限公司 | 半導體製程管制規格之制定方法 |
US8676623B2 (en) * | 2010-11-18 | 2014-03-18 | Navteq B.V. | Building directory aided navigation |
US9159128B2 (en) | 2011-01-13 | 2015-10-13 | Rutgers, The State University Of New Jersey | Enhanced multi-protocol analysis via intelligent supervised embedding (empravise) for multimodal data fusion |
US9317580B2 (en) * | 2011-02-04 | 2016-04-19 | Koninklijke Philips N.V. | Imaging protocol update and/or recommender |
US10600136B2 (en) * | 2011-02-04 | 2020-03-24 | Koninklijke Philips N.V. | Identification of medical concepts for imaging protocol selection |
US8484024B2 (en) | 2011-02-24 | 2013-07-09 | Nuance Communications, Inc. | Phonetic features for speech recognition |
US20120223227A1 (en) * | 2011-03-04 | 2012-09-06 | Chien-Huei Chen | Apparatus and methods for real-time three-dimensional sem imaging and viewing of semiconductor wafers |
US20120259676A1 (en) | 2011-04-07 | 2012-10-11 | Wagner John G | Methods and apparatus to model consumer choice sourcing |
US8903825B2 (en) | 2011-05-24 | 2014-12-02 | Namesforlife Llc | Semiotic indexing of digital resources |
US8793004B2 (en) | 2011-06-15 | 2014-07-29 | Caterpillar Inc. | Virtual sensor system and method for generating output parameters |
WO2013055704A1 (en) * | 2011-10-10 | 2013-04-18 | Ayasdi, Inc. | Systems and methods for mapping new patient information to historic outcomes for treatment assistance |
US8805008B1 (en) * | 2011-11-02 | 2014-08-12 | The Boeing Company | Tracking closely spaced objects in images |
CN102521602B (zh) * | 2011-11-17 | 2013-09-25 | 西安电子科技大学 | 基于条件随机场和最小距离法的超光谱图像分类方法 |
US9311383B1 (en) | 2012-01-13 | 2016-04-12 | The Nielsen Company (Us), Llc | Optimal solution identification system and method |
JP5971794B2 (ja) * | 2012-04-20 | 2016-08-17 | 有限会社アイ・アール・ディー | 特許調査支援装置、特許調査支援方法、およびプログラム |
JP5912813B2 (ja) * | 2012-04-26 | 2016-04-27 | 有限会社アイ・アール・ディー | 特許調査結果評価装置、特許調査結果評価方法、およびプログラム |
US9336302B1 (en) | 2012-07-20 | 2016-05-10 | Zuci Realty Llc | Insight and algorithmic clustering for automated synthesis |
US9183600B2 (en) | 2013-01-10 | 2015-11-10 | International Business Machines Corporation | Technology prediction |
WO2014115254A1 (ja) * | 2013-01-23 | 2014-07-31 | 株式会社日立製作所 | シミュレーションシステム、およびシミュレーション方法 |
US9704136B2 (en) | 2013-01-31 | 2017-07-11 | Hewlett Packard Enterprise Development Lp | Identifying subsets of signifiers to analyze |
US8914416B2 (en) | 2013-01-31 | 2014-12-16 | Hewlett-Packard Development Company, L.P. | Semantics graphs for enterprise communication networks |
US9355166B2 (en) | 2013-01-31 | 2016-05-31 | Hewlett Packard Enterprise Development Lp | Clustering signifiers in a semantics graph |
AU2013378058B2 (en) * | 2013-02-14 | 2017-04-20 | Exxonmobil Upstream Research Company | Detecting subsurface structures |
US9785995B2 (en) | 2013-03-15 | 2017-10-10 | The Nielsen Company (Us), Llc | Method and apparatus for interactive evolutionary algorithms with respondent directed breeding |
WO2014143729A1 (en) | 2013-03-15 | 2014-09-18 | Affinnova, Inc. | Method and apparatus for interactive evolutionary optimization of concepts |
CN103309448A (zh) * | 2013-05-31 | 2013-09-18 | 华东师范大学 | 一种加入符号序列匹配的基于三维加速度的手势识别方法 |
CN104346354B (zh) | 2013-07-29 | 2017-12-01 | 阿里巴巴集团控股有限公司 | 一种提供推荐词的方法及装置 |
US9841463B2 (en) * | 2014-02-27 | 2017-12-12 | Invently Automotive Inc. | Method and system for predicting energy consumption of a vehicle using a statistical model |
US10599705B2 (en) | 2014-03-20 | 2020-03-24 | Gracenote Digital Ventures, Llc | Retrieving and playing out media content for a personalized playlist including a content placeholder |
WO2015172017A1 (en) * | 2014-05-08 | 2015-11-12 | Medical Care Corporation | Systems and methods for assessing human cognition, including a quantitative approach to assessing executive function |
US20150331930A1 (en) * | 2014-05-16 | 2015-11-19 | Here Global B.V. | Method and apparatus for classification of media based on metadata |
US20150363450A1 (en) * | 2014-06-12 | 2015-12-17 | National Chiao Tung University | Bayesian sequential partition system in multi-dimensional data space and counting engine thereof |
US20160004794A1 (en) * | 2014-07-02 | 2016-01-07 | General Electric Company | System and method using generative model to supplement incomplete industrial plant information |
US10062033B2 (en) * | 2014-09-26 | 2018-08-28 | Disney Enterprises, Inc. | Analysis of team behaviors using role and formation information |
US11093845B2 (en) * | 2015-05-22 | 2021-08-17 | Fair Isaac Corporation | Tree pathway analysis for signature inference |
US9665735B2 (en) * | 2015-02-05 | 2017-05-30 | Bank Of America Corporation | Privacy fractal mirroring of transaction data |
US10270609B2 (en) * | 2015-02-24 | 2019-04-23 | BrainofT Inc. | Automatically learning and controlling connected devices |
WO2016147173A1 (en) * | 2015-03-13 | 2016-09-22 | Project Ray Ltd | System and method for assessing user attention while driving |
US10147108B2 (en) | 2015-04-02 | 2018-12-04 | The Nielsen Company (Us), Llc | Methods and apparatus to identify affinity between segment attributes and product characteristics |
US10542961B2 (en) | 2015-06-15 | 2020-01-28 | The Research Foundation For The State University Of New York | System and method for infrasonic cardiac monitoring |
CN106295351B (zh) * | 2015-06-24 | 2019-03-19 | 阿里巴巴集团控股有限公司 | 一种风险识别方法及装置 |
US20170083920A1 (en) * | 2015-09-21 | 2017-03-23 | Fair Isaac Corporation | Hybrid method of decision tree and clustering technology |
US9882807B2 (en) * | 2015-11-11 | 2018-01-30 | International Business Machines Corporation | Network traffic classification |
EP3373089B1 (en) * | 2016-01-13 | 2021-03-10 | Mitsubishi Electric Corporation | Operating state classification device |
US10605470B1 (en) | 2016-03-08 | 2020-03-31 | BrainofT Inc. | Controlling connected devices using an optimization function |
JP6636620B2 (ja) * | 2016-04-27 | 2020-01-29 | 富士フイルム株式会社 | 指標生成方法、測定方法、及び指標生成装置 |
KR101830522B1 (ko) * | 2016-08-22 | 2018-02-21 | 가톨릭대학교 산학협력단 | 빅 데이터를 이용한 예측 대상 지역의 범죄 발생 예측 방법 |
US9946958B1 (en) * | 2016-10-14 | 2018-04-17 | Cloudera, Inc. | Image processing system and method |
US10216899B2 (en) * | 2016-10-20 | 2019-02-26 | Hewlett Packard Enterprise Development Lp | Sentence construction for DNA classification |
US10157613B2 (en) | 2016-11-17 | 2018-12-18 | BrainofT Inc. | Controlling connected devices using a relationship graph |
US10931758B2 (en) | 2016-11-17 | 2021-02-23 | BrainofT Inc. | Utilizing context information of environment component regions for event/activity prediction |
US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
US10739733B1 (en) | 2017-02-01 | 2020-08-11 | BrainofT Inc. | Interactive environmental controller |
CN106874599B (zh) * | 2017-02-17 | 2019-07-09 | 武汉大学 | 快速生成卵石碎石夹杂的混凝土三维随机骨料模型的方法 |
US10067746B1 (en) * | 2017-03-02 | 2018-09-04 | Futurewei Technologies, Inc. | Approximate random number generator by empirical cumulative distribution function |
ES2655544B1 (es) * | 2017-03-29 | 2018-10-26 | Ignacio GOMEZ MAQUEDA | Método y sistema para la monitorización de seres vivos |
US10365893B2 (en) | 2017-03-30 | 2019-07-30 | Futurewei Technologies, Inc. | Sample-based multidimensional data cloning |
CN107515842B (zh) * | 2017-07-19 | 2018-06-19 | 中南大学 | 一种城市人口密度动态预测方法及*** |
US10922334B2 (en) * | 2017-08-11 | 2021-02-16 | Conduent Business Services, Llc | Mixture model based time-series clustering of crime data across spatial entities |
WO2019060200A1 (en) * | 2017-09-19 | 2019-03-28 | Dharma Platform, Inc. | AUTOMATIC DATA SWITCHING |
CN108304853B (zh) * | 2017-10-10 | 2022-11-08 | 腾讯科技(深圳)有限公司 | 游戏相关度的获取方法、装置、存储介质和电子装置 |
EP3471107A1 (en) * | 2017-10-12 | 2019-04-17 | Fresenius Medical Care Deutschland GmbH | Medical device and computer-implemented method of predicting risk, occurrence or progression of adverse health conditions in test subjects in subpopulations arbitrarily selected from a total population |
US11062216B2 (en) * | 2017-11-21 | 2021-07-13 | International Business Machines Corporation | Prediction of olfactory and taste perception through semantic encoding |
JP6457058B1 (ja) * | 2017-12-06 | 2019-01-23 | 株式会社ゴールドアイピー | 知的財産システム、知的財産支援方法および知的財産支援プログラム |
RU2699573C2 (ru) | 2017-12-15 | 2019-09-06 | Общество С Ограниченной Ответственностью "Яндекс" | Способы и системы для создания значений общего критерия оценки |
CN108243191B (zh) * | 2018-01-10 | 2019-08-23 | 武汉斗鱼网络科技有限公司 | 风险行为识别方法、存储介质、设备及*** |
CN108304875A (zh) * | 2018-01-31 | 2018-07-20 | 中国科学院武汉岩土力学研究所 | 一种基于统计判别分类的***块度预测方法 |
GB201802440D0 (en) * | 2018-02-14 | 2018-03-28 | Jukedeck Ltd | A method of generating music data |
US20190355477A1 (en) * | 2018-05-18 | 2019-11-21 | Beckman Coulter, Inc. | Test panel analysis |
CN110599336B (zh) * | 2018-06-13 | 2020-12-15 | 北京九章云极科技有限公司 | 一种金融产品购买预测方法及*** |
CN112154464B (zh) * | 2018-06-19 | 2024-01-02 | 株式会社岛津制作所 | 参数搜索方法、参数搜索装置以及参数搜索用程序 |
US11035943B2 (en) * | 2018-07-19 | 2021-06-15 | Aptiv Technologies Limited | Radar based tracking of slow moving objects |
GB2576501B (en) * | 2018-08-16 | 2021-03-10 | Centrica Plc | Sensing fluid flow |
CN109034269A (zh) * | 2018-08-22 | 2018-12-18 | 华北水利水电大学 | 一种基于计算机视觉技术的棉铃虫雌雄成虫判别方法 |
CN108845302B (zh) * | 2018-08-23 | 2022-06-03 | 电子科技大学 | 一种k近邻变换真假目标特征提取方法 |
CN109325294B (zh) * | 2018-09-25 | 2023-08-11 | 云南电网有限责任公司电力科学研究院 | 一种火电机组空气预热器性能状态的证据表征构建方法 |
JP7005463B2 (ja) * | 2018-09-27 | 2022-01-21 | 株式会社東芝 | 学習装置、学習方法及びプログラム |
CN109446467B (zh) * | 2018-09-28 | 2023-10-24 | 安徽皖仪科技股份有限公司 | 数字滤波方法及装置 |
US10878292B2 (en) * | 2018-12-07 | 2020-12-29 | Goodrich Corporation | Automatic generation of a new class in a classification system |
JP6531302B1 (ja) * | 2018-12-19 | 2019-06-19 | 株式会社AI Samurai | 知的財産システム、知的財産支援方法および知的財産支援プログラム |
CN109697466B (zh) * | 2018-12-20 | 2022-10-25 | 烟台大学 | 一种自适应区间型空间模糊c均值的地物分类方法 |
CA3128973A1 (en) | 2019-03-04 | 2020-09-10 | Bhaskar Bhattacharyya | Data compression and communication using machine learning |
CN110085026A (zh) * | 2019-03-28 | 2019-08-02 | 中国公路工程咨询集团有限公司 | 一种基于聚类分析和马尔科夫模型的交通状态预测方法 |
CN110110133B (zh) * | 2019-04-18 | 2020-08-11 | 贝壳找房(北京)科技有限公司 | 一种智能语音数据生成方法及装置 |
US11245729B2 (en) * | 2019-07-09 | 2022-02-08 | Salesforce.Com, Inc. | Group optimization for network communications |
CN110675959B (zh) * | 2019-08-19 | 2023-07-07 | 平安科技(深圳)有限公司 | 数据智能分析方法、装置、计算机设备及存储介质 |
CN110851321B (zh) * | 2019-10-10 | 2022-06-28 | 平安科技(深圳)有限公司 | 一种业务告警方法、设备及存储介质 |
US20210173855A1 (en) * | 2019-12-10 | 2021-06-10 | Here Global B.V. | Method, apparatus, and computer program product for dynamic population estimation |
CN111078589B (zh) * | 2019-12-27 | 2023-04-11 | 深圳鲲云信息科技有限公司 | 一种应用于深度学习计算的数据读取***、方法及芯片 |
CN111191723B (zh) * | 2019-12-30 | 2023-06-20 | 创新奇智(北京)科技有限公司 | 基于级联分类器的少样本商品分类***及分类方法 |
CN111291326B (zh) * | 2020-02-06 | 2022-05-17 | 武汉大学 | 一种结合类内相似度和类间差异度的聚类有效性指标建立方法 |
CN111427984B (zh) * | 2020-03-24 | 2022-04-01 | 成都理工大学 | 一种区域地震概率空间分布生成方法 |
US11551666B1 (en) * | 2020-05-28 | 2023-01-10 | Amazon Technologies, Inc. | Natural language processing |
CN111693658A (zh) * | 2020-06-11 | 2020-09-22 | 上海交通大学 | 基于多种智能感官数据融合的食品品质鉴定方法 |
US11222232B1 (en) | 2020-06-19 | 2022-01-11 | Nvidia Corporation | Using temporal filters for automated real-time classification |
CN111897945B (zh) * | 2020-07-07 | 2024-07-02 | 广州视源电子科技股份有限公司 | 前置知识点的标注、题目推送方法、装置、设备及介质 |
CN111552260B (zh) * | 2020-07-10 | 2020-10-27 | 炬星科技(深圳)有限公司 | 工人位置估算方法、设备及存储介质 |
CN111912799B (zh) * | 2020-07-17 | 2021-07-27 | 中国科学院西安光学精密机械研究所 | 一种基于高光谱水体库的自适应波段选择方法 |
CN111950987B (zh) * | 2020-08-18 | 2022-03-15 | 远程教育科技(山东)有限公司 | 一种基于互联网的远程教育培训方法及*** |
EP4206699A4 (en) * | 2020-08-26 | 2024-03-13 | Panasonic Intellectual Property Management Co., Ltd. | ANOMALY DETECTION DEVICE, ANOMALY DETECTION METHOD AND PROGRAM |
CN112116159B (zh) * | 2020-09-21 | 2021-08-27 | 贝壳找房(北京)科技有限公司 | 信息交互方法、装置、计算机可读存储介质及电子设备 |
EP4231272A4 (en) * | 2020-10-16 | 2024-07-10 | Nippon Telegraph & Telephone | PARAMETER ESTIMATION DEVICE, PARAMETER ESTIMATION SYSTEM, PARAMETER ESTIMATION METHOD, AND PROGRAM |
US11978266B2 (en) | 2020-10-21 | 2024-05-07 | Nvidia Corporation | Occupant attentiveness and cognitive load monitoring for autonomous and semi-autonomous driving applications |
US20220138260A1 (en) * | 2020-10-30 | 2022-05-05 | Here Global B.V. | Method, apparatus, and system for estimating continuous population density change in urban areas |
US20220262455A1 (en) * | 2021-02-18 | 2022-08-18 | Recursion Pharmaceuticals, Inc. | Determining the goodness of a biological vector space |
CN113327220B (zh) * | 2021-06-24 | 2023-06-02 | 浙江成功软件开发有限公司 | 一种基于复杂网络的海洋多时间序列关联性发现方法 |
JP7504236B2 (ja) * | 2021-06-25 | 2024-06-21 | エルアンドティー テクノロジー サービシズ リミテッド | データサンプルをクラスタ化する方法およびシステム |
CN115700838A (zh) * | 2021-07-29 | 2023-02-07 | 脸萌有限公司 | 用于图像识别模型的训练方法及其装置、图像识别方法 |
CN114443849B (zh) * | 2022-02-09 | 2023-10-27 | 北京百度网讯科技有限公司 | 一种标注样本选取方法、装置、电子设备和存储介质 |
CN115218893B (zh) * | 2022-06-19 | 2024-05-28 | 中国人民解放军空军工程大学 | 一种基于特征提取的地磁导航方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH063252A (ja) * | 1992-06-19 | 1994-01-11 | Toa Medical Electronics Co Ltd | 粒子分析方法及び装置 |
JP2001273302A (ja) * | 2000-03-23 | 2001-10-05 | Toshiba Corp | 画像検索システムおよび画像検索方法 |
JP2003162718A (ja) * | 2001-11-22 | 2003-06-06 | Toshiba Corp | 画像処理方法及びプログラム |
JP2004086540A (ja) * | 2002-08-27 | 2004-03-18 | Fuji Photo Film Co Ltd | オブジェクト抽出方法および装置ならびにプログラム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09161062A (ja) | 1995-12-13 | 1997-06-20 | Nissan Motor Co Ltd | パターン認識方法 |
US6442555B1 (en) * | 1999-10-26 | 2002-08-27 | Hewlett-Packard Company | Automatic categorization of documents using document signatures |
JP2001167124A (ja) | 1999-12-13 | 2001-06-22 | Sharp Corp | 文書分類装置及び文書分類プログラムを記録した記録媒体 |
JP2002183171A (ja) | 2000-12-12 | 2002-06-28 | Matsushita Electric Ind Co Ltd | 文書データ・クラスタリングシステム |
JP3701197B2 (ja) | 2000-12-28 | 2005-09-28 | 松下電器産業株式会社 | 分類への帰属度計算基準作成方法及び装置 |
US6728658B1 (en) * | 2001-05-24 | 2004-04-27 | Simmonds Precision Products, Inc. | Method and apparatus for determining the health of a component using condition indicators |
JP2003030224A (ja) | 2001-07-17 | 2003-01-31 | Fujitsu Ltd | 文書クラスタ作成装置、文書検索システムおよびfaq作成システム |
JP2003076976A (ja) | 2001-08-31 | 2003-03-14 | Mitsui Eng & Shipbuild Co Ltd | パターンマッチング方法 |
US7117108B2 (en) * | 2003-05-28 | 2006-10-03 | Paul Ernest Rapp | System and method for categorical analysis of time dependent dynamic processes |
KR100814143B1 (ko) * | 2003-10-03 | 2008-03-14 | 아사히 가세이 가부시키가이샤 | 데이터 처리 장치 및 데이터 처리 장치 제어 프로그램 |
-
2005
- 2005-11-17 WO PCT/JP2005/021095 patent/WO2006087854A1/ja not_active Application Discontinuation
- 2005-11-17 JP JP2007503580A patent/JP4550882B2/ja not_active Expired - Fee Related
- 2005-11-17 US US11/791,705 patent/US7693683B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH063252A (ja) * | 1992-06-19 | 1994-01-11 | Toa Medical Electronics Co Ltd | 粒子分析方法及び装置 |
JP2001273302A (ja) * | 2000-03-23 | 2001-10-05 | Toshiba Corp | 画像検索システムおよび画像検索方法 |
JP2003162718A (ja) * | 2001-11-22 | 2003-06-06 | Toshiba Corp | 画像処理方法及びプログラム |
JP2004086540A (ja) * | 2002-08-27 | 2004-03-18 | Fuji Photo Film Co Ltd | オブジェクト抽出方法および装置ならびにプログラム |
Non-Patent Citations (1)
Title |
---|
岡 隆一,外: "音素系列表現を用いた音声およびテキスト検索", 電子情報通信学会技術研究報告, vol. 101, no. 155, JPN6010018667, 21 June 2001 (2001-06-21), JP, pages 29 - 35, ISSN: 0001659393 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016071419A (ja) * | 2014-09-26 | 2016-05-09 | 大日本印刷株式会社 | 変動データ管理システム及びその特異性検出方法 |
Also Published As
Publication number | Publication date |
---|---|
US20080114564A1 (en) | 2008-05-15 |
WO2006087854A1 (ja) | 2006-08-24 |
US7693683B2 (en) | 2010-04-06 |
JP4550882B2 (ja) | 2010-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4550882B2 (ja) | 情報分類装置、情報分類方法、情報分類プログラム、情報分類システム | |
CN109299396B (zh) | 融合注意力模型的卷积神经网络协同过滤推荐方法及*** | |
Li et al. | Mining opinion summarizations using convolutional neural networks in Chinese microblogging systems | |
Zhang et al. | Deep Learning over Multi-field Categorical Data: –A Case Study on User Response Prediction | |
US20200104729A1 (en) | Method and system for extracting information from graphs | |
CN111143576A (zh) | 一种面向事件的动态知识图谱构建方法和装置 | |
CN112085565B (zh) | 基于深度学习的信息推荐方法、装置、设备及存储介质 | |
US20200104409A1 (en) | Method and system for extracting information from graphs | |
CN105574067A (zh) | 项目推荐装置以及项目推荐方法 | |
US12020267B2 (en) | Method, apparatus, storage medium, and device for generating user profile | |
KR102370729B1 (ko) | 문장 작성 시스템 | |
Hussain | Survey on current trends and techniques of data mining research | |
Ghosh et al. | An attention-based hybrid architecture with explainability for depressive social media text detection in Bangla | |
CN114298783A (zh) | 基于矩阵分解融合用户社交信息的商品推荐方法及*** | |
WO2024067373A1 (zh) | 一种数据处理方法及相关装置 | |
CN114077661A (zh) | 信息处理装置、信息处理方法和计算机可读介质 | |
CN109829154B (zh) | 基于语义的人格预测方法、用户设备、存储介质及装置 | |
CN112215629B (zh) | 基于构造对抗样本的多目标广告生成***及其方法 | |
Ahmed et al. | Hyper-graph-based attention curriculum learning using a lexical algorithm for mental health | |
Qureshi et al. | Performance evaluation of machine learning models on large dataset of android applications reviews | |
Zhang et al. | Exploring unsupervised multivariate time series representation learning for chronic disease diagnosis | |
CN111552816B (zh) | 面向大数据文本挖掘的动态认知语义匹配方法 | |
Nasir et al. | Pandemia Prediction Using Machine Learning | |
Dai et al. | Graph sparse nonnegative matrix factorization algorithm based on the inertial projection neural network | |
CN111276162A (zh) | 基于助听器的语音输出优化方法、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090918 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100406 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100629 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100708 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130716 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |