CN103810230A - 信息处理装置、信息处理方法和程序 - Google Patents
信息处理装置、信息处理方法和程序 Download PDFInfo
- Publication number
- CN103810230A CN103810230A CN201310534424.1A CN201310534424A CN103810230A CN 103810230 A CN103810230 A CN 103810230A CN 201310534424 A CN201310534424 A CN 201310534424A CN 103810230 A CN103810230 A CN 103810230A
- Authority
- CN
- China
- Prior art keywords
- cluster
- matrix
- distance
- distance matrix
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 10
- 238000003672 processing method Methods 0.000 title claims description 8
- 239000011159 matrix material Substances 0.000 claims description 266
- 230000003750 conditioning effect Effects 0.000 claims description 64
- 238000004364 calculation method Methods 0.000 claims description 47
- 239000000284 extract Substances 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 2
- 230000005055 memory storage Effects 0.000 description 39
- 238000012545 processing Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 12
- 238000001514 detection method Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000000034 method Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000012152 algorithmic method Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/30—Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Library & Information Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种信息处理装置、信息处理方法和程序,该信息处理装置包括:聚类重配置确定单元,在具有特征量空间中的位置信息的新数据被添加到数据组的情况下,如果在聚类中存在基于特征量空间中的距离而能够将该新数据分类到其中的多个候选聚类,则确定当将该新数据分类到聚类时要对候选聚类进行重配置,其中,在数据组中每个数据均具有特征量空间中的位置信息并且基于特征量空间中的距离而被分类到聚类。
Description
对相关申请的交叉引用
该申请要求2012年11月8日提交的日本优先权专利申请JP2012-245980的权益,其全部内容通过引用合并于此。
技术领域
本公开涉及一种信息处理装置、信息处理方法和程序。
背景技术
用于将具有特征量的数据分类到聚类的技术用在各种情形下。例如,基于由各个数据的特征量表示的特征量空间中的数据段之间的距离来确定数据被分类到其中的聚类。这样的技术已频繁用在图像处理领域中。例如,JP2010-3021A公开了一种通过检测包括在视频流的每帧中的面部图像并将面部图像分类到聚类来获得已出现的人的数据的技术。
发明内容
近年来,将由装配在移动终端比如移动电话(智能电话)中的摄像装置拍摄的图像上传到服务器的技术已广泛扩散。例如,服务器提供用户可以存储大量图像的大容量存储装置或者提供使得可以与其他用户共享所存储的图像的服务。甚至对于如上所述存储的图像,出于用户浏览图像方便的目的,也需要用于将显示出同一人的图像或者在相似地点/时间拍摄的图像分类到同一聚类中的技术。
在该情况下,用作聚类目标的图像是数量大并且被顺序添加的数据。因此,在每次添加新图像时对所有图像都执行聚类是不实际的。在这点上,对于添加的图像,例如,考虑如下技术:计算关于已形成的聚类的图像的特征量空间中的距离并且基于该距离来确定要分类的聚类。然而,当对如上所述添加的数据顺序执行聚类时,与包括所添加的数据来共同执行聚类时相比,作为结果所形成的聚类很可能被划分得更细。换言之,例如,通常将包括同一人的图像分类到不同的聚类。
期望提供一种新颖的改进的并且能够将顺序添加的数据分类到适当聚类的信息处理装置、信息处理方法和程序。
根据本公开的实施例,提供了一种信息处理装置,包括:聚类重配置确定单元,在具有特征量空间中的位置信息的新数据被添加到数据组的情况下,如果在聚类中存在基于特征量空间中的距离而能够将该新数据分类到其中的多个候选聚类,则确定当将该新数据分类到聚类时要对候选聚类进行重配置,其中,在数据组中每个数据均具有特征量空间中的位置信息并且基于特征量空间中的距离而被分类到聚类。
根据本公开的实施例,提供了一种信息处理方法,包括:在具有特征量空间中的位置信息的新数据被添加到数据组的情况下,如果在聚类中存在基于特征量空间中的距离而能够将该新数据分类到其中的多个候选聚类,则确定当将该新数据分类到聚类时要对候选聚类进行重配置,其中,在数据组中每个数据均具有特征量空间中的位置信息并且基于特征量空间中的距离而被分类到聚类。
根据本公开的实施例,提供了一种使得计算机执行如下功能的程序:在具有特征量空间中的位置信息的新数据被添加到数据组的情况下,如果在聚类中存在基于特征量空间中的距离而能够将该新数据分类到其中的多个候选聚类,则确定当将该新数据分类到聚类时要对候选聚类进行重配置,其中,在数据组中每个数据均具有特征量空间中的位置信息并且基于特征量空间中的距离而被分类到聚类。
根据本公开的实施例,可以将顺序添加的数据分类到适当的聚类。
附图说明
图1是示出根据本公开的第一实施例的服务器的示意性功能配置的框图;
图2是示出在本公开的第一实施例中计算的图像间距离的示例的图;
图3是示出在本公开的第一实施例中计算的相似度得分的示例的图;
图4是用于描述本公开的第一实施例中的聚类重配置确定的图;
图5是示出根据本公开的第一实施例的服务器的处理概况的流程图;
图6是示出根据本公开的第二实施例的服务器的示意性功能配置的框图;
图7是示出在本公开的第二实施例中生成的示例性距离矩阵的图;
图8是示出在本公开的第二实施例中生成的示例性预测距离矩阵的图;
图9是用于描述本公开的第二实施例中的示例性矩阵计算的图;
图10是用于描述本公开的第二实施例中的矩阵的示例性重复重计算的图;
图11是用于描述本公开的第二实施例中的附加配置的第一示例的图;
图12是用于描述本公开的第二实施例中的附加配置的第二示例的图;
图13是用于描述本公开的第二实施例中的附加配置的第三示例的图;
图14是用于描述本公开的第二实施例中的附加配置的第三示例的图;
图15是示出根据本公开的第二实施例的服务器的处理概况的流程图;以及
图16是用于描述信息处理装置的硬件配置的框图。
具体实施方式
在下文中,将参照附图详细描述本公开的优选实施例。注意,在该说明书和附图中,具有基本上相同的功能和结构的结构元件用相同的附图标记来表示,并且省略这些结构元件的重复说明。
将按以下顺序进行描述。
1.第一实施例
1-1.功能配置
1-2.处理流程
2.第二实施例
2-1.功能配置
2-2.示例性矩阵计算
2-3.附加示例性矩阵计算
2-4.处理流程
3.硬件配置
4.补充
(1.第一实施例)
首先,将参照图1至图5描述本公开的第一实施例。本实施例涉及服务器,该服务器从用户接收图像的输入并且输出对图像进行聚类的结果。服务器可由单个信息处理装置来实现或者可由经由有线或无线网络连接的多个信息处理装置的组合来实现。稍后将描述用于实现每个信息处理装置的示例性硬件配置。
(1-1.功能配置)
图1是示出根据本公开的第一实施例的服务器的示意性功能配置的框图。如上所述,服务器100可由单个信息处理装置或多个信息处理装置的组合来实现。在后一情况下,以下将描述的服务器100的功能配置可由单个信息处理装置来实现或者可被实现为使得单个功能部件可分散在多个信息处理装置中。
服务器100包括输入单元110、特征检测单元120、存储装置130、距离计算单元140、相似度得分计算单元150、重配置确定单元160、聚类单元170和输出单元180作为功能部件。以下将描述各个功能部件。
输入单元110接收用户输入的图像。例如,输入图像可以是用户使用装配在移动终端中的摄像装置拍摄的图像在拍摄之后直接上传的图像。此外,例如,输入图像可以是用户在过去拍摄的并且用户通过诸如个人计算机(PC)的终端装置任意传送的图像。在任意情况下,输入单元110在时间上分散地并且顺序接收图像的输入。这里,“顺序”表示当已聚类的图像存储在服务器100的存储装置130中时添加和输入一个或更多个图像的输入状态。因此,存储在存储装置130中的所有图像可以不是顺序地输入(可以是顺序地输入),并且输入图像的间隔可以不是恒定的。例如,输入单元110由与传送图像的终端装置进行通信的通信装置来实现。
特征检测单元120提取由输入单元110接收的图像的特征量。这里,要提取的特征量是与图像有关的所有特征量并且可以使用任意维度的矢量在特征量空间中表示。因此,从其提取特征量的每个图像具有特征量空间中的位置信息。此外,特征量可以是整个图像的特征量或者可以是主体的面部区域的特征量。例如,特征量可使用各种公知的技术比如在JP2010-3021A和JP2008-77536A中公开的技术来提取。特征检测单元120将所检测的特征量与图像相关联地存储在存储装置130中。例如,特征检测单元120由根据存储在存储器中的程序进行操作的中央处理单元(CPU)来实现。
存储装置130存储与服务器100的处理有关的多种数据。例如,存储装置130存储输入单元110接收的图像。此外,存储装置130与图像相关联地存储特征检测单元120检测的图像的特征量。此外,存储装置130存储由稍后将描述的距离计算单元140计算的图像间距离、相似度得分计算单元150计算的相似度得分、聚类单元170执行的聚类结果等。已存储在存储装置130中的数据已经历了聚类单元170的聚类。例如,聚类基于距离计算单元140计算的图像间距离或相似度得分计算单元150基于图像间距离计算的相似度得分。此外,图1中仅示出了特征检测单元120、距离计算单元140和存储装置130之间的数据交换,但是存储装置130也可以与服务器100的其余部件交换数据。
距离计算单元140计算输入单元110接收的图像与先前存储在存储装置130中的图像之间的图像间距离。在本说明书中,在特征量空间中以两个图像的特征量的矢量表示的位置之间的距离被称为图像间距离。距离计算单元140可计算新接收的图像与根据预定标准从存储在存储装置130中的图像中提取的一些图像之间的图像间距离。在该情况下,例如,可以更准确地检测用于计算图像间距离的特征量的图像被提取作为目标图像,并且具有表示存储在存储装置130中的图像被分类到每个聚类的特征的图像或者不模糊(清晰)的图像或当主体的面部是目标时面部部位(例如,眼睛、鼻子、嘴和下巴)都被检测到的图像被提取作为目标图像。例如,距离计算单元140也由根据存储在存储器中的程序进行操作的CPU来实现。
这里,图2中示出了距离计算单元140计算的图像间距离的示例。图2是示出在本公开的第一实施例中计算的图像间距离的示例的图。在图2所示的示例中,计算新接收的图像(图像ID“10”)与先前存储在存储装置130中的图像(图像ID“1”至“9”)之间的图像间距离。此外,图像间距离可如图2所示由预定范围(例如,-100至+100)来表示或者可由特征量空间的坐标系来表示。在图2所示的示例中,在图像间距离为正并且增加时,目标图像的特征量之间的相似度增加。因此,在该情况下,可以理解,具有与新接收的图像最相似的特征量的图像是计算最大的正图像间距离“80”的、图像ID为“7”的图像。
相似度得分计算单元150计算输入单元110接收的图像与先前存储在存储装置130中的图像之间的相似度得分。在本说明书中,表示两个图像是否彼此相似的二进制得分被称为“相似度得分”。相似度得分计算单元150基于距离计算单元140计算的图像之间的距离来计算相似度得分。更具体地,相似度得分计算单元150可为图像间距离设置阈值,并且可通过阈值“1”设置被确定为彼此相似的两个图像之间的相似度得分,以及通过阈值“0”设置被确定为彼此不相似的两个图像之间的相似度得分。这里,与距离计算单元140类似,相似度得分计算单元150可计算新接收的图像与根据预定标准从存储在存储装置130中的图像中提取的一些图像之间的相似度得分。例如,相似度得分计算单元150也由根据存储在存储器中的程序进行操作的CPU来实现。
这里,图3中示出了相似度得分计算单元150计算的相似度得分的示例。图3是示出在本公开的第一实施例中计算的相似度得分的示例的图。在图3所示的示例中,计算新接收的图像(图像ID“10”)与先前存储在存储装置130中的图像(图像ID“1”至“9”)之间的相似度得分。此外,图2的示例中的编号与图3的示例中的编号之间没有相关性。
图3示出了作为添加图像ID为“1”至“9”的图像之间的相似度得分的矩阵的相似度得分。由于行中的项与列中的项相同,因此该矩阵是对称矩阵。可以根据相似度得分矩阵来理解每个图像与其它图像之间的相似度的趋势。例如,图像ID为“10”的图像与图像ID为“1”、“4”、“7”、“9”和“10”的图像类似。同时,图像ID为“2”的图像与图像ID为“1”、“2”、“4”、“5”、“7”和“9”的图像类似。根据图像间距离,图像不是彼此相似。然而,考虑到与其余图像的相似度趋势,与图像ID为“10”的图像类似的所有图像都包括在与图像ID为“2”的图像类似的图像中,并且图像具有相对高的相关性。如上所述,使用相似度得分的相关性,可以从与图像间距离不同的观点来测量图像的相似度。
当将输入单元110接收的图像分类到聚类时,重配置确定单元160从先前存储在存储装置130中的图像被分类的聚类中确定要重配置的聚类。更具体地,当提取用作新接收的图像被分类到其中的聚类的候选的多个聚类时,重配置确定单元160基于距离计算单元140计算的图像之间的距离或相似度得分计算单元150计算的相似度得分而确定要重配置所提取的多个聚类。当聚类是重配置目标时,被分类到相应聚类的图像进入不执行分类到聚类中的状态,并且通过稍后将描述的聚类单元170对图像和新接收的图像再次执行聚类。例如,重配置确定单元160也由根据存储在存储器中的程序进行操作的CPU来实现。
这里,将参照图4进一步描述重配置确定单元160的聚类重配置确定。图4是用于描述本公开的第一实施例中的聚类重配置确定的图。在图4所示的示例中,对于新接收的图像Pn,具有图像P1作为代表图像的聚类C1、具有图像P2作为代表图像的聚类C2和具有图像P3作为代表图像的聚类C3是要分类的聚类的候选。这里,当仅基于图像间距离或相似度得分来确定要将图像Pn分类到其中的聚类时,将图像Pn添加到任一聚类,并且三个连续聚类C1至C3共存。
然而,如果图像Pn从开始就存在,则聚类结果可能改变。例如,当图像Pn从开始大致存在于聚类C1至C3的中间时,聚类C1至C3可被形成为包括这些聚类的单个聚类C4而不是不同的聚类。然而,当新接收的图像Pn仅被分类到“最相似聚类”时,通常应该联合的聚类被细分的状态保持直至对所有图像重新执行聚类。当图像数量大时,由于对所有图像执行聚类花费时间,因此不易重新执行,从而不频繁地执行聚类。因此,例如,从用户的观点来看,不自然的聚类状态可能持续长时间。
在这点上,在本实施例中,当存在用作新接收的图像被分类到其中的聚类的候选的多个聚类(候选聚类)时,重配置确定单元160确定要对被分类到候选聚类的图像和新接收的图像执行聚类重配置。在图4所示的示例中,分别被分类到聚类C1至C3的图像(例如,图像P1、P2和P3)进入不执行分类到聚类中(聚类C1至C3被去聚类(declustered))的状态,并且通过聚类单元170再次对这些图像和图像Pn执行聚类。通过该操作,例如,当添加图像Pn时,可能再次设置适当聚类比如聚类C4。此外,由于重新执行聚类的范围有限,因此与对所有图像执行聚类相比,处理量小,并且在每次添加图像时执行处理是现实的。
此外,重配置确定单元160可根据用作重配置目标的候选聚类的数量或包括在用作重配置目标的候选聚类中的图像数量,改变用于确定候选聚类的阈值。例如,当用作重配置目标的候选聚类的数量过大或者当包括在候选聚类中的图像的数量过大时,重配置确定单元160可增加阈值(例如,执行设置以使得在特征量空间中距离短的聚类不被提取作为候选聚类),由此控制聚类单元170中连同重配置一起的聚类的处理量。
聚类单元170根据重配置确定单元160的确定而执行图像聚类。聚类单元170基于以特征量的矢量表示的特征量空间中的位置信息而将目标图像分类到聚类中。更具体地,聚类单元170基于距离计算单元140计算的图像之间的距离和/或相似度得分计算单元150计算的相似度得分而将图像分类到聚类中。聚类单元170可基于图像间距离和相似度得分两者而执行聚类,或者可基于图像间距离或相似度得分中的任一个而执行聚类。聚类单元170将聚类结果提供到输出单元180,并且将聚类结果存储在存储装置130中。此外,当聚类单元170仅基于图像间距离执行聚类时,服务器100可不包括相似度得分计算单元150。例如,聚类单元170也由根据存储在存储器中的程序进行操作的CPU来实现。
此外,在重配置确定单元160中,当仅提取了一个候选聚类时,聚类单元170将新接收的图像分类到相应的候选聚类而不重新执行聚类。此外,当没有提取到候选聚类时,聚类单元170生成要将新接收的图像分类到其中的新聚类而不重新执行聚类。如上所述,聚类单元170仅在必要时才根据重配置确定单元160的确定执行聚类重配置,因此可以将添加新图像时的处理负荷和需要时间抑制到所需最小值。
输出单元180输出聚类单元170获得的聚类结果。例如,要输出的信息可以是表示新接收的图像被分类到其中的聚类的信息(例如,“011.jpg已被分类到类别‘你’!”)。此外,当根据重配置确定单元160的确定结果而重配置聚类并且改变先前存储在存储装置130中的图像被分类到其中的聚类时,可进一步添加表示所改变的聚类的信息(例如,“003.jpg和005.jpg的分类已被改变为类别‘你’!”)。例如,输出单元180由将结果传送到终端装置等的通信装置来实现。
这里,将总结本实施例中的部件的技术意义。在本实施例中,图像具有其位置定义在特征量空间中的数据的含义。当已被分类到聚类中的图像存储在存储装置130中时,图像是基于特征量空间中的距离(距离计算单元140计算的图像间距离或相似度得分计算单元150基于图像间距离计算的相似度得分)而被分类到聚类中的数据组。在存在数据组的状态中,输入单元110新接收的图像是具有特征量空间中的位置信息(以特征检测单元120提取的特征量的矢量表示的位置信息)的新数据。
此外,当将新数据新分类到数据组被分类到其中的聚类时,当存在新数据基于特征量空间中的距离(图像间距离或相似度得分)而被分类到其中的多个候选聚类时,重配置确定单元160确定在对新数据聚类时要对候选聚类执行聚类重配置。
(1-2.处理流程)
图5是示出根据本公开的第一实施例的服务器的处理概况的流程图。将参照该流程图从不同的观点来描述本实施例的配置。
在服务器100中,首先,输入单元110接收图像的输入(步骤S101)。接下来,特征检测单元120提取新接收的图像的特征量(步骤S103)。此外,距离计算单元140计算新接收的图像与先前存储在存储装置130中的图像之间的图像间距离。此外,相似度得分计算单元150可基于图像间距离而计算相似度得分(步骤S105)。
这里,重配置确定单元160确定是否存在基于图像间距离或相似度得分而提取的多个候选聚类,即,是否存在新接收的图像要被分类到其中的聚类的多个候选(步骤S107)。这里,当确定存在多个候选聚类时(步骤S107中为是),则聚类单元170对候选聚类进行重配置并且执行聚类(步骤S109)。在该情况下,聚类单元170将已被分类到多个候选聚类的图像连同新接收的图像一起设置为聚类目标。
同时,当在步骤S107中确定仅存在一个候选聚类或者不存在候选聚类(步骤S107中为否)时,聚类单元170执行聚类而不进行重配置(步骤S111)。在该情况下,聚类单元170根据图像间距离或相似度得分而将新接收的图像分类到候选聚类,或者生成新聚类并将新接收的图像分类到新聚类。在步骤S109或S111之后,输出单元180输出聚类结果(步骤S113)。
通过以上处理,例如,当存在新接收的图像可以被添加到连接先前在特征量空间中单独设置的聚类的位置的可能性时,可以通过重配置相关聚类并执行聚类来适当地确定新接收的图像要被分类到其中的聚类,并且如果图像原始存在则将被分类到同一聚类的图像也可以被重分类到同一聚类中。通过步骤S107的确定,仅在必要时执行聚类重配置,并且重配置范围也是有限的,因此可以在每次添加图像时执行处理,并且可以实时输出反映图像的添加的聚类结果。
(2.第二实施例)
接下来,将参照图6至图15描述本公开的第二实施例。与第一实施例类似,本实施例涉及一种服务器,该服务器从用户接收图像的输入并且输出对图像聚类的结果。然而,本实施例与第一实施例的不同之处在于,距离计算单元计算一些图像间距离,并且由距离估计单元估计剩余的图像间距离。因此,以下描述将继续关注不同的点,并且将省略与第一实施例中相同的配置的重复描述。
(2-1.功能配置)
图6是示出根据本公开的第二实施例的服务器的示意性功能配置的框图。与根据第一实施例的服务器100类似,服务器200可由单个信息处理装置来实现或者可由多个处理装置的组合来实现。在后一情况下,稍后将描述的服务器200的功能配置可由单个信息处理装置来实现或者可被实现为使得单个功能部件可分散在多个信息处理装置中。
服务器200包括输入单元110、特征检测单元120、存储装置130、距离计算单元240、距离估计单元290、相似度得分计算单元150、重配置确定单元160、聚类单元170和输出单元180作为功能部件。以下将描述作为与第一实施例不同的功能部件的距离计算单元240和距离估计单元290。
距离计算单元240计算输入单元110接收的图像与先前存储在存储装置130中的一些图像之间的图像间距离。距离计算单元240将根据预定标准从存储在存储装置130中的图像中提取的一些图像(目标图像)设置为目标,并且计算新接收的图像与所提取的一些图像之间的图像间距离。例如,与第一实施例类似,目标图像是可以从其更准确地检测用于计算图像间距离的特征量的图像。此外,距离计算单元240生成包括计算的图像间距离和先前存储在存储装置130中的图像之间的图像间距离的距离矩阵R。例如,距离计算单元240由根据存储在存储器中的程序进行操作的CPU来实现。
这里,图7中示出了距离计算单元240生成的示例性距离矩阵。图7是示出在本公开的第二实施例中生成的示例性距离矩阵的图。在图7所示的示例中,计算新接收的图像(图像ID“10”)与先前存储在存储装置130中的一些图像(图像ID“1”、“3”、“6”和“8”)之间的图像间距离,并且这些图像间距离被设置为距离矩阵R的元素(第10行)。此外,关于图像ID为“1”至“9”的图像先前计算的图像间距离也被设置为距离矩阵R的元素(第1行至第9行)。由于仅针对新接收的图像计算一些图像间距离,因此距离矩阵R是包括未知元素的矩阵。此外,由于行的项与列的项相同,因此距离矩阵R(和稍后将描述的预测距离矩阵R’)是对称矩阵。因此,为了简化的目的,没有示出距离矩阵R和预测距离矩阵R’的上部。
距离估计单元290使用距离矩阵R通过矩阵计算来计算距离矩阵R的元素中没有设置距离计算单元240计算的图像间距离的元素的预测值。例如,距离估计单元290使用例如图7所示的包括未知元素的距离矩阵R通过矩阵计算来生成图8所示的包括未知元素的预测值(以圆圈指示)的预测距离矩阵R’。图8是示出在本公开的第二实施例中生成的示例性预测距离矩阵的图。在图8所示的示例中,排除预测距离矩阵R’的预测值的元素与距离矩阵R中的相同,但是元素实际上可稍微不同。不特别限制距离估计单元290执行的矩阵计算的种类,但是稍后将详细描述一种。距离估计单元290将作为距离矩阵R的元素的预测值而获得的图像间距离连同距离计算单元240计算的图像间距离一起提供到相似度得分计算单元150、重配置确定单元160或聚类单元170。例如,距离估计单元290也由根据存储在存储器中的程序进行操作的CPU来实现。
(2-2.示例性矩阵计算)
这里,图9中示出了距离估计单元290执行的示例性矩阵计算。图9是用于描述本公开的第二实施例中的示例性矩阵计算的图。如图9所示,距离估计单元290从包括具有未知元素的行row的距离矩阵R推出中间矩阵对r1和r2,并且通过将矩阵相乘来计算包括具有未知元素的预测值的行row’的预测距离矩阵R’(R’=r1T×r2)。距离估计单元290输出包括在行row’中的预测值作为距离计算单元240没有计算的图像间距离的预测值。此外,预测距离矩阵R’用作当稍后添加新图像时与距离矩阵R的现有图像对应的部分(除行row和相应列之外的部分)。
在以上矩阵计算中,中间矩阵r1和r2是例如使用奇异值分解(SVD)而从距离矩阵R推出的。然而,当从距离矩阵R初始计算预测距离矩阵R’时,不易获得适当的矩阵作为中间矩阵r1和r2。在这点上,例如通过图10所示的重复重计算来计算中间矩阵r1和r2。图10是用于描述本公开的第二实施例中的矩阵的示例性重复重计算的图。在图10中,诸如(0)和(1)的数字表示该时间点的重计算的次数。
在图10所示的示例中,首先,中间矩阵r1(0)是通过奇异值分解等从距离矩阵R推出的。接下来,中间矩阵r2(1)是基于中间矩阵r1(0)和距离矩阵R而推出的。具体地,中间矩阵r1(0)是固定的,并且中间矩阵r2(1)被确定为使得如在r1(0)T×r2(1)=R’中计算的预测距离矩阵R’与距离矩阵R之间的误差最小化。接下来,中间矩阵r2(1)是固定的,并且中间矩阵r1(1)被确定为使得如在r1(1)T×r2(1)=R’中计算的预测距离矩阵R’与距离矩阵R之间的误差最小化。此后,以类似方式,重复中间矩阵r1和r2的重计算预定次数(k次),然后如在r1(k)T×r2(k)=R’中计算预测距离矩阵R’。
可以通过上述矩阵计算来获取包括在距离矩阵R中的未知元素的预测值。例如,当已存储在存储装置130中的图像数量大时,甚至在根据预定标准从所有图像中提取的图像(从其可以更准确地检测特征量的图像)的情况下也难以将所有特征量的数据都缓存在存储器中。因此,在距离计算单元中,当针对所有目标图像计算与新接收的图像的图像间距离时,频繁执行对存储装置的访问,并且其所需时间可能增加所需的总处理时间。
在这点上,在本实施例中,距离计算单元240计算关于一些目标图像(例如,与其特征量可以缓存在存储器中的数据一样多的目标图像)的图像间距离,并且距离估计单元290估计关于剩余图像的图像间距离。因此,可以减少所需的总处理时间。此外,可以例如通过采用上述重复操作来提高通过矩阵计算执行的图像间距离预测的准确度。
(2-3.附加示例性矩阵计算)
此外,作为本实施例的附加配置,当新接收到图像时,距离估计单元290可使用先前计算的中间矩阵r1和r2来计算预测距离矩阵R’,并且在该情况下,可以进一步抑制处理量。以下将参照图11描述该操作。
(第一示例)
图11是用于描述本公开的第二实施例中的附加配置的第一示例的图。在图11所示的示例中,在特定时间点的第n次矩阵计算处理中,从距离矩阵R(n)推出中间矩阵r1(n)和r2(n),并且如在r1(n)T×r2(n)=R’(n)中计算预测距离矩阵R’(n)。通过该操作,从预测距离矩阵R’(n)的行row’(n)获得包括在距离矩阵R(n)的行row(n)中的未知元素的预测值。
在接下来的第(n+1)次矩阵计算处理中,从距离矩阵R(n+1)推出中间矩阵r1(n+1)和r2(n+1),并且如在r1(n+1)T×r2(n+1)=R’(n+1)中计算预测距离矩阵R’(n+1)。通过该操作,从预测距离矩阵R’(n+1)的行row’(n+1)获得包括在距离矩阵R(n+1)的行row(n+1)中的未知元素的预测值。
这里,通过基于在第n次矩阵计算处理中推出的中间矩阵r1(n)和r2(n)的重计算来获得在第(n+1)次矩阵计算处理中推出的中间矩阵r1(n+1)和r2(n+1)。例如,在第(n+1)次处理中,一行和一列被添加到r1(n)的矩阵r1’是固定的,并且中间矩阵r2(n+1)被确定为使得如在r1’T×r2(n+1)=R’中计算的预测距离矩阵R’与距离矩阵R(n+1)之间的误差最小化。此时,基于一行和一列被添加到r2(n)的矩阵r2’来搜索r2(n+1)。接下来,中间矩阵r2(n+1)是固定的,并且中间矩阵r1(n+1)被确定为使得如在r1(n+1)T×r2(n+1)=R’中计算的预测距离矩阵R’与距离矩阵R(n+1)之间的误差最小化。
在图11所示的示例中,当通过基于在紧邻在前的处理中推出的中间矩阵r1(n)和r2(n)的重计算来获得中间矩阵r1(n+1)和r2(n+1)时,中间矩阵r1(n+1)和r2(n+1)的重计算次数可小于图10所示的示例中的重复次数(k),并且可以是例如1。换言之,在图11所示的示例中,通过上述处理(即,单次重计算),距离估计单元290可以推出中间矩阵r1(n+1)和r2(n+1)并且如在r1(n+1)T×r2(n+1)=R’(n+1)中计算预测距离矩阵R’(n+1)。
由于距离矩阵R(n+1)是新添加的图像的行row(n+1)和相应列被添加到距离矩阵R(n)的矩阵,因此该示例是可能的。换言之,对于除行row(n+1)和相应列中的元素之外的元素,距离矩阵R(n+1)与距离矩阵R(n)相同。
因此,一行和一列被添加到r1(n)的矩阵r1’以及一行和一列被添加到r2(n)的矩阵r2’可能与用于计算距离矩阵R’(n+1)的中间矩阵r1(n+1)和r2(n+1)近似。因此,当取代使用SVD等从距离矩阵R(n+1)推出的矩阵而基于矩阵r1’和r2’执行重计算时,可以通过小量的重计算来推出适当的中间矩阵r1(n+1)和r2(n+1)。
在图11所示的示例中,类似地,对于第(n+2)次至第(n+m)次矩阵计算处理,通过基于在紧邻在前的矩阵计算处理中推出的中间矩阵的重计算来获得中间矩阵r1和r2,并且基于中间矩阵r1和r2来计算预测距离矩阵R’。通过该配置,当新接收到图像时,距离估计单元290可以减少用于计算预测距离矩阵R’的重计算次数,并且减少处理量。
(第二示例)
图12是用于描述本公开的第二实施例中的附加配置的第二示例的图。在图12所示的示例中,当从距离矩阵R(n+1)推出中间矩阵r1(n+1)和r2(n+1)并且如在r1(n+1)T×r2(n+1)=R’(n+1)中计算预测距离矩阵R’(n+1)时,用作重计算目标的行限于中间矩阵r1和r2的一些行。该示例可与第一示例结合使用或者可单独使用。
这里,如上所述,距离矩阵R(n+1)是新添加的图像的行row(n+1)和相应列被添加到距离矩阵R(n)的矩阵。因此,在中间矩阵r1(n+1)和r2(n+1)中,除该行以及与该列对应的行row1(n+1)和row2(n+1)之外的行中的元素可能与中间矩阵r1(n)和r2(n)中的元素相同或近似。因此,在图12所示的示例中,用作用于推出中间矩阵r1(n+1)和r2(n+1)的重计算目标的行限于行row1(n+1)和row2(n+1),从而可以进一步抑制处理量。
在该示例中,用作重计算目标的行可以不一定是与新添加的图像对应的行。实际上,由于距离矩阵R(n+1)的行row(n+1)和相应列也对除中间矩阵r1(n+1)和r2(n+1)的行row1(n+1)和row2(n+1)之外的行具有影响,因此增加包括行row1(n+1)和row2(n+1)的若干行作为重计算目标对于预测距离矩阵R’的准确度改进方面是可期望的。例如,除行row1(n+1)和row2(n+1)之外,随机选择的一个或更多个行可被添加作为重计算目标。此外,基于先前计算的图像间距离被估计为与添加图像相关性高的一个或更多个行可被添加作为重计算目标。
(第三示例)
图13和图14是用于描述本公开的第二实施例中的附加配置的第三示例的图。图13示出了与本实施例的方法不同的一般的均方根误差(RMSE)计算方法,并且图14示出了本实施例的附加配置的示例中的RMSE计算方法。
在如图13所示的一般计算方法中,将数据矩阵(DATA)划分为训练部分(TRAINING)和探查部分(PROBE),并且使用训练部分作为输入矩阵来执行矩阵计算。作为矩阵计算的结果而获得的预测矩阵(估计)包括输入矩阵中为空(未知元素)的探查部分的预测值。可以通过计算探查部分的预测值与实际值之间的RMSE来评估矩阵计算的元素预测准确度。
同时,在如图14所示的根据本实施例的计算方法中,使用距离矩阵R作为输入矩阵来执行矩阵计算,以计算预测距离矩阵R’,并且计算包括在距离矩阵R中的已知元素与对应于相应元素的预测距离矩阵R’的元素之间的RMSE。当计算预测距离矩阵R’时,通过对包括在距离矩阵R中的已知元素以及未知元素的计算来计算值,从而可以基于计算值与距离矩阵R的原始元素值之间的误差来评估矩阵计算的元素预测准确度。
在两种计算方法中,可以通过一般计算方法来执行数学上的精确误差计算。另一方面,通过根据本实施例的计算方法计算的误差不像一般计算方法一样精确。然而,在根据本实施例的计算方法中,由于不需要将数据划分为两个部分,因此预测值的计算和误差的计算可以包括在单个矩阵计算中。
在本实施例中,距离估计单元290通过矩阵计算来计算误差,并且当误差超过预定范围时,可通过图10所示的预定次数(k次)的重复计算、基于距离矩阵R来重计算预测距离矩阵R’,而不使用第一示例和第二示例。第一示例和第二示例可以通过高效地省略计算来抑制处理量,但是由于省略了计算因此出现了一些误差。当误差累积时,预测距离矩阵R’中的预测值的准确度可能降低。因此,优选的是,距离估计单元290计算矩阵计算中的误差并且基于该结果执行预测距离矩阵R’的重计算。
然而,随着存储在存储装置130中的图像数量增加,距离矩阵R的大小增加。此外,由于顺序添加图像,因此可能以高频率来执行距离估计单元290的矩阵计算。因此,不易如在一般计算方法中一样与原始矩阵计算分开执行针对误差评估的矩阵计算。同时,在本示例的计算方法中,可以使用原始矩阵计算的结果来评估误差,因此可以由距离估计单元290来执行误差评估。
如上所述,通过根据本实施例的计算方法计算的误差在数学精确方面不能与一般计算方法相比较。然而,在距离估计单元290中,不需要根据绝对参考来计算准确误差,从而检测相对改变趋势比如误差是否增加。因此,在本实施例中,距离估计单元290通过本示例的计算方法来计算矩阵计算的误差,并且基于该误差确定是否要重计算预测距离矩阵R’,因此可以以适当的定时重计算预测距离矩阵R’,并且可以维持元素预测准确度。
此外,距离估计单元290可使用除比如RMSE的误差之外的标准来确定是否要重计算预测距离矩阵R’。例如,当省略了计算的预测距离矩阵R’的计算由于新图像的添加而执行了预定次数时,距离估计单元290可确定要重计算预测距离矩阵R’。替选地,距离估计单元290可确定每隔预定时间段要重计算预测距离矩阵R’。
(2-4.处理流程)
图15是示出根据本公开的第二实施例的服务器的处理的概况的流程图。将参照该流程图从不同的观点来描述本实施例的配置。
在服务器200中,首先,输入单元110接收图像的输入(步骤S101)。接下来,特征检测单元120提取新接收的图像的特征量(步骤S103)。此外,距离计算单元240计算新接收的图像与先前存储在存储装置130中的一些图像之间的图像间距离(步骤S201)。此外,距离估计单元290通过用于基于距离矩阵R计算预测距离矩阵R’的矩阵计算来估计剩余图像的图像间距离(步骤S203)。
接下来,相似度得分计算单元150可基于计算的或估计的图像间距离而计算相似度得分(步骤S205)。与第一实施例类似,相似度得分的计算不一定执行。在该情况下,聚类单元170仅基于图像间距离执行聚类。随后的处理(步骤S107至S113)与第一实施例中相同,并且将省略重复描述。
通过以上处理,与第一实施例类似,可以适当地确定新接收的图像要被分类到其中的聚类,并且当图像原始存在时将被分类到同一聚类中的图像也可以被重分类为同一聚类中。此外,可以实时输出聚类结果。
此外,在本实施例中,通过步骤S201和S203的处理,对存储在存储装置中的一些图像执行图像间距离的计算,并且对剩余图像估计图像间距离。因此,可以抑制针对图像间距离的计算而产生的对存储装置的访问,可以以高速执行处理,从而可以改进实时特性。
另外,在步骤S203中的用于估计图像间距离的矩阵计算中,使用紧邻在前的计算结果来减少重计算次数,并且限制用作重计算目标的矩阵的行。因此,可以进一步提高处理速度。此时,由于根据预定条件来执行重计算(没有省略计算的矩阵计算),因此可以防止由于计算省略而引起的预测准确度的劣化。
(3.硬件配置)
接下来,将参照图16描述根据本公开的实施例的信息处理装置的硬件配置。图16是用于描述信息处理装置的硬件配置的框图。例如,图16所示的信息处理装置900可由构成根据以上实施例的服务器的一个或更多个信息处理装置来实现。
信息处理装置900包括CPU901、只读存储器(ROM)903和随机存取存储器(RAM)905。信息处理装置900还包括主机总线907、桥接器909、外部总线911、接口913、输入装置915、输出装置917、存储装置919、驱动器921、连接端口923和通信装置925。信息处理装置900可包括取代CPU901或者与CPU901一起的处理电路比如数字信号处理器(DSP)。
CPU901用作算术处理单元和控制装置,并且根据记录在ROM903、RAM905、存储装置919或可移除记录介质927中的各种程序来控制信息处理装置900的总体操作或操作的一部分。RAM905主要存储在CPU901的运行中使用的程序、在运行中适当地改变的参数等。CPU901、ROM903和RAM905经由主机总线907相互连接,主机总线907由诸如CPU总线的内部总线构成。此外,主机总线907通过桥接器909连接到外部总线911比如***部件互连/接口(PCI)。
例如,输入装置915是用户操作的装置,比如鼠标、键盘、触摸面板、按钮、开关和控制杆。例如,输入装置915可以是使用红外线或任意其它无线电波的远程控制装置或者可以是对信息处理装置900的操作进行响应的外部连接装置929比如移动电话。输入装置915包括输入/输出(I/O)控制电路,该输入/输出控制电路基于用户输入的信息而生成输入信号并且将输入信号输出到CPU901。用户操作输入装置915以将各种数据输入到信息处理装置900或者指示信息处理装置900执行处理操作。
输出装置917由能够在视觉上或听觉上向用户通知所获取的信息的装置构成。输出装置917的示例包括显示装置比如液晶显示器(LCD)、等离子显示面板(PDP)、有机电致发光(EL)显示器,音频输出装置比如扬声器或耳机,以及打印机装置。输出装置917输出作为通过信息处理装置900的处理而获得的结果的视频比如文本或图像或者声音比如语音或音响效果。
存储装置919是被配置为信息处理装置900的存储单元的示例的数据存储装置。存储装置919的示例包括磁存储装置比如硬盘驱动器(HDD)、半导体存储器装置、光存储装置和磁光存储装置。存储装置919存储CPU901执行的程序、各种数据、从外部获取的各种数据等。
驱动器921是用于可移除记录介质927比如磁盘、光盘、磁光盘或半导体存储器的读取器/写入器,并且配备在信息处理装置900中或者安装在信息处理装置900外部。驱动器921读取记录在所安装的可移除记录介质927中的信息,并且将所读取的信息输出到RAM905。此外,驱动器921在所安装的可移除记录介质927中写入记录。
连接端口923是装置通过其直接连接到信息处理装置900的端口。连接端口923的示例包括通用串行总线(USB)端口、IEEE1394端口和小型计算机***接口(SCSI)端口。此外,连接端口923可以是RS-232C端口、光音频端子或高清多媒体接口(HDMI)端口。当外部连接装置929连接到连接端口923时,可以在信息处理装置900与外部连接装置929之间交换各种数据。
例如,通信装置925是由提供到通信网络931的连接的通信装置构成的通信接口。例如,通信装置925可以是用于有线或无线局域网(LAN)、蓝牙(注册商标)或无线USB(WUSB)的通信卡。此外,通信装置925可以是用于光通信的路由器、用于异步数字用户线路(ADSL)的路由器或者用于各种通信的调制解调器。例如,通信装置925使用预定协议比如TCP/IP与因特网或其它通信装置执行信号等的传送和接收。此外,连接到通信装置925的通信网络931是以有线或无线方式连接的网络,并且通信网络931的示例包括因特网、家庭LAN、红外线(IR)通信网络、无线电波通信和卫星通信网络。
以上描述了信息处理装置900的示例性硬件配置。每个部件可使用通用构件来配置或者可由专用于每个部件的功能的硬件来配置。该配置可根据实施时的技术水平而适当地改变。
(4.补充)
本公开的实施例可包括上述信息处理装置和***、由信息处理装置或***执行的信息处理方法、用于使得信息处理装置工作的程序和包括其中记录的程序的非暂态记录介质。
已经结合由服务器执行的处理描述了以上实施例,但是本公开的示例不限于该示例。例如,当用户将大量图像存储在本地存储装置中并且频繁地添加图像并拥有具有高处理能力的终端装置比如个人计算机(PC)时,上述处理可以由用户使用的终端装置比如PC来执行。替选地,以上处理可由终端装置和服务器分散地执行。在该情况下,输入单元和输出单元可由装配在终端装置中的I/O装置比如摄像装置或显示器来实现。
此外,在以上实施例中,图像被描述为处理目标的数据,但是本公开的示例不限于该示例。根据本公开的技术可以应用于任意领域,只要位置定义在特征量空间中并且基于数据段之间的距离执行分类到聚类且新数据是顺序添加的数据即可。因此,数据不限于图像,而是可以是例如在各种领域比如统计、模式识别和数据挖掘中使用的数据。
本领域的技术人员应理解,在所附权利要求或其等同物的范围内,根据设计要求和其它因素,可进行各种修改、组合、子组合和变更。
替选地,本技术还可如下配置。
(1)一种信息处理装置,包括:
聚类重配置确定单元,在具有特征量空间中的位置信息的新数据被添加到数据组的情况下,如果在聚类中存在基于所述特征量空间中的距离而能够将所述新数据分类到其中的多个候选聚类,则确定当将所述新数据分类到所述聚类时要对所述候选聚类进行重配置,其中,在所述数据组中每个数据均具有所述特征量空间中的位置信息并且基于所述特征量空间中的距离而被分类到所述聚类。
(2)根据(1)所述的信息处理装置,还包括:
距离计算单元,生成具有所述数据组中包括的数据与所述新数据之间在所述特征量空间中的距离作为元素的距离矩阵,并且将基于所述特征量空间中的位置信息计算的距离设置为所述距离矩阵的一些元素;以及
距离估计单元,通过使用所述距离矩阵的矩阵计算,计算包括所述距离矩阵的没有设置计算的距离的元素的预测值的预测距离矩阵,
其中,所述聚类重配置确定单元基于所述预测距离矩阵来确定所述候选聚类。
(3)根据(2)所述的信息处理装置,
其中,所述距离估计单元通过参考所述距离矩阵交替地重计算从所述距离矩阵推出的矩阵对而生成中间矩阵对,并且基于所述中间矩阵对计算所述预测距离矩阵。
(4)根据(3)所述的信息处理装置,
其中,所述新数据包括第一新数据和在所述第一新数据之后添加的第二新数据,
其中,所述距离矩阵包括当添加所述第一新数据时生成的第一距离矩阵和当添加所述第二新数据时生成的第二距离矩阵,
其中,所述预测距离矩阵包括当添加所述第一新数据时计算的第一预测距离矩阵和当添加所述第二新数据时计算的第二预测距离矩阵,以及
其中,所述距离估计单元通过取代从所述第二距离矩阵推出的矩阵对而使用当添加所述第一新数据时所生成的中间矩阵对,使得当基于所述第二距离矩阵计算所述第二预测距离矩阵时的重计算次数小于当基于所述第一距离矩阵计算所述第一预测距离矩阵时的重计算次数。
(5)根据(4)所述的信息处理装置,
其中,所述距离估计单元将当基于所述第二距离矩阵计算所述第二预测距离矩阵时的重计算目标限制为包括与所述第一距离矩阵和所述第二距离矩阵之间的差对应的行的一些行。
(6)根据(5)所述的信息处理装置,
其中,所述一些行包括对应于所述差的行和至少一个其它行。
(7)根据(6)所述的信息处理装置,
其中,所述一些行包括对应于所述差的行以及与对应于所述差的行相关性高的至少一个行。
(8)根据(4)至(7)中的任意一项所述的信息处理装置,
其中,当满足预定条件时,所述距离估计单元通过参考所述第二距离矩阵交替地重计算从所述第二距离矩阵推出的矩阵对而重生成所述中间矩阵对,并且基于重生成的中间矩阵对来重计算所述第二预测距离矩阵。
(9)根据(8)所述的信息处理装置,
其中,当所述第二距离矩阵与所述第二预测距离矩阵之间的误差超过预定范围时,所述距离估计单元重计算所述第二预测距离矩阵。
(10)根据(9)所述的信息处理装置,
其中,所述距离估计单元将所述第二距离矩阵的设置了计算的距离的元素与所述第二预测距离矩阵中的相应元素的预测值进行比较,从而计算所述误差。
(11)根据(8)至(10)中的任意一项所述的信息处理装置,
其中,当取代从所述第二距离矩阵推出的矩阵对而使用当添加所述第一新数据时所生成的中间矩阵对的、所述第二预测距离矩阵的计算执行了预定次数时,所述距离估计单元重计算所述第二预测距离矩阵。
(12)根据(8)至(11)中的任意一项所述的信息处理装置,
其中,所述距离估计单元每隔预定时间段重计算所述第二预测距离矩阵。
(13)根据(1)至(12)中的任意一项所述的信息处理装置,
其中,所述聚类重配置确定单元根据用作重配置目标的候选聚类的数量或者包括在相应候选聚类中的数据段的数量,改变用于确定所述候选聚类的阈值。
(14)根据(1)至(13)中的任意一项所述的信息处理装置,还包括:
相似度得分计算单元,基于所述特征量空间中的距离来计算数据段之间的相似度得分,
其中,所述聚类重配置确定单元基于所述相似度得分的相关性来确定所述候选聚类。
(15)根据(1)至(14)中的任意一项所述的信息处理装置,还包括:
输入单元,在时间上分散并且顺序接收所述新数据的输入。
(16)根据(1)至(15)中的任意一项所述的信息处理装置,还包括:
存储器,存储作为所述数据组的图像组;
特征提取单元,提取作为所述新数据的新图像的特征量;
距离计算单元,计算包括在所述图像组中的图像与所述新图像之间在所述特征量空间中的距离;
聚类单元,当确定了要重配置的候选聚类时将所述新图像分类到重配置的聚类,并且在其它情况下将所述新图像分类到聚类中的一个或新聚类而不对聚类进行重配置;以及
输出单元,输出将所述新图像分类到聚类的结果。
(17)一种信息处理方法,包括:
在将具有特征量空间中的位置信息的新数据添加到数据组的情况下,如果在聚类中存在基于所述特征量空间中的距离而能够将所述新数据分类到其中的多个候选聚类,则确定当将所述新数据分类到所述聚类时要对所述候选聚类进行重配置,其中,在所述数据组中每个数据均具有所述特征量空间中的位置信息并且基于所述特征量空间中的距离而被分类到聚类。
(18)一种使得计算机执行以下功能的程序:在将具有特征量空间中的位置信息的新数据添加到数据组的情况下,如果在聚类中存在基于所述特征量空间中的距离而能够将所述新数据分类到其中的多个候选聚类,则确定当将所述新数据分类到所述聚类时要对所述候选聚类进行重配置,其中,在所述数据组中每个数据均具有所述特征量空间中的位置信息并且基于所述特征量空间中的距离而被分类到聚类。
Claims (18)
1.一种信息处理装置,包括:
聚类重配置确定单元,在具有特征量空间中的位置信息的新数据被添加到数据组的情况下,如果在聚类中存在基于所述特征量空间中的距离而能够将所述新数据分类到其中的多个候选聚类,则确定当将所述新数据分类到所述聚类时要对所述候选聚类进行重配置,其中,在所述数据组中每个数据均具有所述特征量空间中的位置信息并且基于所述特征量空间中的距离而被分类到所述聚类。
2.根据权利要求1所述的信息处理装置,还包括:
距离计算单元,生成具有所述数据组中包括的数据与所述新数据之间在所述特征量空间中的距离作为元素的距离矩阵,并且将基于所述特征量空间中的位置信息计算的距离设置为所述距离矩阵的一些元素;以及
距离估计单元,通过使用所述距离矩阵的矩阵计算,计算包括所述距离矩阵的没有设置计算的距离的元素的预测值的预测距离矩阵,
其中,所述聚类重配置确定单元基于所述预测距离矩阵来确定所述候选聚类。
3.根据权利要求2所述的信息处理装置,
其中,所述距离估计单元通过参考所述距离矩阵交替地重计算从所述距离矩阵推出的矩阵对而生成中间矩阵对,并且基于所述中间矩阵对计算所述预测距离矩阵。
4.根据权利要求3所述的信息处理装置,
其中,所述新数据包括第一新数据和在所述第一新数据之后添加的第二新数据,
其中,所述距离矩阵包括当添加所述第一新数据时生成的第一距离矩阵和当添加所述第二新数据时生成的第二距离矩阵,
其中,所述预测距离矩阵包括当添加所述第一新数据时计算的第一预测距离矩阵和当添加所述第二新数据时计算的第二预测距离矩阵,以及
其中,所述距离估计单元通过取代从所述第二距离矩阵推出的矩阵对而使用当添加所述第一新数据时所生成的中间矩阵对,使得当基于所述第二距离矩阵计算所述第二预测距离矩阵时的重计算次数小于当基于所述第一距离矩阵计算所述第一预测距离矩阵时的重计算次数。
5.根据权利要求4所述的信息处理装置,
其中,所述距离估计单元将当基于所述第二距离矩阵计算所述第二预测距离矩阵时的重计算目标限制为包括与所述第一距离矩阵和所述第二距离矩阵之间的差对应的行的一些行。
6.根据权利要求5所述的信息处理装置,
其中,所述一些行包括对应于所述差的行和至少一个其它行。
7.根据权利要求6所述的信息处理装置,
其中,所述一些行包括对应于所述差的行以及与对应于所述差的行相关性高的至少一个行。
8.根据权利要求4所述的信息处理装置,
其中,当满足预定条件时,所述距离估计单元通过参考所述第二距离矩阵交替地重计算从所述第二距离矩阵推出的矩阵对而重生成所述中间矩阵对,并且基于重生成的中间矩阵对来重计算所述第二预测距离矩阵。
9.根据权利要求8所述的信息处理装置,
其中,当所述第二距离矩阵与所述第二预测距离矩阵之间的误差超过预定范围时,所述距离估计单元重计算所述第二预测距离矩阵。
10.根据权利要求9所述的信息处理装置,
其中,所述距离估计单元将所述第二距离矩阵的设置了计算的距离的元素与所述第二预测距离矩阵中的相应元素的预测值进行比较,从而计算所述误差。
11.根据权利要求8所述的信息处理装置,
其中,当取代从所述第二距离矩阵推出的矩阵对而使用当添加所述第一新数据时所生成的中间矩阵对的、所述第二预测距离矩阵的计算执行了预定次数时,所述距离估计单元重计算所述第二预测距离矩阵。
12.根据权利要求8所述的信息处理装置,
其中,所述距离估计单元每隔预定时间段重计算所述第二预测距离矩阵。
13.根据权利要求1所述的信息处理装置,
其中,所述聚类重配置确定单元根据用作重配置目标的候选聚类的数量或者包括在相应候选聚类中的数据段的数量,改变用于确定所述候选聚类的阈值。
14.根据权利要求1所述的信息处理装置,还包括:
相似度得分计算单元,基于所述特征量空间中的距离来计算数据段之间的相似度得分,
其中,所述聚类重配置确定单元基于所述相似度得分的相关性来确定所述候选聚类。
15.根据权利要求1所述的信息处理装置,还包括:
输入单元,在时间上分散并且顺序接收所述新数据的输入。
16.根据权利要求1所述的信息处理装置,还包括:
存储器,存储作为所述数据组的图像组;
特征提取单元,提取作为所述新数据的新图像的特征量;
距离计算单元,计算包括在所述图像组中的图像与所述新图像之间在所述特征量空间中的距离;
聚类单元,当确定了要重配置的候选聚类时将所述新图像分类到重配置的聚类,并且在其它情况下将所述新图像分类到聚类中的一个或新聚类而不对聚类进行重配置;以及
输出单元,输出将所述新图像分类到聚类的结果。
17.一种信息处理方法,包括:
在将具有特征量空间中的位置信息的新数据添加到数据组的情况下,如果在聚类中存在基于所述特征量空间中的距离而能够将所述新数据分类到其中的多个候选聚类,则确定当将所述新数据分类到所述聚类时要对所述候选聚类进行重配置,其中,在所述数据组中每个数据均具有所述特征量空间中的位置信息并且基于所述特征量空间中的距离而被分类到聚类。
18.一种使得计算机执行以下功能的程序:在将具有特征量空间中的位置信息的新数据添加到数据组的情况下,如果在聚类中存在基于所述特征量空间中的距离而能够将所述新数据分类到其中的多个候选聚类,则确定当将所述新数据分类到所述聚类时要对所述候选聚类进行重配置,其中,在所述数据组中每个数据均具有所述特征量空间中的位置信息并且基于所述特征量空间中的距离而被分类到聚类。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012-245980 | 2012-11-08 | ||
JP2012245980A JP2014095967A (ja) | 2012-11-08 | 2012-11-08 | 情報処理装置、情報処理方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103810230A true CN103810230A (zh) | 2014-05-21 |
Family
ID=50622456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310534424.1A Pending CN103810230A (zh) | 2012-11-08 | 2013-11-01 | 信息处理装置、信息处理方法和程序 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20140126830A1 (zh) |
JP (1) | JP2014095967A (zh) |
CN (1) | CN103810230A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021376A (zh) * | 2016-05-11 | 2016-10-12 | 上海点荣金融信息服务有限责任公司 | 用于处理用户信息的方法和设备 |
CN109522937A (zh) * | 2018-10-23 | 2019-03-26 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN109990803A (zh) * | 2018-01-02 | 2019-07-09 | 西门子(中国)有限公司 | 检测***异常的方法、装置及传感器处理的方法、装置 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5755822B1 (ja) * | 2014-06-30 | 2015-07-29 | 楽天株式会社 | 類似度算出システム、類似度算出方法およびプログラム |
CN104133917B (zh) * | 2014-08-15 | 2018-08-10 | 百度在线网络技术(北京)有限公司 | 照片的分类存储方法及装置 |
WO2016098589A1 (ja) * | 2014-12-15 | 2016-06-23 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム、および情報処理システム |
CN104765820B (zh) * | 2015-04-07 | 2018-05-11 | 浙江大学 | 一种非侵入式的服务依赖关系发现方法 |
US10699156B2 (en) * | 2016-01-13 | 2020-06-30 | Peking University Shenzhen Graduate School | Method and a device for image matching |
JP6433928B2 (ja) * | 2016-02-15 | 2018-12-05 | 株式会社東芝 | 検索装置、検索方法および検索システム |
US11328024B2 (en) * | 2017-03-27 | 2022-05-10 | Hitachi, Ltd. | Data analysis device and data analysis method |
CN109815971B (zh) * | 2017-11-20 | 2023-03-10 | 富士通株式会社 | 信息处理方法和信息处理装置 |
US20220342913A1 (en) * | 2019-10-07 | 2022-10-27 | Panasonic Intellectual Property Management Co., Ltd. | Classification system, classification method, and program |
JP2021170336A (ja) * | 2021-06-07 | 2021-10-28 | 紘司 余田 | 電子データをスマートに保存管理するシステム |
EP4359962A1 (en) | 2021-06-25 | 2024-05-01 | L & T Technology Services Limited | Method and system for clustering data samples |
-
2012
- 2012-11-08 JP JP2012245980A patent/JP2014095967A/ja active Pending
-
2013
- 2013-09-18 US US14/030,436 patent/US20140126830A1/en not_active Abandoned
- 2013-11-01 CN CN201310534424.1A patent/CN103810230A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021376A (zh) * | 2016-05-11 | 2016-10-12 | 上海点荣金融信息服务有限责任公司 | 用于处理用户信息的方法和设备 |
CN106021376B (zh) * | 2016-05-11 | 2019-05-10 | 上海点融信息科技有限责任公司 | 用于处理用户信息的方法和设备 |
CN109990803A (zh) * | 2018-01-02 | 2019-07-09 | 西门子(中国)有限公司 | 检测***异常的方法、装置及传感器处理的方法、装置 |
CN109522937A (zh) * | 2018-10-23 | 2019-03-26 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN109522937B (zh) * | 2018-10-23 | 2021-02-19 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2014095967A (ja) | 2014-05-22 |
US20140126830A1 (en) | 2014-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103810230A (zh) | 信息处理装置、信息处理方法和程序 | |
US11763599B2 (en) | Model training method and apparatus, face recognition method and apparatus, device, and storage medium | |
JP7213358B2 (ja) | アイデンティティ検証方法、アイデンティティ検証装置、コンピュータ機器、及びコンピュータプログラム | |
CN110929807B (zh) | 图像分类模型的训练方法、图像分类方法及装置 | |
JP2020518938A (ja) | ニューラルネットワークを用いたシーケンスデータの分析 | |
US20150213360A1 (en) | Crowdsourcing system with community learning | |
US20220012502A1 (en) | Activity detection device, activity detection system, and activity detection method | |
Lakkaraju et al. | A bayesian framework for modeling human evaluations | |
CN109033793A (zh) | 滑动验证码人机识别方法及装置、电子设备及可读介质 | |
WO2022193753A1 (zh) | 持续学习方法、装置、终端及存储介质 | |
Zhang et al. | Multi-metric learning for multi-sensor fusion based classification | |
CN109447110A (zh) | 综合邻居标签相关性特征和样本特征的多标签分类的方法 | |
WO2022142903A1 (zh) | 身份识别方法、装置、电子设备及相关产品 | |
Zhang et al. | Mind your neighbours: Image annotation with metadata neighbourhood graph co-attention networks | |
JP6950504B2 (ja) | 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置 | |
KR20230165085A (ko) | 멀티 모달 특징 벡터 사이의 정렬 정도를 정량적으로 평가하는 방법 및 시스템 | |
US10229212B2 (en) | Identifying Abandonment Using Gesture Movement | |
Massip et al. | Exploiting category-specific information for image popularity prediction in social media | |
US20230409422A1 (en) | Systems and Methods for Anomaly Detection in Multi-Modal Data Streams | |
CN116935083A (zh) | 一种图像聚类方法和装置 | |
Guo et al. | Joint intermodal and intramodal correlation preservation for semi-paired learning | |
CN112529181A (zh) | 用于模型蒸馏的方法和装置 | |
WO2023060578A1 (en) | Systems and methods for multi-task and multi-scene unified ranking | |
US20220300740A1 (en) | System and method for enhancing machine learning model for audio/video understanding using gated multi-level attention and temporal adversarial training | |
Wu et al. | MetaWCE: Learning to Weight for Weighted Cluster Ensemble |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140521 |