CN101908057B - 信息处理装置与信息处理方法 - Google Patents
信息处理装置与信息处理方法 Download PDFInfo
- Publication number
- CN101908057B CN101908057B CN2010101944430A CN201010194443A CN101908057B CN 101908057 B CN101908057 B CN 101908057B CN 2010101944430 A CN2010101944430 A CN 2010101944430A CN 201010194443 A CN201010194443 A CN 201010194443A CN 101908057 B CN101908057 B CN 101908057B
- Authority
- CN
- China
- Prior art keywords
- data block
- target
- metadata piece
- piece
- metadata
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 10
- 238000003672 processing method Methods 0.000 title claims abstract description 7
- 238000004458 analytical method Methods 0.000 claims abstract description 17
- 230000003750 conditioning effect Effects 0.000 claims description 13
- 238000012423 maintenance Methods 0.000 claims description 3
- 238000012790 confirmation Methods 0.000 claims 2
- 238000000034 method Methods 0.000 description 144
- 230000008569 process Effects 0.000 description 102
- 238000012545 processing Methods 0.000 description 96
- 238000010586 diagram Methods 0.000 description 36
- 239000002245 particle Substances 0.000 description 10
- 238000003860 storage Methods 0.000 description 9
- HUTDUHSNJYTCAR-UHFFFAOYSA-N ancymidol Chemical compound C1=CC(OC)=CC=C1C(O)(C=1C=NC=NC=1)C1CC1 HUTDUHSNJYTCAR-UHFFFAOYSA-N 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 238000003384 imaging method Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000011084 recovery Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/587—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32106—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file
- H04N1/32117—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file in a separate transmission or protocol signal prior to or subsequent to the image data transmission, e.g. in digital identification signal [DIS], in non standard setup [NSS] or in non standard field [NSF]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3225—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
- H04N2201/3253—Position information, e.g. geographical position at time of capture, GPS data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Software Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Abstract
公开了一种信息处理装置和方法。该信息处理装置包括:适于从目标数据块获取位置元数据块的第一位置获取单元,该位置元数据块指示位置;适于从与目标数据块不同的多个其它数据块获取多个位置元数据块的第二位置获取单元;适于从其它数据块获取除多个位置元数据块之外的目标元数据块的目标获取单元;适于根据由从其它数据块获取的多个位置元数据块所指示的位置来分析目标元数据块的分布的分析单元;及分配单元,适于根据由从目标数据块获取的位置元数据块所指示的位置与所述分布,来向目标数据块分配具有与该目标数据块相关的值的目标元数据块,该目标元数据块是从经分析的目标元数据块中选择的。
Description
技术领域
本发明涉及信息处理装置与信息处理方法,尤其涉及将元数据分配给目标数据的技术。
背景技术
数码照相机与数码摄像机的普及极大地增加了用户管理的静止图像与运动图像的数量。为了管理这么大量的图像数据,使用说明图像的信息,例如拍摄时的事件和拍摄地点的名称,这种信息被称为元数据。例如,用户输入要查找的图像数据的事件名等,就可以基于该事件名等查找期望的图像数据。
传统上,为了分配这种元数据,已知有如下配置,其中利用从外部源获得的信息来估计与图像相关的信息(日本专利特开第2005-149511号)。在这种配置中,可从外部源获得的信息是利用代表拍摄时状态的元数据(例如,拍摄日期和时间或者拍摄位置)标识的。在外部源提供诸如全国天气服务的***管理的信息的情况下,元数据将是高精度地确定的。
然而,在例如事先已经分配了拍摄地点名称的图像数据块被收集并用作外部源时,不是总能高精度地确定元数据。例如,诸如拍摄地点名称的数据可能具有层次。因此,对相同的拍摄地点可能分配不同的元数据值。此外,不考虑事例数据块相对于估计目标数据块的分布,而对一般的元数据估计方法不加选择的使用不是总能高精度地确定最优的元数据。因此,仅仅标识具有代表拍摄时状态的相似元数据的那些数据块是不够的。
发明内容
本发明的一个目的是提供如下一种技术,该技术允许高精度地确定适合的元数据,而与为估计元数据而事先准备的数据的属性无关。
根据本发明的一方面,提供了一种信息处理装置,该信息处理装置包括:第一位置获取单元,适于从目标数据块获取一位置元数据块,该位置元数据块指示位置;第二位置获取单元,适于从与所述目标数据块不同的多个其它数据块获取多个位置元数据块;目标获取单元,适于从所述其它数据块获取除所述多个位置元数据块之外的目标元数据块;分析单元,适于根据由从所述其它数据块获取的多个位置元数据块指示的位置来分析所述目标元数据块的分布;以及分配单元,适于根据由从所述目标数据块获取的位置元数据块指示的位置与所述分布,来向所述目标数据块分配具有与该目标数据块相关的值的目标元数据块,该目标元数据块选自经分析的目标元数据块。
根据本发明的另一方面,提供了一种信息处理方法,该信息处理方法包括:第一位置获取步骤,用于从目标数据块获取位置元数据块,该位置元数据块指示位置;第二位置获取步骤,用于从与所述目标数据块不同的多个其它数据块获取位置元数据块;目标获取步骤,用于从所述其它数据块获取除所述位置元数据块之外的目标元数据块;分析步骤,用于根据由从所述其它数据块获取的位置元数据块指示的位置来分析所述目标元数据块的分布;以及分配步骤,用于根据由从所述目标数据块获取的位置元数据块指示的位置与所述分布,来向所述目标数据块分配具有与该目标数据块相关的值的目标元数据块,该目标元数据块选自经分析的目标元数据块。
根据以下对示例性实施例的描述(参照附图),本发明的进一步特征将变得显而易见。
附图说明
图1例示了计算机设备的示例硬件配置。
图2例示了图像数据的示例配置。
图3例示了构成元数据分配设备的示例模块。
图4是示出事例数据块与估计目标数据块的分布的示例的概念图。
图5例示了保持指示层次结构的信息的表的示例。
图6是示出由元数据分配设备所执行的示例过程的流程图。
图7例示了估计规则表的示例。
图8是示出估计处理中的示例过程的流程图。
图9例示了处理选择表的示例。
图10是示出状态分析处理中的示例过程的流程图。
图11是示出简单估计处理中的示例过程的流程图。
图12是示出重复估计处理中的示例过程的流程图。
图13是示出层次性估计处理中的示例过程的流程图。
图14例示了包含附加特征元数据的估计规则表的示例。
图15例示了构成层次结构构造设备的示例模块。
图16是示出由层次结构构造设备所执行的处理的示例过程的流程图。
图17是示出由群集事例数据块所获得的结果的示例的概念图。
图18例示了群集表的示例。
图19例示了层次结构表的示例。
具体实施方式
下面将参照附图详细描述本发明的示例性实施例。
硬件配置
将参照图1中的框图来描述根据本实施例的构成服务器设备或客户端设备的计算机设备的硬件配置。根据需要,服务器设备或者客户端设备各自可以由单个计算机设备来实现或者由具有分布式功能的多个计算机设备来实现。在一个设备由多个计算机设备配置的情况下,那些设备连接到诸如局域网(LAN)的网络,从而彼此建立通信。每个计算机设备可以由诸如个人计算机(PC)或者工作站(WS)的信息处理装置来实现。
在图1中,标号101指示用于控制整个计算机设备100的中央处理单元(CPU)。标号102指示存储不需要任何改变的程序和参数的只读存储器(ROM)。标号103指示临时存储例如从外部设备提供的程序和数据的随机存取存储器(RAM)。
标号104指示用于存储数据的外部存储设备。存储设备的示例包括固定安装到计算机设备100的硬盘以及存储卡。外部存储设备104的其它示例包括诸如可以从计算机设备100拆除的软盘(FD)和紧凑盘(CD)的光盘,以及诸如磁卡或光学卡、IC卡和存储卡的存储介质。
标号105指示与输入设备109的接口,其中的输入设备109例如是通过用户操作输入数据的指示设备或键盘。标号106指示与监视器110的接口,其中监视器110用于显示计算机设备100中保持的数据或者提供的数据。标号107指示通信接口,该通信接口用于提供到诸如互联网的网络线路111或者到诸如数码照相机112或数码摄像机113的成像设备的连接。标号108指示用以连接单元101至107从而使得能够进行通信的***总线。随后要描述的操作是通过CPU 101执行存储在诸如ROM 102的计算机可读存储介质中的程序来实现的。
图像数据的配置
将参照图2来描述根据本实施例的图像数据的配置。在图2中,图像数据200或者是由数码照相机生成的静止图像,或者是由数码摄像机生成的运动图像。图像数据200包括元数据201和图像主体数据207。
元数据201是说明图像数据200的数据。在本实施例中,元数据201是由拍摄日期和时间202、拍摄位置203、摄影师信息204、地名205和事件名206构成的,每个元数据块都具有元数据名称和值。
拍摄日期和时间202指示数码照相机捕捉图像的日期和时间或者利用数码摄像机拍摄的起始日期和时间,而且它可以由成像设备分配。拍摄位置203指示由例如全球定位***(GPS)分配的拍摄位置信息。摄影师信息204是关于执行拍摄的人的信息,例如成像设备的所有者的名字,这可以根据成像设备的设置来分配。
地名205和事件名206分别指示拍摄时的地点和事件的名称。它们可以由用户分配或者利用根据本实施例的元数据分配设备来分配。应当指出,所有那些元数据块不是总被分配,例如,可能存在只分配拍摄日期和时间202以及拍摄位置203的情况。
应当指出,元数据201是以例如Exif、XML或XMP(可扩展元数据平台)格式描述的。在图2中,尽管地名205和事件名206各自具有单个分配的值,但也可以向它们分配多个值。可选地,可以向它们分配层次性值。例如,可以分配诸如“东京=>东京塔”的值。在这里,符号“=>”代表层次关系。
图像主体数据207是图像数据200的主体,它是静止图像或运动图像的像素数据。应当指出,元数据201可以与图像主体数据207相关联地单独存储,而不是嵌入到图像数据200中。
元数据分配设备的配置
将参照图3来描述根据本实施例的元数据分配设备的配置。图3是例示了元数据分配设备的功能性配置的框图。事例管理单元301管理先前已经分配了元数据的图像数据。可选地,它可以只管理元数据201,而不保持图像主体数据207。作为另一种可选,可以管理等同于元数据信息的信息。例如,可以管理处于具有由用户登录的维度和经度的点的地名。在下文中,由事例管理单元301管理的多种类型的元数据块称为“事例数据块”。如随后所描述的,事例数据块用于确定分配给要进行元数据分配的目标的元数据值。应当指出,在元数据具有多个值或者层次性值的情况下,那些值可以被划分并作为单独的事例数据块(元数据块)来管理。在本实施例中,事例数据块从事例管理单元301读取并获得(第二获取)。
在本实施例中,包括由事例管理单元301管理的事例数据块的图像数据存储在外部存储设备104中。然而,它还可以存储在例如网络上的计算机设备、数码照相机或者数码摄像机中,并可以通过通信接口107获取。而且,图像数据的保存位置不限于此。
分配目标获取单元302获取要向其分配元数据的图像数据(下文中称为“估计目标数据”)。有些可能的元数据块事先已经被分配给了估计目标数据。如随后所描述的,利用这种事先分配给估计目标数据的元数据并利用事例数据来执行估计,由此来确定要分配给估计目标数据的元数据(下文中称为“估计目标元数据”)。
估计目标数据(图像数据)是由外部存储设备104获取的,其中外部存储设备104获得由输入设备109指定的图像数据。可选地,估计目标数据可以通过通信接口107从网络上的计算机设备或者诸如数码照相机的成像设备获取。作为另一种可选,估计目标数据可以通过成像设备检测其到通信接口107的连接来自动地获取。作为又一种可选,在根据本实施例的元数据分配设备配置成服务器设备的情况下,图像数据可以通过通信接口107从客户端设备获取。作为还一种可选,分配目标获取单元302可以只获取对应于图像数据的元数据201作为估计目标数据,而不获取图像主体数据207(第一获取)。
基于预设事例数据和已经分配给所获取的图像数据的元数据根据估计来确定并获取要分配给估计目标数据的元数据(估计目标元数据)。然而,估计目标元数据可以由输入设备109指定,或者可以从记录在外部存储设备104中的预定配置文件读取。可选地,估计目标元数据可以事先保持。作为另一种可选,在根据本实施例的元数据分配设备配置成服务器设备的情况下,估计目标元数据可以在客户端设备请求时指定。应当指出,用于获取图像数据和元数据的方法不限于在此所述的示例。
现在,将概述本实施例中所使用的估计方法的基本思想及本说明书中所使用的术语,然后将返回到对图3的示例的描述。在本实施例中,要分配给由分配目标获取单元302所获取的估计目标数据的估计目标元数据是利用由事例管理单元301管理的事例数据块来估计的。在这里,k最近邻鉴别器主要地用作鉴别手段。现在将描述这种k最近邻鉴别器。
k最近邻鉴别器是一种用于从包括特征向量与标签的集合的训练数据中为不具有标签的测试数据确定标签的手段。具体而言,从给定的训练数据块中选择与测试数据具有类似特征向量的k个训练数据块,所选训练数据块中最公用的标签被确定为测试数据的标签。特征向量之间的相似性可以利用例如向量之间的欧几里得距离来确定。
应当指出,根据本实施例的鉴别手段不限于k最近邻鉴别器。例如,可以使用诸如支持向量机(SVM)的其它鉴别手段。在使用需要先前学习的鉴别手段的情况下,先前学习可以利用事例管理单元301中的图像数据(事例数据)来执行。
为了将这种鉴别手段应用到对元数据的估计中,k最近邻鉴别器中所使用的训练数据、测试数据、标签和特征向量需要与本实施例中所使用的数据相关联。训练数据可以与一个事例数据块集合(下文中称为“估计事例数据集”)相关联,测试数据可以与估计目标数据相关联,而标签可以与估计目标元数据相关联。特征向量需要与估计目标元数据的属性相对应地配置。例如,在估计“地名”的情况下,可以利用拍摄位置作为特征向量来估计地名。这种用作特征向量的元数据在下文中称为“特征元数据”。
返回参照对图3的描述。状态分析单元303在导出要分配给估计目标数据的估计目标元数据中分析“状态”。在本实施例中,有四种状态,即“层次性的”、“未登录的”、“混合的”和“确定的”。现在将顺序描述那些状态。
有些元数据块具有层次。一个示例是“地名”。例如,地名“东京”在目录“日本”之下。对于这种层次性的元数据块,仅仅简单应用k最近邻鉴别器是不够的。这是因为不同的元数据值可以分配给相同的地点。例如,存在这样的情况,即来自国外的游客将“日本”作为地名分配给他们在观光过程中所捕捉到的图像数据。同时,还存在这样的情况,即日本人将“东京”作为地名分配给他们在东京观光过程中所捕捉到的图像数据。如由这两种情况所例示的,依赖于数据在其层次中被看作是什么级别,不同的元数据值可以作为地名分配给相同的拍摄位置。在这种情况下,需要考虑数据层次来执行估计。
接下来,为了解释其它状态,即“未登录的”、“混合的”和“确定的”,参照图4例示“地名”用作估计目标元数据而“拍摄位置”用作特征元数据的情况。图4例示了如下示例,其中分别利用其拍摄位置的维度和经度作为垂直轴和水平轴,绘制事例数据块与估计目标数据块使得它们的分布可视化。
在图4中,大写的字母表字母A和B分别代表指示地名A和B的事例数据块。在这里,字母表字母(A,B)对应于标签,而它们的拍摄位置(垂直轴和水平轴上的坐标)对应于作为特征向量的特征元数据块。图4中小写的希腊字母α、β和γ代表由分配目标获取单元302获取的图像数据块(估计目标数据块),而图4中α、β和γ的位置对应于它们的拍摄位置。参考估计目标数据块α周围的四个事例数据块,发现估计目标数据块α周围只有事例数据块A。在这种状态下,通过k最近邻鉴别器,将值明确地确定为“A”。因此,这种状态被确定为是“确定的”状态。
同时,参考估计目标数据块β周围的四个事例数据块,事例数据块A和B在估计目标数据块β周围是混合的。因为事例数据块A和B的这种混合,所以这种状态被称为“混合的”。还参考估计目标数据块γ周围的四个事例数据块,发现每个事例数据块都远离估计目标数据块γ。在这种情况下,可以认为还没有获取要作为事例数据分配给估计目标数据块γ的值。因此,这种状态被确定为“未登录的”。应当指出,随后将参照图10中的流程图来描述这种分布确定方法的具体内容。
选择性估计单元304基于由状态分析单元303获得的“状态”选择简单估计单元305、重复估计单元306和层次性估计单元307中的任何一个,并使所选的单元执行估计。然后,从这些估计单元305至307中的一个获取估计结果(包括“不可估计的”结果)。例如,在只有“混合”状态的情况下,选择重复估计单元306。随后将参照图8中的流程图来描述处理的具体内容。
简单估计单元305通过简单地将k最近邻鉴别器应用到估计目标数据(测试数据)的特征元数据(特征向量)和事例数据(训练数据)的特征元数据来获得结果。随后将参照图11中的流程图来描述该处理的具体内容。
然而,在“混合”状态的情况下,简单估计单元305不是总能选择出合适的元数据。“混合”状态出现的可能情况将以导出地名的情况作为示例来描述。例如,当事件是在公园或会议厅发生时,常常提供特定的建筑场所。具体而言,存在这样的情况,即一天在一个场所举行商用车展,而另一天在同一场所举行游艇展。在此类情况下,如果该场所的展台名称用作地名,则用户将向每天相同的拍摄位置分配不同的地名,作为拍摄地点的名称。在这种情况下,例如,需要不仅考虑拍摄位置,还要考虑拍摄日期和时间,以鉴别数据。在这种“混合”状态下,重复估计单元306确定要考虑的新元数据并执行估计。
在导出估计目标元数据的过程中,重复估计单元306检测要考虑的新元数据,并在把要考虑的新元数据添加到特征元数据之后执行估计。例如,在“地名”用作估计目标元数据的情况下,在上述展厅的示例中,“拍摄时间”作为要考虑的新元数据被检测。然后,利用“拍摄位置”和“拍摄时间”作为特征元数据来估计“地名”。随后将参照图12中的流程图来描述该处理的具体内容。
层次性估计单元307考虑估计目标元数据的层次来执行估计。在本实施例中,元数据分配设备保持用于每个估计目标元数据块的层次结构,并从较高的级别确定估计目标元数据块。图5例示了示出保持在元数据分配设备中的元数据块的层次结构的表的示例。在图5中,值之间的层次结构是由父元数据和子元数据的集合来指示的。如果最高级别标志为“开(ON)”,则指示父元数据没有更高级别的父元数据。利用这个,确定最高级别的元数据,然后确定其子元数据。随后将参照图13中的流程图来描述该处理的具体内容。
分配目标写单元308将由选择性估计单元304所导出的元数据嵌入到作为估计目标数据获取的图像数据的元数据中,并输出所得数据。数据输出目的地的示例包括外部存储设备104,及通过通信接口107连接的成像设备和客户端设备。应当指出,在分配目标获取单元302只获取元数据的情况下,与所导出的元数据相关联的图像数据的元数据可以被重写。应当指出,用于输出图像数据和元数据的手段不限于此。
元数据分配处理
接下来,将参照图6中的流程图来描述根据本实施例的由元数据分配设备执行的处理。在S601中,分配目标获取单元302获取(已经对其分配了元数据的)图像数据。这种图像数据被假定为估计目标数据。
在S602中,分配目标获取单元302根据已经分配给图像数据的元数据的种类来识别可估计的元数据的种类,并将它们组织到要从估计导出的元数据块(估计目标元数据块)的列表中。可以根据估计目标元数据与在对估计目标元数据进行估计的过程中必需的特征元数据(下文中称为“必需特征元数据”)之间的对应关系,来识别估计目标元数据(的种类),其中的对应关系是事先确定并保持的。
具体而言,这种对应关系可以保持在如图7所例示的估计规则表中。图7例示了估计规则表的示例,该估计规则表示出了估计目标元数据701和估计目标数据的在对估计目标元数据进行估计的过程中必需的特征元数据(必需特征元数据702)之间的对应关系。例如,为了估计事件名,拍摄日期和时间及拍摄位置需要事先分配给估计目标数据。
因此,例如,在只向估计目标数据分配了“拍摄位置”的情况下,可以利用图7中的估计规则表估计“地名”,因此在S602中列出“地名”。应当指出,可以从列表中排除其值已经分配给图像数据的元数据,即使根据上述方法其被认为是可估计的。
在S603中,确定在S602所创建的列表中是否有任何未处理的估计目标元数据块。由于在后述步骤S604和S605中已经处理过的估计目标元数据块从初始列表中删除了,因此如果列表为空,则确定没有未处理的估计目标元数据。可选地,在列表中可以提供处理标志,且可以依赖于是否有任何估计目标元数据的处理标志仍为“关(OFF)”来作出确定。如果有任何未处理的估计目标元数据块(S603中为“是”),则处理前进到S604。如果没有未处理的估计目标元数据块(S603中为“否”),则处理前进到S606。
在S604中,从列表中选择未处理的估计目标元数据块(或类型),且对估计目标数据的用于估计的特征元数据和估计事例数据集进行初始化。例如,用于估计的特征元数据被假定为是与图7中的估计规则表中的估计目标元数据相关联的必需特征元数据。然后,事例管理单元301中的包括特征元数据和估计目标元数据的事例数据块被假定为估计事例数据集。
在S605中,执行从估计导出估计目标元数据的估计处理。随后将参照图8的流程图来描述该处理的具体内容。然后,处理返回S603。以这种方式,对每个估计目标元数据块执行S604和S605的处理。当所有的估计目标元数据块都处理完之后(S603中为“否”),处理前进到S606。
在S606中,分配目标写单元308将从S605中的估计获得的元数据分配给图像数据。然而,导致“不可估计”的估计目标元数据块不分配给图像数据。应当指出,尽管图6中的流程图示出了分配目标获取单元302获取并处理单个图像数据块的情况,但也可以获取并处理多个图像数据块。在获取多个图像数据块的情况下,将从S602到S606的处理应用到每个图像数据块。
估计处理
参照图8中的流程图来描述S605中的估计处理。图8是示出估计处理中具体过程的流程图。在确定估计目标元数据块的值的过程中,要执行什么样的估计处理是依赖于估计目标元数据块的特征和用于鉴别的事例数据集(估计事例数据集)而变化的。因此,确定用于导出估计目标元数据的状态,即,估计目标数据的特征元数据和事例数据中所包括的特征元数据之间的关系。在本实施例中,假定了四种状态,即,“层次性的”、“未登录的”、“混合的”和“确定的”。在S801中,列出那些状态,从而创建状态列表。随后将参照图10中的流程图来描述该处理的具体内容。
在S802至S805中,从处理选择表中选择对应于S801中所获得的状态的估计处理并执行该估计处理。处理选择表如图9中所例示。处理选择表包含处理选择规则,每个规则都以“ID”901、“优先级”902、“状态”903、“处理”904和“无效标志”905的集合表示。利用这个表,为每种状态选择合适的处理选择规则,并执行与“处理”904相关联的估计处理。具体的选择方法按照S802至S805所描述。“处理”904的具体内容随后将单独描述。
在S802中,列出了其状态903与在S801中所获得的任何状态匹配且其无效标志905为“关(OFF)”的处理选择规则。该列出可以通过例如将ID 901保持在诸如RAM 103的存储设备中来进行。例如,在处理选择表如图9所例示的那样且S801中所获得的状态列表包括“层次性”和“未登录”的情况下,列出ID号为“1”和“2”的处理选择规则。
在S803中,从S802中所获得的列表中选择具有最高优先级的处理选择规则。然后,将所选处理选择规则的无效标志设置成“开(ON)”。应当指出,在本实施例中,优先级值902越高意味着优先级越高。例如,在ID号为“1”和“2”的处理选择规则包括在列表中的情况下,从列表中选择其中具有最高优先级的处理选择规则,即,最高优先级值为4、ID号为“1”的规则。然后,将ID号为“1”的处理选择规则的无效标志设置成“开(ON)”。
在S804中,通过执行与S803中所选的处理选择规则相关联的估计处理来获得结果。例如,如果在S803中选择了ID号为“1”的处理选择规则,则获得“不可估计”的结果。如果在S803中选择了ID号为“2”的处理选择规则,则通过执行层次性估计处理来获得结果。估计处理的细节将随后描述。
在S805中,将S803中所选的处理选择规则的无效标志设置成“关(OFF)”。这完成了估计处理,且处理返回到图6中的S603。应当指出,从S802至S805的处理是由选择性估计单元304执行的。
状态列表创建处理
接下来,将参照图10中的流程图来描述在图8的S801中所执行的状态列表创建处理。首先,在S1001中准备空状态列表。例如,准备可变长度阵列,用以存储与状态相关联的值。
在S1002中,确定估计目标元数据块是否具有层次。例如,指示层次的存在或缺少的信息(层次信息)可以存储在以上提到的图7的估计规则表中,而且可以在进行确定的时候参考。如果估计目标元数据块被确定为有层次(S1002中为“是”),则处理前进到S1003。如果估计目标元数据块被确定为没有层次(S1002中为“否”),则处理前进到S1004。
在S1003中,将“层次性的”添加到状态列表。然后,处理前进到S1004。在S1004中,收集估计事例数据集中从最靠近估计目标数据块的特征向量的特征向量起依次的预定个数(k个)特征向量作为事例数据块。然后,将从估计目标数据块的特征向量到所收集的事例数据块中最远一个的距离给定为L(最大距离值L)。应当指出,特征元数据块之间的距离可以假定为作为特征向量的特征元数据块之间的欧几里得距离。例如,在使用“拍摄位置”作为特征元数据块的情况下,特征元数据块之间的距离可以利用那些元数据块的拍摄位置的维度和经度来计算。
在S1005中,确定在S1004中所获得的距离L是否等于或者大于预定的阈值。如果距离L等于或者大于阈值,则意味着估计事例数据集不包括要分配给估计目标数据块的估计目标元数据值的值。如果距离L等于或者大于阈值(S1005中为“是”),则处理前进到S1006。如果距离L小于阈值(S1005中为“否”),则处理前进到S1007。
在S1006中,将“未登录的”添加到状态列表。这完成了状态列表创建处理,且处理前进到图8中的S802。同时,在S1007中,确定在S1004中所获得的k个事例数据块的估计目标元数据块是否具有基本上相同的值。例如,这可以依赖于是否有百分之九十或者更多的事例数据块具有相同的值来确定(如果是这样,则确定它们“基本上相同”)。这确定是否确定了要分配给估计目标数据块的估计目标元数据块的值。然后,如果确定k个事例数据块的估计目标元数据块的值基本上相同(S1007中为“是”),则处理前进到S1008。如果不是(S1007中为“否”),则处理前进到S1009。
在S1008中,将“确定的”添加到状态列表。这完成了状态列表创建处理,且处理前进到图8中的S802。同时,在S1009中,将“混合的”添加到状态列表。这完成了状态列表创建处理,且处理前进到图8中的S802。
以上所述的从S1001至S1009的处理是由状态分析单元303执行的。应当指出,从S1004至S1008的处理不限于上述手段。例如,还可以假定鉴别器不仅返回鉴别结果,还返回指示训练数据不包括要鉴别的结果的结果,或者将鉴别结果及其置信因数一起返回。在这个时候,由鉴别器获得的结果可以在S1005或S1007的确定处理中使用。
如上所述,要使用的估计方法是通过分析距离L是否等于或者大于分布中的阈值并在状态列表中设置不同的值来确定的,这有效地防止在实际上难以估计的情况下以低精度执行估计。而且,在本实施例中,从已经分配的元数据值中具有较小向量间(intervector)距离的那些起按顺序选择相同类型的k个估计元数据块,然后分析预定比率或者更多的另一种类型的对应估计元数据块是否具有相同的值。然后,如后面将描述的,基于分析结果确定估计方法。这允许在元数据值被确定性地估计和这种估计不可行的情况下都选择合适的估计方法,由此允许对合适元数据值的高精度估计。
简单估计处理
接下来,将参照图11、12和13中的流程图来描述由简单估计单元305、重复估计单元306和层次性估计单元307执行的处理。首先,将参照图11的流程图来描述根据本实施例的由简单估计单元305执行的处理。这个处理对应于在图9的处理选择表中关于ID为“4”的处理选择规则所描述的简单估计处理。
在S1101中,确定估计事例数据集是否包含事例数据块。例如,确定估计事例数据集是否包含个数等于或者大于阈值的事例数据块。如果确定存在事例数据块(S1101中为“是”),则处理前进到S1103。如果不存在(S1101中为“否”),则处理前进到S1102。
在S1102中,获得“不可估计”的估计结果,且简单估计处理完成。同时,在S1103中,计算估计目标数据块的特征元数据块与事例数据块的特征元数据块之间的距离,且从最靠近估计目标数据块的特征元数据块的事例数据块起依次列出k个事例数据块。然后,在S1104中,将在S1103中所列出的事例数据块的估计目标元数据块的最公用值确定为估计结果。然后,简单估计处理完成。
重复估计处理
接下来,将参照图12中的流程图来描述根据本实施例的由重复估计单元306执行的处理。这个处理对应于在图9的处理选择表中关于ID为“3”的处理选择规则所描述的重复估计处理。
首先,在S1201中创建附加特征元数据列表。附加特征元数据块是指辅助地与最低限度必需特征元数据块一起使用以便更适当地执行估计的特征元数据块,而附加特征元数据列表是指这种附加特征元数据块的列表。在本实施例中,以上提到的估计规则表存储与估计目标元数据块相关联的候选附加特征元数据块,且这种估计规则表在创建附加特征元数据列表的过程中被参考。图14例示了估计规则表的示例,其中附加特征元数据块与估计目标元数据块相关联。例如,在估计规则表如图14所例示的那样配置且“地名”用作估计目标元数据块1401的情况下,“拍摄日期和时间”与“摄影师信息”在附加特征元数据块1402的列表中列出。可选地,考虑数据组合,“拍摄日期和时间”、“摄影师信息”和“拍摄日期和时间与摄影师信息”可以单独列出。最后一个组合即“拍摄日期和时间与摄影师信息”指示“拍摄日期和时间”与“摄影师信息”都用作附加特征元数据块。应当指出,用于创建附加特征元数据列表的方法不限于此,而且例如,可以列出已经固有地分配给特征元数据块但没有使用的所有元数据块。
在S1202中,确定在S1201中所获得的附加特征元数据列表中是否有未处理的附加特征元数据块。由于在后述步骤中处理过的附加特征元数据块将从初始列表中删除,因此如果列表为空,则确定没有未处理的附加特征元数据块。可选地,在列表中可以提供处理标志,且可以依赖于是否仍有处理标志保持为“关”的附加特征元数据块来作出确定。如果存在未处理的附加特征元数据块(S1202中为“是”),则处理前进到S1203。如果不存在(S1202中为“否”),则处理前进到S1207。
在S1203中,从附加特征元数据列表中选择未处理的附加特征元数据块,并将其添加到要用于估计的特征元数据块。然后,估计事例数据集缩小到包括更新过的特征元数据块的那些事例数据块。
在S1204中,通过状态分析处理来创建状态列表。这个处理类似于以上提到的图10的流程图中的处理(状态列表创建处理)。应当指出,在将摄影师信息添加到特征元数据的情况下,可以构想S1004中的估计目标元数据块与事例数据块之间的距离将采取随捕捉那些数据块的用户之间的人际关系中距离的增加而增大的值,例如按“自己”、“家庭成员”、“朋友”和“熟人”的次序。
在S1205中,确定“确定的”是否包括在状态列表中。这确定估计是否已通过考虑S1203中所添加的附加特征元数据块确定了。如果“确定的”包括在状态列表中(S1205中为“是”),则处理前进到S1207。如果不是(S1205中为“否”),则处理前进到S1206。
在S1206中,将特征元数据块和估计事例数据集恢复到其原始状况。例如,关于特征元数据块和估计事例数据集的信息可以在处理开始时事先保持,并用于重写。然后,处理返回S1202。
在S1207中,通过利用特征元数据块以及附加特征元数据块的简单估计处理获得结果。简单估计处理的内容如图11的上述流程图中的那样。
在S1208中,将特征元数据块和估计事例数据集恢复到其原始状况。例如,关于特征元数据块和估计事例数据集的信息可以在处理开始时事先保持,并用于重写。这完成了重复估计处理。
层次性估计处理
接下来,将参照图13的流程图来描述根据本实施例的由层次性估计单元307执行的处理。这个处理对应于在图9的处理选择表中关于ID为“2”的处理选择规则所描述的层次性估计处理。
在S1301中,从用于估计的特征元数据块中列出在其层次中处于最高级别的特征元数据块。在本实施例中,由于层次结构事先保持在表中(图5),因此参考该表以列出其最高级别标志为“开”的父元数据块。
在S1302中,确定S1301或S1305中所创建的列表是否为空。空列表指示处理已经完成。如果列表为空(S1302中为“是”),则处理前进到S1306。如果列表不为空(S1302中为“否”),则处理前进到S1303。
在S1303中,估计事例数据集缩小到属于S1301或S1305中所创建的列表中所包括的层次的事例数据块。例如,考虑当“地名”用作估计目标元数据块的情况,“日本”和“美国”都包括在处于其层次中最高级别的元数据块的列表中。在这个时候,当前的估计事例数据集缩小到其“地名”为“日本”或“美国”的事例数据块,这构成新的估计事例数据集。
在S1304中,利用S1303中所获得的估计事例数据集执行估计处理。这种估计处理对应于图8的上述流程图中的处理。在执行这种估计处理时,图9的处理选择表中的ID号为“2”的处理选择规则的无效标志是“开”。因此,将不选择层次性估计处理。此外,即使诸如“层次性的”和“混合的”状态包括在S1303中所获得的估计事例数据集中,也按照图8的流程图选择合适的估计处理(S803),并获得合适的结果(S804)。
在S1305中,存储在S1304中所获得的结果。然后,列出层次中下一级别的数据块。之后,处理返回到S1302。具体而言,从图5中列出其父元数据块与以上结果具有相同值的子元数据块。例如,如果结果是“日本”,则“东京”和“京都”作为子元数据块列出。
在S1306中,在S1305中存储的结果作为这种层次性估计处理的结果给出。然而,如果没有存储结果,则“不可估计”作为结果给出。然后,层次性估计处理完成。
如上所述,在本实施例中,根据和与估计目标数据块的已分配元数据块相同类型的估计元数据块相对应的其它类型的估计元数据块的值的分布,来确定用于估计要重新分配的元数据块的估计方法,然后执行估计。即,要重新分配的元数据块是利用对应于数据分布的最佳估计方法来确定的,这允许高精度地确定适合的元数据块,而不考虑事先为元数据块估计所准备的数据块的属性。
而且,在本实施例中,事先存储对应关系信息(估计规则表),其指示已分配的元数据块的种类与其值可以从已分配的元数据块的值估计的元数据块的种类之间的对应关系。然后,参考这种对应关系信息,以指定与目标数据块的已分配的元数据块的种类相对应的元数据块的种类,作为要重新分配给目标数据块的元数据块的种类。这允许通过简单处理从事先为元数据估计所准备的数据指定估计所需的数据。
应当指出,在本实施例中,为元数据的估计假定了四种状态。然后,已经描述了根据状态来选择元数据估计方法的元数据分配设备。然而,意在配置本实施例的状态不限于此。例如,还有其它可能的状态,例如“多值的”,其中假设元数据有多个值。具体而言,有些地名可以有别名,例如Everest(珠穆朗玛峰)有别名Chomolungma。在这种情况下,上述估计处理是不够的,且需要另一种使得能够分配多个值的估计方法。例如,以下处理与处理选择表中优先级值为“3.5”且状态为“混合的”的情况相关联。这个处理使得事先存储将相同值与多个元数据块相关联的表,并准备其中用单个值替代被认为具有相同值的元数据块的估计事例数据集。然后,调用图8的流程图中的估计处理,并且在获得结果以后,根据所述表用多个元数据值替代以上被替代的内容。由于用于指定状态的方法和用于选择状态的方法是根据假定的状态配置的,因此它们不限于本实施例中所述的示例。而且,对应于在此所述的状态的估计方法不限于以上所述的示例。
本实施例的以上描述已经给出了事先给出用于层次性估计处理的层次结构的情况。在本实施例中,以下描述了一种配置(层次结构构造设备),其中层次结构是根据事例数据块的分布自动构造的。根据这种实施例的配置,四种状态,即“层次性的”、“未登录的”、“混合的”和“确定的”,是仅仅基于事例数据块的分布来识别的。
在本实施例中,执行群集,以便群集和与目标元数据块(为该目标元数据块确定了层次的存在或缺少)相同种类的特征元数据块相对应的其它种类的特征元数据值的分布。然后,分析群集之间的包含关系。据此确定目标元数据块的层次。这允许通过简单处理自动确定元数据的层次。
如上所述,诸如“地名”的有些元数据块具有层次。例如,在商用车展的情况下,“客车区”和“双轮车区”可以在目录“展厅”之下。在这种层次性数据的情况下,其“地名”为“展厅”或者“客车区”的事例数据块是基于其拍摄位置绘制的。所得的事例数据块的分布常常使得“客车区”包括在“展厅”中。为了从事例数据块获取层次结构,本实施例使用这种数据属性。
层次结构构造设备的配置
图15例示了根据本实施例的层次结构构造设备的配置。在图15中,事例管理单元301与本实施例中以上所述的图3中的事例管理单元301相同。
层次性元数据确定单元1501确定从事例数据块为其构造层次结构的元数据块(下文中称为“层次性元数据块”),以及用于检测层次结构的元数据块(下文中称为“特征元数据块”)。层次性元数据块和特征元数据块可以由输入设备109指定,或者可以从记录在外部存储设备104上的预定配置文件读取。然而,用于确定层次性元数据块和特征元数据块的方法不限于此。
事例数据划分单元1502执行如下处理,即单独处理由事例管理单元301管理的事例数据块中的那些具有相同层次性元数据值但具有不同意义的事例数据块。这是为了以下目的。例如,在商用车展的情况下,假定在“客车区”或“双轮车区”的目录下还存在参展公司的展台。在这个时候,即使两个给定事例数据块的地名都是“公司A的展台”,但它们中的一个可能在目录“客车区”之下,而另一个可能在目录“双轮车区”之下。因此,执行用于单独处理这种具有相同的层次性元数据值但具有不同意义的数据块的处理。这产生一组具有相同意义的事例数据块。随后将参照图16中的流程图来描述该处理的具体内容。
包含关系确定单元1503获得由事例数据划分单元1502所获得的事例数据集之间的包含关系。层次结构构造单元1504根据在包含关系确定单元1503中所获得的包含关系构造层次结构。随后将参照图16中的流程图来描述由那些功能部件执行的处理的具体内容。
层次结构构造处理
将参照图16中的流程图来描述根据本实施例的由层次结构构造设备执行的处理。首先,在S1601中,层次性元数据确定单元1501确定要为其构造层次结构的层次性元数据块和用于确定层次结构的特征元数据块。
在S1602中,创建层次性元数据块的值的列表。具体而言,由事例管理单元301管理的事例数据块的所有层次性元数据块的值都列出来,然后从中排除重复的,其结果作为列表获得。
在S1603中,确定在S1602中所获得的列表中是否包括未处理的值。由于在随后所述的步骤S1604至S1606中已经处理过的值从初始列表中删除了,因此如果列表为空,则确定没有未处理的值。可选地,在列表中可以提供处理标志,且可以依赖于是否还有处理标志保持为“关”(这意味着“未处理”)的值来作出确定。如果存在未处理的值(S1603中为“是”),则处理前进到S1604。如果不存在未处理的值(S1603中为“否”),则处理前进到S1607。
在S1604中,从S1602中所获得的列表中选择值。然后,从由事例管理单元301管理的事例数据块(层次性元数据块)中指定具有所选值的事例数据块。
在S1605中,对S1604中所指定的一组事例数据块应用群集。群集是为以下目的执行的。有些事例数据块可以是不同种类的,即使它们具有相同的元数据值。例如,在商用车展的情况下,假定在“客车区”和“双轮车区”的目录下还存在参展公司的展台。在这个时候,即使两个给定事例数据块的地名都是“公司A的展台”,但它们中的一个可能是目录“客车区”之下的公司A的展台,而另一个可能是目录“双轮车区”之下的公司A的展台。在这种情况下,那些公司A的展台是不同的展台。群集是为分离这种属于层次中不同上级数据块的事例数据块而执行的。群集是利用基于特征元数据块的相似性执行的,而且结果是从层次性群集获得的。可选地,通过连接靠近所关注事例数据块的k个事例数据块而获得的连接部分可以组织到单个群集中。根据本实施例的群集方法不限于此。而且,群集结果不总是通过划分事例数据块来获得,而且所有数据块都可以组织到单个群集中。
在S1606中,存储在S1605中所获得的群集结果。具体而言,将“元数据值”和“群集ID”彼此关联地存储。而且,将“群集ID”和“事例数据ID”彼此关联地存储。在此所述的元数据值是指在S1604中所选的值。在此所使用的术语“群集ID”是指为了识别S1605中所获得的群集而分配的标识符。在此所述的术语“事例数据ID”是指用于与由事例管理单元301管理的事例数据块关联的标识符。示出了群集与群集ID之间的对应关系的表被称为群集表。示出了事例数据块与事例数据ID之间的对应关系的表也被称为群集配置表。那些表在后续处理及随后所述的层次性估计处理中使用。应当指出,从S1602至S1606的处理是由事例数据划分单元1502执行的。
在所描述的示例处理中,重复从S1603至S1606的处理,直到列表为空。例如,假定事例数据块如图17中所例示的那样基于给定的特征元数据分布。图17中的大写字母表字母代表事例数据块,而层次性元数据块的值可以是任何那些字母表字母。图17中由虚线指示的矩形1701至1705示意性地例示了在S1605中获得的群集。从图17可以看到,单独的群集1702和1705是从相同的事例数据块B获得的。通过关联那些群集和元数据值,创建如图18中所例示的群集表。
在S1607中,包含关系确定单元1503确定S1605中所获得的群集之间的包含关系。具体而言,创建围绕群集的区域(在图17的示例中是矩形区域),且区域之间的包含关系用于获得群集之间的包含关系。例如,群集A包含群集B的关系表示为在这个时候,如果事例数据块如图17所例示的那样基于给定的特征元数据块分布,则获得围绕群集的矩形区域,例如1701至1705。然后,获得它们的包含关系,例如和应当指出,在确定包含关系时,如果群集A在某种程度上覆盖群集B,则确定群集A包含群集B。具体而言,如果R(A∧B)/R(B)超过特定的值(例如,0.95),其中R(B)是矩形区域B的面积,而R(A∧B)是A和B之间的重叠区域的面积,则可以确定群集A包含群集B。然而,用于确定包含关系的方法不限于此。
此外,在创建围绕群集的区域之前,可以排除在获得精确区域中可能是噪声的元数据块。具体而言,包含在群集中的元数据块可以限于其值针对包含在群集中的元数据块值的平均值或者中间值在预定阈值范围内的那些元数据块。例如,这排除了错误地输入成“京都”的元数据块“东京”,由此防止从包括具有值“东京”的元数据块的群集创建错误的区域。
在S1608中,层次结构构造单元1504从S1607中所获得的包含关系构造(确定)层次结构。具体而言,创建如上所述的图5中所例示的保持层次结构的表(下文中称为“层次结构表”)。然而,在本实施例中,由于代替元数据值而使用群集ID,因此表中的项是“最高级别标志”、“父群集ID”和“子群集ID”。首先,根据在S1607中所获得的包含关系,填充“父群集ID”和“子群集ID”。然而,该包含关系代表的不是层次结构中的父子关系,而是先祖子孙关系。因此,将包含关系缩小到父子关系。例如,从图17所获得的包含关系中获得和并且将它们存储在表中。然后,将不作为子群集出现的父群集的“最高级别标志”设成“开”。其它父群集的最高级别标志全都设成“关”。通过上述处理获得的层次结构表如图19中所例示。应当指出,如果S1607中没有获得包含关系,则不创建层次结构表。
在这种设备与本实施例中以上所述的元数据分配设备一起使用的情况下,在元数据分配设备的处理之前事先构造层次结构。例如,在图6的流程图中的S604之后,紧接着可以利用层次性元数据块作为估计目标元数据块来执行上述处理,从而构造层次结构。或者,在S601之前,估计规则表中所述的所有估计目标元数据块的层次结构可以通过上述处理事先构造。然而,层次结构的构造时间不限于此。
层次性估计处理
接下来描述的是本实施例中所构造的层次结构用在本实施例中的上述层次性估计处理中的情况。这种处理的内容与图13的流程图中所示的基本上相同。不同之处仅仅在于,该处理采用群集ID而不是元数据值来指定层次。下文中,将参照图13来描述根据本实施例的层次性估计处理。
在S1301中,列出在其层次中处于最高级别的数据块。例如,在如图19所例示的那样事先给出层次结构表的情况下,列出其最高级别标志为“开”的群集ID。
在S1302中,确定在S1301或S1305中所创建的列表是否为空。如果列表为空(S1302中为“是”),则处理前进到S1306。如果列表不为空(S1302中为“否”),则处理前进到S1303。
在S1303中,估计事例数据集缩小到属于包括在S1301或S1305所创建的列表中的层次的事例数据块。此外,估计目标元数据块被群集ID替代,这构成新的估计事例数据集。例如,假定群集“1701”和“1702”包括在列表中。在这个时候,当前的估计事例数据集进一步缩小到属于群集“1701”或“1702”的事例数据块。具体而言,参考群集配置表,从而只留下与群集ID“1701”或“1702”关联的事例数据块。然后,估计目标元数据块被群集ID替代,这产生新的估计事例数据集。
在S1304中,利用在S1303中所获得的估计事例数据集来执行估计处理。这种估计处理对应于参考以上提到的图8的流程图所述的处理。在估计处理之后,处理前进到S1305。
在S1305中,存储在S1304中所获得的结果。然后,列出层次中下一级别的数据块。其后,处理返回到S1302。具体而言,从图19的层次结构表中列出其父群集ID等于所得群集ID的子群集ID。例如,如果“1701”作为结果获得,则列出“1702”。应当指出,如果在层次中的下一级别没有发现数据块,则意味着列表为空。
同时,在S1306中,配置处理结果。具体而言,由于在S1305中所存储的结果是群集ID,因此它们被其对应的元数据值替代。为了更加明确,当所存储的结果是“1701=>1702=>1703”时,参考图18中的群集表,以便获得“A=>B=>C”。应当指出,如果S1305中没有存储结果,则“不可估计”作为结果给出。应当指出,从S1301至S1306的处理是由本实施例以上描述中的层次性估计单元307执行的。
在本实施例的以上描述中,由分配目标获取单元302获得的图像数据和与该图像数据相关的元数据用作估计目标数据。在本实施例中,一组图像数据块或者与图像相关联的一组元数据块用作估计目标元数据块。
为了创建这种组,例如在分配目标获取单元302获取在外部存储设备104中以文件夹管理的图像数据块或者仅仅元数据块的情况下,每个文件夹都可以组织成一组。然后,可以从构成该组的元数据块获取诸如平均值或者模式值的代表值。然而,用于创建组的方法和用于获取元数据块的值的方法不限于此。
可选地,在用于组的元数据块通过估计获得的情况下,分配目标写单元308写元数据块,从而将其反映到组中的所有成员。
在以上所述的配置中,在利用一组已经事先分配了元数据块的图像数据块的情况下,估计方法是与状态对应地确定的,这提高了获得元数据块的精度。
本发明提供了如下技术,该技术允许高精度地确定适合元数据块,而不管事先为元数据块估计所准备的数据块的属性如何。
其它实施例
本发明的各方面还可以通过读出并执行记录在存储器件上的程序以执行上述实施例的功能的***或装置(或者例如CPU或MPU的设备)的计算机来实现,本发明的各方面还可以通过方法来实现,其中该方法的步骤被***或装置的计算机例如通过读出并执行记录在存储器件上的程序以执行上述实施例的功能来执行。为此,程序例如通过网络或者从用作存储器件的各种类型的记录介质(例如,计算机可读介质)提供给计算机。
尽管已经参照示例性实施例描述了本发明,但应当理解,本发明不限于所公开的示例性实施例。以下权利要求的范围是要符合最广泛的解释,从而包括所有这种修改及等效的结构与功能。
Claims (10)
1.一种信息处理装置,包括:
第一位置获取单元,其适于从目标数据块获取位置元数据块,该位置元数据块指示位置;
第二位置获取单元,其适于从与所述目标数据块不同的多个其它数据块获取多个位置元数据块;
目标获取单元,其适于从所述其它数据块获取除所述多个位置元数据块之外的目标元数据块;
分析单元,其适于根据由从所述其它数据块获取的所述多个位置元数据块指示的位置,来分析所述目标元数据块的分布;及
分配单元,其适于根据由从所述目标数据块获取的所述位置元数据块指示的位置与所述分布,来向所述目标数据块分配具有与该目标数据块相关的值的目标元数据块,该目标元数据块是从经分析的目标元数据块中选择的。
2.如权利要求1所述的信息处理装置,包括:
群集单元,其适于针对所述经分析的目标元数据块的每个值,将从所述其它数据块获取的所述多个位置元数据块组织成多个群集;及
区域创建单元,其适于针对所述多个群集中的每一个创建与该群集对应的区域,在该区域中可能存在由该群集中所包括的每个位置元数据块指示的位置;
其中,当由从所述目标数据块获取的所述位置元数据块指示的位置在任何所述区域中存在时,所述分配单元向所述目标数据块分配目标元数据块,其中该目标元数据块是为具有与该区域对应的群集中所包括的位置元数据块的另一数据块分配的目标元数据块。
3.如权利要求2所述的信息处理装置,还包括:
包含确定单元,其适于当由从所述目标数据块获取的所述位置元数据块指示的位置存在于作为所述区域之一的第一区域和不同于该第一区域的第二区域中时,确定所述第一区域是否被包含在所述第二区域中,其中,如果确定所述第一区域被包含在所述第二区域中,则所述分配单元向所述目标数据块分配目标元数据块,该目标元数据块是为具有与所述第一区域对应的群集中所包括的位置元数据块的另一数据块分配的目标元数据块。
4.如权利要求2所述的信息处理装置,还包括:
层次信息保持单元,其适于保持层次信息,该层次信息指示分配到所述其它数据块的目标元数据块的值中具有较高级别和较低级别的层次关系的值的组合;及
层次确认单元,其适于当由从所述目标数据块获取的所述位置元数据块指示的位置存在于作为所述区域之一的第一区域和不同于该第一区域的第二区域中时,确认是否保持层次信息,在该层次信息中,为具有与所述第一区域对应的群集中所包括的位置元数据块的另一数据块分配的目标元数据块处于层次中较低的级别,而为具有与所述第二区域对应的群集中所包括的位置元数据块的另一数据块分配的目标元数据块处于所述层次中较高的级别;
其中,如果确认了对所述层次信息的保持,则所述分配单元向所述目标数据块分配目标元数据块,该目标元数据块是为具有与所述第一区域对应的群集中所包括的位置元数据块的另一数据块分配的目标元数据块。
5.如权利要求3所述的信息处理装置,还包括:
层次信息保持单元,其适于保持层次信息,该层次信息指示分配到所述其它数据块的目标元数据块的值中具有较高级别和较低级别的层次关系的值的组合;及
层次确认单元,其适于当由从所述目标数据块获取的所述位置元数据块指示的位置被包括在作为所述区域之一的第一区域和不同于该第一区域的第二区域中时,确认是否保持层次信息,在该层次信息中,为具有与所述第一区域对应的群集中所包括的位置元数据块的另一数据块分配的目标元数据块处于层次中较低的级别,而为具有与所述第二区域对应的群集中所包括的位置元数据块的另一数据块分配的目标元数据块处于所述层次中较高的级别;
其中,如果确认了对所述层次信息的保持,则所述分配单元向所述目标数据块分配目标元数据块,该目标元数据块是为具有与所述第一区域对应的群集中所包括的位置元数据块的另一数据块分配的目标元数据块,及
如果所述包含确定单元确定所述第一区域被包括在所述第二区域中,则所述层次信息保持单元还保持如下层次信息:该层次信息指示为具有与所述第一区域对应的群集中所包括的位置元数据块的另一数据块分配的目标元数据块处于层次中较低的级别,而为具有与所述第二区域对应的群集中所包括的位置元数据块的另一数据块分配的目标元数据块处于所述层次中较高的级别。
6.如权利要求2所述的信息处理装置,还包括:
排除单元,其适于从群集中排除指示离代表性位置超出预定距离的位置的位置元数据块,其中的代表性位置是从由所述群集中所包括的多个位置元数据块指示的位置获得的,
其中,所述区域创建单元从排除后获得的群集创建区域。
7.如权利要求6所述的信息处理装置,其中所述代表性位置是从所述位置获得的平均位置或者中间位置。
8.如权利要求1所述的信息处理装置,还包括:
第一时间获取单元,其适于从所述目标数据块获取时间元数据块,该时间元数据块指示时间;及
第二时间获取单元,其适于从所述其它数据块获取时间元数据块;
其中,当经分析的目标元数据块的值包含多个不同的值时,所述分配单元向所述目标数据块分配具有与该目标数据块相关的值的目标元数据块,该目标元数据块是为具有时间元数据块的所述其它数据块分配的目标元数据块中的目标元数据块,该时间元数据块指示与由从所述目标数据块所获取的时间元数据块所指示的时间接近的时间。
9.如权利要求1所述的信息装置,还包括:
第一人物获取单元,其适于从所述目标数据块获取人物元数据块,人物元数据块指示人物;
第二人物获取单元,其适于从所述其它数据块获取人物元数据块;及
关联获取单元,其适于获取关于人物的信息,其中该人物被认为与由从所述目标数据块获取的人物元数据块所指示的人物相关联,
其中,当经分析的目标元数据块的值包含多个不同的值时,所述分配单元向所述目标数据块分配其值与所述目标数据块相关的目标元数据块,该目标元数据块是分配到具有人物元数据块的所述其它数据块的目标元数据块中的目标元数据块,该人物元数据块指示被认为有关联的人物。
10.一种信息处理方法,包括:
第一位置获取步骤,从目标数据块获取位置元数据块,该位置元数据块指示位置;
第二位置获取步骤,从与所述目标数据块不同的多个其它数据块获取多个位置元数据块;
目标获取步骤,从所述其它数据块获取除所述多个位置元数据块之外的目标元数据块;
分析步骤,根据由从所述其它数据块获取的所述多个位置元数据块指示的位置,来分析所述目标元数据块的分布;及
分配步骤,根据由从所述目标数据块获取的所述位置元数据块指示的位置与所述分布,来向所述目标数据块分配具有与该目标数据块相关的值的目标元数据块,该目标元数据块是从经分析的目标元数据块中选择的。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009-135356 | 2009-06-04 | ||
JP2009135356A JP5268787B2 (ja) | 2009-06-04 | 2009-06-04 | 情報処理装置及びその制御方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101908057A CN101908057A (zh) | 2010-12-08 |
CN101908057B true CN101908057B (zh) | 2013-06-12 |
Family
ID=43263518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010101944430A Active CN101908057B (zh) | 2009-06-04 | 2010-06-01 | 信息处理装置与信息处理方法 |
Country Status (3)
Country | Link |
---|---|
US (2) | US8290957B2 (zh) |
JP (1) | JP5268787B2 (zh) |
CN (1) | CN101908057B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013042766A1 (ja) * | 2011-09-22 | 2013-03-28 | オリンパス株式会社 | 画像処理装置、画像処理システム、及び画像読出し装置 |
JP6116168B2 (ja) * | 2012-09-14 | 2017-04-19 | キヤノン株式会社 | 情報処理装置およびその方法 |
US9087138B2 (en) | 2013-01-15 | 2015-07-21 | Xiaofan Zhou | Method for representing and storing hierarchical data in a columnar format |
CN105138278B (zh) * | 2015-07-27 | 2018-05-25 | 云南电力调度控制中心 | 一种智能变电站网络报文的裸盘存储方法 |
JP7196502B2 (ja) * | 2018-09-26 | 2022-12-27 | 株式会社リコー | 情報処理装置、情報処理システム、ファイル一覧表示方法及びプログラム |
JP7267703B2 (ja) * | 2018-09-27 | 2023-05-02 | キヤノン株式会社 | 画像データ格納装置、画像データ格納方法、及び、プログラム |
WO2021020299A1 (ja) * | 2019-07-30 | 2021-02-04 | 株式会社Nttドコモ | 人気度推定システム及び地理的特徴生成モデル |
CN111400359B (zh) * | 2020-03-17 | 2023-11-10 | 创新奇智(北京)科技有限公司 | 面向股票趋势预测的相似k线检索方法及检索*** |
WO2024127678A1 (ja) * | 2022-12-16 | 2024-06-20 | 富士通株式会社 | 情報処理プログラム、情報処理方法、および情報処理装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1738430A (zh) * | 2004-06-17 | 2006-02-22 | 株式会社东芝 | 活动图像的元数据的数据结构及其再现方法 |
CN1745375A (zh) * | 2001-06-15 | 2006-03-08 | 美国索尼公司 | 内容管理***及过程 |
CN1811819A (zh) * | 2005-01-24 | 2006-08-02 | 富士通株式会社 | 图像绘制设备和图像绘制方法 |
Family Cites Families (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5553289A (en) * | 1991-12-26 | 1996-09-03 | International Business Machines Corporation | System for automatically assigning attributes to objects of multimedia distribution when the objects being within a predetermined relationship |
JP2891616B2 (ja) * | 1993-09-24 | 1999-05-17 | 富士通株式会社 | 仮ラベル割付処理方式と実ラベル割付処理方式 |
EP1125227A4 (en) * | 1998-11-06 | 2004-04-14 | Univ Columbia | SYSTEMS AND METHODS FOR INTEROPERABLE MULTIMEDIA CONTENTS |
US6941321B2 (en) * | 1999-01-26 | 2005-09-06 | Xerox Corporation | System and method for identifying similarities among objects in a collection |
US6353823B1 (en) * | 1999-03-08 | 2002-03-05 | Intel Corporation | Method and system for using associative metadata |
US6496806B1 (en) * | 1999-12-16 | 2002-12-17 | Samsys Technologies Inc. | Method and system for tracking clustered items |
US6791530B2 (en) * | 2000-08-29 | 2004-09-14 | Mitsubishi Electric Research Laboratories, Inc. | Circular graphical user interfaces |
US6804684B2 (en) * | 2001-05-07 | 2004-10-12 | Eastman Kodak Company | Method for associating semantic information with multiple images in an image database environment |
US7068309B2 (en) * | 2001-10-09 | 2006-06-27 | Microsoft Corp. | Image exchange with image annotation |
US6917360B2 (en) * | 2002-06-21 | 2005-07-12 | Schlumberger Technology Corporation | System and method for adaptively labeling multi-dimensional images |
US7149755B2 (en) * | 2002-07-29 | 2006-12-12 | Hewlett-Packard Development Company, Lp. | Presenting a collection of media objects |
US7234106B2 (en) * | 2002-09-10 | 2007-06-19 | Simske Steven J | System for and method of generating image annotation information |
US7409405B1 (en) * | 2002-12-06 | 2008-08-05 | Adobe Systems Incorporated | File dispatcher for multiple application targets |
US6997388B2 (en) * | 2003-02-19 | 2006-02-14 | Inksure Rf Inc. | Radio frequency data carrier and method and system for reading data stored in the data carrier |
US7296223B2 (en) * | 2003-06-27 | 2007-11-13 | Xerox Corporation | System and method for structured document authoring |
US7313574B2 (en) * | 2003-10-02 | 2007-12-25 | Nokia Corporation | Method for clustering and querying media items |
US20050104976A1 (en) * | 2003-11-17 | 2005-05-19 | Kevin Currans | System and method for applying inference information to digital camera metadata to identify digital picture content |
US20060195858A1 (en) * | 2004-04-15 | 2006-08-31 | Yusuke Takahashi | Video object recognition device and recognition method, video annotation giving device and giving method, and program |
JP2006004157A (ja) * | 2004-06-17 | 2006-01-05 | Olympus Corp | 画像検索プログラム、画像検索方法、画像検索装置及び記録媒体 |
US20050234896A1 (en) | 2004-04-16 | 2005-10-20 | Nobuyuki Shima | Image retrieving apparatus, image retrieving method and image retrieving program |
BRPI0418908A (pt) * | 2004-05-26 | 2007-11-27 | Nokia Corp | método, programa de computador, terminal móvel e sistema de armazenagem para gerenciar os itens de mìdia |
JP2006050275A (ja) * | 2004-08-04 | 2006-02-16 | Toshiba Corp | メタデータの構造及びその再生方法 |
JP2007013939A (ja) * | 2005-05-30 | 2007-01-18 | Matsushita Electric Ind Co Ltd | メタデータ付与装置及びメタデータ付与方法 |
JP4507991B2 (ja) * | 2005-06-09 | 2010-07-21 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP2007052581A (ja) * | 2005-08-17 | 2007-03-01 | Sony Corp | メタデータ生成装置、メタデータ生成システム、これらにおける処理方法ならびに当該方法をコンピュータに実行させるプログラム |
JP2007102290A (ja) * | 2005-09-30 | 2007-04-19 | Seiko Epson Corp | 画像データ管理装置、画像データ管理方法および画像データ管理プログラム |
US7281664B1 (en) * | 2005-10-05 | 2007-10-16 | Leapfrog Enterprises, Inc. | Method and system for hierarchical management of a plurality of regions of an encoded surface used by a pen computer |
KR100673014B1 (ko) * | 2005-10-28 | 2007-01-24 | 삼성전자주식회사 | 포토 마스크의 제조 방법 |
US7663671B2 (en) * | 2005-11-22 | 2010-02-16 | Eastman Kodak Company | Location based image classification with map segmentation |
US7339523B2 (en) * | 2005-12-05 | 2008-03-04 | Honeywell International Inc. | Navigation system using radio frequency tags |
US8341112B2 (en) * | 2006-05-19 | 2012-12-25 | Microsoft Corporation | Annotation by search |
KR20080026003A (ko) * | 2006-09-19 | 2008-03-24 | 삼성전자주식회사 | 물리적인 상대 위치에 기반한 사진상의 ⅰd 태깅 장치 및방법 |
US7698336B2 (en) * | 2006-10-26 | 2010-04-13 | Microsoft Corporation | Associating geographic-related information with objects |
JP2008165700A (ja) * | 2007-01-05 | 2008-07-17 | Seiko Epson Corp | 画像処理装置、電子機器、画像処理システム、画像処理方法、および、プログラム |
US20080201302A1 (en) * | 2007-02-16 | 2008-08-21 | Microsoft Corporation | Using promotion algorithms to support spatial searches |
US8189880B2 (en) * | 2007-05-29 | 2012-05-29 | Microsoft Corporation | Interactive photo annotation based on face clustering |
JP2008305311A (ja) * | 2007-06-11 | 2008-12-18 | Sony Corp | 表示装置および方法、プログラム、並びに記録媒体。 |
US8069173B2 (en) * | 2007-11-12 | 2011-11-29 | Canon Kabushiki Kaisha | Information processing apparatus and method of controlling the same, information processing method, and computer program |
JP2009140361A (ja) * | 2007-12-07 | 2009-06-25 | Canon Inc | データ管理装置及びデータ処理方法 |
US8150098B2 (en) * | 2007-12-20 | 2012-04-03 | Eastman Kodak Company | Grouping images by location |
US8676001B2 (en) * | 2008-05-12 | 2014-03-18 | Google Inc. | Automatic discovery of popular landmarks |
US8086048B2 (en) * | 2008-05-23 | 2011-12-27 | Yahoo! Inc. | System to compile landmark image search results |
US8422832B2 (en) * | 2008-06-06 | 2013-04-16 | Google Inc. | Annotating images |
US20100029326A1 (en) * | 2008-07-30 | 2010-02-04 | Jonathan Bergstrom | Wireless data capture and sharing system, such as image capture and sharing of digital camera images via a wireless cellular network and related tagging of images |
US8411953B2 (en) * | 2008-09-30 | 2013-04-02 | International Business Machines Corporation | Tagging images by determining a set of similar pre-tagged images and extracting prominent tags from that set |
US20100171763A1 (en) * | 2009-01-05 | 2010-07-08 | Apple Inc. | Organizing Digital Images Based on Locations of Capture |
US8275733B2 (en) * | 2009-03-11 | 2012-09-25 | Hewlett-Packard Development Company, L.P. | Creating an album |
US8483715B2 (en) * | 2009-03-26 | 2013-07-09 | Yahoo! Inc. | Computer based location identification using images |
US20110013810A1 (en) * | 2009-07-17 | 2011-01-20 | Engstroem Jimmy | System and method for automatic tagging of a digital image |
US8626699B2 (en) * | 2009-09-16 | 2014-01-07 | Microsoft Corporation | Construction of photo trip patterns based on geographical information |
-
2009
- 2009-06-04 JP JP2009135356A patent/JP5268787B2/ja active Active
-
2010
- 2010-04-23 US US12/766,575 patent/US8290957B2/en not_active Expired - Fee Related
- 2010-06-01 CN CN2010101944430A patent/CN101908057B/zh active Active
-
2012
- 2012-09-12 US US13/612,500 patent/US8620920B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1745375A (zh) * | 2001-06-15 | 2006-03-08 | 美国索尼公司 | 内容管理***及过程 |
CN1738430A (zh) * | 2004-06-17 | 2006-02-22 | 株式会社东芝 | 活动图像的元数据的数据结构及其再现方法 |
CN1811819A (zh) * | 2005-01-24 | 2006-08-02 | 富士通株式会社 | 图像绘制设备和图像绘制方法 |
Also Published As
Publication number | Publication date |
---|---|
US20100312765A1 (en) | 2010-12-09 |
US8290957B2 (en) | 2012-10-16 |
US8620920B2 (en) | 2013-12-31 |
CN101908057A (zh) | 2010-12-08 |
JP2010282431A (ja) | 2010-12-16 |
JP5268787B2 (ja) | 2013-08-21 |
US20130038720A1 (en) | 2013-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101908057B (zh) | 信息处理装置与信息处理方法 | |
US7730036B2 (en) | Event-based digital content record organization | |
CN106462362B (zh) | 存储内容项 | |
US20190108186A1 (en) | Processing media items in location-based groups | |
US8433993B2 (en) | Context aware image representation | |
Kim et al. | Mediaq: mobile multimedia management system | |
JP2004213129A (ja) | 画像分類方法および装置並びにプログラム | |
CN102129448A (zh) | 图像管理设备及其控制方法 | |
US20100262605A1 (en) | Image management apparatus, control method thereof and storage medium storing program | |
US20150213136A1 (en) | Method and System for Providing a Personalized Search List | |
US10977677B2 (en) | Contact importer | |
US20170039264A1 (en) | Area modeling by geographic photo label analysis | |
US20140270524A1 (en) | System and methods for generating quality, verified, and synthesized information | |
CN104679879A (zh) | 一种照片智能存储方法和装置 | |
US20180242027A1 (en) | System and method for perspective switching during video access | |
CN105336017A (zh) | 一种基于Storm技术的行车记录信息处理方法及*** | |
KR102375145B1 (ko) | 비디오 데이터 통합 분석 및 관리 시스템 | |
Hoffmann et al. | Using social media images for building function classification | |
US8862995B1 (en) | Automatically creating a movie from geo located content using earth | |
Wang et al. | Defining urban big data in urban planning: literature review | |
CN114255360A (zh) | 图像聚类方法、装置及计算机存储介质 | |
CN114786032B (zh) | 一种培训视频管理方法及*** | |
CN111008294A (zh) | 交通图像处理、图像检索方法及装置 | |
CN109753482A (zh) | 文件管理方法及装置 | |
CN113299058B (zh) | 交通事故责任的认定方法、装置、介质以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |