CN102982337B - 信息处理设备和方法 - Google Patents

信息处理设备和方法 Download PDF

Info

Publication number
CN102982337B
CN102982337B CN201210180331.9A CN201210180331A CN102982337B CN 102982337 B CN102982337 B CN 102982337B CN 201210180331 A CN201210180331 A CN 201210180331A CN 102982337 B CN102982337 B CN 102982337B
Authority
CN
China
Prior art keywords
cluster
name
candidate
correlation
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210180331.9A
Other languages
English (en)
Other versions
CN102982337A (zh
Inventor
佐藤达人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN102982337A publication Critical patent/CN102982337A/zh
Application granted granted Critical
Publication of CN102982337B publication Critical patent/CN102982337B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/44Browsing; Visualisation therefor
    • G06F16/444Spatial browsing, e.g. 2D maps, 3D or virtual spaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q90/00Systems or methods specially adapted for administrative, commercial, financial, managerial or supervisory purposes, not involving significant data processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种信息处理设备和方法,其中,该信息处理设备使用被配置成接收与包括至少一个数据项的聚类相关联的信息的候选属性区标识部。候选属性区标识部为至少一个数据项中的每一个标识至少一个命名属性区。相关度估计部估计聚类与至少一个命名属性区中的每一个之间的相关度。聚类名称生成部基于所估计的相关度生成聚类名称,其中所述聚类名称包括至少一个命名属性区之一的至少一部分。

Description

信息处理设备和方法
技术领域
本公开内容涉及信息处理设备、信息处理方法以及计算机程序产品。
背景技术
作为用于对包括位置信息的数据进行分组的方法,进行聚类是公知的。作为进行聚类的示例,在日本专利申请公布第JP-A 2008-250605号中公开了如下技术:基于关于捕获照片的位置的信息,将在相互接近的位置所捕获的照片分组成同一聚类。另外,在日本专利申请公布第JP-A4577173号中公开了如下技术:基于关于捕获照片的时间的信息,将在相互接近的时间捕获的照片分组成同一聚类。
还开发了如下技术:使用指定区域的名称来为作为进行聚类的结果所产生的聚类分配名称,以使得包括捕获已被分组成该聚类的照片的位置的地点的名称被分配作为聚类名称。
发明内容
然而,通过上述技术分配给聚类的名称不一定是用户觉得合适的自然名称。例如,在基于捕获照片的位置而将照片分组成聚类的情况下,如果已被分组成聚类的照片是在相互接近的但是跨越地点之间的边界的位置捕获的,则分配给该聚类的名称可以是与聚类所表示的区域相比不自然地较大的地点的名称。
示例性信息处理设备使用候选地理属性区标识部,该候选地理属性区标识部被配置成接收与包括至少一个数据项的聚类相关联的信息。候选地理属性区标识部为至少一个数据项中的每一个标识至少一个命名地理属性区。相关度估计部被配置成执行聚类与至少一个命名地理属性区中的每一个之间的相关度(relatedness)估计。聚类名称生成部基于所估计的相关度生成聚类名称,其中所述聚类名称包括至少一个命名地理属性区之一的至少一部分。其中,相关度估计部根据E=n×D/S确定相关度估计,其中,E是相关度估计,n是数据项的数量,S是候选地理属性区的面积,并且D是候选地理属性区与聚类区域之间的重叠面积,其中候选地理属性区是名称用于聚类名称的区域,并且候选地理属性区是从作为命名地理属性区的地图中的地点当中选择的,候选地理属性区的面积是地图上的相对应的地点的大小。
示例性信息处理方法包括:接收与具有至少一个数据项的聚类相关联的信息,并且为至少一个数据项中的每一个标识至少一个命名地理属性区;利用处理电路估计聚类与至少一个命名地理属性区中的每一个之间的相关度估计;以及基于相关度估计生成聚类名称,其中,聚类名称包括至少一个命名地理属性区之一的至少一部分,其中,估计包括根据E=n×D/S确定相关度估计,其中,E是相关度估计,n是数据项的数量,S是候选地理属性区的面积,并且D是候选地理属性区与聚类区域之间的重叠面积,其中,候选地理属性区是名称用于聚类名称的区域,并且候选地理属性区是从作为命名地理属性区的地图中的地点当中选择的,候选地理属性区的面积是地图上的相对应的地点的大小。
附图说明
图1是示出通过另一方法进行的聚类名称生成的示例的图;
图2是示出根据本公开内容的第一实施例的聚类名称生成的示例的图;
图3是示意性地示出根据本公开内容的第一实施例的信息处理设备的功能配置的框图;
图4是示出本公开内容的第一实施例中的聚类处理的流程图;
图5是示出本公开内容的第一实施例中的聚类结果的示例的图;
图6是示出本公开内容的第一实施例中的聚类名称生成处理的概况的流程图;
图7是示出本公开内容的第一实施例中的候选区域标识部中的处理的流程图;
图8是示出本公开内容的第一实施例中的存储在区域名称数据库中的地点列表的示例的图;
图9是用于说明本公开内容的第一实施例中的图像内容、聚类以及候选区域之间的关系的图;
图10是示出本公开内容的第一实施例中的候选区域的初级列表的示例的图;
图11是示出本公开内容的第一实施例中的相关度估计部的处理的流程图;
图12是用于说明本公开内容的第一实施例中的相关度估计部的处理的图;
图13是用于说明本公开内容的第一实施例中的相关度估计部的处理的图;
图14是用于说明本公开内容的第一实施例中的相关度估计部的处理的图;
图15是示出本公开内容的第一实施例中的聚类名称生成部的处理的流程图;
图16是用于说明在本公开内容的第一实施例中可以设置的阈值的图;
图17是示出根据本公开内容的第二实施例的聚类名称生成的示例的图;
图18是示出本公开内容的第三实施例中的特征图空间的示例的图;
图19是示出根据本公开内容的第三实施例的聚类名称生成的示例的图;
图20是示意性地示出根据本公开内容的第四实施例的信息处理设备的功能配置的框图;以及
图21是用于说明根据本公开内容的实施例的信息处理设备的硬件配置的框图。
具体实施方式
在下文中,将参照附图详细描述本公开内容的优选实施例。注意,在本说明书和附图中,具有基本上相同的功能和结构的结构元件以相同的附图标记来表示,并且省略对这些结构元件的重复说明。
注意,将按以下所示的顺序来说明实施例。
1.第一实施例
1-1.概况
1-2.设备配置
1-3.候选区域(或属性区)标识部
1-4.相关度估计部
1-5.聚类名称生成部
2.第二实施例
3.第三实施例
4.第四实施例
5.硬件配置
6.补充
1.第一实施例
1-1.概况
首先,将参照图1和图2说明本公开内容的第一实施例的概况。这里,为了提供对本实施例实现的聚类名称生成的总体理解,将与通过另一方法进行的聚类名称生成的示例进行对比来说明通过本实施例进行的聚类名称生成的示例。图1中示出了通过其它方法进行的聚类名称生成的示例,并且图2中示出了通过本实施例进行的聚类名称生成的示例。
首先将说明图1所示的通过其它方法进行的聚类名称生成的示例。图像内容110是由具有图像捕获功能的设备(诸如数字摄像装置、移动电话等)捕获的图像内容。将关于图像捕获位置的信息作为元信息附于图像内容110。图像内容110根据其图像捕获位置而表示在地图100上。还基于图像捕获位置而将图像内容110分组成聚类120。使用预定名称作为地图100上的地点的名称而生成的聚类名称122被分配给聚类120。
这里,地图100上的地点名称是针对市镇村(municipality)、县(prefecture)以及地区(region)而定义的。每个市镇村与县相关联,并且每个县与地区相关联。换言之,市镇村、县以及地区之间的关系由树结构来定义,彼此具有等级较高元素与等级较低元素之间的关系。在图1的示例中,在分布在多个地点的多项图像内容110包括在聚类120中的情况下,对于所有地点而言共同的等级较高地点的名称被分配作为聚类名称122。
图1的部分(a)示出了多项图像内容110被分组成聚类120a和聚类120b的示例。位于盛冈的一项图像内容110包括在聚类120a中,因此,“盛冈”被分配作为聚类名称122a。位于新泻县、福岛县以及山形县的三项图像内容110包括在聚类120b中,因此,“北陆-东北地区”被分配作为聚类名称122b,其中“北陆-东北地区”是对于三个县而言共同的等级较高地点名称。当然,在美国,地点、城镇、城市、乡村、州等级可能更适用。
相比之下,图1的部分(b)示出了多项图像内容110被分组成聚类120c和聚类120d的示例。位于盛冈的一项图像内容110以与其包括在聚类120a中相同的方式包括在聚类120c中,并且“盛冈”被分配作为聚类名称122c。位于新泻县和福岛县的三项图像内容110包括在聚类120d中,因此“北陆-东北地区”被分配作为聚类名称122d,其中“北陆-东北地区”是对于两个县而言共同的等级较高地点名称。
这里,聚类120a、120c是大小与市镇村的区域近似相同的聚类。因此,使用市镇村名称“盛冈”的聚类名称122a、122c被认为是自然名称。聚类120b是大小大于平均县的区域的聚类。因此,使用地区名称“北陆-东北地区”的聚类名称122b被认为是自然名称。
然而,即使聚类120d的大小与市镇村的区域近似相同,聚类120d也被分配了聚类名称122d,该聚类名称122d也使用与大得多的聚类120b相同的地区名称“北陆-东北地区”。所分配的聚类名称122d不适合聚类120d的大小,因此与其它聚类名称122a至122c相比,这会给用户留下较不自然的印象。
当对于多个地点而言共同的等级较高地点名称被分配作为聚类120的聚类名称122时,如在聚类120d的示例中一样,可能会分配给用户留下不自然的印象的聚类名称122,其中聚类120的大小与聚类名称122表示的区域不匹配,其中位于多个地点的多项图像内容110被分组成聚类120。
接下来,将说明图2所示的本实施例的示例。图2的部分(a)示出了如下示例:图像内容110与在图1的部分(a)中的相同,并且聚类名称122a、122b以与在图1的示例中的方式相同的方式被分配给聚类120a、120b。在图2的部分(b)中,示出了如下示例:图像内容110和聚类120c、120d与在图1的部分(b)中的相同,并且聚类名称122c与在图1的示例中的相同,但是聚类名称122d是“阿贺镇(Aga town)等”而不是“北陆-东北地区”。
甚至在图2的示例中,聚类名称122也是以与图1的示例中相同的方式、使用地图100上的地点名称生成的。例如,对于聚类120b,“北陆-东北地区”以与图1的示例中的方式相同的方式被分配作为聚类名称122b,其中“北陆-东北地区”是对于图像内容110的内容项所位于的多个县而言共同的等级较高地点名称。另一方面,对于聚类120d,例如,所分配的聚类名称122d与在图1的示例中的聚类名称不同。这是因为在图2的示例中,进行了关于分配等级较高地点名称是否合适的确定。在确定分配较高等级地点名称不合适的情况下,可以使用等级较低地点名称来生成聚类名称122,甚至在分布在多个地点的多项图像内容110包括在聚类120中的情况下也是如此。
将使用聚类120d作为示例更详细地对此进行说明。在生成聚类120d的聚类名称122d时,确定市镇村名称“阿贺镇”(新泻县中的城镇)、作为等级较高地点的县名称“新泻县”和“福岛县”以及作为等级更高的地点的地区名称“北陆-东北地区”中的哪一个最准确地描述了聚类120d的区域。在图中所示的示例中,确定最准确的名称是“阿贺镇”,其是包括在聚类120d中所包括的三项图像内容110中的两项的图像捕获位置的市镇村的名称,因此“阿贺镇”用于聚类名称122d。图像捕获位置不包括在阿贺镇的区域中的图像内容110的内容项也包括在聚类120d中,因此“等”被添加到聚类名称122d。
如上所述,聚类120d是大小与市镇村区域近似相同的聚类。在图2的示例中所分配的聚类名称122d“阿贺镇等”是使用市镇村的名称“阿贺镇”生成的,因此认为这是会给用户留下更自然的印象的名称,其中市镇村是大小与聚类120d的大小匹配的地点。
在本实施例中,实现如在以上说明的图2中的示例中一样的聚类名称122的生成。在下文中,将说明针对该目的的配置以及聚类名称生成的更详细示例。
1-2.设备配置
将参照图3说明根据本公开内容的第一实施例的信息处理设备10的功能配置。图3中的框图示意性地示出了根据本公开内容的第一实施例的信息处理设备10的功能配置。信息处理设备10可以以例如个人计算机(PC)的形式来实现,并且包括内容获取部11、聚类部13、候选区域(属性区)标识部15、相关度估计部17、聚类名称生成部19、区域名称数据库21以及聚类名称输出部23。
内容获取部11获取关于图像内容110的信息。图像内容110可以是例如通过具有图像捕获功能的设备(诸如数字摄像装置、移动电话等)捕获的图像内容,并且关于图像捕获位置的信息作为元信息附于图像内容110。内容获取部11可以以与捕获图像内容110的设备进行通信的连接端口、通信设备等形式来实现。注意,内容获取部11不需要获取包括图像数据的全部图像内容110,而是例如可仅获取指定内容的ID和关于图像捕获位置的元信息。
聚类部13将已由内容获取部11获取的图像内容110分组成聚类120。候选区域标识部15、相关度估计部17以及聚类名称生成部19生成分配给聚类120的聚类名称122。稍后将详细描述这些部中的每一个的功能。聚类部13、候选区域标识部15、相关度估计部17以及聚类名称生成部19可以通过例如中央处理单元(CPU)、只读存储器(ROM)、随机存取存储器(RAM)等来实现。
区域名称数据库21是候选区域标识部15所参考的数据库。区域名称数据库21可以通过例如信息处理设备10所具有的存储设备等来实现。区域名称数据库21还可通过信息处理设备10外部的存储设备来实现,并且信息处理设备10可通过使用通信设备来参考该区域名称数据库21。稍后将描述存储在区域名称数据库21中的信息。
聚类名称输出部23输出关于已生成的聚类名称122的信息。例如,关于聚类名称122的信息可通过取得关于与聚类名称122相关联的聚类120的信息并将该信息传送回到其它设备(诸如数字摄像装置、移动电话等)来输出,其中其它设备将关于图像内容110的信息提供到信息处理设备10。在该情况下,聚类名称输出部23可以以与其它设备进行通信的连接端口或通信设备的形式来实现。关于聚类名称122的信息还可从信息处理设备10连同关于聚类120的信息一起输出到用户。在该情况下,聚类名称输出部23可以以信息处理设备10所具有的输出设备(诸如显示器等)的形式来实现。
注意,不限于上述示例的各种类型的配置使得通过信息处理设备10对图像内容110的获取,将图像内容110分组成聚类120的聚类以及聚类名称122的输出成为可能。例如,信息处理设备10还可具有图像捕获功能并且可自己捕获图像内容110。信息处理设备10还可获取另一设备进行的聚类的结果,并且可仅执行聚类名称122的生成。因此,信息处理设备10可以不仅是PC,而且可以是任意类型的信息处理设备,诸如数字摄像装置、摄像机、游戏机、移动电话、智能电话、汽车导航***、个人数字助理(PDA)等。
尽管以上配置是示例性的基于PC的配置,但是结构不必限于单个设备。例如,聚类部13、候选区域标识部15、相关度估计部17以及聚类名称生成部19可在诸如云计算服务器的远程设备中来实现,该远程设备经由通信链路(诸如无线链路或有线互联网链路)与内容获取部11和聚类名称输出部23通信。
聚类处理
接下来,将参照图4和图5说明通过根据本实施例的信息处理设备10进行的聚类处理。
图4是示出本实施例中的聚类处理的流程图。首先,聚类部13获取已由内容获取部11获取的图像内容110(步骤S101)。接下来,聚类部13从图像内容110的元信息中提取位置信息(步骤S103)。在该情况下,所提取的位置信息是作为关于图像捕获位置的信息而附于图像内容110的信息。
接下来,聚类部13基于所提取的位置信息而执行聚类(步骤S105)。通过进行聚类将图像内容110分组成聚类120。在进行聚类时,可以使用基于距离的技术,其中,基于例如位置信息而计算图像内容110的内容项之间的距离,并且相互接近的图像内容110的内容项被分组成同一聚类120,但是聚类不限于该技术,而是可以使用任意种类的公知技术。
接下来,聚类部13将聚类结果输出到候选区域标识部15(步骤S107)。所输出的结果可以是例如图5所示的结果。
图5是示出本实施例中的聚类结果的示例的图。聚类结果包括图像内容110的内容项在地图100上的位置和关于图像内容110的内容项已被分组后的聚类120的区域的信息。在本说明书中,从聚类部13输出的信息还被称为聚类信息。注意,地图100是二维特征空间,并且图像内容110的内容项是被表示为特征空间中的位置的数据。聚类部13是通过执行聚类获取上述聚类信息的聚类信息获取部。
聚类名称生成处理
接下来,将参照图6说明本实施例中的聚类名称生成处理。
图6是示出本实施例中的聚类名称生成处理的概况的流程图。首先,候选区域标识部15生成候选区域的初级列表(步骤S201)。接下来,相关度估计部17基于候选区域的初级列表而生成候选区域的次级列表(步骤S203)。接下来,聚类名称生成部19基于候选区域的次级列表生成聚类名称122(步骤S205)。
这里,候选区域是名称可能用于聚类名称122的区域,并且它们是从地图100上的预定地点当中选择的。地点是地图100上的预定区域,每个地点具有诸如“日本”、“东京都”等名称。如地图100上的地点一样,名称已预先确定的在特征空间中的区域在本说明书中被称为命名区域。在该实施例中,候选区域是从作为命名区域的地点当中选择的,并且基于指定准则从所选择的候选区域当中选择的地点的名称用于聚类名称122。
候选区域的初级列表和次级列表用于标识候选区域。在下文中,这些列表将被简称为初级列表和次级列表。初级列表是如下列表:其中,对于已被分组成聚类120的图像内容110的内容项中的每一个,标识包括图像内容110的内容项的位置的至少一个地点。换言之,在初级列表中标识的地点包括至少一项图像内容110的位置。在次级列表中,包括在初级列表中的每个区域均同表示该区域与聚类120的相关度的估计的值相关联。列表存储在例如信息处理设备10所具有的存储设备等中,并且可以在必要时进行更新。
在下文中,将参照图7至图16详细说明步骤S201至S205中的每一步骤的处理。注意,步骤S201的处理对应于图7,步骤S203的处理对应于图11,并且步骤S205的处理对应于图15。
1-3.候选区域标识部
图7是示出本实施例中的候选区域标识部15中的处理的流程图。
候选区域标识部15对已被分组成聚类120的图像内容110的内容项中的每一个执行迭代处理(步骤S301)。这里,候选区域标识部15从图像内容110的内容项的元信息中提取位置信息(步骤S303)。所提取的位置信息是如下信息:其被附加作为关于图像内容110的内容项的图像捕获位置的信息。
候选区域标识部15还将对应于所提取的位置信息的地点添加到初级列表(步骤S305)。这里,对应于位置信息的地点是地图100上包括图像内容110的内容项的图像捕获位置的地点。关于地点的信息作为地点列表存储在区域名称数据库21中。关于地点的信息可以是例如图8所示那样的列表。初级列表还可以是如下列表:其不仅包括区域名称,而且还包括诸如包括在区域中的图像内容110的内容项、与聚类120重叠的面积等信息,如例如图10所示的列表那样。
图8是示出本实施例中的存储在区域名称数据库21中的地点列表25的示例的图。参照图8,地点列表25包括关于ID、区域名称、区域数据以及区域面积的信息。
ID是用于标识地点信息的ID。区域名称是分配给各个地点的名称。区域数据可包括例如表示地图100上的多个位置的信息,并且各个地点中的区域由多个位置作为顶点的多边形来定义。区域面积是地图100上的各个地点的大小。
在图8所示的示例中,地点列表25包括陆标地点(诸如“富士山”、“幕张展览馆”、“海滨幕张站及附近”等)和地址地点(诸如“关东地区”、“东京都”、“品川区”等)。地址地点布置在市镇村(例如,品川区)、县(例如,东京都)以及地区(例如,关东地区)的树结构中,其中等级较高地点包括等级较低地点。
相比之下,陆标地点不一定具有诸如树结构的有序结构。例如,在图8所示的示例中,区域“幕张展览馆”和区域“海滨幕张站及附近”彼此部分重叠,但是一个不包括另一个。陆标地点也可以独立于地址地点的树结构来定义。因此,陆标地点与地址地点之间的关系可以是无规律的。
出于上述原因,在图7中的步骤S305添加到初级列表的地点的数量不限于一个。首先,由于地址地点具有树结构,因此在图像内容110的内容项的图像捕获位置包括在等级较低地点中的情况下,同一位置也包括在等级较高地点中。例如,在图像内容110的内容项的图像捕获位置包括在“品川区”中的情况下,该位置也包括在“东京都”中并且还包括在“关东地区”中。
此外,陆标地点可能不规则地与多个地点重叠,因此图像内容110的内容项的图像捕获位置有时将包括在多个地点中。例如,在图像内容110的内容项的图像捕获位置在幕张展览馆与海滨幕张站之间的情况下,可以将“幕张展览馆”和“海滨幕张站及附近”标识为包括图像捕获位置的陆标地点。
图9是用于说明在本实施例中图像内容110的内容项、聚类120以及候选区域130之间的关系的图。图10是示出在本实施例中可以针对图9中的示例而生成的初级列表140的示例的图。
图9示出了图像内容110的内容项已被分组后的聚类120以及候选区域130a至130c,其中候选区域130a至130c是每一个均包括已被分组成聚类120的图像内容110的内容项中的至少一个的图像捕获位置的地点。候选区域130a是具有区域名称“A”并且包括图像内容110的内容项“1”至“5”的位置的区域。候选区域130b是具有区域名称“B”并且包括图像内容110的内容项“1”和“3”的位置的区域。候选区域130c是具有区域名称“C”并且包括图像内容110的内容项“2”至“6”的位置的区域。
图10示出了通过候选区域标识部15针对图像内容110的内容项“1”至“6”中的每一个标识候选区域130而生成的初级列表140的示例。在图10所示的示例中,初级列表140包括区域名称、区域面积、内容项ID、内容项的数量以及关于与聚类区域重叠的面积的信息。
在这些当中,区域名称和区域面积可以从存储在区域名称数据库21中的地点列表25获取。内容项ID可以在例如在图7中的步骤S305针对图像内容110的内容项中的每一个标识候选区域130时,从关于相应的图像内容110的内容项的信息中获取。内容项的数量可以如下来获取:首先当在步骤S305针对给定的图像内容110的内容项标识给定的一个候选区域130时将计数设置为1,然后在针对图像内容110的另一项标识同一候选区域130时增加计数。可以基于针对从存储在区域名称数据库21中的地点列表25获取的每个区域的区域数据以及关于聚类部13提供的聚类的区域的信息来计算与聚类区域的重叠面积。
这里,候选区域130a至130c中的每一个均是包括已被分组成聚类120的图像内容110的内容项的位置中的至少一个的区域,但是在该时间点,不知道哪个候选区域130的名称将最适合作为聚类名称122。因此,候选区域标识部15将所生成的初级列表140中的信息提供到相关度估计部17,并且相关度估计部17估计每个候选区域130与聚类120的相关度。
1-4.相关度估计部
图11是示出本实施例中的相关度估计部17中的处理的流程图。
首先,相关度估计部17针对初级列表140中的每个候选区域130计算相关度估计值(步骤S401)。在本实施例中,基于位置被候选区域130所包括的图像内容110的内容项的数量和候选区域130与聚类120之间的重叠面积而计算相关度估计值。
接下来,相关度估计部17取初级列表140中具有最大相关度估计值的候选区域130并且将其添加到次级列表(步骤S403)。在步骤S401针对候选区域130算出的相关度估计值与关于添加到次级列表的候选区域130的信息相关联。
接下来,相关度估计部17从初级列表140中删除与在步骤S403添加到次级列表的候选区域130相关的元素(步骤S405)。如稍后所述,与候选区域130相关的元素包括候选区域130中所包括的图像内容110的内容项以及聚类120与候选区域130重叠的部分。
接下来,相关度估计部17确定初级列表140是否是空的(步骤S407),并且如果是空的,则相关度估计部17终止处理。如果初级列表140不是空的,则相关度估计部17再次针对初级列表140中的每个候选区域130计算相关度估计值(步骤S401),其中在步骤S405从该初级列表140中删除与在步骤S403添加到次级列表的候选区域130相关的元素。
在已终止了上述处理的情况下,相关度估计部17将所生成的次级列表中的信息提供到聚类名称生成部19,并且聚类名称生成部19基于包括在次级列表中的候选区域130的相关度估计值而生成聚类名称122。
因此,在本实施例中,在通过相关度估计部17进行的处理中,每次来自初级列表140的候选区域130之一被添加到次级列表时,从初级列表140删除与该候选区域130相关的元素,此后再次针对初级列表140中剩余的候选区域130中的每一个来计算相关度估计值。以下将更详细地说明该处理。
图12至图14是用于更详细地说明已参照图11说明的、相关度估计部17进行的处理的图。注意,图12至图14所示的图像内容110的内容项、聚类120以及候选区域130与图9和图10中的示例的相同。
图12示出了针对初级列表140的第一次相关度估计值的计算。在本实施例中,使用内容项的数量n、候选区域130的面积S以及候选区域130与聚类120之间的重叠面积D、通过以下等式1来计算每个候选区域130的相关度估计值E。
等式1:E=n×D/S
这里,具有区域名称“A”的候选区域130a包括五项图像内容110,并且在等于50的区域面积中有15与聚类120重叠。因此,对于候选区域130a,相关度估计值E是5×15/50=1.5。
以相同方式,具有区域名称“B”的候选区域130b包括两项图像内容110,并且在等于55的区域面积中有7与聚类120重叠。因此,对于候选区域130b,相关度估计值E是2×7/55=0.25。
此外,具有区域名称“C”的候选区域130c包括五项图像内容110,并且在等于50的区域面积中有14与聚类120重叠。因此,对于候选区域130c,相关度估计值E是5×14/50=1.4。
这些结果示出在包括在初级列表140中的候选区域130a至130c中,候选区域130a的相关度估计值E最高,随后是候选区域130c的相关度估计值E,并且候选区域130b的相关度估计值E最低。在本实施例中,根据这些结果确定在包括在初级列表140中的候选区域130中,具有与聚类120最高的相关度并且因此名称最适合于聚类名称122的是候选区域130a。
图13示出了将第一候选区域130添加到次级列表150。上述相关度估计值计算的结果表明候选区域130a的相关度估计值E在初级列表140中最高,因此相关度估计部17将关于候选区域130a的信息添加到次级列表150。候选区域130a的区域名称“A”和算出的相关度估计值1.5被添加到次级列表150。注意,关于候选区域130a的其它信息也可被添加到次级列表150。
这里,关于候选区域130a的信息伴随其被添加到次级列表150而从初级列表140中删除。也从初级列表140中删除了与候选区域130a相关的元素。具体地,从初级列表140中删除了表示候选区域130a的记录。此外,从候选区域130b、130c删除关于包括在候选区域130a中的图像内容110的内容项“1”至“5”的信息,如聚类120的区域内与候选区域130a重叠的部分的面积。
在图13中通过删去信息并利用修订符号示出了上述的删除结果。包括在候选区域130b中的图像内容110的内容项“1”和“3”的图像捕获位置均包括在候选区域130a中,因此从初级列表140中删除这二者的信息。这意味着在初级列表140中图像内容110的内容项的图像捕获位置中没有一个包括在候选区域130b中。另外,聚类120的区域与候选区域130b重叠的部分也都与候选区域130a重叠,因此也删除它们。这些删除的结果为在初级列表140中,候选区域130b与聚类120的区域不重叠。
以此方式,作为删除了图像内容110的内容项和聚类120的部分区域的结果,对于不再包括图像内容110的内容项的图像捕获位置并且与聚类120的区域不重叠的任意候选区域130,从初级列表140删除表示给定候选区域130的记录。因此,还从初级列表140删除对于候选区域130b的记录。
相比之下,在候选区域130c中,在图像内容110的内容项“2”至“6”之中,删除包括在候选区域130a中的图像内容110的内容项“2”至“5”。因此,候选区域130c在初级列表140中仅包括图像内容110“6”。另外,候选区域130c与聚类120重叠的一些部分也与候选区域130a重叠,因此从重叠面积D减去这些部分的面积。注意,区域面积是11。因此,当删除了与候选区域130a相关的元素时,候选区域130c与聚类120的区域重叠的面积D在初级列表140中变为14-11=3。
图14中示出了针对初级列表140的第二次相关度估计值的计算。如上所述,作为基于第一次相关度估计值的计算而将候选区域130a添加到次级列表150的结果,从初级列表140删除了候选区域130a的信息和与候选区域130a相关的元素。对进行了删除之后的初级列表140执行第二次相关度估计值的计算。
如上所述,第一次相关度估计值的计算的结果是已从初级列表140删除了候选区域130a和候选区域130b的记录。因此,在第二次相关度估计值的计算中,针对候选区域130c计算相关度估计值。在该时间点初级列表140中的候选区域130c包括图像内容110的内容项之一,并且在等于50的区域面积中,与聚类120的区域的重叠面积为3。因此,对于候选区域130c,相关度估计值E是1×3/50=0.06。
在图14所示的示例中,在初级列表140中仅存在一个候选区域130,因此相关度估计部17自动地将候选区域130c作为具有最高相关度估计值E的候选区域130添加到次级列表150。候选区域130c的区域名称“C”和算出的相关度估计值0.06被添加到次级列表150。
这里,关于候选区域130c的信息伴随其被添加到次级列表150而从初级列表140中删除。因此,已从初级列表140中删除了关于候选区域130的全部信息,并且相关度估计部17终止基于初级列表140而生成次级列表150的处理。
用于相关度估计的准则
如等式1所示,在本实施例中,基于候选区域130与聚类120的重叠部分的比率以及包括在候选区域130中的图像内容110的内容项的数量,估计候选区域130与聚类120之间的相关度。
基于候选区域130与聚类120的重叠部分来估计相关度使得可以为与聚类120的重叠面积较大并且尺寸较小的候选区域130分配较高的相关度估计值。
基于包括在候选区域130中的图像内容110的内容项的数量来估计相关度使得可以为包括较大数量的图像内容110的内容项的候选区域130分配较高的相关度估计值。
这两个准则中的每一个可单独用于相关度估计,并且二者也可结合使用。仅使用一个准则的优点在于使得处理更简单。然而,通过结合上述两个准则来估计候选区域130的相关度具有下述优点。
首先,考虑仅基于包括在候选区域130中的图像内容110的内容项的数量n估计相关度的情况。在该情况下,包括较多图像内容110的内容项的候选区域130被给予较高的相关度估计值。因此,在例如具有树结构的地址地点的情况下,相关度估计值对于等级越高的地点趋于越高,以使得县相比于市村镇而言具有较高的值,并且地区相比于县而言具有较高的值。因此,在处于多个地点的图像内容110的内容项被分组后的聚类120的情况下,多个地点当中等级最高的地点的名称用于聚类名称122。在该情况下,用于聚类名称122的地点的大小不对应于聚类120的大小,因此不是总生成自然的聚类名称122。
这里,如果还基于候选区域130与聚类120的重叠部分的比率D/S来估计相关度,则区域面积S随着地点的等级变得越高而变得越大,因此地点的大小变得越大,重叠部分的比率D/S变得越小,从而使得相关度估计值E越小。因此,即使候选区域130包括较大数量的图像内容110的内容项,也可以使得大小对应于聚类120的大小的候选区域130的相关度估计值最高。
接下来,考虑仅基于候选区域130与聚类120的重叠部分的比率D/S来估计相关度的情况。在该情况下,与聚类120重叠的部分的比率D/S较大的候选区域130被给予较高的相关度估计值。因此,例如,对于聚类120所包括的小地点,重叠部分的比率D/S的值是1,即,相关度估计值E达到其最大值。在该情况下,针对聚类名称122选择包括小数量的图像内容110的内容项的小地点的名称,而与聚类120的大小无关,因此不是总生成自然的聚类名称122。
这里,如果还基于包括在候选区域130中的图像内容110的内容项的数量n来估计相关度,则包括在地点中的图像内容110的内容项的数量n随着地点变得越小而变得越小,因此相关度估计值E变得越小。因此,在与聚类120重叠的部分的比率D/S略大的候选区域130当中,包括最大数量的图像内容110的内容项的候选区域130可以被给予最高的相关度估计值。
因此,根据两个准则的组合来估计候选区域130的相关度使得可以通过将包括最多图像内容110的内容项的点与尺寸最接近聚类120的点进行平衡,选择生成聚类名称122的候选区域130。
注意,在使用具有树结构的地址地点的名称和以不规则方式彼此重叠的路标地点的名称、如在本实施例中一样生成聚类名称122的情况下,结合上述两个准则是估计候选区域130与聚类120的相关度的有效方式。然而,如果命名区域的结构不同,如在稍后将描述的另一实施例的情况下一样,则仅使用一个准则估计相关度就可以是足够有效的。
相关度估计值的变化
还可通过不同于等式1的公式来计算相关度估计值E。例如,还可通过包括基于指定属性(诸如地理属性、时段或情绪)的权重的公式来计算相关度估计值E。属性可以是例如候选区域130的类别、候选区域130的名气、候选区域130中的家庭的人口或数量、候选区域130是否是主要城市、县政府或者由法规指定的城市的所在地、通过用户的编辑操作已选择候选区域130的次数等。
在这些属性当中,候选区域130的类别可以是商业设施、公共设施、居民设施、游览胜地等。例如,为用户已设置用于捕获图像内容110的特定类别分配权重使得可以使对于该类别中的候选区域130的相关度估计值E较大,从而使得候选区域130更可能用于聚类名称122。因此,在例如用户选择了游览胜地类别的情况下,作为游览胜地的陆标地点的名称可以优先地包括在聚类名称122中。
根据候选区域130的名气、人口等进行加权使得可以将候选区域130的重要性、知名度等体现到聚类名称122的生成中。这使得例如用户更可能知道名称的地点(诸如陆标地点(如更受欢迎的主题公园、游览胜地等或较大的城市))的名称优先地包括在聚类名称122中。
1-5.聚类名称生成部
图15是示出本实施例中的聚类名称生成部19中的处理的流程图。
首先,聚类名称生成部19确定次级列表150中是否存在任意候选区域130(步骤S501)。在针对已从相关度估计部17提供的次级列表150第一次进行确定的情况下,至少一个候选区域130存在于次级列表150中。这里,在确定没有候选区域130存在于次级列表150中的情况下,聚类名称生成部19跳至稍后将描述的步骤S521,并且开始聚类名称生成的后处理。
在步骤S501确定候选区域130存在于次级列表150中的情况下,聚类名称生成部19标识次级列表150中具有最高相关度估计值的候选区域130(步骤S503)。这里标识的候选区域130是已被确定为在此时存在于次级列表150中的所有候选区域130中与聚类120具有最高相关程度的区域。换言之,聚类名称生成部19在次级列表150中按相关度估计部17所确定的与聚类120的相关度的降序来标识候选区域130。
接下来,聚类名称生成部19确定等级比在步骤S503标识的候选区域130低的区域的名称是否已包括在聚类名称122中(步骤S505)。在等级较低的区域的名称已包括在聚类名称122中的情况下,聚类名称生成部19从次级列表150删除所标识的候选区域130,并且设置高-低确定删除标志(步骤S507)。高-低确定删除标志是针对每个单独的聚类120的处理而保持的标志,并且在稍后将描述的步骤S521参考该标志。接下来,聚类名称生成部19返回到步骤S501,并且重复在次级列表150中标识候选区域130的处理。
这里,例如,对于具有地址地点的树结构(如“市镇村-县-地区”结构)的区域,由区域之间的层级关系来定义等级较低的区域。例如,“品川区”是比“东京都”等级低的区域,并且“东京都”是比“关东地区”等级低的区域。在本实施例中,在“品川区”已包括在聚类名称122中的情况下,例如,如果在次级列表150中标识“东京都”的候选区域130,则从次级列表150删除关于“东京都”的候选区域130的信息。由于认为具有层级关系的区域名称联合用作聚类名称122是不自然的(如“品川区,东京都”),因此进行此删除。
注意,在本实施例的处理中没有发生比所标识的候选区域130等级高的区域的名称已包括在聚类名称122中的情形,因此没有进行这种确定。此外,如之前所述,在本实施例中在地址地点与陆标地点之间没有建立层级关系,因此,例如,如“东京铁塔,东京都”一样,可以在聚类名称122中联合使用陆标地点的名称和包括陆标地点的地址地点的名称。
在步骤S505确定比所标识的候选区域130等级低的区域的名称不包括在聚类名称122中的情况下,聚类名称生成部19将所标识的候选区域130的名称添加到聚类名称122并且从次级列表150中删除候选区域130(步骤S509)。
此时,在本实施例中,通过顺序地链接候选区域130的名称来生成聚类名称122。例如,在将具有名称“中国城”和“品川区”的候选区域130按该顺序标识在次级列表150中的情况下,聚类名称122被生成为“中国城,品川区”。
接下来,聚类名称生成部19确定包括在聚类名称122中的候选区域130的名称的数量是否已达到阈值(步骤S511)。在本实施例中,针对包括在聚类名称122中的名称的数量设置上限阈值T1。这样做是为了防止例如聚类名称122变得过长,使得聚类120和图像内容110当显示在地图100上时变得视觉上较难识别。在确定包括在聚类名称122中的名称的数量已达到阈值T1的情况下,聚类名称生成部19进行到稍后将描述的步骤S517,并且开始聚类名称生成的后处理。
注意,在考虑到例如根据地图100的比例尺、聚类120的大小等的显示的平衡的情况下,可以将包括在聚类名称122中的名称的数量的阈值T1自动设置为适当值。例如,在地图100的比例尺比较小的情况下,认为将阈值T1设置为比较小的值是适当的。在聚类120的大小比较小的情况下,也认为将阈值T1设置为比较小的值是适当的。还可通过用户操作将阈值T1设置为任意期望值。
另一方面,在步骤S511,在包括在聚类名称122中的名称的数量没有达到阈值T1的情况下,聚类名称生成部19对到现在为止名称已被添加到聚类名称122的候选区域130的相关度估计值进行合计(步骤S513)。可以从次级列表150获取相关度估计值。
在本实施例中,相关度估计值的和用作聚类名称122是否充分地描述了聚类120的区域的指示符。例如,在已被分组成聚类120的图像内容110的内容项的图像捕获位置包括集中在单个候选区域130中的位置的情况下,相关度估计值的和在该候选区域130的名称首先被添加到聚类名称122时相当大。另一方面,在已被分组成聚类120的图像内容110的内容项的图像捕获位置包括分布在多个候选区域130当中的位置的情况下,各个候选区域130的相关度估计值比较低,因此在相关度估计值的和达到与在第一示例中的相同的值之前,多个候选区域130的名称可以被添加到聚类名称122。
接下来,聚类名称生成部19确定在步骤S513合计的相关度估计值的和是否已达到阈值(步骤S515)。在本实施例中,针对名称包括在聚类名称122中的候选区域130的相关度估计值的和,设置下限阈值T2。如以上所说明的,相关度估计值的和用作聚类名称122是否充分地描述了聚类120的区域的指示符。提供阈值T2,以使得不必要的大量的名称不会被添加到聚类名称122。
注意,可以根据例如地图100的比例尺、聚类120的大小等将阈值T2自动设置为适当的值。也可根据包括在次级列表150中的候选区域130的相关度估计值的平均值来动态地设置阈值T2的适当值。还可通过用户操作将阈值T2设置为任意期望值。
在步骤S515确定合计的相关度估计值的和已达到阈值T 2的情况下,聚类名称生成部19进行到稍后将描述的步骤S517,并且开始聚类名称生成的后处理。另一方面,在确定合计的相关度估计值的和没有达到阈值T2的情况下,聚类名称生成部19返回到步骤S501,并且重复在次级列表150中标识候选区域130的处理。
在步骤S511确定包括在聚类名称122中的名称的数量已达到阈值T1的情况下,以及在步骤S515确定相关度估计值的和已达到阈值T2的情况下,聚类名称生成部19确定候选区域130是否保留在次级列表150中(步骤S517)。在确定关于候选区域130的信息保留在次级列表150中的情况下,聚类名称生成部19将“等”添加到聚类名称122(步骤S519)。
另一方面,在步骤S517确定没有关于候选区域130的信息保留在次级列表150中的情况下,聚类名称生成部19确定是否设置了高-低确定删除标志(步骤S521)。高-低确定删除标志是当从次级列表150删除候选区域130且其名称没有被添加到聚类名称122时在步骤S507设置的标志。在步骤S521确定已设置高-低确定删除标志的情况下,聚类名称生成部19还将“等”添加到聚类名称122(步骤S519)。
在存在名称未被添加到聚类名称122的候选区域130的情况下,执行在步骤S519以此方式将“等”添加到聚类名称122,即使该候选区域130的名称包括在相关度估计部17所生成的次级列表150(下文中还称为初始次级列表150)中也是如此。
从相关度估计部17执行的生成次级列表150的上述处理表明,包括在初始次级列表150中的每个候选区域130包括在次级列表150的其它候选区域130中不包括的图像内容110的内容项的至少一个图像捕获位置。因此,提及存在包括在初始次级列表150中但是名称不包括在聚类名称122中的候选区域130,也就是提及与包括在该候选区域130中的图像内容110的内容项的图像捕获位置对应的名称不包括在聚类名称122中。
因此,在这种情况下,聚类名称生成部19通过将“等”附于聚类名称122来指示存在如下图像内容110的内容项:其包括在聚类120中,但是其图像捕获位置在与由聚类名称122中的名称表示的区域不同的区域中。
图16是用于说明在本实施例中针对聚类名称生成部19执行的处理而设置的阈值的图。注意,图16所示的次级列表150与在图12至图14的示例中生成的次级列表150相同。另外,注意,在以下的说明中,必要时将参考图15中说明的步骤。
在图16所示的示例中,初始次级列表150包括关于候选区域130a的信息和关于候选区域130c的信息,其中,候选区域130a的区域名称是“A”并且相关度估计值是1.5,候选区域130c的区域名称是“C”并且相关度估计值是0.06。
首先,在可以包括在聚类名称122中的名称的数量的阈值T1不是至少为2的情况下,即,在仅一个名称可以包括在聚类名称122中的情况下,在步骤S509将名称“A”添加到聚类名称122之后,在步骤S511确定包括在聚类名称122中的名称的数量是否已达到阈值T1。因此,在该时间点终止将名称添加到聚类名称122的处理,并且候选区域130c的名称“C”不包括在聚类名称122中。
然而,在图12中被表示为“6”的图像内容110的内容项的图像捕获位置不包括在候选区域130a中。因此,如果聚类名称122被简单定义为“A”,则图像内容110的内容项“6”包括在聚类120中的事实不以聚类名称122来表示。因此,聚类名称生成部19在步骤S519将“等”添加到聚类名称122。如此生成为“A等”的聚类名称122y。
相比之下,在阈值T1不小于2的情况下,候选区域130c的区域名称“C”可以包括在聚类名称122中。然而,在相关度估计值的和的阈值T2不大于1.5的情况下,在步骤S509将名称“A”添加到聚类名称122之后,在步骤S515确定相关度估计值的和(其在此时等于候选区域130a的相关度估计值或1.5)已到达阈值T2。因此,以与在上述情况下相同的方式,如此生成为“A等”的聚类名称122y。
另一方面,在阈值T2大于1.5的情况下,在步骤S515确定相关度估计值的和没有达到阈值T2,因此处理返回到步骤S501,并且再次执行将名称添加到聚类名称122的处理。因此,第二次执行步骤S509,其中将候选区域130c的名称“C”添加到聚类名称122。如此生成为“A,C”的聚类名称122x。
2.第二实施例
接下来,将参照图17说明本公开内容的第二实施例。图17是示出根据本实施例的聚类名称生成的示例的图。
参照图17,图像内容210的内容项是由具有图像捕获功能的设备(诸如数字摄像装置、移动电话等)捕获的图像内容项。关于图像捕获的日期和时间的信息作为元信息被附于图像内容210的内容项中的每一个。图像内容210的内容项根据其捕获的日期和时间被放置在时间轴200上。图像内容210的内容项还根据其捕获的日期和时间而被分组成聚类220。
这里,时间轴200是一维特征空间,并且可以认为图像内容210的内容项是通过其在特征空间中的位置来描述的数据。还预先在时间轴200上建立事件时期230。事件时期230基于例如季节、事件等、由时段和名称来定义。时段是时间轴200上的区域。因此,事件时期230可以称为命名区域。
在本实施例中,通过以时间区域(即,时段)替换上述的第一实施例中的地理区域来生成聚类名称。
具体地,首先,信息处理设备10的候选区域标识部15基于事件时期230生成候选区域的初级列表140。在初级列表140中,事件时期230被标识为使得每一个均包括被分组成聚类220的图像内容210的内容项中的至少一个的图像捕获日期和时间。从区域名称数据库21获取事件时期230的时段和名称。
接下来,对于包括在初级列表140中的每个事件时期230,相关度估计部17计算其与聚类220的相关度的估计值。可以基于图像捕获日期和时间包括在事件时期230中的图像内容210的内容项的数量、以及事件时期230的时段与聚类220的时段之间的任意重叠长度,计算相关度估计值。相关度估计部17取初级列表140中具有最高相关度估计值的事件时期230,并且将其连同关于其相关度估计值的信息一起添加到次级列表150。然后,相关度估计部17从初级列表140删除关于该事件时期230的信息,并且重复处理直至初级列表140为空。
接下来,对于包括在次级列表150中的每个事件时期230,聚类名称生成部19按相关度估计值的降序将事件时期230的名称添加到聚类名称222。在本实施例中,还可以设置可以包括在聚类名称222中的名称的数量的阈值T1以及名称包括在聚类名称222中的事件时期230的相关度估计值的和的阈值T2。聚类名称生成部19重复将事件时期230的名称添加到聚类名称222,直至包括在聚类名称222中的名称的数量达到阈值T1为止,直至相关度估计值的和达到阈值T2为止,或者直至次级列表150为空为止。
注意,上述聚类名称生成处理的细节与第一实施例中相同,因此将省略详细说明。在例如日本专利申请公布第JP-A 4577173号中描述了根据图像捕获日期和时间对图像内容项进行聚类。日本专利申请公布第JP-A4577173号中描述的方法还可以根据需要而用于本实施例中的聚类,因此还将省略聚类处理的详细说明。
在图17中,示出了如下示例:图像内容210的内容项被分组成等级较低的聚类220a至220d以及等级较高的聚类220e、220f。因此,图像内容210的内容项可被分组成具有树结构的聚类220。
在图17所示的示例中所定义的事件时期230之中,事件时期230a、230b是具有“季节”属性“春季”和“夏季”的事件时期。此外,事件时期230c至230e是具有“公共事件”属性“女儿节(Doll Festival)”和“儿童节”的事件时期。事件时期230f至230j是具有“私人事件”属性“毕业典礼”和“观赏樱花”的事件时期。具有“季节”属性的事件时期230a、230b包括具有“公共事件”属性和“私人事件”属性的事件时期230c至230j。换言之,可以说树结构存在于事件时期230a、230b与事件时期230c至230j之间。另一方面,有序结构不一定存在于事件时期230c至230j当中,其中各个时段分开分布并且它们的一部分重叠。
在下文中,将通过具体地说明对于各个聚类220的聚类名称222的生成来说明本实施例中的聚类名称生成处理。
聚类名称生成示例1
首先,将说明聚类220a作为示例。聚类220a包括在“女儿节”事件时期230c期间捕获的两项图像内容210和稍晚捕获的一项图像内容210。三项图像内容210包括在“春季”事件时期230a中。在该情况下,候选区域标识部15在初级列表140中标识“女儿节”事件时期230c和“春季”事件时期230a。
这里,在初级列表140中已标识的事件时期230之中,“女儿节”事件时期230c包括比较大数量的图像内容210的内容项,并且其与聚类220a的重叠区域的比率较大,因此其被给予较高的相关度估计值。相比之下,“春季”事件时期230a包括聚类220a中的全部图像内容210的内容项,但是事件时期230a的时段比聚类220a的时段长,因此其与聚类220a的重叠时期的比率较小,并且其被给予较低的相关度估计值。因此,在相关度估计部17的处理中,首先将“女儿节”事件时期230c添加到次级列表150。“春季”事件时期230a也作为包括图像内容210的一个剩余内容项的事件时期230而被添加到次级列表150。
如上所述,在树结构中,可以说事件时期230c比事件时期230a的等级低。因此,聚类名称生成部19可如图17所示,通过添加“等”来代替包括事件时期230a的名称“春季”,将聚类名称222a定义为“女儿节等”,其中事件时期230a的名称“春季”在包括在次级列表150中的事件时期230的名称当中等级较高。此外,与在地点名称的情况下不同,在不认为联合使用具有高-低关系的名称特别奇怪的情况下,还可通过将事件时期230a的名称“春季”包括在聚类名称222a中而将聚类名称222a定义为“女儿节,春季”。
聚类名称生成示例2
接下来,将聚类220b作为示例来进行说明。聚类220b包括在“毕业典礼”事件时期230f期间捕获的两项图像内容210和在如下时段期间捕获的两项图像内容210:在该时段期间,“观赏樱花”事件时期230g与“春季假期”事件时期230h重叠。四项图像内容210都包括在“春季”事件时期230a中。在该情况下,候选区域标识部15在初级列表140中标识“毕业典礼”事件时期230f、“观赏樱花”事件时期230g、“春季假期”事件时期230h以及“春季”事件时期230a。
这里,在已在初级列表140中标识的事件时期230之中,与聚类220b重叠的区域的比率对于“毕业典礼”事件时期230f和“观赏樱花”事件时期230g而言较大,并且它们包括数量比较大的图像内容210的内容项,因此它们被给予较高相关度估计值。相比之下,“春季假期”事件时期230h包括与事件时期230g相同数量的图像内容210的内容项,但是事件时期230h的时段较长,因此其与聚类220b的重叠时期的比率较小,并且其被给予较低的相关度估计值。“春季”事件时期230a包括聚类220b中的全部图像内容210的内容项,但是事件时期230a的时段比聚类220b的时段长,因此其与聚类220b的重叠时期的比率较小,并且其被给予较低的相关度估计值。
因此,在相关度估计部17的处理中,首先将“毕业典礼”事件时期230f和“观赏樱花”事件时期230g添加到次级列表150。当组合这些事件时期230时,它们包括聚类220b中的全部图像内容210的内容项的图像捕获日期和时间。因此,伴随将这些事件时期230添加到次级列表150,从初级列表140删除剩余的“春季假期”事件时期230h和“春季”事件时期230a的记录。因此,将“毕业典礼”事件时期230f和“观赏樱花”事件时期230g添加到次级列表150。阈值T1和和阈值T2的设置值同样适用,但是在图17所示的示例中,这些事件时期230的名称联合用于变为“毕业典礼,观赏樱花”的聚类名称222b。
在上述的聚类220b的示例中,考虑如下情况:以与在第一实施例中相同的方式,使用内容项的数量和与聚类220重叠的事件时期230的时段的比率来计算事件时期230与聚类220的相关度的估计值。在该情况下,“毕业典礼”事件时期230f和“观赏樱花”事件时期230g均包括两项图像内容210,但是它们的时段完全与聚类220b重叠,因此它们具有相同的相关度估计值。为了应对这种情况,可做出如下设置:例如在多个事件时期230具有相同的相关度估计值的情况下,它们将被添加到次级列表150,其中优先添加最早的事件时期230。因此,在事件时期230具有与聚类220等同程度的相关度的情况下,可以通过以最早的事件时期230开始名称来生成聚类名称222,如聚类名称222b中的“毕业典礼,观赏樱花”一样。
聚类名称生成示例3
接下来,将聚类220c作为示例进行说明。聚类220c包括在“星祭(Star Festival)”事件时期230e捕获的一项图像内容210和较早捕获的六项图像内容210。七项图像内容210都包括在“夏季”事件时期230b中。在该情况下,候选区域标识部15在初级列表140中标识“星祭”事件时期230e和“夏季”事件时期230b。
这里,在已在初级列表140中标识的事件时期230之中,“星祭”事件时期230e的整个时段与聚类220c重叠,但是其仅包括聚类220c中所包括的七项图像内容210之一。相比之下,“夏季”事件时期230b的时段的一部分与聚类220c重叠,但是它包括聚类220c中所包括的全部七项图像内容210。
因此,在图17所示的示例中,尽管其也取决于对于相关度估计值的计算的设置,但是“夏季”事件时期230b的相关度估计值较高,因此“夏季”事件时期230b首先被添加到候选区域的次级列表150中。“夏季”事件时期230b包括聚类220c中所包括的图像内容210的全部内容项。因此,伴随将“夏季”事件时期230b添加到次级列表150,从初级列表140删除对于“星祭”事件时期230e的记录。因此,仅“夏季”事件时期230b被添加到次级列表150。因此,聚类名称222c变为“夏季”。
以与在上述示例中相同的方式来针对聚类220d至220f生成聚类名称222d至222f。
聚类220d主要包括“夏季假期”事件时期230j中所包括的图像内容210的内容项,但是其还包括事件时期230j中不包括的图像内容210的内容项。因此,聚类名称222d变为“夏季假期等”。
聚类220e包括“女儿节”事件时期230c、“毕业典礼”事件时期230f以及“观赏樱花”事件时期230g中所包括的图像内容210的内容项。在图17所示的示例中,事件时期230c、230f、230g均包括比整个聚类220e中所包括的图像内容项少的图像内容210的内容项,因此等级较高的事件时期230a的相关度估计值变得较大。因此,聚类名称222d变为“春季”。
聚类220f包括“星祭”事件时期230e和“夏季假期”事件时期230j中所包括的图像内容210的内容项和不包括在事件时期230e、230j中的图像内容210的内容项。在图17所示的示例中,等级较高的事件时期230b的相关度估计值大于事件时期230e、230j的值。因此,聚类名称222f变为“夏季”。
3.第三实施例
接下来,将参照图18和图19说明本公开内容的第三实施例。图18中示出了根据本实施例的特征空间的示例。
在图18中,示出了分布有音乐内容310的内容项的特征图空间300。音乐内容310是包括音乐的音频数据的内容。关于音乐的特性的信息(例如,诸如节奏、氛围等)作为元信息附于音乐内容310。在图18所示的示例中,在特征图空间300中定义描述音乐的氛围的参数“欢乐”和“悲伤”的坐标轴以及描述音乐的节奏的参数“快节奏”和“慢节奏”的坐标轴,并且音乐内容310的内容项根据关于这些特性的信息而置于特征图空间300中。
这里,特征图空间300是二维特征空间。此外,音乐内容310的内容项是通过其在特征空间中的位置来描述的数据。使用这种特征图空间300对音乐内容310的内容项的显示被用作用户例如搜索音乐内容310的内容项的接口。
图19中示出了根据本实施例的聚类名称生成的示例。该特征图空间300中的音乐内容310的内容项被分组成聚类320。也在特征地图空间300中预先定义作为命名区域的类别区域330,并且使用类别区域330的名称将聚类名称322分配给聚类320。
在本实施例中,通过以称为特征图空间的虚拟区域替代上述第一实施例中的地理区域来执行聚类名称生成处理。具体地,首先,信息处理设备10的候选区域标识部15基于类别区域330生成候选区域的初级列表140。在初级列表140中,针对被分组成聚类320的音乐内容310的内容项中的每一个标识至少一个类别区域330。从区域名称数据库21获取类别区域330的范围和名称。
接下来,对于包括在初级列表140中的类别区域330中的每一个,相关度估计部17计算其与聚类320的相关度的估计值。可以基于包括在类别区域330中的音乐内容310的内容项的数量以及类别区域330的区域与聚类320的区域之间的任意重叠的大小,计算相关度估计值。相关度估计部17取在初级列表140中具有最高相关度估计值的类别区域330,并且将其连同关于其相关度估计值的信息一起添加到次级列表150。然后,相关度估计部17从初级列表140删除关于类别区域330的信息,并且重复处理,直至初级列表140为空为止。
接下来,对于包括在次级列表150中的类别区域330中的每一个,聚类名称生成部19按相关度估计值的降序将类别区域330的名称添加到聚类名称322。在本实施例中,也可以设置可以包括在聚类名称322中的名称的数量的阈值T1和名称包括在聚类名称322中的类别区域330的相关度估计值的和的阈值T2。聚类名称生成部19重复将类别区域330的名称添加到聚类名称322,直至包括在聚类名称322中的名称的数量达到阈值T1为止,直至相关度估计值的和达到阈值T2为止,或者直至次级列表150为空为止。
注意,上述聚类名称生成处理的细节与在第一实施例中的相同,因此将省略详细说明。在例如日本专利申请公布第JP-A 2008-250857号中描述了根据音乐的特性对音乐内容项的聚类。在日本专利申请公布第JP-A 2008-250857号中描述的方法也可以根据需要用于本实施例中的聚类,因此也将省略聚类处理的详细说明。
在图19所示的示例中,节奏和情绪用于分开的区域,并且将如下类别区域定义为类别区域330:节奏接近“快节奏”且氛围接近“悲伤”的称为“深情(emotional)”的类别区域330a、节奏接近“快节奏”且氛围接近“欢乐”的称为“极端(extreme)”的类别区域330b、节奏是中等的且氛围接近“悲伤”的称为“悲伤”的类别区域330c、节奏是中等的且氛围接近“欢乐”的称为“欢乐”的类别区域330d、节奏接近“慢节奏”且氛围接近“悲伤”的称为“柔和”的类别区域330e以及节奏接近“慢节奏”且氛围接近“欢乐”的称为“轻松”的类别区域330f。
在本实施例中,这些类别区域330以其之间没有任何重叠来定义。在这种情况下,位置包括在各个类别区域330中的音乐内容310的内容项的数量和各个类别区域330与聚类320的区域之间的重叠面积均呈现出同种趋势。换言之,类别区域330中的音乐内容310的内容项的数量变得越大,与聚类320的区域的重叠面积就变得越大,并且相反也成立。因此,在本实施例中,可基于之前所述的两个准则中的任一个来估计类别区域330与聚类320之间的相关度。
在下文中,将通过具体地说明对于各个聚类320的聚类名称322的生成来说明本实施例中的聚类名称生成处理。
聚类名称生成示例1
首先,将聚类320a作为示例来进行说明。聚类320a包括“悲伤”类别区域330c中所包括的七项音乐内容310和包括在“深情”类别区域330a中的一项音乐内容310。在该情况下,候选区域标识部15在初级列表140中标识“悲伤”类别区域330c和“深情”类别区域330a。
这里,在已在初级列表140中标识的类别区域330之中,“悲伤”类别区域330c包括数量比较大的音乐内容310的内容项,并且其与聚类320a的重叠区域的比率较大,因此其被给予较高的相关度估计值。相比之下,“深情”类别区域330a包括较少的音乐内容310的内容项,并且其与聚类320a的重叠区域的比率较小,因此其被给予较低的相关度估计值。
因此,在相关度估计部17的处理中,首先将类别区域330c添加到次级列表150。接下来将类别区域330a添加到次级列表150,这是因为其包括类别区域330c中没有包括的一项音乐内容310。然而,“悲伤”类别区域330c包括聚类320a中所包括的几乎全部音乐内容310的内容项,因此其相关度估计值变为相当高的值。因此,在“悲伤”类别区域330c的相关度估计值本身达到阈值T2的情况下,例如,“深情”类别区域330a不用于生成聚类名称322a,并且替代地添加“等”。因此,在图19所示的示例中,聚类名称322a变为“悲伤等”。
聚类名称生成示例2
接下来,将聚类320b作为示例进行说明。聚类320b包括“欢乐”类别区域330d中所包括的五项音乐内容310和“轻松”类别区域330f中所包括的五项音乐内容310。在该情况下,候选区域标识部15在初级列表140中标识“欢乐”类别区域330d和“轻松”类别区域330f。这些类别区域330中的每一个均包括相同数量的音乐内容310的内容项,并且具有近似相同的相关度估计值,但是与聚类320b的重叠区域的比率对于类别区域330d而言较大,因此其被给予较高的相关度估计值。因此,相关度估计部17首先将类别区域330d添加到次级列表150,并且然后添加类别区域330f。因此,聚类名称322b变为“欢乐,轻松”。
4.第四实施例
将参照图20描述本公开内容的第四实施例。上述第一至第三实施例中的每个实施例均是关于获取聚类信息并生成聚类名称信息的信息处理设备10的实施例,但是本实施例与获取关于已生成的聚类名称的信息的信息处理设备30有关。
图20中的框图示意性地示出了根据本公开内容的第四实施例的信息处理设备30的功能配置。信息处理设备30例如可被实现为数字摄像装置、移动电话等,并且其包括内容信息提供部31、聚类信息获取部33、聚类名称信息获取部35、显示控制部37以及显示部39。信息处理设备30可以是用作客户端并且与信息处理设备10通信的信息处理设备,其中信息处理设备10例如可以用作服务器。
内容信息提供部31将内容信息提供到服务器。内容可以是例如图像内容、音乐内容等。图像内容可以是已通过例如信息处理设备30所具有的图像捕获部所捕获的内容,并且其也可以是已由其它设备捕获的并被提供到信息处理设备30的内容。音乐内容可以是已使用信息处理设备30所具有的驱动器从可移动存储介质获取的内容,并且其也可以是已从诸如因特网等的网络下载的内容。内容信息提供部31可以由用于将关于内容的信息提供到服务器的通信设备等来实现。在由内容信息提供部31提供到服务器的信息中,内容的位置信息作为元信息而被附加。如在其它实施例的示例中一样,内容的位置信息可以例如是图像内容的图像捕获位置或图像捕获日期和时间,并且可以是音乐内容的特性信息。
聚类信息获取部33基于内容信息提供部31已提供到服务器的、关于内容的信息而获取关于服务器已将内容所分组后的聚类的信息。如在其它实施例的示例中一样,聚类可以是例如地图上的区域、时间轴上的时段、特征图空间中的区域等。聚类信息获取部33从服务器获取定义聚类的范围的信息和关于已被分组成聚类的内容的信息,然后将该信息提供到显示控制部37。聚类信息获取部33可以由例如从服务器获取关于聚类的信息的通信设备等来实现。
聚类名称信息获取部35获取与已由聚类信息获取部33获取的关于聚类的信息对应的关于聚类名称的信息。聚类名称可以由服务器以与在其它实施例的示例中相同的方式来生成。换言之,可以基于已基于聚类与特征空间中的命名区域之间的相关度而选择的命名区域的名称来生成聚类名称。聚类名称信息获取部35从服务器获取关于聚类名称的信息并且将其提供到显示控制部37。聚类名称信息获取部35可以由例如从服务器获取关于聚类名称的信息的通信设备等来实现。
显示控制部37从聚类信息获取部33获取关于聚类的信息,从聚类名称信息获取部35获取关于聚类名称的信息,并且在显示部39上显示所获取的信息。显示控制部37可以由例如CPU、ROM、RAM等来实现,并且显示部39可以由诸如例如液晶显示器(LCD)等显示器来实现。
如上所述,在第一至第三实施例中的信息处理设备10是例如服务器的情况下,信息处理设备30可以被实现为用作与服务器相关的客户端的设备。换言之,信息处理设备30可以是如下设备:其与信息处理设备10通信,并且将已由信息处理设备10生成的聚类名称连同聚类一起显示在显示部39上。
信息处理设备30还可以被实现为与例如上述第一至第三实施例中的信息处理设备10相同的设备。换言之,信息处理设备30也可以是将其自身生成的聚类名称连同聚类一起在显示部39上的设备。
因此,信息处理设备30可以以各种类型的设备的形式来实现。因此,除了数字摄像装置或移动电话之外,信息处理设备30还可以是任意类型的信息处理设备,诸如PC、摄像机、游戏设备、智能电话、汽车导航***、PDA等。
在这些情况中的每种情况下,例如,如图2、图17、图19等所示,聚类和聚类名称显示在信息处理设备30的显示部39上。
5.硬件配置
接下来,将参照图21详细描述根据上述实施例的信息处理设备10的硬件配置。注意,信息处理设备30可以由类似的硬件配置来实现。
图21是用于描述根据实施例的信息处理设备10的硬件配置的框图。
信息处理设备10包括CPU 901、ROM 903以及RAM 905。此外,信息处理设备10还可包括主机总线907、桥接器909、外部总线911、接口913、输入设备915、输出设备917、存储设备919、驱动器921、连接端口923以及通信设备925。
CPU 901用作处理设备和控制设备,并且根据记录在ROM 903、RAM 905、存储设备919或可移动记录介质927中的各种程序来控制信息处理设备10的总体操作或操作的一部分。ROM 903存储要由CPU 901使用的程序、处理参数等。RAM 905暂时存储要在CPU 901运行时所使用的程序、在运行中变化的参数等。CPU 901、RAM 903以及RAM 905通过由诸如CPU总线的内部总线构成的主机总线907而彼此连接。
主机总线907经由桥接器909连接到诸如PCI(外设部件互连/接口)总线的外部总线911。
输入设备915是由用户操作的输入装置,诸如鼠标、键盘、触摸面板、按钮、开关、控制杆等。此外,输入设备915可以是使用红外线或其它无线电波的遥控装置,或者其可以是外部连接的设施929,诸如遵照信息处理设备10的操作的移动电话、PDA等。此外,输入设备915由如下输入控制电路等构成:其用于基于用户利用上述操作装置输入的信息而生成输入信号,并且将该信号输出到CPU 901。信息处理设备10的用户可以通过操作输入设备915,将各种数据输入到信息处理设备10或者指示信息设备10执行处理。
输出设备917由能够视觉上或听觉上向用户通知所获取的信息的设备构成。这样的设备的示例包括诸如CRT显示设备、液晶显示设备、等离子显示设备、EL显示设备或灯的显示设备、诸如扬声器或耳机的音频输出设备、打印机、移动电话、传真机等。输出设备917输出通过例如信息处理设备10执行的各种处理而获得的结果。具体地,显示设备以文本或图像的形式来显示通过信息处理设备10执行的各种处理而获得的结果。另一方面,音频输出设备将音频信号(诸如再现的音频数据或声学数据)转换成模拟信号,并且输出该模拟信号。
存储设备919是被配置为信息处理设备10的存储单元的示例的、用于存储数据的设备。存储设备919由例如磁存储设备(诸如HDD(硬盘驱动器))、半导体存储设备、光学存储设备或者磁光存储设备构成。该存储设备919存储例如要由CPU 901执行的程序、各种类型的数据以及从外部获得的各种类型的数据。
驱动器921是用于记录介质的读写器,并且被合并在信息处理设备10中或者外部附接于信息处理设备10。驱动器921读取记录在所附接的可移动记录介质927(诸如磁盘、光盘、磁光盘或者半导体存储器)中的信息,并且将该信息输出到RAM 905。此外,驱动器921可以写所附接的可移动记录介质927(诸如磁盘、光盘、磁光盘或者半导体存储器)。可移动记录介质927是例如DVD介质、HD-DVD介质或蓝光(注册商标)介质。可移动记录介质927可以是紧凑闪存(CF;注册商标)、闪存、SD存储卡(安全数字存储卡)等。替选地,可移动记录介质927可以是例如电子设施或配备有非接触式IC(集成电路)芯片的IC卡(集成电路卡)。
连接端口923是允许设备直接连接到信息处理设备10的端口。连接端口923的示例包括USB(通用串行总线)端口、IEEE 1394端口、SCSI(小型计算机***接口)端口等。连接端口923的其它示例包括RS-232C端口、光音频端子、HDMI(高清多媒体接口)端口等。在外部连接的设施929连接到该连接端口923的情况下,信息处理设备10直接从外部连接的设施929获得各种类型的数据,并且将各种类型的数据提供到外部连接的设施929。
通信设备925是由例如用于连接到通信网络931的通信设备构成的通信接口。通信设备925是例如有线或无线LAN(局域网)、蓝牙(注册商标)、用于WUSB(无线USB)的通信卡等。替选地,通信设备925可以是用于光通信的路由器、用于ADSL(非对称数字用户线路)的路由器、用于各种通信的调制解调器等。该通信设备925可以根据因特网上的预定协议(诸如TCP/IP)与例如其它通信设备传送和接收信号等。连接到通信设备925的通信网络931由有线地或无线地连接的网络等构成,并且可以是例如因特网、家庭LAN、红外通信、无线电波通信、卫星通信等。
至此,已示出了信息处理设备10的硬件配置的示例。上述结构元件中的每一个均可使用通用材料来构成,或者可由专用于各个结构元件的功能的硬件构成。因此,可以根据执行上述各个实施例时的技术水平而适当地改变要使用的硬件配置。
6.补充
因此,基于聚类与各个命名区域之间的相关程度,根据预定命名区域的名称生成适当的聚类名称。通过候选区域标识部对已被分组成聚类的位置数据项中的每一个标识至少一个候选区域使得可以将甚至仅包括已被分组成聚类的位置数据项的一部分的命名区域标识为候选区域。因此,甚至对于例如覆盖多个命名区域的比较小的聚类,也可以生成适当的名称。
相关度估计部可至少基于聚类与至少一个命名区域中的每一个重叠的部分的比率来估计相关度。
因此,防止例如在生成聚类名称时使用与聚类的大小相比过大的命名区域、并且使用大小与聚类的大小近似相同的命名区域的名称使得可以分配大小与聚类的大小对应的自然聚类名称。
候选区域标识部可标识第一命名区域和第二命名区域,并且在第一命名区域的相关度大于第二命名区域的相关度的情况下,相关度估计部可从聚类与第二命名区域重叠的部分移除聚类与第一命名区域重叠的部分,并且可再次估计第二命名区域的相关度。
因此,在估计每个命名区域的相关度时,排除聚类中包括具有较高相关程度的其它命名区域的部分。因此,在重叠较大的命名区域之间或处于一个命名区域包括另一命名区域的关系的命名区域之间,与聚类具有较高相关程度的命名区域可以被标识并且用于聚类名称。
相关度估计部可至少基于包括在至少一个命名区域的每一个中的位置数据项的数量来估计相关度。
因此,防止例如在生成聚类名称时使用与聚类的大小相比过小的命名区域、并且使用大小与聚类的大小近似相同的命名区域的名称使得可以分配大小与聚类的大小对应的自然聚类名称。
候选区域标识部可标识第一命名区域和第二命名区域,并且在第一命名区域的相关度大于第二命名区域的相关度的情况下,相关度估计部可从包括在第二命名区域的位置数据项中移除包括在第一命名区域中的位置数据项,并且可再次估计第二命名区域的相关度。
因此,在随后的相关度估计中不考虑在特定时间点被估计为具有最高相关程度的命名区域中所包括的位置数据项。因此,在随后的相关度估计中,具有其它位置数据项的命名区域的相关度被估计为相对高。
候选区域标识部可标识多个命名区域,并且聚类名称生成部可通过按其相关度的降序联合使用命名区域的名称来生成聚类的名称。
因此,甚至在用单个名称难以描述聚类的区域的情况下,也可以通过联合使用名称而精确地描述聚类的区域。
相关度估计部可计算多个命名区域中的每一个的相关度的估计值,并且聚类名称生成部可通过在所使用的命名区域的估计值的和达到第一阈值以前联合使用命名区域的名称来生成聚类的名称。
因此,可以通过防止例如与聚类的相关度较小但是不为零的命名区域的名称在没有任何限制的情况下被添加到聚类名称,保持聚类名称的适当长度并且确保其在显示期间的可读性。
聚类名称生成部可通过在所使用的名称的数量达到第二阈值以前联合使用命名区域的名称来生成聚类的名称。
因此,聚类名称的长度可以被限制于指定范围,并且可以确保名称在显示期间的可读性。
聚类名称生成部可通过在具有层级关系的命名区域当中优先使用等级较低的命名区域的名称来生成聚类的名称。
因此,可以防止在聚类名称中联合使用具有层级关系的区域的名称并且给用户留下不自然的印象。
在已标识的至少一个命名区域当中存在名称没有用在聚类的名称中的命名区域的情况下,聚类名称生成部可将表示“等”的语言附于聚类的名称。
因此,甚至在与所有位置数据项对应的区域的名称出于某种原因而不包括在聚类名称中的情况下,也可以表明除以聚类名称表示的位置数据项之外的位置数据项包括在聚类中。
在说明上述实施例时,示出了二维特征空间(地图、特征图空间)和一维特征空间(时间轴)的示例,但是本公开内容不限于这些示例。本公开内容可以适用于任何情况,只要存在特征空间中的位置、位置被分组后的聚类以及特征空间中的指定区域即可。即,本公开内容可以以与在上述示例中相同的方式来应用,甚至在具有任何维数(包括三个或更多个)的特征空间中也是如此。
本领域技术人员应理解,在所附权利要求或其等同方案的范围内,根据设计要求和其它因素,可进行各种修改、组合、子组合和变更。
根据一个实施例,一种信息处理设备包括:
候选属性区标识部,被配置成接收与具有至少一个数据项的聚类相关联的信息,并且为所述至少一个数据项中的每一个标识至少一个命名属性区;
相关度估计部,被配置成执行所述聚类与所述至少一个命名属性区中的每一个之间的相关度估计;以及
聚类名称生成部,被配置成基于所述相关度估计生成聚类名称,其中,所述聚类名称包括所述至少一个命名属性区之一的至少一部分。
根据一方面,
所述属性区是地理属性区。
根据另一方面,
所述属性区是时间属性区。
根据另一方面,
所述属性区是音乐内容属性区。
根据另一方面,
所述候选属性区标识部标识候选属性区的初级列表,以及
所述相关度估计部基于所述候选属性区标识部提供的所述初级列表,生成候选属性区的次级列表作为所述相关度估计,并且
所述聚类名称生成部基于所述次级列表生成所述名称。
根据另一方面,
所述相关度估计部根据E=n×D/S确定所述相关度估计,
其中,E是所述相关度估计,n是数据项的数量,D是属性区之间的重叠面积,并且S是候选属性区的面积。
根据另一方面,
所述聚类名称生成部被配置成将第一候选属性区的所述相关度估计与第一预定值进行比较,并且如果高于所述第一预定值,则将所述第一候选属性区的名称的至少一部分包括在所述聚类名称中。
根据另一方面,
所述聚类名称生成部被配置成将另一候选属性区的所述相关度估计与第二预定值进行比较,并且如果高于所述第二预定值,则将所述第二候选属性区的名称的至少一部分包括在所述聚类名称中。
根据另一方面,
所述至少一个数据项包括具有相关联的图像捕获日期和时间作为候选属性区的所述初级列表的一部分的多个图像,
所述次级列表包括包含所述至少一个数据项的图像捕获日期和时间的事件时期,以及
所述聚类名称生成部中将所述事件时期的名称的至少一部分包括在所述名称。
根据另一方面,
所述至少一个数据项包括具有相关联的节奏和情绪作为候选属性区的所述初级列表的一部分的多个音乐内容,
所述次级列表包括与所述至少一个数据项相关的特定情绪和节奏区域,以及
所述聚类名称生成部将所述特定情绪和节奏区域的至少一部分包括在所述名称中。
根据另一方面,
所述候选属性区标识部从内容获取部接收与所述聚类相关联的信息,所述内容获取部被远程地设置并且经由无线链接和因特网链接中的至少一个与所述候选属性区标识部通信。
根据另一方面,
所述候选属性区标识部直接从内容获取部接收与所述聚类相关联的信息,所述内容获取部与所述候选属性区标识部在共同外壳内。
根据一种信息处理方法的实施例,所述方法包括:
接收与具有至少一个数据项的聚类相关联的信息,并且为所述至少一个数据项中的每一个标识至少一个命名属性区;
利用处理电路估计所述聚类与所述至少一个命名属性区中的每一个之间的相关度估计;以及
基于所述相关度估计生成聚类名称,其中,所述聚类名称包括所述至少一个命名属性区之一的至少一部分。
根据所述方法的一方面,
所述属性区是地理属性区。
根据另一方面,
所述属性区是时间属性区。
根据另一方面,
所述属性区是音乐内容属性区。
根据另一方面,
所述标识包括标识候选属性区的初级列表,以及
所述估计包括基于通过所述标识提供的所述初级列表,生成候选属性区的次级列表作为所述相关度估计,并且
所述生成包括基于所述次级列表生成所述名称。
根据另一方面,
所述估计包括根据E=n×D/S确定所述相关度估计,
其中,E是所述相关度估计,n是数据项的数量,D是属性区之间的重叠面积,并且S是候选属性区的面积。
根据另一方面,
所述生成包括将所估计的第一候选属性区的相关度与第一预定值进行比较,并且如果高于所述第一预定阈值,则将所述第一候选属性区的名称的至少一部分包括在所述聚类名称中。
根据一种非暂态计算机可读介质的实施例,所述介质包括当由处理电路执行时执行信息处理方法的计算机可读指令,所述方法包括:
接收与包括至少一个数据项的聚类相关联的信息,并且为所述至少一个数据项中的每一个标识至少一个命名属性区;
利用处理电路估计所述聚类与所述至少一个命名属性区中的每一个之间的相关度估计;以及
基于所述相关度估计生成聚类名称,其中,所述聚类名称包括所述至少一个命名属性区之一的至少一部分。
另外,本技术还可以如下配置。
(1)一种信息处理设备,包括:
候选属性区标识部,被配置成接收与具有至少一个数据项的聚类相关联的信息,并且为所述至少一个数据项中的每一个标识至少一个命名属性区;
相关度估计部,被配置成执行所述聚类与所述至少一个命名属性区中的每一个之间的相关度估计;以及
聚类名称生成部,被配置成基于所述相关度估计生成聚类名称,其中,所述聚类名称包括所述至少一个命名属性区之一的至少一部分。
(2)根据(1)所述的信息处理设备,其中,
所述属性区是地理属性区。
(3)根据(1)或(2)所述的信息处理设备,其中,
所述属性区是时间属性区。
(4)根据(1)至(3)中任一项所述的信息处理设备,其中,
所述属性区是音乐内容属性区。
(5)根据(1)至(4)中任一项所述的信息处理设备,其中,
所述候选属性区标识部标识候选属性区的初级列表,以及
所述相关度估计部基于所述候选属性区标识部提供的所述初级列表,生成候选属性区的次级列表作为所述相关度估计,并且
所述聚类名称生成部基于所述次级列表生成所述名称。
(6)根据(1)至(5)中任一项所述的信息处理设备,其中,
所述相关度估计部根据E=n×D/S确定所述相关度估计,
其中,E是所述相关度估计,n是数据项的数量,D是属性区之间的重叠面积,并且S是候选属性区的面积。
(7)根据(1)至(6)中任一项所述的信息处理设备,其中,
所述聚类名称生成部被配置成将第一候选属性区的所述相关度估计与第一预定值进行比较,并且如果高于所述第一预定值,则将所述第一候选属性区的名称的至少一部分包括在所述聚类名称中。
(8)根据(7)所述的信息处理设备,其中,
所述聚类名称生成部被配置成将另一候选属性区的所述相关度估计与第二预定值进行比较,并且如果高于所述第二预定值,则将所述第二候选属性区的名称的至少一部分包括在所述聚类名称中。
(9)根据(5)所述的信息处理设备,其中,
所述至少一个数据项包括具有相关联的图像捕获日期和时间作为候选属性区的所述初级列表的一部分的多个图像,
所述次级列表包括包含所述至少一个数据项的图像捕获日期和时间的事件时期,以及
所述聚类名称生成部将所述事件时期的名称的至少一部分包括在所述名称中。
(10)根据(5)或(9)所述的信息处理设备,其中,
所述至少一个数据项包括具有相关联的节奏和情绪作为候选属性区的所述初级列表的一部分的多个音乐内容,
所述次级列表包括与所述至少一个数据项相关的特定情绪和节奏区域,以及
所述聚类名称生成部将所述特定情绪和节奏区域的至少一部分包括在所述名称中。
(11)根据(1)至(10)中任一项所述的信息处理设备,其中,
所述候选属性区标识部从内容获取部接收与所述聚类相关联的信息,所述内容获取部被远程地设置并且经由无线链接和因特网链接中的至少一个与所述候选属性区标识部通信。
(12)根据(1)至(11)中任一项所述的信息处理设备,其中,
所述候选属性区标识部直接从内容获取部接收与所述聚类相关联的信息,所述内容获取部与所述候选属性区标识部在共同外壳中。
本公开内容包含与2011年6月8日向日本专利局提交的日本优先权专利申请JP2011-128359中公开的主题内容相关的主题内容,其全部内容通过引用合并于此。

Claims (9)

1.一种信息处理设备包括:
候选地理属性区标识部,被配置成接收与具有至少一个数据项的聚类相关联的信息,并且为所述至少一个数据项中的每一个标识至少一个命名地理属性区;
相关度估计部,被配置成执行所述聚类与所述至少一个命名地理属性区中的每一个之间的相关度估计;以及
聚类名称生成部,被配置成基于所述相关度估计生成聚类名称,其中,所述聚类名称包括所述至少一个命名地理属性区之一的至少一部分,
其中,所述相关度估计部根据E=n×D/S确定所述相关度估计,
其中,E是所述相关度估计,n是数据项的数量,S是候选地理属性区的面积,并且D是所述候选地理属性区与聚类区域之间的重叠面积,其中,所述候选地理属性区是名称用于所述聚类名称的区域,并且所述候选地理属性区是从作为命名地理属性区的地图中的地点当中选择的,所述候选地理属性区的面积是所述地图上的相对应的地点的大小。
2.根据权利要求1所述的信息处理设备,其中,
所述候选地理属性区标识部标识候选地理属性区的初级列表,以及
所述相关度估计部基于所述候选地理属性区标识部提供的所述初级列表,生成候选地理属性区的次级列表作为所述相关度估计,并且
所述聚类名称生成部基于所述次级列表生成所述名称。
3.根据权利要求1所述的信息处理设备,其中,
所述聚类名称生成部被配置成将第一候选地理属性区的所述相关度估计与第一预定值进行比较,并且如果高于所述第一预定值,则将所述第一候选地理属性区的名称的至少一部分包括在所述聚类名称中。
4.根据权利要求3所述的信息处理设备,其中,
所述聚类名称生成部被配置成将第二候选地理属性区的所述相关度估计与第二预定值进行比较,并且如果高于所述第二预定值,则将所述第二候选地理属性区的名称的至少一部分包括在所述聚类名称中。
5.根据权利要求1所述的信息处理设备,其中,
所述候选地理属性区标识部从内容获取部接收与所述聚类相关联的信息,所述内容获取部被远程地设置并且经由无线链接和因特网链接中的至少一个与所述候选地理属性区标识部通信。
6.根据权利要求1所述的信息处理设备,其中,
所述候选地理属性区标识部直接从内容获取部接收与所述聚类相关联的信息,所述内容获取部与所述候选地理属性区标识部在共同外壳中。
7.一种信息处理方法,包括:
接收与具有至少一个数据项的聚类相关联的信息,并且为所述至少一个数据项中的每一个标识至少一个命名地理属性区;
利用处理电路估计所述聚类与所述至少一个命名地理属性区中的每一个之间的相关度估计;以及
基于所述相关度估计生成聚类名称,其中,所述聚类名称包括所述至少一个命名地理属性区之一的至少一部分,
其中,所述估计包括根据E=n×D/S确定所述相关度估计,
其中,E是所述相关度估计,n是数据项的数量,S是候选地理属性区的面积,并且D是所述候选地理属性区与聚类区域之间的重叠面积,其中,所述候选地理属性区是名称用于所述聚类名称的区域,并且所述候选地理属性区是从作为命名地理属性区的地图中的地点当中选择的,所述候选地理属性区的面积是所述地图上的相对应的地点的大小。
8.根据权利要求7所述的信息处理方法,其中,
所述标识包括标识候选地理属性区的初级列表,以及
所述估计包括基于通过所述标识提供的所述初级列表,生成候选地理属性区的次级列表作为所述相关度估计,并且
所述生成包括基于所述次级列表生成所述名称。
9.根据权利要求7所述的信息处理方法,其中,
所述生成包括将所估计的第一候选地理属性区的相关度与第一预定值进行比较,并且如果高于所述第一预定阈值,则将所述第一候选地理属性区的名称的至少一部分包括在所述聚类名称中。
CN201210180331.9A 2011-06-08 2012-06-01 信息处理设备和方法 Expired - Fee Related CN102982337B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-128359 2011-06-08
JP2011128359A JP5708278B2 (ja) 2011-06-08 2011-06-08 情報処理装置および情報処理方法

Publications (2)

Publication Number Publication Date
CN102982337A CN102982337A (zh) 2013-03-20
CN102982337B true CN102982337B (zh) 2018-02-23

Family

ID=46354001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210180331.9A Expired - Fee Related CN102982337B (zh) 2011-06-08 2012-06-01 信息处理设备和方法

Country Status (4)

Country Link
US (1) US8949238B2 (zh)
EP (1) EP2541487A1 (zh)
JP (1) JP5708278B2 (zh)
CN (1) CN102982337B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102202231B1 (ko) * 2012-12-14 2021-01-13 한국전자통신연구원 지리 정보 분석 장치 및 그 방법
CN110780707B (zh) 2014-05-22 2024-05-24 索尼公司 信息处理设备、信息处理方法与计算机可读介质
WO2017017740A1 (ja) * 2015-07-24 2017-02-02 株式会社日立製作所 情報配信装置及び方法
US10360276B2 (en) 2015-07-28 2019-07-23 Expedia, Inc. Disambiguating search queries
US10467284B2 (en) 2015-08-03 2019-11-05 Google Llc Establishment anchoring with geolocated imagery
US20170039264A1 (en) * 2015-08-04 2017-02-09 Google Inc. Area modeling by geographic photo label analysis
JP6602245B2 (ja) * 2016-03-18 2019-11-06 株式会社Nttドコモ 情報処理装置
JP6641398B2 (ja) * 2018-01-26 2020-02-05 株式会社カルチベイトジャパン 醸造酒検索装置及びプログラム
JP6516899B2 (ja) * 2018-04-26 2019-05-22 株式会社日立製作所 情報配信装置及び方法
JP7138866B2 (ja) * 2019-12-26 2022-09-20 株式会社カルチベイトジャパン 情報表示装置、方法、及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1523813A (zh) * 2002-12-19 2004-08-25 ��˹��ŵ�� 用于生成描述性链接名的***及方法
JP2007011637A (ja) * 2005-06-30 2007-01-18 Seiko Epson Corp 画像管理装置
CN101360174A (zh) * 2007-08-03 2009-02-04 广达电脑股份有限公司 数字图像的分类方法及分类装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002056009A (ja) * 2000-05-29 2002-02-20 Fuji Xerox Co Ltd 文書分類方法および装置
EP3388784B1 (en) * 2001-05-04 2019-07-17 Vexcel Imaging GmbH Method and large format camera for acquiring a large format image of a large area object
US7313574B2 (en) * 2003-10-02 2007-12-25 Nokia Corporation Method for clustering and querying media items
JP2006058979A (ja) * 2004-08-17 2006-03-02 Fuji Photo Film Co Ltd 画像分類装置、画像分類方法、画像分類プログラム、及び撮像装置
JP2006065764A (ja) * 2004-08-30 2006-03-09 Sharp Corp 画像照合装置、画像照合方法、画像照合プログラムおよび画像照合プログラムを記録したコンピュータ読取り可能な記録媒体
JP4412342B2 (ja) 2007-03-30 2010-02-10 ソニー株式会社 コンテンツ管理装置、画像表示装置、撮像装置、および、これらにおける処理方法ならびに当該方法をコンピュータに実行させるプログラム
JP4356027B2 (ja) 2007-03-30 2009-11-04 ソニー株式会社 情報処理装置および方法、並びにプログラム
US8724909B2 (en) * 2008-06-03 2014-05-13 Kooaba Ag Method and system for generating a pictorial reference database using geographical information
JP5215046B2 (ja) * 2008-06-05 2013-06-19 株式会社東芝 文書分類装置
WO2011069291A1 (en) * 2009-12-10 2011-06-16 Nokia Corporation Method, apparatus or system for image processing
JP2011128359A (ja) 2009-12-17 2011-06-30 Hitachi Chemical Dupont Microsystems Ltd ポジ型感光性樹脂組成物、それを用いた硬化膜及び電子部品

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1523813A (zh) * 2002-12-19 2004-08-25 ��˹��ŵ�� 用于生成描述性链接名的***及方法
JP2007011637A (ja) * 2005-06-30 2007-01-18 Seiko Epson Corp 画像管理装置
CN101360174A (zh) * 2007-08-03 2009-02-04 广达电脑股份有限公司 数字图像的分类方法及分类装置

Also Published As

Publication number Publication date
JP2012256171A (ja) 2012-12-27
US8949238B2 (en) 2015-02-03
CN102982337A (zh) 2013-03-20
EP2541487A1 (en) 2013-01-02
JP5708278B2 (ja) 2015-04-30
US20120317114A1 (en) 2012-12-13

Similar Documents

Publication Publication Date Title
CN102982337B (zh) 信息处理设备和方法
JP6784308B2 (ja) 施設特性を更新するプログラム、施設をプロファイリングするプログラム、コンピュータ・システム、及び施設特性を更新する方法
JP6229655B2 (ja) 情報処理装置、情報処理方法およびプログラム
CN108431802A (zh) 组织与用户关联的图像
CN104756510B (zh) 通信终端、通信方法、计算机可读介质以及通信***
CN105975581A (zh) 媒体信息的展示方法、客户端及服务器
CN103516768A (zh) 互动***
CN103718215A (zh) 演示内容生成装置、演示内容生成方法、演示内容生成程序及集成电路
KR101460990B1 (ko) 위치기반 소셜 네트워크 게임방법 및 시스템
EP2919123A1 (en) Communication terminal, communication method, program, and communication system
CN103839290A (zh) 信息处理设备、终端设备、信息处理方法以及程序
CN107124476A (zh) 信息推送方法和装置
US11244487B2 (en) Proactive creation of photo products
EP2919129A1 (en) Communication terminal, information processing device, communication method, information processing method, program, and communication system
CN110199525A (zh) 用于选择场景以在增强现实界面中浏览历史记录的***和方法
BR102018013612A2 (pt) Mídia legível por computador, aparelho de processamento de informação e método de processamento de informação
CN107710246A (zh) 用以促进描述位置的用户图像的提交的***和方法
CN109213831A (zh) 事件检测方法和装置、计算设备及存储介质
CN105979403A (zh) 一种自动选择视频资源的标识版本的方法及装置
CN106682014A (zh) 游戏展示数据的生成方法和装置
TWI640952B (zh) Virtual object collection method and portable electronic device
CN110366025A (zh) 显示内容的配置方法、智能终端及计算机可读存储介质
CN109040584A (zh) 一种互动拍摄的方法和装置
JP3878979B2 (ja) 主観的地図作成システム
JP6063697B2 (ja) 画像表示のための装置、方法及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180223

CF01 Termination of patent right due to non-payment of annual fee