CN102640146A - 数据库搜索方法、***和控制器 - Google Patents

数据库搜索方法、***和控制器 Download PDF

Info

Publication number
CN102640146A
CN102640146A CN2010800502756A CN201080050275A CN102640146A CN 102640146 A CN102640146 A CN 102640146A CN 2010800502756 A CN2010800502756 A CN 2010800502756A CN 201080050275 A CN201080050275 A CN 201080050275A CN 102640146 A CN102640146 A CN 102640146A
Authority
CN
China
Prior art keywords
search
representative
subclass
data items
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800502756A
Other languages
English (en)
Other versions
CN102640146B (zh
Inventor
布雷特·詹姆斯·格罗诺
基思·大卫·德弗雷尔
乔纳森·大卫·帕克
克里斯多佛·格伦顿·贝茨
大卫·彼得·沃尔夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Someones Group Intellectual Property Holdings Pty Ltd
Original Assignee
Someones Group Intellectual Property Holdings Pty Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2009904400A external-priority patent/AU2009904400A0/en
Application filed by Someones Group Intellectual Property Holdings Pty Ltd filed Critical Someones Group Intellectual Property Holdings Pty Ltd
Publication of CN102640146A publication Critical patent/CN102640146A/zh
Application granted granted Critical
Publication of CN102640146B publication Critical patent/CN102640146B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • G06F16/3328Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages using graphical result space presentation or visualisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/54Browsing; Visualisation therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

提供了一种用户通过用户接口搜索包含数据项目的数据库的方法、***和控制器,所述方法包括以下步骤:指定数据库中的一些数据项目或所有数据项目的初始搜索子集(1201);识别搜索子集中的多个数据类别中的每一个类别的代表(1203);将代表显示在用户接口上(1204);选择代表中的一个或多个(1205);指定在搜索子集中的在对应于所选择的代表的数据类别内的数据项目的细化搜索子集(1207);以及重复识别和显示细化搜索子集的代表的步骤。

Description

数据库搜索方法、***和控制器
领域
本发明涉及用于搜索数据项目的数据库的计算机化方法、***和控制器,数据项目特别是但不局限于诸如图像、音乐、电影、游戏或书籍的媒体项目。
发明背景
搜寻媒体项目例如现有的照片的数据库是一项经常在媒体业中以及消费者通常进行的任务。诸如gettyimages.com、images.***.com等的网站通常提供涉及图像内容的基于描述符的编索引的搜索方法。内容描述符通常涉及诸如观念、情感、位置的方面或涉及图像中的人的特点。用户通常使用下拉列表中的复选框指定一个或多个内容描述符的值,且图像搜索引擎然后搜索与用户指定的值匹配的图像的图像数据库索引。匹配的图像然后通常伴随着诸如分辨率或来源的技术信息被显示在滚动窗口中。通常第一页示出最接近的匹配,其可能涉及诸如色彩平衡的额外的本机特性的某个评估,以及多个其他页包含较少的接近的匹配。用户检查许多图像,并可以通过指定另外的内容描述符值或通过选择一个参考图像作为示例来细化搜索。
尽管使用描述符的初始搜索产生了许多可能相关的图像,但选择出更感兴趣的图像的搜索的细化常常是令人沮丧的。
另外,对滚动以及单独地检查大量图像和文本的混合的需要是令人疲倦和乏味的。
因此存在提供改进的数据库搜索技术的需要,改进的数据库搜索技术实现有用的数据项目的更高效和用户友好的识别。
本发明的发明人通过在具代表性的数据项目的选择和显示的使用方面取得进展,找到了帮助用户定位感兴趣的数据项目的更加改进的方法。
发明概述
根据本发明的第一方面,提供了一种用户通过用户接口搜索包含数据项目的数据库的方法,其包括以下步骤:
指定数据库中的一些数据项目或所有数据项目的初始搜索子集;
识别搜索子集中的多个数据类别中的每一个类别的代表;
将这些代表显示在用户接口上;
选择代表中的一个或多个;
指定在搜索子集中的在对应于所选择的代表的数据类别内的数据项目的细化搜索子集;以及
重复识别和显示细化搜索子集的代表的步骤。
在一个实施方式中,指定初始搜索子集的步骤包括从用户接收限制标准并将初始子集定义为满足限制标准的数据项目。限制标准可以是搜索词的值。
在一个实施方式中,数据项目与多维描述符空间中的描述符值相关联,并且搜索子集中的数据类别是描述符空间中的区段。考虑获得适合于所指定的搜索子集的类别,例如通过识别具有对搜索子集的减小的维度的一组适当的描述符的算法从更大维度的描述符空间中的存储的值的描述符表,可以定义所述多维描述符空间。考虑类别的数量来选择减小的维度。
在一个实施方式中,描述符空间的原点在搜索子集的中心附近,以便搜索子集的描述符坐标具有正值和负值;以及
类别中的至少一个是多维描述符空间中的区段,相比于其他维度,所述区段在一个维度中的正方向或负方向上较大。
在一个实施方式中,类别的数量被选择成使得所有的代表可以一起被显示给用户。显示细化搜索集的代表的步骤可以包括显示靠近初始搜索子集的代表的细化搜索子集的代表。
在一个实施方式中,指定、识别、显示和选择的过程适合于重复,直到所有的类别具有不多于一个的成员。
在一个实施方式中,数据项目包括数字媒体。
根据本发明的第二方面,提供了一种供用户交互地搜索包含数据项目的数据库的数据库搜索***,其包括:
具有显示器的用户接口;
初始搜索子集指定器,其用于指定数据库中的一些数据项目或所有数据项目的初始搜索子集;
代表识别器,其用于识别搜索子集中的多个数据类别中的每一个类别的代表;
代表显示控制器,其用于将代表显示在显示器上;
代表选择器,其用于选择代表中的一个或多个;
细化搜索子集指定器,其用于指定在搜索子集中的在对应于所选择的代表的数据类别内的数据项目的细化搜索子集;
重复器,其用于重复识别以及显示细化搜索子集的代表的步骤。
根据本发明的第三方面,提供了一种供用户通过具有显示器的用户接***互地搜索包含数据项目的数据库的数据库搜索控制器,其包括:
初始搜索子集指定器,其用于指定数据库中的一些数据项目或所有数据项目的初始搜索子集;
代表识别器,其用于识别搜索子集中的多个数据类别中的每一个类别的代表;
代表显示控制器,其用于将代表显示在显示器上;
代表选择器,其用于选择代表中的一个或多个;
细化搜索子集指定器,其用于指定在搜索子集中的在对应于所选择的代表的数据类别内的数据项目的细化搜索子集;
重复器,其用于重复识别以及显示细化搜索子集的代表的步骤。
根据本发明的第五方面,提供了计算机可读介质,其包括本发明的第四方面的程序代码。
根据本发明的第六方面,提供了数据信号,其包括本发明的第四方面的计算机程序代码。
附图的简要描述
图1是本发明的示例性数据库搜索***的框图;
图2示出本发明的一个实施方式的数据库搜索的方法的流程图。
图3-6示出根据本发明的一个实施方式的在图像的数据库中的搜索会话中的显示。
实施方式的详细描述
参考附图,示出了根据本发明的一个实施方式的数据库搜索***、控制器和方法的不同方面。
所述***可以采用若干不同的形式。在第一种形式中,提供了独立的***,其中所需要的所有组件或大部分组件存在于本地用户可操作的计算机和接口中。
在第二种形式中,提供了分布式结构,其中实现***所需要的一些组件存在于本地用户可操作的计算机和接口中,以及一些组件相对用户被远程定位。例如,可以使用“胖客户端”结构,其中搜索和/或显示控制的一部分在本地用户可操作的计算机和接口上执行,而一部分被远程地例如通过服务器执行;或者可以使用“瘦客户端”结构,其中搜索和显示控制的大部分被远程地例如通过服务器执行,而本地机器只用于用户接口。
典型的基于网络的实现涉及具有显示器、键盘和鼠标或触敏屏的传统的个人计算机,其将数据库搜索控制器实现为可以从网站下载的JavaScript或XML程序。数据库将通常远离用户被存储并由数据库搜索控制器询问。
现在参考图1,最广泛地来说,核心组件是数据库搜索***10,其包括用户接口20和数据库搜索控制器30,数据库搜索***10与数据存储器40通信,数据存储器40可以本地以及远程地被定位。在一个实施方式中,数据存储器40包括数据项目数据库420、描述符表422和限制标签表421。
用户接口20的组件包括诸如LCD监视器的显示器200以及诸如鼠标的位置选择器210,用于使用户使用诸如左鼠标按钮或右鼠标按钮的至少一个选择器按钮来指示显示器200上的位置,以使用户能够选择位置并执行其他的输入功能。
数据库搜索控制器30与用户接口20和数据存储器40进行数据通信,并且通常包含处理器或在处理器上被实现,处理器根据在显示器200上的用户输入和输出来处理搜索。在此,术语“处理器”用于一般指可执行这一功能的任何设备并且可以包括:微处理器、微控制器、可编程逻辑器件或其他计算设备、通用计算机(例如,PC)或服务器。
对于媒体应用,数据项目数据库420是媒体数据项的大数据库,如在本领域中的普通的,媒体数据项伴随有通常包含与每个媒体项目相关的基于文本或二进制内容的信息的限制标签表421,而且还可以包含一些本机媒体信息例如媒体类型(例如彩色/黑白)。数据存储器40还包含如在此所描述的每个媒体项目的衍生描述符的描述符表422,描述符表422通常起源于本机视听描述符,而且也可以起源于基于内容的信息。表421和422在数据库建立期间被计算,并可以从媒体项目数据库420远程地定位,尤其是在本发明由除了数据项目数据库420的所有者之外的一方运用的情况下。表421和422可以例如使用二叉树全部或部分地被排序或编索引,以加速在数据库420中满足描述符或限制标签中的值或值的范围的项目的识别,如本领域中所熟知的。
数据库搜索控制器30具有初始搜索子集指定器310,初始搜索子集指定器310用于通常通过经由用户接口从用户接收限制标准来指定初始搜索子集。在简单的实现中,初始搜索子集指定器310可以平凡地仅适合于指定数据库420中的全部数据项目或其固定子集。数据库搜索控制器30还具有代表识别器320、代表显示控制器321和代表选择器330,代表识别器320用于识别搜索子集420中的一组代表性数据项目,每个代表性数据项目代表搜索子集中的若干类别中的一个,代表显示控制器321用于将代表显示在显示器200上,以及代表选择器330用于选择通常由用户通过位置选择器210选择的代表中的一个或多个。在数据库搜索控制器30中还提供了细化搜索子集指定器331和重复器332,细化搜索子集指定器331用于指定在搜索子集中的在对应于所选择的代表的数据类别内的数据项目的细化搜索子集,以及重复器332用于将细化搜素子集转移到代表识别器320并用于通过代表显示控制器321显示新识别的代表。
现在参考图2到图6,在图2的流程图中描绘了本发明的方法方面的一个实施方式,以及在图3到图6中在本发明的方法的步骤中示出了示例性显示布局。在步骤1201中,用户通过在限制标准窗口62中键入诸如搜索词“fruit(水果)”的限制标准并点击“search(搜索)”按钮64b来指定初始搜索子集。初始搜索子集指定器310访问限制标签表421以识别满足限制标准的数据项目,在这种情况下为包含水果的图像。这是初始搜索子集。在步骤1202中,使用从在描述符表422中表示的35维空间到10维描述符空间的单值分解来找到20个适合于搜索子集的数据类别。在下面的示例中提供了这些过程的细节。在步骤1203和1204中,每个数据类别的代表被识别和显示,也在下面被更详细地描述。图3示出所显示的20个代表是在显示器60的左侧上的5乘4网格64。在每个图像的左上方处是通知用户搜索子集中的多少数据项目在每个对应的数据类别中的数字。在步骤1205中,用户通过使用位置选择器210点击并在步骤1206中确认所选择的项目将是通过点击“search”按钮64b而选择的代表来选择值得进一步搜索的代表中的一个或多个。在图3中示出的会话中,选择了右上代表64a。在步骤1207中,细化搜索子集被定义为当前搜索子集的包含在对应于所选择的代表的数据类别内的那些成员。***然后重复通过SVD从细化搜索子集的描述符表值到适合于细化搜索子集的新的10维描述符空间来找到适当的类别的步骤。
20个类别中的每一个类别的代表然后被再次识别并显示在显示器的右侧65上。左上代表与之前选择的代表相同,但可以不一定是这种情况。在屏幕的底部是搜索细化的“面包屑”小径(breadcrumb trail)。点击小径中的最后一个框会将搜索子集返回到之前的搜索子集。进一步细化的子集从图5中的代表65a(石榴)选择以产生二维描述符空间的四个代表,以及如在图6中所示,作为具有3个成员的类别的代表的石榴66a被再次选择,以及仅具有3个成员的最后的细化搜索子集67被显示。
随着分级搜索的继续,面包屑小径63扩展,且在搜索子集的代表处的系列被添加到在左边消失的带中。用户可以通过点击面包屑小径中的相关的框来跳回到序列中的任何搜索子集,并可以通过编辑限制标准窗62对搜索子集添加进一步的限制。基于图像的描述符表的示例
设想在本发明的典型的实施方式中,从更大维度的描述符空间中的存储值的描述符表422定义适合于数据类别的多维描述符空间。
对于图像的应用,存在很多可用的图像描述符,其在本发明中可以用来生成描述符表422。例子包括彩色直方图、SIFT边缘检测、SURF边缘检测、Canny边缘检测、Tamura纹理特征以及Gabor纹理特征。
发明人当前实现的对于图像例如照片或静止的电影的实施方式对描述符表使用一组35个描述符,其在数据库建立期间使用未压缩的CEDD[参考文献1]和FTCH[参考文献2]描述符集的组合中的336个描述符的单值分解(SVD)来获取。
找到搜索子集的数据类别的示例
在图3到图6中所示的实施方式中,在所有数据项目的初始搜索子集中具有“fruit”标签的20个数据类别的代表以5乘4网格64显示在显示器60的左边部分上。在预备步骤中,使用单值分解(SVD)从被限制到搜索子集的描述符表计算适合于搜索子集的新的35维描述符空间。通过选择前10维将35维减少到10,这10维是对搜索子集的35个描述符的差异的最大的贡献者,并因此是识别适合于搜索子集的类别的好的开始。这20个类别然后被定义为已减小的10维描述符空间中的区段。SVD算法的输出被按比例缩放,以便描述符空间的原点在搜索子集的中心附近,使得搜索子集的描述符坐标具有正值和负值。实现这一目的的简单方法是通过减去搜索子集中的每个坐标维的最大值和最小值的平均值来相对于粗略计算的中心定义该维。这允许区段定义为区域,其中一个坐标在正方向或负方向上比每维产生两个区段的其他坐标大。
就数学符号而言,n维描述符空间(例如新的已减小的10维空间)的第k维的点x≡(x1,x2..xn)的正区段由下式定义:
S+ k=(所有的点x,使得对于所有的i≠k,xk>xi且|xk|≥|xi|)
以及负区段由下式定义:
S- k=(所有的点x,使得对于所有的i≠k,xk≤xi且|xk|≥|xi|)
这种定义区段的方法通过B+树的使用在标准数据库上高效地运行。
识别数据类别的代表的示例
对于在以上示例中找到的类别,可以通过多种方法对每一类别识别代表性的数据项目。对标准数据库快速执行的方法的示例是识别最大值和最小值。换句话说,对于第k维的正区段的代表由具有最大的(最正的)xk的区段S+ k中的数据项目定义,以及对于第k维的负区段的代表由具有最小的(最负的)xk的区段S- k中的数据项目定义。
显示代表的示例
对于在本说明书中详细说明的图像示例,代表的显示可以方便地通过将S+ k和S- k的代表放在显示器网格上的相对位置处来排序,例如,S+ 1和S- 1被放在左上(行1,列1)和右下(5,4)位置上,以及S+ 2和S- 2被放在相邻的相对的位置(2,1)和(4,4)上,等等。
如在图5和图6中所看到的,当搜索集被细化到包括逐步减少的数据项目时,由于一些区段变空,代表的数量减少。可以通过如图5所示的增大每个代表的图像尺寸并如图6所示的为不能整齐地放在网格中的素数数量的代表提供不规则分区,来实现减少数量的图像的显示。
音频描述符空间的示例
附图示出了图像数据库的示例,但本发明同样适用于诸如音乐的音频数据。
可以在本发明中使用的音频描述符的例子包括梅尔频率倒谱、零交叉、光谱分析、光谱矩心、光谱滚降、线性预测编码系数和节拍直方图。
发明人当前实现的对于音乐和音频数据项目的实施方式对多维描述符空间使用例如在jAudio描述符计算软件[参考文献3]上实现的、在互联网上在http://jmir.sourceforge.net/jAudio.html找到的各种各样的已知音频描述符的组合。大量的可用描述符(在这种情况下为330个)在数据集上被首次测试以移除倾向于在对某些数据类型的SVD算法中引起错误的任何(通常大约为30个)描述符。鲁棒剩余集(大约300个)然后经受如在图像示例中的SVD算法,以提供要存储在描述符表422中的一组35个描述符。10维及更低的描述符空间的计算在搜索过程中如以上所描述的进行。
音频显示的示例
在照片的情况下,项目的性质在项目的显示中对于用户是明显的。在音频的情况下很清楚,在代表显示控制器321中在音频项目的显示中适应是合乎需要的,以传达通常关于除了视觉方面例如所提供的音乐曲目插图或专辑封面外的音频的性质的一些信息。一种方法是使用SVD将描述符坐标进一步从35缩简到3,并将这3个缩简的坐标表示为颜色空间中的RGB值。用户将会明白哪些颜色对应于哪些类型的声音。
基于标签的描述符应用
尽管在以上的示例中数据库建于从本地视听数据计算的描述符,例如图像的色彩平衡或边缘信息以及在音乐的情况下的时间序列描述符,但在原始的描述符集中包括搜索词是可能的,原始的描述符集也可以与本地描述符一起用SVD算法简缩。
根据数据库和应用,也存在描述符表422中的描述符集完全从简缩的描述符来计算的情况。例如,当搜索一部电影或尤其是一本书时,可能发现诸如演员、导演、作者、情节、暴力程度等的信息在向用户提供建议方面比本机描述符更有用。也可能存在各式各样的二进制描述符,例如,在视频游戏的情况下,游戏是否具有动作或战略元素、谜题、精灵或枪。这些内容标签都可以用与本机描述符相同的方式来处理,并使用诸如SVD的算法减少到可控数量的连续坐标的多维集。
将认识到,虽然从大量描述符的单值分解被描述为计算描述符表422的可控描述符空间以及初始搜索子集和细化搜索子集的减少的维度的多维描述符空间的一种方法,然而本发明包括分类和识别所产生的代表的任何方式。特别是,可以使用诸如NIPALS的另一聚类算法来代替SVD。而且,描述符空间不限于笛卡尔空间,且例如可以是节点树,坐标是代表在树中的位置的任何方式或任何其他结构。另外,尽管例证了适合于搜索子集的内容的自动分类,但本发明以其最广泛的形式还包括严格的非适应性分类。
在权利要求和说明书中,术语“初始搜索子集”扩展到领先并被细化成“细化搜索子集”的任何搜索子集,并且不需要是由用户在搜索会话中指定的绝对的第一搜索子集。
本领域中的技术人员还将认识到,可以对本发明进行许多其他变化而不偏离本发明的范围。
在接下来的权利要求中以及在本发明的前面的描述中,除了在上下文由于明确的语言或必要的暗示而另外需要的场合外,词“包括(comprise)”或诸如“包括(comprises)”或“包括(comprising)”的变化形式在包含的意义上使用,即,以指定所陈述的特征的存在但不排除在本发明的多种实施方式中的另外的特征的存在或添加。
应理解,如果在此提到任何已有技术公布,这样的参考文献并不构成所述公布在澳大利亚或任何其他国家形成本领域中的常见的一般知识的一部分的承认。
参考文献
1.S.A.Chatzichristofis和Y.S.Boutalis的“CEDD:COLOR AND EDGEDIRECTIVITY DESCRIPTOR-A COMPACT DESCRIPTOR FOR IMAGEINDEXING AND RETRIEVAL(CEDD:颜色和边缘的方向性描述符——用于图像索引和检索的简洁描述符)”,《6th International Conference inadvanced research on Computer Vision Systems ICVS 2008(2008第6届关于计算机视觉***的高级研究国际会议ICVS)》,Proceedings(学报):LectureNotes in Computer Science(计算机科学讲义)(LNCS)pp.312-322,2008年5月12-15日,Santorini,Greece。
2.S.A.Chatzichristofis和Y.S.Boutalis的“FCTH:FUZZY COLORAND TEXTURE HISTOGRAM-A LOW LEVEL FEATURE FORACCURATE IMAGE RETRIEVAL(FCTH:模糊颜色和纹理直方图——用于精确的图像检索的低水平特征)”,《9th International Workshop on ImageAnalysis for Multimedia Interactive Services(关于用于多媒体交互服务的图像分析的第9届国际研讨会)》,Proceedings(学报):IEEE Computer Society(IEEE计算机学会)pp.191-196,2008年5月7-9日,Klagenfurt,Austria。
3.McEnnis,D.、C.McKay、I.Fujinaga和P.Depalle的2005,jAudio:Afeature extraction library Proceedings of the International Conference on MusicInformation Retrieval(关于音乐信息检索的国际会议的特征提取库学报),600-3。

Claims (20)

1.一种搜索方法,供用户通过用户接口搜索包含数据项目的数据库,所述方法包括以下步骤:
指定所述数据库中的一些所述数据项目或所有所述数据项目的初始搜索子集;
识别所述搜索子集中的多个数据类别中的每一个类别的代表;
将所述代表显示在所述用户接口上;
选择所述代表中的一个或多个;
指定在所述搜索子集中的在对应于所选择的代表的所述数据类别内的数据项目的细化搜索子集;以及
重复识别和显示所述细化搜索子集的代表的步骤。
2.如权利要求1所述的方法,其中指定初始搜索子集的步骤包括从用户接收限制标准并将所述初始子集定义为满足所述限制标准的数据项目。
3.如权利要求2所述的方法,其中所述限制标准是搜索词的值。
4.如权利要求1所述的方法,其中所述数据项目与多维描述符空间中的描述符值相关联,并且所述搜索子集中的所述数据类别是所述描述符空间中的区段。
5.如权利要求4所述的方法,其中考虑获得适合于所指定的搜索子集的类别来定义所述多维描述符空间。
6.如权利要求5所述的方法,其中通过识别具有对所述搜索子集的减小的维度的一组适当的描述符的算法从更大维度的描述符空间中的存储的值的描述符表来定义所述多维描述符空间。
7.如权利要求6所述的方法,其中考虑类别的数量来选择所述减小的维度。
8.如权利要求7所述的方法,其中
所述描述符空间的原点在所述搜索子集的中心附近,以便所述搜索子集的所述描述符的坐标具有正值和负值;以及
所述类别中的至少一个是所述多维描述符空间中的区段,相比于其他维度,所述区段在一个维度中的正方向或负方向上较大。
9.如权利要求8所述的方法,其中
所述区段在一个维度中的正方向上较大,并由所述一个维度中的坐标值的带符号值以及绝对值比所有其他维度中的坐标值的带符号值以及绝对值大的点来定义;或者
所述区段在所述一个维度中的负方向上较大,并由所述一个维度中的坐标值的带符号值比在其他维度中的坐标值的带符号值小且绝对值比在其他维度中的坐标值的绝对值大的点来定义。
10.如权利要求8所述的方法,其中
对应于在所述一个维度中的所述正方向上的较大值的所述区段的所述代表是在所述搜索子集中具有所述一个维度中的最大带符号坐标值的数据项目;以及
对应于在所述一个维度中的所述负方向上的较大值的所述区段的所述代表是在所述搜索子集中具有所述一个维度中的最小带符号坐标值的数据项目。
11.如权利要求1所述的方法,其中所述类别的数量被选择成使得所有的所述代表能够一起被显示给用户。
12.如权利要求11所述的方法,其中显示所述细化搜索集的代表的步骤包括显示靠近所述初始搜索子集的代表的所述细化搜索子集的代表。
13.如权利要求1所述的方法,其中指定、识别、显示和选择的过程适合于重复,直到所有的所述类别具有不多于一个的成员。
14.如权利要求1所述的方法,其中所述数据项目包括数字媒体。
15.一种供用户交互地搜索包含数据项目的数据库的数据库搜索***,包括
具有显示器的用户接口;
初始搜索子集指定器,其用于指定所述数据库中的一些所述数据项目或所有所述数据项目的初始搜索子集;
代表识别器,其用于识别所述搜索子集中的多个数据类别中的每一个类别的代表;
代表显示控制器,其用于将所述代表显示在所述显示器上;
代表选择器,其用于选择所述代表中的一个或多个;
细化搜索子集指定器,其用于指定在所述搜索子集中的在对应于所选择的代表的所述数据类别内的数据项目的细化搜索子集;
重复器,其用于重复识别以及显示所述细化搜索子集的代表的步骤。
16.一种供用户通过具有显示器的用户接***互地搜索包含数据项目的数据库的数据库搜索控制器,包括
初始搜索子集指定器,其用于指定所述数据库中的一些所述数据项目或所有所述数据项目的初始搜索子集;
代表识别器,其用于识别所述搜索子集中的多个数据类别中的每一个类别的代表;
代表显示控制器,其用于将所述代表显示在所述显示器上;
代表选择器,其用于选择所述代表中的一个或多个;
细化搜索子集指定器,其用于指定在所述搜索子集中的在对应于所选择的代表的所述数据类别内的数据项目的细化搜索子集;
重复器,其用于重复识别以及显示所述细化搜索子集的代表的步骤。
17.分别如权利要求15或权利要求16中所述的数据库搜索***或数据库搜索控制器,其中所述初始搜索子集指定器、代表识别器、代表显示控制器、代表选择器、细化搜索子集指定器和重复器中的至少一个至少部分地通过执行存储在存储器中的代码的处理器来实现。
18.计算机程序代码,所述计算机程序代码当由计算机执行时使所述计算机实现权利要求1到14中的任一项所述的搜索方法。
19.一种计算机可读介质,包括权利要求18所述的程序代码。
20.一种数据信号,包括权利要求18所述的计算机程序代码。
CN201080050275.6A 2009-09-11 2010-09-10 数据库搜索方法、***和控制器 Active CN102640146B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2009904400 2009-09-11
AU2009904400A AU2009904400A0 (en) 2009-09-11 Database searching system, method and controller
PCT/AU2010/001176 WO2011029150A1 (en) 2009-09-11 2010-09-10 Database searching method, system and controller

Publications (2)

Publication Number Publication Date
CN102640146A true CN102640146A (zh) 2012-08-15
CN102640146B CN102640146B (zh) 2017-07-14

Family

ID=43731864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080050275.6A Active CN102640146B (zh) 2009-09-11 2010-09-10 数据库搜索方法、***和控制器

Country Status (6)

Country Link
US (2) US8832134B2 (zh)
EP (1) EP2476069A4 (zh)
JP (2) JP5770732B2 (zh)
CN (1) CN102640146B (zh)
AU (1) AU2010292988B2 (zh)
WO (1) WO2011029150A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104461494A (zh) * 2014-10-29 2015-03-25 中国建设银行股份有限公司 一种生成数据处理工具的数据包的方法及装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8774526B2 (en) * 2010-02-08 2014-07-08 Microsoft Corporation Intelligent image search results summarization and browsing
US10606883B2 (en) 2014-05-15 2020-03-31 Evolv Technology Solutions, Inc. Selection of initial document collection for visual interactive search
US10102277B2 (en) 2014-05-15 2018-10-16 Sentient Technologies (Barbados) Limited Bayesian visual interactive search
US20150331908A1 (en) 2014-05-15 2015-11-19 Genetic Finance (Barbados) Limited Visual interactive search
JP6289519B2 (ja) * 2016-01-27 2018-03-07 ヤフー株式会社 生成装置、生成方法および生成プログラム
JP6324433B2 (ja) * 2016-04-26 2018-05-16 ヤフー株式会社 配信装置、配信方法および配信プログラム
WO2017212459A1 (en) 2016-06-09 2017-12-14 Sentient Technologies (Barbados) Limited Content embedding using deep metric learning algorithms
US10755142B2 (en) 2017-09-05 2020-08-25 Cognizant Technology Solutions U.S. Corporation Automated and unsupervised generation of real-world training data
US10755144B2 (en) 2017-09-05 2020-08-25 Cognizant Technology Solutions U.S. Corporation Automated and unsupervised generation of real-world training data
US11574201B2 (en) 2018-02-06 2023-02-07 Cognizant Technology Solutions U.S. Corporation Enhancing evolutionary optimization in uncertain environments by allocating evaluations via multi-armed bandit algorithms

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020007373A1 (en) * 1997-06-02 2002-01-17 Blair Tim W. System, method, and computer program product for knowledge management
US20020083031A1 (en) * 1998-02-20 2002-06-27 Aymeric Riverieulx De Varax Methods of refining descriptors
US20060218522A1 (en) * 2005-03-25 2006-09-28 Vistaprint Technologies Limited Selecting images using associated keywords
US20070094241A1 (en) * 2005-10-26 2007-04-26 International Business Machines Corporation System and method for web searching

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160728A (ja) * 1993-12-06 1995-06-23 Sanyo Electric Co Ltd マルチ画面形成装置
US5995978A (en) * 1997-09-24 1999-11-30 Ricoh Company, Ltd. Navigation system for document image database
US7559039B2 (en) * 1998-07-14 2009-07-07 Brad Ridgley Method and device for finding, collecting and acting upon units of information
US7272593B1 (en) * 1999-01-26 2007-09-18 International Business Machines Corporation Method and apparatus for similarity retrieval from iterative refinement
US7325198B2 (en) * 2002-12-31 2008-01-29 Fuji Xerox Co., Ltd. Calendar-based interfaces for browsing and manipulation of digital images
JP4653557B2 (ja) * 2004-05-24 2011-03-16 株式会社東芝 医用画像表示装置及び医用画像表示方法
JP2006268295A (ja) * 2005-03-23 2006-10-05 Sharp Corp ユーザインターフェース表示装置及びその操作方法
WO2007009238A1 (en) 2005-07-19 2007-01-25 March Networks Corporation Temporal data previewing system
JP2008217117A (ja) * 2007-02-28 2008-09-18 Fujifilm Corp 画像検索方法及び画像検索システム
US8200618B2 (en) * 2007-11-02 2012-06-12 International Business Machines Corporation System and method for analyzing data in a report
US8352465B1 (en) * 2009-09-03 2013-01-08 Google Inc. Grouping of image search results

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020007373A1 (en) * 1997-06-02 2002-01-17 Blair Tim W. System, method, and computer program product for knowledge management
US20020083031A1 (en) * 1998-02-20 2002-06-27 Aymeric Riverieulx De Varax Methods of refining descriptors
US20060218522A1 (en) * 2005-03-25 2006-09-28 Vistaprint Technologies Limited Selecting images using associated keywords
US20070094241A1 (en) * 2005-10-26 2007-04-26 International Business Machines Corporation System and method for web searching

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
S. NEWSAM 等: "Category-Based Image Retrieval", 《PROCEEDING OF THE IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104461494A (zh) * 2014-10-29 2015-03-25 中国建设银行股份有限公司 一种生成数据处理工具的数据包的方法及装置
CN104461494B (zh) * 2014-10-29 2018-10-26 中国建设银行股份有限公司 一种生成数据处理工具的数据包的方法及装置

Also Published As

Publication number Publication date
AU2010292988A1 (en) 2012-04-19
JP2013504795A (ja) 2013-02-07
US20120173559A1 (en) 2012-07-05
US8832134B2 (en) 2014-09-09
EP2476069A1 (en) 2012-07-18
JP5770732B2 (ja) 2015-08-26
US20140344303A1 (en) 2014-11-20
WO2011029150A1 (en) 2011-03-17
AU2010292988B2 (en) 2016-09-29
EP2476069A4 (en) 2017-04-05
JP6069419B2 (ja) 2017-02-01
JP2015215912A (ja) 2015-12-03
CN102640146B (zh) 2017-07-14

Similar Documents

Publication Publication Date Title
CN102640146A (zh) 数据库搜索方法、***和控制器
US20220035827A1 (en) Tag selection and recommendation to a user of a content hosting service
CN111241311A (zh) 媒体信息推荐方法、装置、电子设备及存储介质
US8081198B1 (en) Compact clustered 2-D layout
JP5212610B2 (ja) 代表画像又は代表画像群の表示システム、その方法、およびそのプログラム並びに、代表画像又は代表画像群の選択システム、その方法およびそのプログラム
CN103377258B (zh) 用于对微博信息进行分类显示的方法和设备
CN108073568A (zh) 关键词提取方法和装置
CN110390052B (zh) 搜索推荐方法、ctr预估模型的训练方法、装置及设备
US20080075360A1 (en) Extracting dominant colors from images using classification techniques
CN101458703A (zh) 用于控制相对重要性的标签表示或标签组表示大小调整
CN103491205A (zh) 一种基于视频搜索的关联资源地址的推送方法和装置
CN104160712A (zh) 计算媒体节目之间的相似度
WO2010074887A2 (en) Interactively ranking image search results using color layout relevance
US11875585B2 (en) Semantic cluster formation in deep learning intelligent assistants
WO2014050774A1 (en) Document classification assisting apparatus, method and program
CN111159431A (zh) 基于知识图谱的信息可视化方法、装置、设备及存储介质
CN104881428A (zh) 一种信息图网页的信息图提取、检索方法和装置
GB2592884A (en) System and method for enabling a search platform to users
JP5302614B2 (ja) 施設関連情報の検索データベース形成方法および施設関連情報検索システム
CN113886615A (zh) 一种基于多粒度联想学习的手绘图像实时检索方法
CN113742578A (zh) 一种数据推荐方法、装置、电子设备及存储介质
CN105095385B (zh) 一种检索结果的输出方法及装置
CN103500214B (zh) 一种基于视频搜索的分词信息推送方法和装置
CN104021201A (zh) 一种数据转换方法及装置
CN114329181A (zh) 一种题目推荐方法、装置及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1174712

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1174712

Country of ref document: HK