CN107735782A - 图像和文本数据层级分类器 - Google Patents

图像和文本数据层级分类器 Download PDF

Info

Publication number
CN107735782A
CN107735782A CN201680033242.8A CN201680033242A CN107735782A CN 107735782 A CN107735782 A CN 107735782A CN 201680033242 A CN201680033242 A CN 201680033242A CN 107735782 A CN107735782 A CN 107735782A
Authority
CN
China
Prior art keywords
label
data set
data
hierarchical classification
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680033242.8A
Other languages
English (en)
Other versions
CN107735782B (zh
Inventor
A.斯坦顿
N.拉哈文
M.拉加舍卡
D.圭罗里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IRIS
Original Assignee
IRIS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IRIS filed Critical IRIS
Priority to CN202210117061.0A priority Critical patent/CN114416999A/zh
Publication of CN107735782A publication Critical patent/CN107735782A/zh
Application granted granted Critical
Publication of CN107735782B publication Critical patent/CN107735782B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

公开了对数据加索引。接收与数据集相关联的图像和文本数据。使用一个或多个层级分类器来生成标签。图像和文本数据被输入到一个或多个层级分类器中的至少一个中。至少基于所生成的标签来生成搜索索引。

Description

图像和文本数据层级分类器
其他申请的交叉引用
本申请要求2015年6月10日提交的标题为DEEP LEARNING SEARCH的美国临时专利申请第62/173,828号的优先权,该专利申请为了所有目的通过引用合并于此。
背景技术
当搜索信息时,通常利用搜索索引来加速搜索过程。例如,对要搜索的内容进行预处理,并且将关于该内容的选择信息存储在搜索索引中。然而,搜索结果通常仅与关于正被搜索的内容被理解和加索引的内容几乎一样。例如,搜索查询的结果高度依赖于针对要搜索的内容哪些信息能够被加索引。改善和增加被加索引的信息的范围将提高搜索结果的准确度和性能。
附图说明
在下面的详细描述和附图中公开了本发明的各种实施例。
图1是图示现有技术搜索***的搜索结果的屏幕截图。
图2是图示用于对数据集加索引的***的实施例的框图。
图3是图示用于生成搜索索引的过程的实施例的流程图。
图4是图示用于自动生成数据集的一个或多个标签的过程的实施例的流程图。
图5是图示利用人工神经网络来标识一个或多个标签的过程的实施例的流程图。
图6是图示用于解决数据集与生成的标签的不一致性的过程的实施例的流程图。
图7是图示用于处理搜索查询的过程的实施例的流程图。
具体实施方式
本发明可以以多种方式被实现,这些方式包括作为过程;装置;***;物质的组成;体现在计算机可读存储介质上的计算机程序产品;和/或处理器,诸如被配置为执行存储在耦合到处理器的存储器上和/或由该存储器提供的指令的处理器。在本说明书中,这些实现方式或者本发明可以采取的任何其他形式可以被称为技术。通常,所公开的过程的步骤的顺序可以在本发明的范围内改变。除非另有说明,否则被描述为被配置为执行任务的组件(诸如处理器或存储器)可以被实现为临时配置为在给定时间执行该任务的通用组件或被制造为执行该任务的特定组件。如本文所使用的,术语“处理器”是指配置为处理诸如计算机程序指令之类的数据的一个或多个设备、电路和/或处理核心。
以下与图示本发明的原理的附图一起提供本发明的一个或多个实施例的详细描述。结合这样的实施例描述了本发明,但是本发明不限于任何实施例。本发明的范围仅由权利要求限制,并且本发明包含许多替代、修改和等同物。在以下描述中阐述了许多特定细节,以便提供对本发明的全面理解。这些细节是为了示例的目的而被提供的,并且本发明可以在没有这些特定细节中的一些或全部的情况下根据权利要求来实践。为了清楚的目的,在与本发明相关的技术领域中已知的技术材料没有被详细描述,以便本发明不会不必要地被混淆。
图1是图示现有技术搜索***的搜索结果的屏幕截图。响应于在在线商家网站上查找被描述为待售的“红色桌子”的所有可获得物品的搜索查询,搜索结果100被现有技术搜索***提供作为顶部搜索结果。即使商家销售红颜色的桌子,但是这些顶部结果实际上都不是如搜索查询所期望的红色桌子。如搜索结果100所证明的,这些不好的搜索结果有可能是由于使用了不包括相关加索引术语集的搜索索引。在一些实施例中,为了增加关于产品的可用描述性信息的量,使用图像识别来处理产品的图像,并且生成要被包括在搜索索引中的附加标签。例如,使用图像识别在产品的关联图像中自动识别桌子的存在及其颜色,并且将所识别的特征作为标签与产品相关联。
公开了加索引数据集。在一些实施例中,检索与多个数据集中的每个数据集相关联的图像和文本数据。例如,每个数据集对应于待售的不同产品,并且每个数据集包括关于该对应产品的信息。使用一个或多个层级分类器来生成标签,并且将图像和文本数据输入到一个或多个层级分类器中。使用所生成的标签来生成数据集的搜索索引。
例如,不是仅仅对数据集中指定的文本信息加索引,而是生成关于每个数据集的附加信息用于搜索加索引。在一些实施例中,使用图像识别、计算机视觉和/或神经网络来分析产品的图像,以标识关于图像的内容的标签/属性。通过得出关于要搜索的数据集的附加信息,扩展能够与每个数据集匹配的信息的范围。例如,尽管描述服装服饰物品的数据集在数据集的文本数据记录中标识服装的单个整体颜色,但是对该物品的照片执行图像识别(例如,图像识别由文本数据引导)以标识该物品上的其他颜色或图案。为了引导和改善图像识别的性能,利用包括在对应数据集中的文本数据(例如,物品名称)。文本数据和与该数据相关联的图像数据可以共同用于深度学习神经网络,以改善数据集的自动生成的描述性标签的准确性和检测。数据集的其他示例包括广告数据、视频数据以及任何其他要搜索的内容。
图2是图示用于对数据集加索引的***的实施例的框图。搜索***206经由网络208连接到数据集提供商***202和用户***204。搜索***206从数据集提供商***202接收要被加索引的数据集。例如,数据集提供商***202将描述产品的信息上传到搜索***206以允许搜索***206建立搜索索引,以允许使用搜索查询来搜索该产品。除了对所提供的数据集包括的文本内容加索引之外,与数据集相关联的附加信息由搜索***206生成和加索引。例如,使用图像识别(例如,使用计算机视觉、人工神经网络、深度学习等)来分析与数据集相关联的图像,以便提取关于数据集的附加信息。新的信息可以作为标签被输出以与相应的数据集相关联并且被加索引以供搜索。在一些实施例中,生成标签包括利用包括在数据集中的文本内容来引导/补充图像识别。例如,将文本内容和图像内容一起用作人工神经网络的输入以生成标签。
在一些实施例中,层级分类器用于生成标签。例如,存在分类器的层级,并且如果较高级别分类器已经检测到与较低级别分类器匹配的足够信息,则仅利用较低级别分类器。例如,较高级别分类器检测与数据集相关联的产品类别,并且对于每个可能的检测到的产品类别,存在特定于所检测到的类别的一个或多个较低级别分类器。可能存在任何数量的级别的分类器层级。使用层级分类器的结果,生成用于实现数据集的搜索的搜索索引。搜索索引的示例包括倒排索引,该倒排索引对所生成的标签以及包括在数据集中的文本信息加索引。所生成的搜索索引可以被提供给将处理搜索查询的另一***和/或可以由搜索***206用来处理搜索查询。
用户***204提供要被处理以标识数据集的期望数据的搜索查询。该搜索查询可以由有权访问生成的搜索索引的任何***处置。例如,搜索查询可以由搜索***206、数据集提供商***202和/或有权访问所生成的搜索索引的任何其他服务器/***处置。在一些实施例中,处置搜索查询包括处理该搜索查询以理解查询的搜索项及其关系(例如,确定搜索项的本体)以及使用搜索索引来标识与所处理的搜索查询匹配的一个或多个数据集。
数据集提供商***202和搜索***206的示例包括一个或多个服务器、计算机、存储设备、网络服务、网络、计算机和/或其他计算机/网络设备。例如,搜索***206包括服务器和网络存储设备组。用户***204的示例包括膝上型计算机、台式计算机、智能电话、平板计算机、物联网设备、可穿戴计算机、无线中继器、无线路由器或任何其他无线计算机或设备。
网络208的示例包括下述各项中的一项或多项:直接或间接物理通信连接、移动通信网络、无线网络、因特网、内联网、局域网、广域网、存储区域网络以及将两个或更多个***、组件或存储设备连接在一起的任何其他形式。其他通信路径可能存在,并且图2的示例已经被简化以清楚地图示示例。尽管图2中所示的组件的单个实例已经被示出以简化附图,但是可能存在图2中所示的任何组件的附加实例。例如,任何数目的客户端***和数据集提供商***可以经由网络208访问搜索***206。也可以存在图2中未示出的组件。
图3是图示用于生成搜索索引的过程的实施例的流程图。图3的过程可以在图2的搜索***206上实现。
在302处,接收要被加索引以用于搜索的数据集。在一些实施例中,每个数据集包括关于特定产品的信息。例如,每个数据集包括关于数据集的主题的以下信息中的一个或多个:颜色、价格、文本描述、名称、图像、图像位置、审阅、评论、类别标识符、相关产品标识符以及与主题相关联的任何其他信息/属性。在一些实施例中,每个数据集对应于不同的产品。数据集的其他示例包括广告数据、视频数据以及要搜索的任何其他内容。在一些实施例中,每个数据集是文档并且容纳多个文档。在一些实施例中,数据集由远程***(例如,图2的***202)经由网络提供。例如,远程***将数据集上传到搜索索引***以供分析和加索引。在一些实施例中,使用由搜索***提供的应用编程接口(API)来提供数据集。在一些实施例中,以JavaScript对象表示法(JSON)格式对数据集进行编码。在一些实施例中,接收数据集包括接收网络位置地址,可以在该网络位置地址获得数据集的至少一部分。在一些实施例中,数据集被放置在处理队列中。例如,为了高效和公平地处置大量数据集的处理,数据集被放置在一个或多个处理队列中。在一些实施例中,来自不同提供商/商家的数据集被放置在不同的处理队列中,并且按照先进先出的顺序处理来自每个处理队列的数据集。
在304处,从数据集提取属性。在一些实施例中,提取属性包括提取在要被加索引以供搜索的数据集中所包括的数据记录。例如,读取和解析数据集以将数据集的内容转换成用于搜索加索引的格式。在一些实施例中,提取属性包括提取在每个数据集中所包括的文本数据。例如,从数据集获得元数据(例如,数据标记)和相关联的文本内容(例如,描述数据集的主题/产品的文本内容)。
在306,获得由数据集标识的一个或多个外部资源。在一些实施例中,在数据集中标识一个或多个外部资源的一个或多个网络位置地址(例如,URI)。例如,每个数据集包括与主题(例如,产品)相关联的数据记录,并且数据记录中的一个或多个指示一网络地址,在该网络地址处可以获得主题的外部资源(例如,图像)。在一些实施例中,获得一个或多个外部资源包括经由网络下载外部资源。例如,位于(一个或多个)位置地址处的(一个或多个)图像被下载和存储以供分析。在一些实施例中,可以在数据集中包括一个或多个图像,并且从数据集提取所包括的图像以供分析。外部资源的示例包括图像、视频、文件、音频以及可经由网络访问的任何其他内容。在一些实施例中,所获得的外部资源被存储在本地存储装置中。在一些实施例中,所获得的外部资源被放置于处理队列中以供处理。
在308处,使用一个或多个层级分类器来自动生成针对一个或多个数据集的一个或多个标签。所生成的标签与对应数据集相关联。例如,标签包括描述对应数据集的主题的一个或多个文本项(例如,标签标识产品的产品类别、推断的属性等),并且通过识别数据集的主题的图像的内容来针对对应数据集生成该标签。在一些实施例中,层级分类器的层级按照层级相关顺序被组织。例如,每个层级分类器处理输入数据以确定一个或多个输出。这些输出中的一个或多个可以是去往较低级别的层级分类器的输入和/或可以是与数据集关联的(一个或多个)所生成的标签。分类器是否将被利用可以取决于较高级别分类器是否已经生成了与特定较低级别分类器相对应的结果(例如,具有至少阈值置信水平)。例如,一旦分类器已经标识特定标签(例如,标记为“珠宝”)与一数据集相关联,则使用一个或多个较低级别分类器生成与该特定标签相关的其他子标签(例如,“戒指”、“金”等),该较低级别分类器仅在该特定标签已经被较高级别分类器标识的情况下被利用。可以存在任何数量的分类器级别,并且每个子级别可以包括基于直接更高级别的分类器的结果而被选择性地利用的一个或多个分类器。
在一些实施例中,每个层级分类器可以包括利用人工管理的特征训练的一个或多个人工神经网络和/或机器学习模型。例如,已经使用训练数据训练的人工神经网络用于执行数据集的图像的图像识别。在一些实施例中,对层级分类器的输入包括图像数据(例如,在306中获得的)和在数据集中指定的文本内容(例如,在304中提取的属性)二者。例如,对图像的图像识别由包括在数据集中的文本内容来辅助。
在310处,生成数据集的搜索索引。在一些实施例中,生成数据集的索引就绪文档,并且索引就绪文档包括在308中标识的标签。这些索引就绪文档可以被加索引以生成搜索索引。在一些实施例中,生成搜索索引包括对在304中提取的一个或多个属性和在308中生成的标签加索引。例如,所提取的属性和所生成的标签二者一起用于生成搜索索引。在一些实施例中,搜索索引包括倒排索引。例如,通过倒排索引来将一个或多个提取的属性和生成的标签的关键字映射到数据集的一个或多个主题(例如,产品)。搜索索引可以用于确定搜索查询的结果。例如,搜索查询的关键字被标识,并且使用搜索索引来标识与关键字相对应的数据集的主题。
图4是图示用于自动生成数据集的一个或多个标签的过程的实施例的流程图。图4的过程可以在图2的搜索***206上被实现。在一些实施例中,图4的过程被包括在图3的308中。在一些实施例中,针对要处理的每个数据集重复图4的过程。例如,要处理的所接收的数据集已经被放置于处理队列中,并且图4的过程用于按照处理队列的顺序来处理每个数据集。
在402处,使用顶级层级分类器来标识数据集的一个或多个标签。例如,使用层级顶级分类器来标识数据集的类别分类。在一些实施例中,存在多个可能的类别,并且在可能的类别当中选择在该可能的类别当中与数据集相关联的一个或多个类别。例如,数据集的主题是产品,并且该产品的产品类别(例如,服饰、珠宝、电子产品、美容、玩具、汽车等)被自动确定。虽然数据集可能已经包括产品归类的标识符,但是所确定的类别分类可以对应于与层级分类器相关联的不同归类方案。在一些实施例中,每个层级分类器可以利用包括在数据集中的一个或多个文本数据和数据集的图像作为输入。例如,使用产品的图像和包括在数据集中的产品名称来确定产品类别。顶级层级分类器可以是用于每个数据集的多个顶级层级分类器中的一个。
在404处,已经被标识为具有足够置信度的一个或多个标签中的任何标签与该数据集相关联。例如,当标识针对数据集的标签时,确定标签正确地与该数据集的主题对应的置信度的指示符(例如,数值)。在一些实施例中,在标签的置信度指示符满足阈值(例如,阈值的值)的情况下,该标签与该数据集相关联。例如,通过关联该标签,该标签基本上针对该数据集被生成,因为该标签所标识的信息先前没有在数据集中被指定。将标签与数据集相关联可以包括将标签映射到数据集的主题,以允许与标签相关联的搜索查询与数据集的主题匹配。在一些实施例中,关联标签包括在多个标签选项当中选择已经由分类器标识的标签(例如,选择最可能与数据集关联的标签)。在一些实施例中,在没有标签被标识为具有足够置信度的情况下,标识该无标签确定的标签(例如,“未知”标签)与数据集相关联。该“未知”标签可以用于在搜索排名中对与该数据集关联的产品进行去优先。
在406处,对于每个关联的标签,利用与该关联的标签对应的一个或多个子层级分类器(如果有的话)来标识针对数据集的一个或多个附加标签。例如,存在分类器的层级组织,并且是否将利用特定分类器来生成针对数据集的标签取决于与该特定分类器具有层级关系的更高级别的分类器是否已经标识与该特定分类器相对应的输出(例如,具有足够置信度的标签)。因此,被标识为具有足够置信度的先前标识的标签可以触发所述一个或多个子层级分类器来生成与该先前标识的标签相关联的一个或多个附加标签。例如,因为较高级别的分类器已经将数据集的主题标识为具有高置信度的“戒指”并且将“戒指”标签与该数据集相关联,所以基于“戒指”标签来触发一个或多个子分类器。这些子分类器可以生成描述戒指的宝石(如果有的话)的类型、戒指的金属材料、戒指的尺寸、戒指是否被雕刻等的一个或多个标签。在一些实施例中,标签不与子级别分类器相关联,并且标签不触发子分类器的处理。在一些实施例中,标签与多个子分类器相关联,并且标签的标识触发多个分类器。一个分类器可以标识多个标签。由层级分类器标识的标签的示例包括图像中所包括的特定对象组件的颜色、颜色的属性、颜色的质量、颜色的暗度或亮度、服饰的特征、服饰的领口、服装服饰的长度、服饰的袖子属性等等。
在408处,将已经被标识为具有足够置信度的一个或多个附加标签中的任何一个与该数据集相关联。在一些实施例中,在所标识的标签的置信度指示符(例如,由分类器确定的数值)满足阈值(例如,阈值的值)的情况下,该标签与该数据集相关联。将附加标签与数据集相关联可以包括将附加标签映射到数据集以允许与该标签相关联的搜索查询与数据集的主题相匹配。在一些实施例中,关联标签包括选择多个标签选项当中的已被分类器标识为最有可能与该数据集关联的标签。
在410处,确定是否已经达到停止标准。例如,因为存在由一个或多个附加标签触发的一个或多个附加层级分类器,并且要执行分类器的下一个子级别,所以尚未达到停止标准。
在一些实施例中,存在分类器的多个级别,并且当达到最低级别时,已经满足停止标准。在一些实施例中,当在408中没有附加标签与数据集相关联或者408中的(一个或多个)关联的标签不触发其他分类器时,已经达到停止标准。如果在410确定尚未达到停止标准,则过程返回到406,其中对于已经关联的(一个或多个)附加标签中的每一个,对应于关联的标签的一个或多个子层级分类器(如果有的话)用于标识针对该数据集的一个或多个附加标签。如果在410确定了已经达到停止标准,则过程结束。
图5是图示用于利用人工神经网络来标识一个或多个标签的过程的实施例的流程图。图5的过程可以在图2的搜索***206上被实现。在一些实施例中,图5的过程被包括在图3的308中。在一些实施例中,当在图4的过程中利用每个层级分类器来标识标签时,图5的过程被重复。
在502处,选择数据集的一个或多个提取的属性用于输入。例如,层级分类器包括多个神经网络,并且选择适用于要由层级分类器标识的标签的一个或多个提取的属性(例如,在图3的304中提取的)作为输入。在一些实施例中,选择包括在数据集中的文本数据。例如,文本数据是在数据集中指定的文本名称。文本数据的其他示例包括数据集中包括的文本描述的至少一部分。
在504,使用一个或多个属性处理人工神经网络来处理数据集的一个或多个提取的属性。在一些实施例中,选择将产生最佳结果的神经网络类型作为属性处理神经网络,并且利用一个或多个属性处理人工神经网络来处理属性以生成输出。属性处理人工神经网络的示例包括最适合于识别文本数据的期望属性的神经网络。输出的示例包括如下数据:该数据可以被提供给另一神经网络以标识针对该数据集的一个或多个标签。属性处理人工神经网络的示例包括以下各项中的一项或多项:自动编码器、卷积神经网络、递归神经网络、循环神经网络、全连接神经网络、长期短期记忆神经网络、记忆网络和神经图灵机。在一些实施例中,已经使用示例性训练数据来训练(一个或多个)属性处理人工神经网络。例如,反向传播已经被用来训练(一个或多个)属性处理人工神经网络。多个属性处理人工神经网络可以通过将一个属性处理神经网络的输出作为输入馈送到另一属性处理神经网络来按阶段处理数据。
在506处,选择数据集的一个或多个图像用于输入。例如,选择由数据集引用并在图3的306中获得的图像用于输入。在一些实施例中,所选择的图像被包括在数据集中。在一些实施例中,所选择的图像是视频的一部分。在一些实施例中,所选择的图像可以描绘数据集的主题,并且图像被选择用于图像识别的输入以生成针对数据集的附加标签。
在508,使用一个或多个图像处理人工神经网络来处理数据集的一个或多个图像。在一些实施例中,选择将产生用于图像检测的最佳结果的神经网络类型作为图像处理神经网络,并且利用一个或多个图像处理人工神经网络来处理图像以生成输出。图像处理人工神经网络的示例包括最适合于识别图像的神经网络。输出的示例包括可以被提供给另一神经网络以标识针对数据集的一个或多个标签的数据。图像处理人工神经网络的示例包括以下各项中的一项或多项:卷积神经网络、循环卷积神经网络和受限玻尔兹曼机。在一些实施例中,已经使用示例性训练数据训练(一个或多个)图像处理人工神经网络。例如,反向传播已经用于训练(一个或多个)图像处理人工神经网络。多个图像处理人工神经网络可以通过将一个图像处理神经网络的输出作为输入馈送到另一图像处理神经网络来按阶段处理数据。
在510,(一个或多个)属性处理人工神经网络的结果和(一个或多个)图像处理人工神经网络的结果二者被用作对一个或多个联合处理人工神经网络的输入,以标识数据集的一个或多个标签。例如,504的输出和508的输出二者被一起输入到联合处理人工神经网络,以发现针对该数据集的一个或多个标签。通过利用图像数据和描述性文本数据二者,可以提高数据集的所标识的标签的准确度。联合处理人工神经网络可以按照阶段进行组织,各阶段利用一个联合处理神经网络的输出作为另一联合处理神经网络的输入。在一些实施例中,标识标签包括确定能够由(一个或多个)联合处理人工神经网络检测到的一个或多个合格的生成的标签是否对应于输入。合格的生成的标签可以被预先配置和/或自动检测/生成。
在一些实施例中,已经使用示例性训练数据训练了联合处理人工神经网络。可以使用反向传播不断提高联合处理人工神经网络的准确度。可以一起训练属性处理人工神经网络、图像处理人工神经网络和联合处理人工神经网络。在一些实施例中,标识标签包括确定针对每个标识的标签的置信度度量,该置信度度量标识该标签的预测准确度,并且仅当置信度度量满足阈值时,该标识的标签与数据集关联。在一些实施例中,标识的标签在图3的308、图4的402和/或图4的406中被提供。
图6是图示用于解决数据集与所生成的标签的不一致性的过程的实施例的流程图。图6的过程可以在图2的搜索***206上实现。在一些实施例中,图6的过程被包括在图3的308中。在一些实施例中,图6的过程被包括在图4的404和/或408中。
在602处,接收要与数据集相关联的一个或多个标签。在一些实施例中,接收到的标签包括在图3的308、图4的402和/或图4的406中标识的标签。
在604处,确定数据集的内容是否与(一个或多个)接收到的标签不一致。例如,包括在数据集中的文本描述或其他数据记录可能由于人类数据输入错误而不正确(例如,当由数据集引用的产品照片证明的实际服饰产品的颜色为“蓝色”时,服饰产品在数据集中被描述为“红”颜色)。在一些实施例中,确定不一致性包括验证每个标签与包括在数据集中的文本属性一致。数据集的文本属性可以是在图3的304中提取的属性。
如果在604确定存在不一致性,则在606,解决不一致性。在一些实施例中,解决不一致性包括指示不一致性以允许人类审阅者解决该不一致性。在一些实施例中,解决不一致性包括修改数据集的内容以与不一致的标签一致。在一些实施例中,解决不一致性包括移除数据集的不一致部分。在一些实施例中,解决不一致性包括确定不将不一致的标签与数据集相关联。例如,仅在所标识的标签被确定为不与数据集的现有属性和/或数据集的先前关联的标签不一致的情况下,标签与数据集相关联。
如果在604确定不存在不一致性,则在608,(一个或多个)接收到的标签与数据集相关联。
图7是图示用于处理搜索查询的过程的实施例的流程图。图7的过程可以在图2的搜索***206上实现。
在702处,接收搜索查询。在一些实施例中,搜索查询是用于标识与该搜索查询的指定约束匹配的一个或多个产品的查询。在一些实施例中,搜索查询是用于搜索在图3的302中接收的数据集的查询。在一些实施例中,从图2的用户***204接收搜索查询。搜索查询的其他示例包括:用于在视频内查找包括与该搜索查询相匹配的内容的位置的查询、用于搜索相关图像和/或视频广告的查询或用于搜索一组图像当中的匹配图像的查询。
在704处,分析搜索查询以确定搜索查询的搜索项的本体。例如,解析搜索查询,并且分析和确定搜索项之间的含义和关系以执行对由搜索查询指定的期望内容的搜索。在一些实施例中,搜索查询被矢量化以确定搜索查询的项的矢量化表示。
在706处,利用搜索索引来确定响应于搜索查询的搜索结果。在一些实施例中,搜索索引是在图3的310中生成的搜索索引。在一些实施例中,通过对数据集的一个或多个属性和自动生成的标签加索引来生成搜索索引,并且搜索查询的语义项与搜索索引中引用的内容匹配。
尽管为了清楚理解的目的已经对前述实施例相当详细地进行了描述,但是本发明不限于所提供的细节。存在许多实现本发明的替代方式。所公开的实施例是说明性的而不是限制性的。

Claims (20)

1.一种用于对数据加索引的***,包括:
处理器;以及
与所述处理器耦合的存储器,其中,所述存储器被配置为向所述处理器提供指令,所述指令在被执行时使得所述处理器:
接收与数据集关联的图像和文本数据;
使用一个或多个层级分类器来生成标签,其中,所述图像和所述文本数据被输入到所述一个或多个层级分类器中的至少一个中;以及
至少基于所生成的标签来生成搜索索引。
2.根据权利要求1所述的***,其中,所述数据集是被处理以生成所述搜索索引的多个数据集中的一个。
3.根据权利要求1所述的***,其中,所述文本数据是所述数据集的主题的名称。
4.根据权利要求1所述的***,其中,所述数据集包括对所述图像的引用。
5.根据权利要求1所述的***,其中,所述指令在被执行时进一步使得所述处理器从由所述数据集标识的远程网络位置地址获得所述图像。
6.根据权利要求1所述的***,其中,所述图像是所述数据集的主题的图形描绘。
7.根据权利要求1所述的***,其中,所述数据集指定单个产品的属性。
8.根据权利要求1所述的***,其中,所生成的标签是由所述一个或多个层级分类器生成的多个标签中的一个。
9.根据权利要求1所述的***,其中,所述文本数据包括所述数据集的主题的描述的至少一部分。
10.根据权利要求1所述的***,其中,所述一个或多个层级分类器中的所述至少一个包括人工神经网络。
11.根据权利要求1所述的***,其中,生成所述标签包括将所述标签与所述数据集相关联。
12.根据权利要求1所述的***,其中,所述一个或多个层级分类器中的一个分类器已经标识出先前标识的标签,所述先前标识的标签触发所述一个或多个层级分类器中的另一分类器来标识所生成的标签。
13.根据权利要求1所述的***,其中,基于所述一个或多个层级分类器中包括的较高级别层级分类器的结果,来有条件地执行在所述一个或多个层级分类器中包括的至少一个层级分类器。
14.根据权利要求1所述的***,其中,生成所述标签包括:确定与满足阈值的所述标签相关联的置信度指示符。
15.根据权利要求1所述的***,其中,生成所述标签包括:使用第一人工神经网络来处理所述图像,使用第二人工神经网络来处理所述文本数据,并且使用所述第一人工神经网络的结果和所述第二人工神经网络的结果作为对第三人工神经网络的输入。
16.根据权利要求1所述的***,其中,生成所述标签包括:解决所生成的标签与所述数据集的数据记录之间的冲突。
17.根据权利要求1所述的***,其中,所述搜索索引已经至少部分地通过对所生成的标签加索引来生成。
18.根据权利要求1所述的***,其中,所述搜索索引包括倒排索引。
19.一种用于对数据加索引的方法,包括:
接收与数据集相关联的图像和文本数据;
使用处理器来使用一个或多个层级分类器生成标签,其中,所述图像和所述文本数据被输入到所述一个或多个层级分类器中的至少一个中;以及
至少基于所生成的标签来生成搜索索引。
20.一种用于对数据加索引的计算机程序产品,所述计算机程序产品被体现在非临时性计算机可读存储介质中,并且包括用于下述操作的计算机指令:
接收与数据集相关联的图像和文本数据;
使用一个或多个层级分类器来生成标签,其中,所述图像和所述文本数据被输入到所述一个或多个层级分类器中的至少一个中;以及
至少基于所生成的标签来生成搜索索引。
CN201680033242.8A 2015-06-10 2016-06-07 图像和文本数据层级分类器 Active CN107735782B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210117061.0A CN114416999A (zh) 2015-06-10 2016-06-07 图像和文本数据层级分类器

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562173828P 2015-06-10 2015-06-10
US62/173828 2015-06-10
US14/866554 2015-09-25
US14/866,554 US20160364419A1 (en) 2015-06-10 2015-09-25 Image and text data hierarchical classifiers
PCT/US2016/036244 WO2016200828A1 (en) 2015-06-10 2016-06-07 Image and text data hierarchical classifiers

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202210117061.0A Division CN114416999A (zh) 2015-06-10 2016-06-07 图像和文本数据层级分类器

Publications (2)

Publication Number Publication Date
CN107735782A true CN107735782A (zh) 2018-02-23
CN107735782B CN107735782B (zh) 2022-03-01

Family

ID=57504704

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202210117061.0A Pending CN114416999A (zh) 2015-06-10 2016-06-07 图像和文本数据层级分类器
CN201680033242.8A Active CN107735782B (zh) 2015-06-10 2016-06-07 图像和文本数据层级分类器

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202210117061.0A Pending CN114416999A (zh) 2015-06-10 2016-06-07 图像和文本数据层级分类器

Country Status (5)

Country Link
US (2) US20160364419A1 (zh)
EP (2) EP3308301A4 (zh)
CN (2) CN114416999A (zh)
HK (1) HK1253368A1 (zh)
WO (1) WO2016200828A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112925875A (zh) * 2021-03-25 2021-06-08 华南师范大学 一种开放数据集的数据关联方法及***

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160364419A1 (en) 2015-06-10 2016-12-15 Blackbird Technologies, Inc. Image and text data hierarchical classifiers
US10013640B1 (en) * 2015-12-21 2018-07-03 Google Llc Object recognition from videos using recurrent neural networks
US9792530B1 (en) * 2015-12-28 2017-10-17 Amazon Technologies, Inc. Generating and using a knowledge base for image classification
US10264099B2 (en) * 2016-03-07 2019-04-16 Cisco Technology, Inc. Method and system for content closures in a content centric network
US10878318B2 (en) * 2016-03-28 2020-12-29 Google Llc Adaptive artificial neural network selection techniques
WO2018033137A1 (zh) * 2016-08-19 2018-02-22 北京市商汤科技开发有限公司 在视频图像中展示业务对象的方法、装置和电子设备
US20180247191A1 (en) 2017-02-03 2018-08-30 Milestone Entertainment Llc Architectures, systems and methods for program defined entertainment state system, decentralized cryptocurrency system and system with segregated secure functions and public functions
US10929450B2 (en) * 2017-02-06 2021-02-23 Flipboard, Inc. Customizing digital content with editorial content
CA3000166A1 (en) * 2017-04-03 2018-10-03 Royal Bank Of Canada Systems and methods for cyberbot network detection
US11132605B2 (en) 2017-11-20 2021-09-28 International Business Machines Corporation Cardinal sine as an activation function for universal classifier training data
US10223586B1 (en) * 2018-07-15 2019-03-05 Cognigo Research Ltd. Multi-modal electronic document classification
WO2020018062A1 (en) * 2018-07-16 2020-01-23 Visa International Service Association Dynamic cache size management of multi-tenant caching systems
CN112740196A (zh) * 2018-09-20 2021-04-30 华为技术有限公司 基于知识管理人工智能***中的识别模型
US10984066B2 (en) * 2019-01-02 2021-04-20 Zyte Group Limited System and method for a web scraping tool and classification engine
US11720621B2 (en) * 2019-03-18 2023-08-08 Apple Inc. Systems and methods for naming objects based on object content
CN110162558B (zh) * 2019-04-01 2023-06-23 创新先进技术有限公司 结构化数据处理方法及装置
WO2020251236A1 (ko) * 2019-06-10 2020-12-17 (주)사맛디 딥러닝 알고리즘을 이용한 영상데이터 검색 방법, 장치 및 프로그램
US11531703B2 (en) * 2019-06-28 2022-12-20 Capital One Services, Llc Determining data categorizations based on an ontology and a machine-learning model
US10489454B1 (en) * 2019-06-28 2019-11-26 Capital One Services, Llc Indexing a dataset based on dataset tags and an ontology
CN110502538B (zh) * 2019-07-05 2023-10-13 中国平安人寿保险股份有限公司 画像标签生成逻辑映射的方法、***、设备及存储介质
US11687812B2 (en) * 2020-08-18 2023-06-27 Accenture Global Solutions Limited Autoclassification of products using artificial intelligence
US11636677B2 (en) * 2021-01-08 2023-04-25 Huawei Technologies Co., Ltd. Systems, devices and methods for distributed hierarchical video analysis
US11941000B2 (en) * 2021-04-16 2024-03-26 International Business Machines Corporation Cognitive generation of tailored analogies
US20230214881A1 (en) * 2021-12-31 2023-07-06 Synamedia Limited Methods, Devices, and Systems for Dynamic Targeted Content Processing
US11907841B1 (en) * 2023-05-01 2024-02-20 Ian Truitner Machine learning based consumer product identification system and method therefor

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030187809A1 (en) * 2002-03-29 2003-10-02 Suermondt Henri Jacques Automatic hierarchical classification of temporal ordered case log documents for detection of changes
US20080140679A1 (en) * 2006-12-11 2008-06-12 Microsoft Corporation Relational linking among resoures
US20090012991A1 (en) * 2007-07-06 2009-01-08 Ebay, Inc. System and method for providing information tagging in a networked system
US20110310113A1 (en) * 2005-12-19 2011-12-22 Adobe Systems Incorporated Displaying generated changes to an image file
CN102750541A (zh) * 2011-04-22 2012-10-24 北京文通科技有限公司 一种文档图像分类识别方法及装置
CN103853792A (zh) * 2012-12-07 2014-06-11 中兴通讯股份有限公司 一种图片语义自动标注方法与***
EP2835748A1 (en) * 2013-08-05 2015-02-11 Facebook, Inc. Systems and methods for image classification by correlating contextual cues with images
CN104504109A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 图片搜索方法和装置
CN104978328A (zh) * 2014-04-03 2015-10-14 北京奇虎科技有限公司 一种获取层级分类器以及文本分类的方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050289473A1 (en) * 2004-03-17 2005-12-29 Carl Gustafson Method and system for providing search information via a communications network
WO2006099429A2 (en) * 2005-03-14 2006-09-21 Thaler Stephen L Neural network development and data analysis tool
US7464893B2 (en) * 2006-06-30 2008-12-16 Per Spjut Method of using a cord holder
US9471600B2 (en) * 2011-06-21 2016-10-18 Telefonaktiebolaget Lm Ericsson (Publ) Electronic device and method for handling tags
US9053194B2 (en) * 2012-02-01 2015-06-09 Sri International Method and apparatus for correlating and viewing disparate data
US8849764B1 (en) * 2013-06-13 2014-09-30 DataGravity, Inc. System and method of data intelligent storage
US20160364419A1 (en) 2015-06-10 2016-12-15 Blackbird Technologies, Inc. Image and text data hierarchical classifiers

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030187809A1 (en) * 2002-03-29 2003-10-02 Suermondt Henri Jacques Automatic hierarchical classification of temporal ordered case log documents for detection of changes
US20110310113A1 (en) * 2005-12-19 2011-12-22 Adobe Systems Incorporated Displaying generated changes to an image file
US20080140679A1 (en) * 2006-12-11 2008-06-12 Microsoft Corporation Relational linking among resoures
US20090012991A1 (en) * 2007-07-06 2009-01-08 Ebay, Inc. System and method for providing information tagging in a networked system
CN102750541A (zh) * 2011-04-22 2012-10-24 北京文通科技有限公司 一种文档图像分类识别方法及装置
CN103853792A (zh) * 2012-12-07 2014-06-11 中兴通讯股份有限公司 一种图片语义自动标注方法与***
EP2835748A1 (en) * 2013-08-05 2015-02-11 Facebook, Inc. Systems and methods for image classification by correlating contextual cues with images
CN104978328A (zh) * 2014-04-03 2015-10-14 北京奇虎科技有限公司 一种获取层级分类器以及文本分类的方法及装置
CN104504109A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 图片搜索方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SONAM ET AL.: ""Implementation of MD algorithm for text extraction from video"", 《NIRMA UNIVERSITY INTERNATIONAL CONFERENCE ON ENGINEERING》 *
曾东红 等: ""基于底层图像特征组合的文本图像分类研究"", 《江西理工大学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112925875A (zh) * 2021-03-25 2021-06-08 华南师范大学 一种开放数据集的数据关联方法及***
CN112925875B (zh) * 2021-03-25 2023-08-18 华南师范大学 一种开放数据集的数据关联方法及***

Also Published As

Publication number Publication date
EP3308301A1 (en) 2018-04-18
EP3308301A4 (en) 2018-10-24
EP4040310A1 (en) 2022-08-10
US20200210396A1 (en) 2020-07-02
US20160364419A1 (en) 2016-12-15
CN107735782B (zh) 2022-03-01
WO2016200828A1 (en) 2016-12-15
CN114416999A (zh) 2022-04-29
US11809393B2 (en) 2023-11-07
HK1253368A1 (zh) 2019-06-14

Similar Documents

Publication Publication Date Title
CN107735782A (zh) 图像和文本数据层级分类器
Min et al. A survey on food computing
US11335062B2 (en) Automated apparel design using machine learning
US20190080207A1 (en) Deep neural network visual product recognition system
US10223454B2 (en) Image directed search
CN107424043B (zh) 一种产品推荐方法及装置,电子设备
US20170278135A1 (en) Image recognition artificial intelligence system for ecommerce
CN110073347A (zh) 锚定搜索
US20200334486A1 (en) System and a method for semantic level image retrieval
CN112015998B (zh) 一种基于用户画像的商品推荐方法
US20230214895A1 (en) Methods and systems for product discovery in user generated content
CN105022773B (zh) 包括图像优先级的图像处理***
CN105005982B (zh) 包括对象选择的图像处理
JP5012078B2 (ja) カテゴリ作成方法、カテゴリ作成装置、およびプログラム
CN110489578A (zh) 图片处理方法、装置及计算机设备
CN105183739B (zh) 图像处理方法
Liao et al. Knowledge-aware multimodal fashion chatbot
US10474919B2 (en) Method for determining and displaying products on an electronic display device
JP7032713B1 (ja) 検索装置、検索方法及び検索プログラム
Papadopoulos et al. Attentive hierarchical label sharing for enhanced garment and attribute classification of fashion imagery
CN104462151B (zh) 评估网页发布时间的方法和相关装置
WO2020185226A1 (en) Deep neural network visual and contextual image labeling system
KR102495868B1 (ko) Ai를 활용한 패션 연계 맞춤형 향수 추천시스템
KR20210041733A (ko) 패션 상품 추천 방법, 장치 및 컴퓨터 프로그램
CN111797622A (zh) 用于生成属性信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant