CN113779297A

CN113779297A - 基于图片的信息搜索方法、装置以及存储介质

Info

Publication number: CN113779297A
Application number: CN202111020576.0A
Authority: CN
Inventors: 谢金林; 赵晓乐; 吴风
Original assignee: Orange Cloud Internet Design Co ltd; Beijing Uni Orange Technology Co ltd
Current assignee: Orange Cloud Internet Design Co ltd; Beijing Uni Orange Technology Co ltd
Priority date: 2021-09-01
Filing date: 2021-09-01
Publication date: 2021-12-10

Abstract

本申请公开了一种基于图片的信息搜索方法、装置以及存储介质。其中，方法包括：获取作为搜索线索的源图片；从与源图片相关的信息源获取与源图片相关的语言文本信息；根据语言文本信息，确定与源图片相关的第一关键词集合；以及利用第一关键词集合中的关键词进行搜索，获取与源图片相关的搜索结果。

Description

基于图片的信息搜索方法、装置以及存储介质

技术领域

本申请涉及人工智能技术领域，特别是涉及一种基于图片的信息搜索方法、装置以及存储介质。

背景技术

基于图片的信息搜索技术正在得到越来越广泛的应用，用户可以将图片输入搜索平台，搜索平台会在互联网上搜索包含有该图片的网页等信息源，从而将该信息源返回给用户，使得用户可以访问该信息源从而获取与该图片相关的信息。更进一步的，搜索平台也可以将信息源中与该图片相关的文本信息返回给用户，从而用户可以直接观看到与该图片相关的文本信息。

但是，现有技术根据图片搜索的技术，更多地是直接将包含该图片的信息源的信息直接返回给用户，而缺少对该信息源的信息做出进一步的处理，从而不能向用户提供更准确而全面的信息。

针对现有图片搜索技术中存在的缺少对包含图片的信息源的信息做出进一步的处理，从而不能向用户提供更准确而全面的信息的技术问题，目前尚未提出有效的解决方案。

发明内容

本公开的实施例提供了一种基于图片的信息搜索方法、装置以及存储介质，以至少解决现有技术中存在的缺少对包含图片的信息源的信息做出进一步的处理，从而不能向用户提供更准确而全面的信息的技术问题。

根据本公开实施例的一个方面，提供了一种基于图片的信息搜索方法，包括：获取作为搜索线索的源图片；从与源图片相关的信息源获取与源图片相关的语言文本信息；根据语言文本信息，确定与源图片相关的第一关键词集合；以及利用第一关键词集合中的关键词进行搜索，获取与源图片相关的搜索结果。

根据本公开实施例的另一个方面，还提供了一种存储介质，存储介质包括存储的程序，其中，在程序运行时由处理器执行以上所述的方法。

根据本公开实施例的另一个方面，还提供了一种基于图片的信息搜索装置，包括：图片获取模块，用于获取作为搜索线索的源图片；语言文本信息获取模块，用于从与源图片相关的信息源获取与源图片相关的语言文本信息；关键词确定模块，用于根据语言文本信息，确定与源图片相关的第一关键词集合；以及搜索模块，用于利用第一关键词集合中的关键词进行搜索，获取与源图片相关的搜索结果。

根据本公开实施例的另一个方面，还提供了一种基于图片的信息搜索装置，包括：处理器；以及存储器，与所述处理器连接，用于为所述处理器提供处理以下处理步骤的指令：获取作为搜索线索的源图片；从与源图片相关的信息源获取与源图片相关的语言文本信息；根据语言文本信息，确定与源图片相关的第一关键词集合；以及利用第一关键词集合中的关键词进行搜索，获取与源图片相关的搜索结果。

在本公开实施例中，在从网页和网址获取与源图片相关的语言文本信息之后，并不是仅仅将该语言文本信息输出给用户，而是继续根据该语言文本信息确定与源图片相关的关键词，然后利用关键词进行搜索，获取与源图片相关的搜索结果。从而通过这种方式，计算设备能够突破源图片相关的信息源的限制，根据从语言文本信息中重新确定的关键词进行进一步的搜索。从而能够全面而准确地搜索与源图片相关的信息，从而解决了现有图片搜索技术中存在的缺少对包含图片的信息源的信息做出进一步的处理，从而不能向用户提供更准确而全面的信息的技术问题。

附图说明

此处所说明的附图用来提供对本公开的进一步理解，构成本申请的一部分，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。在附图中：

图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图；

图2是根据本公开实施例1的第一个方面所述的基于图片的信息搜索方法的流程示意图；

图3是根据本公开实施例1所述的语言文本信息的一部分示意图；

图4是根据本公开实施例1所述的知识图谱的一部分的示意图；

图5是根据本公开实施例1的第一个方面所述的基于图片的信息搜索方法的具体流程示意图；

图6是根据本公开实施例2所述的基于图片的信息搜索装置的示意图；以及

图7是根据本公开实施例3所述的基于图片的信息搜索装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本公开的技术方案，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本公开一部分的实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本公开保护的范围。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本实施例，提供了一种基于图片的信息搜索方法的方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的计算设备中执行。图1示出了一种用于实现基于图片的信息搜索方法的计算设备的硬件结构框图。如图1所示，计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外，还可以包括：显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算设备还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本公开实施例中所涉及到的，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器可用于存储应用软件的软件程序以及模块，如本公开实施例中的基于图片的信息搜索方法对应的程序指令/数据存储装置，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用程序的基于图片的信息搜索方法。存储器可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中，传输装置包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD)，该液晶显示器可使得用户能够与计算设备的用户界面进行交互。

此处需要说明的是，在一些可选实施例中，上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是，图1仅为特定具体实例的一个实例，并且旨在示出可存在于上述计算设备中的部件的类型。

在上述运行环境下，根据本实施例的第一个方面，提供了一种基于图片的信息搜索方法，该方法由图1中所示的计算设备实现。图2示出了该方法的流程示意图，参考图2所示，该方法包括：

S202：获取作为搜索线索的源图片；

S204：从与源图片相关的信息源获取与源图片相关的语言文本信息；

S206：根据语言文本信息，确定与源图片相关的第一关键词集合；以及

S208：利用第一关键词集合中的关键词进行搜索，获取与源图片相关的搜索结果。

具体地，当用户需要基于图片进行检索时，可以向图1所示的计算设备输入作为搜索线索的源图片。从而，计算设备获取用户所输入的源图片(S202)。该图片例如可以是关于某个产品的图片，例如可以是关于手机的图片等等。

然后，计算设备基于该源图片在互联网上进行搜索，从而确定与该源图片相关的网页和网址(即信息源)。该网页和网址包含与该源图片相关的语言文本信息，例如对某个手机产品的说明性文字，或者是结合手机产品对某个新闻进行描述的文字等等。从而，计算设备可以从该网页或网址获取与该源图片相关的语言文本信息(S204)。其中，图3示出了该语言文本信息的一部分示意图。参见图3所示，计算设备根据关于手机的源图片获取相关的语言文本信息。并且，当计算设备基于该源图片进行搜索从而搜索到多个网页和网址(即多个信息源)时，计算设备可以将从多个网页和网址获取的语言文本信息进行合并从而进一步对合并后的语言文本信息进行处理。

然后，计算设备根据所获取的语言文本信息确定与源图片相关的关键词(即第一关键词集合)(S206)，例如该关键词可以是从所获取的语言文本信息中所提取的关键词，或者是根据预设的自然语言处理模型根据该语言文本信息所生成的关键词。例如，当源图片是手机的图片时，计算设备所确定的与源图片相关的关键词可以包括“手机”、“移动电话”等等，并且也可以包括“射频电路”、“天线”、“4G模块”或者“5G”模块等手机组件的关键词。关于确定与源图片相关的关键词的方法，将在下文中详细说明。

然后，计算设备利用该关键词进行搜索。例如计算设备可以利用关键词在预设的产品数据库中进行搜索，从而获取与该源图片相关的搜索结果。该搜索结果例如包含与手机产品相关的搜索结果以及手机的各个组件的搜索结果(S208)。然后计算设备将搜索到的搜索结果输出给用户以便于用户查看。

正如背景技术中所述，现有技术根据图片搜索的技术，更多地是直接将包含该图片的信息源的信息直接返回给用户，而缺少对该信息源的信息做出进一步的处理，从而不能向用户提供更准确而全面的信息。

针对该技术问题，本实施例所述的方法在从网页和网址获取与源图片相关的语言文本信息之后，并不是仅仅将该语言文本信息输出给用户，而是继续根据该语言文本信息确定与源图片相关的关键词(即第一关键词集合)，然后利用关键词进行搜索，获取与源图片相关的搜索结果。从而通过这种方式，计算设备能够突破源图片相关的信息源的限制，根据从语言文本信息中重新确定的关键词进行进一步的搜索。从而能够全面而准确地搜索与源图片相关的信息，从而解决了现有图片搜索技术中存在的缺少对包含图片的信息源的信息做出进一步的处理，从而不能向用户提供更准确而全面的信息的技术问题。

尤其是，根据该语言文本信息所确定的关键词中的至少一部分关键词是不包含于该语言文本信息的关键词，从而通过这种方式能够进一步地扩充搜索的范围，从而实现更加全面的搜索。

可选地，根据语言文本信息，确定与源图片相关的第一关键词集合的操作，包括：利用预先设置的自然语言处理模型，生成与语言文本信息相关的第二关键词集合；以及根据预先设置的知识图谱对第二关键词集合进行扩充，生成第一关键词集合。

具体地，计算设备在获取与源图片相关的语言文本信息后，可以首先根据预先设置的自然语言处理模型(后文详细说明)，生成与语言文本信息相关的关键词(即第二关键词集合)。然后计算设备再利用预先设置的知识图谱对关键词进行扩充，其中图4示出了关于知识图谱的一部分的示意图。

例如，计算设备首先根据源图片相关的语言文本信息生成“手机”、“移动电话”等关键词后，然后可以根据图4所示的知识图谱对关键词做出进一步的扩充，从而得到扩充后的关键词(即第一关键词集合)，其例如可以包括“射频电路”、“天线”、“4G”或者“5G”等关键词。其中，图3所示出的知识图谱例如可以是工作人员根据相关知识预先设计的。

从而，本实施例所述的方法，将自然语言处理模型与知识图谱相结合。从而可以利用自然语言处理模型准确地生成与语言文本信息相关的关键词，然后根据知识图谱对该关键词进行扩充。从而能够更加准确而全面地确定与源图片相关联的关键词，并实现准确而全面地搜索。

可选地，利用预先设置的自然语言处理模型，生成与语言文本信息相关的第二关键词集合的操作，包括：利用预先设置的语义分析模型，生成与语言文本信息相关的第一词序列；利用预先设置的序列处理模型，根据第一词序列生成与第二关键词集合对应的第二词序列；以及根据第二词序列生成第二关键词集合。

具体地，计算设备在获取语言文本信息之后，会利用预先设置的语义分析模型生成与该语言文本信息相关的摘要文本信息以及关键词(即第三关键词集合)。

然后计算设备可以基于所生成摘要文本信息和关键词，进一步生成新关键词(即第二关键词集合)。换句话说，计算设备将所生成的摘要文本信息和第三关键词集合看作一个整体，进一步生成能够表征其重点的新关键词(即第二关键词集合)。

具体地，计算设备对于摘要文本信息中各个字词生成相应的词向量，并针对第三关键词集合中的关键词生成词向量，并且计算设备将摘要文本信息的词向量与第三关键词集合的词向量进行组合，生成词向量序列(即第一词序列)。由于第一词序列是将该摘要信息的词向量和第三关键词集合的词向量进行组合而生成的，因此第一词序列能够表征该摘要文本信息和第三关键词集合整体所表述的语义。

然后，计算设备利用预先设置的序列处理模型，将上面所述的词向量序列作为输入序列处理模型，从而序列处理模型输出的词向量序列(即第二词序列)能够用于表征该摘要文本信息和第三关键词集合作为一个整体所表述的语义的重点。因此序列处理模型输出的词向量序列的词向量的数量少于输入的词向量序列的词向量。例如，输入序列处理模型的词向量序列的词向量可能有300个，序列处理模型输出的词向量可能不到30个。但是输出的30个词向量能够表征输入的300个词向量所表征的语义的重点。

然后计算设备根据所输出的词向量序列生成相应的关键词(即第二关键词集合)。其中第二关键词集合中的关键词用于表征该摘要文本信息和第三关键词集合作为一个整体所表述的语义的重点。

其中关于语义分析模型将在后文中进行详细说明。关于序列处理模型，例如可以使用序列到序列(seq2seq)模型根据输入的词向量序列(即第一词序列)输出与第二关键词集合对应的词向量序列，并且输出的词向量序列能够表征输入的词向量序列所表述的语义的重点。

从而，本实施例的方法在针对语言文本信息所生成的关键词的基础上，进一步生成与语言文本信息对应的摘要文本信息，并将摘要文本信息与所生成的关键词结合生成新的关键词。从而通过这种方式，相对于直接针对语言文本信息抽取关键词(即第三关键词集合)的方法，本实施例的方法能够利用摘要文本信息更加有效准确地对关键词进行修正和调整，从而保证了最终生成的关键词(即第二关键词集合)能够更加准确地反映语言文本信息的语义。

可选地，利用预先设置的语义分析模型，生成与语言文本信息相关的摘要文本信息的操作，包括：利用预先设置的句向量模型，针对语言文本信息中的语句生成相应的句向量；根据语句的句向量对语句进行聚类，从而生成与语句相关的多个语句类别；分别从多个语句类别中选择最接近于各个语句类别的质心的语句；以及根据所选择的语句生成与摘要文本信息。

具体地，计算设备在生成与语言文本信息相关的摘要文本信息时，首先利用预先设置的句向量模型，针对语言文本信息中的语句生成相应的句向量。例如，计算设备可以利用Doc2Vec模型，生成与文本信息中的各个语句对应的句向量。

然后，计算设备例如使用K-means聚类算法，根据各个语句的句向量，对语句进行聚类，从而得到与该语言文本信息中的语句对应的k个语句类别。其中，如果将每个语句看作与句向量对应的一个点，那么计算设备可以从k个类别中选择与各个类别的质心距离最近的语句。然后，计算设备根据从各个类别中选择的距离质心最近的语句，生成与语言文本信息相关的摘要信息。

从而，本实施例首先根据语言文本信息生成相关的摘要文本信息，然后再根据摘要文本信息生成相应的词向量序列(即第一词序列中的一部分)。从而，通过这种方式，本申请能够对语言文本信息中的语句进行去重处理。即，本申请通过从各个类别中含义相似的语句中选取最接近质心的语句生成摘要文本信息，排除了含义相同或相似的其他语句。从而减少了后续的序列处理模型所处理的数据量，在提高了后续的序列处理模型处理效率的同时，也避免了序列处理模型处理大量相似的词向量构成的词向量序列，从而也提高了序列处理模型输出的词向量序列的准确性。

可选地，利用预先设置的语义分析模型，生成与语言文本信息相关的第三关键词集合的操作，包括：利用预先设置的主题模型，生成与语言文本信息相关的第三关键词集合。具体地，例如计算设备可以利用预先设置的LDA主题模型，生成与语言文本信息相关的关键词(即第三关键词集合)。从而，通过LDA主题模型，本实施例的方法能够根据语言文本信息的主题，确定语言文本信息的关键词。

可选地，从与源图片相关的信息源获取与源图片相关的语言文本信息的操作，包括：确定与源图片近似的近似图片；以及从与源图片和近似图片相关的信息源获取语言文本信息。

具体地，计算设备在搜索与源图片相关的网页或者网址时，先根据该源图片确定与该源图片近似的近似图片。然后计算设备基于该源图片和近似图片进行搜索，从而从该源图片和近似图片相关的网页或网址(即信息源)获取与该源图片相关的语言文本信息。从而通过这种方式，可以更加全面地进行搜索，从而获取与源图片相关的更全面的语言文本信息，从而有利于更全面地得到最终的搜索结果。

可选地，确定与源图片近似的近似图片的操作，包括：提取源图片的图片特征；根据源图片的图片特征与预先设置的图片集合中的图片的图片特征，确定源图片与图片集合中的各个图片之间的相似度；以及根据源图片与图片集合中的各个图片之间的相似度，确定近似图片。

具体地，计算设备在确定与源图片近似的近似图片时，可以先提取源图片的图片特征。提取源图片的图片特征的方式不限，例如可以利用经过训练的卷积层(例如，卷积神经网络的卷积层)提取源图片的图片特征。

然后，计算设备根据源图片的图片特征以及预设的图片集合中的各个图片的图片特征，确定源图片与图片集合中的各个图片的相似度。例如，该相似度可以是基于源图片的图片特征与各个图片的图片特征所计算的特征距离。

然后，计算设备根据源图片与图片集合中各个图片之间的相似度，确定近似图片。例如，计算设备可以选择源图片与各个图片之间的距离小于预定阈值的图片作为近似图片。

从而通过这种方式，可以基于图片特征确定与源图片近似的近似图片。

下面结合附图5按照流程顺序对本实施例所述的方法进行详细说明。附图5示出了根据本实施例所述的方法的具体流程，参考图5所示：

首先，计算设备获取用户输入的源图片(S502)；

然后，计算设备提取源图片的图片特征，并根据图片特征确定与源图片近似的近似图片(S504)；

然后，计算设备从与源图片以及近似图片相关的信息源(例如网页、网址等)获取相关的语言文本信息(S506)；

然后，计算设备利用预先设置的语义分析模型生成与语言文本信息相关的摘要文本信息以及关键词(即第三关键词集合)(S508)；

然后，计算设备根据摘要文本信息以及关键词生成相应的词序列(即第一词序列)(S510)；

然后，计算设备将生成的词序列输入预先设置的序列处理模型，获取输出的词序列(即第二词序列)，并根据第二词序列生成与语言文本信息相关的关键词(即第二关键词集合)(S512)；

然后，计算设备利用预先设置的知识图谱，对关键词(即第二关键词集合)进行扩充，生成扩充后的关键词(即第一关键词集合)(S514)；以及

最后，计算设备利用扩充后的关键词进行搜索，得到与源图片相关的搜索结果(S516)。

此外，参考图1所示，根据本实施例的第二个方面，提供了一种存储介质。所述存储介质包括存储的程序，其中，在所述程序运行时由处理器执行以上任意一项所述的方法。

从而根据本实施例，在从网页和网址获取与源图片相关的语言文本信息之后，并不是仅仅将该语言文本信息输出给用户，而是继续根据该语言文本信息确定与源图片相关的关键词，然后利用关键词进行搜索，获取与源图片相关的搜索结果。从而通过这种方式，计算设备能够突破源图片相关的信息源的限制，根据从语言文本信息中重新确定的关键词进行进一步的搜索。从而能够全面而准确地搜索与源图片相关的信息，从而解决了现有图片搜索技术中存在的缺少对包含图片的信息源的信息做出进一步的处理，从而不能向用户提供更准确而全面的信息的技术问题。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

图6示出了根据本实施例所述的基于图片的信息搜索装置600，该装置600与根据实施例1的第一个方面所述的方法相对应。参考图6所示，该装置600包括：图片获取模块610，用于获取作为搜索线索的源图片；语言文本信息获取模块620，用于从与源图片相关的信息源获取与源图片相关的语言文本信息；关键词确定模块630，用于根据语言文本信息，确定与源图片相关的第一关键词集合；以及搜索模块640，用于利用第一关键词集合中的关键词进行搜索，获取与源图片相关的搜索结果。

可选地，关键词确定模块630包括：第一关键词生成子模块，用于利用预先设置的自然语言处理模型，生成与语言文本信息相关的第二关键词集合；以及第二关键词生成子模块，用于根据预先设置的知识图谱对第二关键词集合进行扩充，生成第一关键词集合。

可选地，第一关键词生成子模块包括：语义分析单元，用于利用预先设置的语义分析模型，生成与语言文本信息相关的摘要文本信息以及第三关键词集合；第一词序列生成单元，用于生成与摘要文本信息以及第三关键词集合对应的第一词序列；第二词序列生成单元，用于利用预先设置的序列处理模型，根据第一词序列生成与第二关键词集合对应的第二词序列；以及关键词生成单元，用于根据第二词序列生成第二关键词集合。

可选地，语义分析单元括：句向量生成子单元，用于利用预先设置的句向量模型，针对语言文本信息中的语句生成相应的句向量；聚类子单元，用于根据语句的句向量对语句进行聚类，从而生成与语句相关的多个语句类别；语句选择子单元，用于分别从多个语句类别中选择最接近于各个语句类别的质心的语句；以及摘要生成子单元，用于根据所选择的语句生成与摘要文本信息。

可选地，语义分析单元括关键词生成子单元，用于利用预先设置的主题模型，生成与语言文本信息相关的第三关键词集合。

可选地，语言文本信息获取模块620包括：近似图片确定子模块，用于确定与源图片近似的近似图片；以及语言文本信息获取子模块，用于从与源图片和近似图片相关的信息源获取语言文本信息。

可选地，近似图片确定子模块包括：图片特征提取单元，用于提取源图片的图片特征；相似度确定单元，用于根据源图片的图片特征与预先设置的图片集合中的图片的图片特征，确定源图片与图片集合中的各个图片之间的相似度；以及近似图片确定单元，用于根据源图片与图片集合中的各个图片之间的相似度，确定近似图片。

实施例3

图7示出了根据本实施例所述的基于图片的信息搜索装置700，该装置700与根据实施例1的第一个方面所述的方法相对应。参考图7所示，该装置700包括：处理器710；以及存储器720，与所述处理器710连接，用于为所述处理器710提供处理以下处理步骤的指令：获取作为搜索线索的源图片；从与源图片相关的信息源获取与源图片相关的语言文本信息；根据语言文本信息，确定与源图片相关的第一关键词集合；以及利用第一关键词集合中的关键词进行搜索，获取与源图片相关的搜索结果。

可选地，利用预先设置的自然语言处理模型，生成与语言文本信息相关的第二关键词集合的操作，包括：利用预先设置的语义分析模型，生成与语言文本信息相关的摘要文本信息以及第三关键词集合；生成与摘要文本信息以及第三关键词集合对应的第一词序列；利用预先设置的序列处理模型，根据第一词序列生成与第二关键词集合对应的第二词序列；以及根据第二词序列生成第二关键词集合。

可选地，利用预先设置的语义分析模型，生成与语言文本信息相关的第三关键词集合的操作，包括：利用预先设置的主题模型，生成与语言文本信息相关的第三关键词集合。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，RandomAccess Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于图片的信息搜索方法，其特征在于，包括：

获取作为搜索线索的源图片；

从与所述源图片相关的信息源获取与所述源图片相关的语言文本信息；

根据所述语言文本信息，确定与所述源图片相关的第一关键词集合；以及

利用所述第一关键词集合中的关键词进行搜索，获取与所述源图片相关的搜索结果。

2.根据权利要求1所述的方法，其特征在于，根据所述语言文本信息，确定与所述源图片相关的第一关键词集合的操作，包括：

利用预先设置的自然语言处理模型，生成与所述语言文本信息相关的第二关键词集合；以及

根据预先设置的知识图谱对所述第二关键词集合进行扩充，生成所述第一关键词集合。

3.根据权利要求2所述的方法，其特征在于，利用预先设置的自然语言处理模型，生成与语言文本信息相关的第二关键词集合的操作，包括：

利用预先设置的语义分析模型，生成与所述语言文本信息相关的摘要文本信息以及第三关键词集合；

生成与所述摘要文本信息以及所述第三关键词集合对应的第一词序列；

利用预先设置的序列处理模型，根据所述第一词序列生成与所述第二关键词集合对应的第二词序列；以及

根据所述第二词序列生成所述第二关键词集合。

4.关于权利要求3所述的方法，其特征在于，利用预先设置的语义分析模型，生成与所述语言文本信息相关的摘要文本信息的操作，包括：

利用预先设置的句向量模型，针对所述语言文本信息中的语句生成相应的句向量；

根据所述语句的句向量对所述语句进行聚类，从而生成与所述语句相关的多个语句类别；

分别从所述多个语句类别中选择最接近于各个语句类别的质心的语句；以及

根据所选择的语句生成与所述摘要文本信息。

5.关于权利要求3所述的方法，其特征在于，利用预先设置的语义分析模型，生成与所述语言文本信息相关的第三关键词集合的操作，包括：利用预先设置的主题模型，生成与所述语言文本信息相关的第三关键词集合。

6.关于权利要求1所述的方法，其特征在于，从与所述源图片相关的信息源获取与所述源图片相关的语言文本信息的操作，包括：

确定与所述源图片近似的近似图片；以及

从与所述源图片和所述近似图片相关的信息源获取所述语言文本信息。

7.关于权利要求6所述的方法，其特征在于，确定与所述源图片近似的近似图片的操作，包括：

提取所述源图片的图片特征；

根据所述源图片的图片特征与预先设置的图片集合中的图片的图片特征，确定所述源图片与所述图片集合中的各个图片之间的相似度；以及

根据所述源图片与所述图片集合中的各个图片之间的相似度，确定所述近似图片。

8.一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时由处理器执行权利要求1至7中任意一项所述的方法。

9.一种基于图片的信息搜索装置(600)，其特征在于，包括：

图片获取模块(610)，用于获取作为搜索线索的源图片；

语言文本信息获取模块(620)，用于从与所述源图片相关的信息源获取与所述源图片相关的语言文本信息；

关键词确定模块(630)，用于根据所述语言文本信息，确定与所述源图片相关的第一关键词集合；以及

搜索模块(640)，用于利用所述第一关键词集合中的关键词进行搜索，获取与所述源图片相关的搜索结果。

10.一种基于图片的信息搜索装置(700)，其特征在于，包括：

处理器；以及

存储器，与所述处理器连接，用于为所述处理器提供处理以下处理步骤的指令：

获取作为搜索线索的源图片；