CN109522479A - 搜索处理方法及装置 - Google Patents

搜索处理方法及装置 Download PDF

Info

Publication number
CN109522479A
CN109522479A CN201811332817.3A CN201811332817A CN109522479A CN 109522479 A CN109522479 A CN 109522479A CN 201811332817 A CN201811332817 A CN 201811332817A CN 109522479 A CN109522479 A CN 109522479A
Authority
CN
China
Prior art keywords
term vector
search
vector representation
word segmentation
euclidean distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811332817.3A
Other languages
English (en)
Inventor
彭碧海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GD Midea Air Conditioning Equipment Co Ltd
Original Assignee
Guangdong Midea Refrigeration Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Midea Refrigeration Equipment Co Ltd filed Critical Guangdong Midea Refrigeration Equipment Co Ltd
Priority to CN201811332817.3A priority Critical patent/CN109522479A/zh
Publication of CN109522479A publication Critical patent/CN109522479A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种搜索处理方法及装置,该搜索处理方法包括:获取用户输入的搜索问题;根据搜索问题,获取搜索问题对应的第一词向量表示形式;根据第一词向量表示形式和预先存储的多个问答对中的多个问题对应的第二词向量表示形式,在多个问题中确定出与搜索问题匹配的目标问题。本发明的搜索处理方法及装置,解决了现有技术中对搜索问题进行数据库字段匹配而导致的匹配不准确、人工整理工作量大的技术问题,达到了对搜索问题的匹配准确,人工整理工作量小的技术效果。

Description

搜索处理方法及装置
技术领域
本发明涉及搜索领域,尤其涉及一种搜索处理方法及装置。
背景技术
搜索处理方法通常在获取到用户输入的搜索问题后,与数据库中预存的信息进行匹配,然后将匹配到的搜索结果返回给用户。
相关技术中,通常将用户输入的搜索问题进行数据库字段匹配,然后对每个字段加权,将取加权后的匹配到的搜索结果返回给用户。
但本申请发明人发现上述技术至少存在如下技术问题:
技术问题一:对搜索问题进行数据库字段匹配,只能识别到搜索问题中的字段信息,无法准确识别到搜索问题整句的信息,导致匹配结果不准确。
技术问题二:需在数据库中准备大量的字段信息,例如品类、问题种类、问题关键字等,导致人工整理的工作量大。
发明内容
本申请实施例通过提供一种搜索处理方法及装置,解决了现有技术中对搜索问题采用数据库字段匹配方式而导致的匹配不准确,人工整理工作量大的问题,实现了对搜索问题的准确匹配,减小了人工整理的工作量。
本申请第一方面实施例提供了一种搜索处理方法,包括以下步骤:
获取用户输入的搜索问题;
根据所述搜索问题,获取所述搜索问题对应的第一词向量表示形式;
根据所述第一词向量表示形式和预先存储的多个问答对中的多个问题对应的第二词向量表示形式,在所述多个问题中确定出与所述搜索问题匹配的目标问题。
根据本申请的一个实施例,所述根据所述第一词向量表示形式和预先存储的多个问答对中的多个问题对应的第二词向量表示形式,在所述多个问题中确定出与所述搜索问题匹配的目标问题,包括:计算所述第一词向量表示形式和多个所述第二词向量表示形式之间的欧式距离;根据多个所述欧式距离,在所述多个问题中确定出所述目标问题。
根据本申请的一个实施例,所述根据多个所述欧式距离,在所述多个问题中确定出所述目标问题,包括:将所述多个问题中最小的所述欧式距离对应的问题作为所述目标问题。
根据本申请的一个实施例,所述根据多个所述欧式距离,在所述多个问题中确定出所述目标问题,包括:将所述多个问题中最小的所述欧式距离对应的问题作为候选问题;若所述最小的所述欧式距离等于或者小于设定阈值,则将所述候选问题确定为所述目标问题。
根据本申请的一个实施例,所述根据所述搜索问题,获取所述搜索问题对应的第一词向量表示形式,包括:对所述搜索问题进行分词处理,得到多个第一分词结果;获取所述第一分词结果对应的第一词向量;将多个所述第一分词结果对应的多个所述第一词向量相加,得到所述第一词向量表示形式。
根据本申请的一个实施例,该搜索处理方法还包括:对所述多个问题分别进行分词处理,得到多个第二分词结果;获取所述第二分词结果对应的第二词向量;将多个所述第二分词结果对应的多个所述第二词向量相加,得到所述第二词向量表示形式。本申请第二方面实施例提供了一种搜索处理装置,包括:
第一获取模块,用于获取用户输入的搜索问题;
第二获取模块,用于根据所述搜索问题,获取所述搜索问题对应的第一词向量表示形式;
确定模块,用于根据所述第一词向量表示形式和预先存储的多个问答对中的多个问题对应的第二词向量表示形式,在所述多个问题中确定出与所述搜索问题匹配的目标问题。
根据本申请的一个实施例,所述确定模块包括:计算单元,用于计算所述第一词向量表示形式和多个所述第二词向量表示形式之间的欧式距离;确定单元,用于根据多个所述欧式距离,在所述多个问题中确定出所述目标问题。
根据本申请的一个实施例,所述确定单元具体用于:将所述多个问题中最小的所述欧式距离对应的问题作为所述目标问题。
根据本申请的一个实施例,所述确定单元具体用于:将所述多个问题中最小的所述欧式距离对应的问题作为候选问题;若所述最小的所述欧式距离等于或者小于设定阈值,则将所述候选问题确定为所述目标问题。
根据本申请的一个实施例,所述第二获取模块具体用于:对所述搜索问题进行分词处理,得到多个第一分词结果;获取所述第一分词结果对应的第一词向量;将多个所述第一分词结果对应的多个所述第一词向量相加,得到所述第一词向量表示形式。
根据本申请的一个实施例,该搜索处理装置还包括:处理模块,用于对所述多个问题分别进行分词处理,得到多个第二分词结果;获取所述第二分词结果对应的第二词向量;将多个所述第二分词结果对应的多个所述第二词向量相加,得到所述第二词向量表示形式。
本申请第三方面实施例提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本申请第一方面实施例所述的搜索处理方法。
本申请第四方面实施例提供了一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,实现如本申请第一方面实施例所述的搜索处理方法。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
1、由于采用对搜索问题进行词向量表示形式匹配的方式来实现对搜索问题的搜索,所以,有效解决了对搜索问题进行数据库字段匹配而导致的匹配结果不准确的问题,进而实现了对搜索问题的准确匹配。
由于采用对搜索问题进行词向量表示形式匹配的方式来实现对搜索问题的搜索,所以,有效解决了需在数据库中准备大量的字段信息而导致的人工整理的工作量大的问题,进而实现了减小人工整理工作量的优点。
2、通过计算第一词向量表示形式和多个第二词向量表示形式之间的欧式距离,然后依据欧式距离来确定与搜索问题匹配的目标问题,可实现搜索问题与目标问题的准确匹配。
3、将最小欧式距离对应的问题作为目标问题,可准确获取与搜索问题匹配的目标问题。
4、通过最小欧式距离与设定阈值比较的方法来确定目标问题,可准确获取与搜索问题匹配的目标问题。
5、对搜索问题进行分词处理后得到第一分词结果,接着获取第一分词结果对应的第一词向量,然后通过将第一分词结果对应的多个第一词向量相加的方式,得到第一词向量表示形式,可准确、方便的获取搜索问题所对应的词向量表示形式。
6、对预先存储的多个问答对中的多个问题分别进行分词处理得到多个第二分词结果,接着获取第二分词结果对应的第二词向量,然后通过将多个第二分词结果对应的多个第二词向量相加的方式,得到第二词向量表示形式,可准确、方便的获取预先存储的多个问答对中的多个问题的所对应的词向量表示形式。
附图说明
图1是根据本发明一个实施例的搜索处理方法的流程图;
图2是对图1所示实施例中S103步骤的进一步的细化流程图;
图3是根据本发明一个实施例的搜索处理装置的结构图;
图4是根据本发明一个实施例的电子设备的结构图。
具体实施方式
本发明为了解决现有技术中对搜索问题进行数据库字段匹配而导致的匹配不准确、人工整理工作量大的问题,提出了一种搜索处理方法及装置,采用对搜索问题进行词向量表示形式的匹配方式以实现对搜索问题的搜索,实现了对搜索问题的准确匹配,并且,减小了人工整理的工作量。
为了更好的理解上述技术方案,下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例一:
图1是根据本发明一个实施例的搜索处理方法的流程图,如图1所示,该搜索处理方法包括以下步骤:
S101,获取用户输入的搜索问题。
本发明实施例中,获取用户输入的搜索问题,可以是直接获取用户以文字形式输入的搜索问题,也可以是对用户以语音形式输入的搜索问题进行转换,转换为文字形式的搜索问题。
S102,根据搜索问题,获取搜索问题对应的第一词向量表示形式。
本发明实施例中,根据步骤S101获取到的用户的搜索问题,获取搜索问题对应的第一词向量表示形式。
作为一种可行的实施方式,步骤102可具体包括:对搜索问题进行分词处理,得到多个第一分词结果;获取第一分词结果对应的第一词向量;将多个第一分词结果对应的多个第一词向量相加,得到第一词向量表示形式。
具体的,对搜索问题的整句做分词处理,例如可分别使用jieba分词工具的三种分词模式,即精确模式,全模式,搜索引擎模式,对搜索问题的整句进行分词处理,得到搜索问题整句在三种分词模式下的多个分词的词列表,即第一分词结果;分别将列表中的分词完成后得到的多个第一分词结果输入到训练好的词向量模型中,得到多个第一分词结果对应的多个第一词向量,作为一种可行的实施方式,词向量模型可以采用TensorFlow中已经训练好的中文词向量模型;将得到的多个第一分词结果对应的多个第一词向量相加,得到第一词向量表示形式。
S103,根据第一词向量表示形式和预先存储的多个问答对中的多个问题对应的第二词向量表示形式,在多个问题中确定出与搜索问题匹配的目标问题。
本发明实施例中,可在数据库中预先存储多个问答对中的多个问题对应的第二词向量表示形式,数据库中第二词向量表示形式的获取方式可与S102步骤中第一词向量表示形式的获取方式相同,包括:对多个问题分别进行分词处理,得到多个第二分词结果;获取第二分词结果对应的第二词向量;将多个第二分词结果对应的多个第二词向量相加,得到第二词向量表示形式,具体过程此处不再赘述。将第一词向量表示形式与数据库中多个问题对应的第二词向量表示形式进行比对,与第一词向量表示形式相匹配的第二词向量表示形式所对应的问题即与搜索问题匹配的目标问题。
上述本申请实施例中的技术方案,至少具有如下的技术效果或优点:
1、由于采用对搜索问题进行词向量表示形式匹配的方式来实现对搜索问题的搜索,所以,有效解决了对搜索问题进行数据库字段匹配而导致的匹配结果不准确的问题,进而实现了对搜索问题的准确匹配。
由于采用对搜索问题进行词向量表示形式匹配的方式来实现对搜索问题的搜索,所以,有效解决了需在数据库中准备大量的字段信息而导致的人工整理的工作量大的问题,进而实现了减小人工整理工作量的优点。
2、对搜索问题进行分词处理后得到第一分词结果,接着获取第一分词结果对应的第一词向量,然后通过将第一分词结果对应的多个第一词向量相加的方式,得到第一词向量表示形式,可准确、方便的获取搜索问题所对应的词向量表示形式。
3、对预先存储的多个问答对中的多个问题分别进行分词处理得到多个第二分词结果,接着获取第二分词结果对应的第二词向量,然后通过将多个第二分词结果对应的多个第二词向量相加的方式,得到第二词向量表示形式,可准确、方便的获取预先存储的多个问答对中的多个问题的所对应的词向量表示形式。
实施例二:
图2是对图1所示实施例中S103步骤的进一步的细化流程图,如图2所示,图1所示实施例中S103步骤可包括:
S201,计算第一词向量表示形式和多个第二词向量表示形式之间的欧式距离。
本发明实施例中,计算第一词向量表示形式和数据库中多个第二词向量表示形式之间的多个欧式距离。作为一种可行的实施方式,欧式距离的计算可使用Python中的numpy库,第一词向量表示形式与多个第二词向量表示形式之间的多个欧式距离的计算法则为:两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的欧氏距离
S202,根据多个欧式距离,在多个问题中确定出目标问题。
根据步骤S201计算得出的第一词向量表示形式与多个第二词向量表示形式之间的多个欧式距离,在多个问题中确定出目标问题。
作为一种可行的实施方式,可将多个问题中最小的欧式距离对应的问题作为目标问题。
具体的,将步骤S201计算得出的第一词向量表示形式与多个第二词向量表示形式之间的多个欧式距离进行比较,得出多个欧式距离中最小的欧式距离,最小欧式距离对应的第二词向量表示形式所对应的问题即与搜索问题匹配的目标问题。
作为另一种可行的实施方式,将多个问题中最小的欧式距离对应的问题作为候选问题;若最小的欧式距离等于或者小于设定阈值,则将候选问题确定为目标问题。
具体的,可预先设置设定阈值。将步骤S201计算得出的第一词向量表示形式与多个第二词向量表示形式之间的多个欧式距离进行比较,得出多个欧式距离中最小的欧式距离,将最小欧式距离对应的第二词向量表示形式所对应的问题作为候选问题,将最小的欧式距离与设定阈值进行比较,如果最小的欧式距离等于或者小于设定阈值,则候选问题即与搜索问题匹配的目标问题。
上述本申请实施例中的技术方案,至少具有如下的技术效果或优点:
1、通过计算第一词向量表示形式和多个第二词向量表示形式之间的欧式距离,然后依据欧式距离来确定与搜索问题匹配的目标问题,可实现搜索问题与目标问题的准确匹配。
2、将最小欧式距离对应的问题作为目标问题,可准确获取与搜索问题匹配的目标问题。
3、通过最小欧式距离与设定阈值比较的方法来确定目标问题,可准确获取与搜索问题匹配的目标问题。
基于同一发明构思,本发明实施例还提供了实施例一和二中方法对应的装置,见实施例三。
实施例三:
图3是根据本发明一个实施例的搜索处理装置的结构图。如图3所示,该搜索处理装置包括:
第一获取模块21,用于获取用户输入的搜索问题;
第二获取模块22,用于根据搜索问题,获取搜索问题对应的第一词向量表示形式;
确定模块23,用于根据第一词向量表示形式和预先存储的多个问答对中的多个问题对应的第二词向量表示形式,在多个问题中确定出与搜索问题匹配的目标问题。
进一步的,在本发明实施例一种可能的实现方式中,确定模块23包括:计算单元,用于计算第一词向量表示形式和多个第二词向量表示形式之间的欧式距离;确定单元,用于根据多个欧式距离,在多个问题中确定出目标问题。
进一步的,在本发明实施例一种可能的实现方式中,确定单元具体用于:将多个问题中最小的欧式距离对应的问题作为目标问题。
进一步的,在本发明实施例一种可能的实现方式中,确定单元具体用于:将多个问题中最小的欧式距离对应的问题作为候选问题;若最小的欧式距离等于或者小于设定阈值,则将候选问题确定为目标问题。
进一步的,在本发明实施例一种可能的实现方式中,第二获取模块22具体用于:对搜索问题进行分词处理,得到多个第一分词结果;获取第一分词结果对应的第一词向量;将多个分词结果对应的多个第一词向量相加,得到第一词向量表示形式。
进一步的,在本发明实施例一种可能的实现方式中,该搜索处理装置还包括:处理模块,用于对多个问题分别进行分词处理,得到多个第二分词结果;获取第二分词结果对应的第二词向量;将多个第二分词结果对应的多个第二词向量相加,得到第二词向量表示形式。
由于本发明实施例三所介绍的装置,为实施本发明实施例一和二的方法所采用的装置,故而基于本发明实施例一和二所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例一和二的方法所采用的装置都属于本发明所欲保护的范围。
上述本申请实施例中的技术方案,至少具有如下的技术效果或优点:
1、由于采用对搜索问题进行词向量表示形式匹配的方式来实现对搜索问题的搜索,所以,有效解决了对搜索问题进行数据库字段匹配而导致的匹配结果不准确的问题,进而实现了对搜索问题的准确匹配。
由于采用对搜索问题进行词向量表示形式匹配的方式来实现对搜索问题的搜索,所以,有效解决了需在数据库中准备大量的字段信息而导致的人工整理的工作量大的问题,进而实现了减小人工整理工作量的优点。
2、通过计算第一词向量表示形式和多个第二词向量表示形式之间的欧式距离,然后依据欧式距离来确定与搜索问题匹配的目标问题,可实现搜索问题与目标问题的准确匹配。
3、将最小欧式距离对应的问题作为目标问题,可准确获取与搜索问题匹配的目标问题。
4、通过最小欧式距离与设定阈值比较的方法来确定目标问题,可准确获取与搜索问题匹配的目标问题。
5、对搜索问题进行分词处理后得到第一分词结果,接着获取第一分词结果对应的第一词向量,然后通过将第一分词结果对应的多个第一词向量相加的方式,得到第一词向量表示形式,可准确、方便的获取搜索问题所对应的词向量表示形式。
6、对预先存储的多个问答对中的多个问题分别进行分词处理得到多个第二分词结果,接着获取第二分词结果对应的第二词向量,然后通过将多个第二分词结果对应的多个第二词向量相加的方式,得到第二词向量表示形式,可准确、方便的获取预先存储的多个问答对中的多个问题的所对应的词向量表示形式。
基于同一发明构思,本发明实施例还提供了实施例一和二中方法对应的电子设备,见
实施例四。
实施例四:
图4是根据本发明一个实施例的电子设备的结构图。如图4所示,该电子设备50,包括:存储器51、处理器52及存储在存储器51上并可在处理器上运行的计算机程序,处理器52执行程序时,以实现如上述实施例所示的搜索处理方法。
基于同一发明构思,本发明实施例还提供了实施例一和二中方法对应的非临时性计算机可读存储介质,见实施例五。
实施例五:
该非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如上述实施例所示的搜索处理方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种搜索处理方法,其特征在于,包括以下步骤:
获取用户输入的搜索问题;
根据所述搜索问题,获取所述搜索问题对应的第一词向量表示形式;
根据所述第一词向量表示形式和预先存储的多个问答对中的多个问题对应的第二词向量表示形式,在所述多个问题中确定出与所述搜索问题匹配的目标问题。
2.根据权利要求1所述的搜索处理方法,其特征在于,所述根据所述第一词向量表示形式和预先存储的多个问答对中的多个问题对应的第二词向量表示形式,在所述多个问题中确定出与所述搜索问题匹配的目标问题,包括:
计算所述第一词向量表示形式和多个所述第二词向量表示形式之间的欧式距离;
根据多个所述欧式距离,在所述多个问题中确定出所述目标问题。
3.根据权利要求2所述的控制方法,其特征在于,所述根据多个所述欧式距离,在所述多个问题中确定出所述目标问题,包括:
将所述多个问题中最小的所述欧式距离对应的问题作为所述目标问题。
4.根据权利要求2所述的控制方法,其特征在于,所述根据多个所述欧式距离,在所述多个问题中确定出所述目标问题,包括:
将所述多个问题中最小的所述欧式距离对应的问题作为候选问题;
若所述最小的所述欧式距离等于或者小于设定阈值,则将所述候选问题确定为所述目标问题。
5.根据权利要求1所述的控制方法,其特征在于,所述根据所述搜索问题,获取所述搜索问题对应的第一词向量表示形式,包括:
对所述搜索问题进行分词处理,得到多个第一分词结果;
获取所述第一分词结果对应的第一词向量;
将多个所述第一分词结果对应的多个所述第一词向量相加,得到所述第一词向量表示形式。
6.根据权利要求1所述的搜索处理方法,其特征在于,还包括:
对所述多个问题分别进行分词处理,得到多个第二分词结果;
获取所述第二分词结果对应的第二词向量;
将多个所述第二分词结果对应的多个所述第二词向量相加,得到所述第二词向量表示形式。
7.一种搜索处理装置,其特征在于,包括:
第一获取模块,用于获取用户输入的搜索问题;
第二获取模块,用于根据所述搜索问题,获取所述搜索问题对应的第一词向量表示形式;
确定模块,用于根据所述第一词向量表示形式和预先存储的多个问答对中的多个问题对应的第二词向量表示形式,在所述多个问题中确定出与所述搜索问题匹配的目标问题。
8.根据权利要求7所述的搜索处理装置,其特征在于,所述确定模块包括:
计算单元,用于计算所述第一词向量表示形式和多个所述第二词向量表示形式之间的欧式距离;
确定单元,用于根据多个所述欧式距离,在所述多个问题中确定出所述目标问题。
9.根据权利要求8所述的搜索处理装置,其特征在于,所述确定单元具体用于:
将所述多个问题中最小的所述欧式距离对应的问题作为所述目标问题。
10.根据权利要求8所述的搜索处理装置,其特征在于,所述确定单元具体用于:
将所述多个问题中最小的所述欧式距离对应的问题作为候选问题;
若所述最小的所述欧式距离等于或者小于设定阈值,则将所述候选问题确定为所述目标问题。
11.根据权利要求7所述的搜索处理装置,其特征在于,所述第二获取模块具体用于:
对所述搜索问题进行分词处理,得到多个第一分词结果;
获取所述第一分词结果对应的第一词向量;
将多个所述第一分词结果对应的多个所述第一词向量相加,得到所述第一词向量表示形式。
12.根据权利要求7所述的搜索处理装置,其特征在于,还包括:
处理模块,用于对所述多个问题分别进行分词处理,得到多个第二分词结果;获取所述第二分词结果对应的第二词向量;将多个所述第二分词结果对应的多个所述第二词向量相加,得到所述第二词向量表示形式。
13.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-6任一项所述的搜索处理方法。
14.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,实现如权利要求1-6任一项所述的搜索处理方法。
CN201811332817.3A 2018-11-09 2018-11-09 搜索处理方法及装置 Pending CN109522479A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811332817.3A CN109522479A (zh) 2018-11-09 2018-11-09 搜索处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811332817.3A CN109522479A (zh) 2018-11-09 2018-11-09 搜索处理方法及装置

Publications (1)

Publication Number Publication Date
CN109522479A true CN109522479A (zh) 2019-03-26

Family

ID=65773724

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811332817.3A Pending CN109522479A (zh) 2018-11-09 2018-11-09 搜索处理方法及装置

Country Status (1)

Country Link
CN (1) CN109522479A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899188A (zh) * 2015-03-11 2015-09-09 浙江大学 一种基于问题主题和焦点的问题相似度计算方法
CN105302882A (zh) * 2015-10-14 2016-02-03 东软集团股份有限公司 获取关键词的方法及装置
CN106610950A (zh) * 2016-09-29 2017-05-03 四川用联信息技术有限公司 一种改进的文本相似度求解方法
CN108536708A (zh) * 2017-03-03 2018-09-14 腾讯科技(深圳)有限公司 一种自动问答处理方法及自动问答***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899188A (zh) * 2015-03-11 2015-09-09 浙江大学 一种基于问题主题和焦点的问题相似度计算方法
CN105302882A (zh) * 2015-10-14 2016-02-03 东软集团股份有限公司 获取关键词的方法及装置
CN106610950A (zh) * 2016-09-29 2017-05-03 四川用联信息技术有限公司 一种改进的文本相似度求解方法
CN108536708A (zh) * 2017-03-03 2018-09-14 腾讯科技(深圳)有限公司 一种自动问答处理方法及自动问答***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李安: "《语料库语言学及Python实现》", 31 August 2018, 山东大学出版社 *

Similar Documents

Publication Publication Date Title
CN107291783B (zh) 一种语义匹配方法及智能设备
CN111382255B (zh) 用于问答处理的方法、装置、设备和介质
CN111738016A (zh) 多意图识别方法及相关设备
CN110263133B (zh) 基于知识图谱的问答方法、电子装置、设备及存储介质
CN110489424A (zh) 一种表格化信息提取的方法、装置、存储介质及电子设备
CN110874528B (zh) 文本相似度的获取方法及装置
CN109857873A (zh) 推荐实体的方法和装置、电子设备、计算机可读介质
CN109272003A (zh) 一种消除深度学习模型中未知错误的方法与装置
CN106919551A (zh) 一种情感词极性的分析方法、装置及设备
CN109766550A (zh) 一种文本品牌识别方法、识别装置和存储介质
CN109189892A (zh) 一种基于文章评论的推荐方法及装置
CN110399488A (zh) 文本分类方法及装置
CN112420125A (zh) 分子属性预测方法、装置、智能设备和终端
CN113220854B (zh) 机器阅读理解的智能对话方法及装置
Osborn et al. Evaluating play trace (dis) similarity metrics
CN113705792A (zh) 基于深度学习模型的个性化推荐方法、装置、设备及介质
CN112632254A (zh) 对话状态确定方法、终端设备及存储介质
Jagadamba Online subjective answer verifying system using artificial intelligence
CN106598935B (zh) 一种确定文档情感倾向性的方法及装置
CN109522479A (zh) 搜索处理方法及装置
CN113704452B (zh) 基于Bert模型的数据推荐方法、装置、设备及介质
CN113420545B (zh) 摘要生成方法、装置、设备及存储介质
CN114065741A (zh) 用于验证表述的真实性的方法、设备、装置和介质
CN114490926A (zh) 一种相似问题的确定方法、装置、存储介质及终端
CN112541557A (zh) 生成式对抗网络的训练方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190326