CN111177521A - 一种查询词分类模型的确定方法和装置 - Google Patents

一种查询词分类模型的确定方法和装置 Download PDF

Info

Publication number
CN111177521A
CN111177521A CN201811243106.9A CN201811243106A CN111177521A CN 111177521 A CN111177521 A CN 111177521A CN 201811243106 A CN201811243106 A CN 201811243106A CN 111177521 A CN111177521 A CN 111177521A
Authority
CN
China
Prior art keywords
type
query
image
classification model
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811243106.9A
Other languages
English (en)
Inventor
孙玉玺
丁文彪
周泽南
苏雪峰
商磊
马龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201811243106.9A priority Critical patent/CN111177521A/zh
Publication of CN111177521A publication Critical patent/CN111177521A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种查询词分类模型的确定方法和装置,通过图像分类模型对历史查询结果中的图像进行识别,如果一个历史查询结果中包括了目标类型的图像,那么确定这个历史查询结果对应的历史查询词的类型为该目标类型。可以将识别出的该目标类型的历史查询词训练查询词分类模型,从而该查询词分类模型可以实现识别查询词的类型是否为目标类型的功能。当需要确定查询词的类型是否为目标类型时,不再需要人工标注,直接通过该查询词分类模型即可实现,提高了查询词类型的识别效率。

Description

一种查询词分类模型的确定方法和装置
技术领域
本申请涉及数据处理领域,特别是涉及一种查询词分类模型的确定方法和装置。
背景技术
用户通过搜索引擎输入查询词,可以获得与该查询词相关的查询结果。
搜索引擎如果能够确定查询词的类型或者说查询词对应的查询意图,可以基于查询词类型有针对性的进行搜索,从而提高搜索效率以及搜索准确性。目前针对查询词类型的识别主要是通过人工识别、标注的方式,为查询词手动标注上人工识别出的类型标签。
这种方式效率很低,远远跟不上用户所使用查询词的更新速度,难以适用于当前的网络搜索需求。
发明内容
为了解决上述技术问题,本申请提供了一种查询词分类模型的确定方法和装置,直接通过该查询词分类模型即可实现,提高了查询词类型的识别效率。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种查询词分类模型的确定方法,所述方法包括:
根据图像分类模型识别历史查询词所对应历史查询结果中是否包括目标类型的图像;
将包括所述目标类型的图像的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词;
根据所述目标类型的历史查询词训练查询词分类模型,所述查询词分类模型用于识别查询词的类型是否为所述目标类型。
可选的,所述方法还包括:
获取所述目标类型的图像集合;
根据所述图像集合训练所述图像分类模型,所述图像分类模型用于识别图像的类型是否为所述目标类型。
可选的,所述方法还包括:
根据所述查询词分类模型识别待识别查询词的类型是否为所述目标类型;
若是,根据所述图像分类模型识别所述待识别查询词所对应目标查询结果中图像的类型。
可选的,若所述目标类型为敏感类型,所述根据所述图像分类模型识别所述待识别查询词所对应目标查询结果中图像的类型,包括:
若识别所述目标查询结果中包括所述敏感类型的图像,取消对所述目标查询结果中所述敏感类型的图像的展示。
可选的,所述方法还包括:
根据所述待识别查询词的敏感类型对应的敏感等级,确定所述图像分类模型识别敏感类型时所采用的确定条件。
可选的,所述将包括所述目标类型的图像的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词,包括:
将包括所述目标类型的图像、且所述目标类型的图像所占比例满足预定条件的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词。
第二方面,本申请实施例提供了一种查询词分类模型的确定装置,所述装置包括第一识别单元、类型确定单元和第一训练单元:
所述第一识别单元,用于根据图像分类模型识别历史查询词所对应历史查询结果中是否包括目标类型的图像;
所述类型确定单元,用于将包括所述目标类型的图像的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词;
所述第一训练单元,用于根据所述目标类型的历史查询词训练查询词分类模型,所述查询词分类模型用于识别查询词的类型是否为所述目标类型。
可选的,所述装置还包括获取单元和第二训练单元:
所述获取单元,用于获取所述目标类型的图像集合;
所述第二训练单元,用于根据所述图像集合训练所述图像分类模型,所述图像分类模型用于识别图像的类型是否为所述目标类型。
可选的,所述装置还包括第二识别单元和第三识别单元:
所述第二识别单元,用于根据所述查询词分类模型识别待识别查询词的类型是否为所述目标类型;若识别结果为是,触发第三识别单元;
所述第三识别单元,用于根据所述图像分类模型识别所述待识别查询词所对应目标查询结果中图像的类型。
可选的,若所述目标类型为敏感类型,所述第三识别单元还用于若识别所述目标查询结果中包括所述敏感类型的图像,取消对所述目标查询结果中所述敏感类型的图像的展示。
可选的,所述装置还包括条件确定单元:
所述条件确定单元,用于根据所述待识别查询词的敏感类型对应的敏感等级,确定所述图像分类模型识别敏感类型时所采用的确定条件。
可选的,所述类型确定单元还用于将包括所述目标类型的图像、且所述目标类型的图像所占比例满足预定条件的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词。
第三方面,本申请实施例提供了一种查询词分类模型的确定设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
根据图像分类模型识别历史查询词所对应历史查询结果中是否包括目标类型的图像;
将包括所述目标类型的图像的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词;
根据所述目标类型的历史查询词训练查询词分类模型,所述查询词分类模型用于识别查询词的类型是否为所述目标类型。
第四方面,本申请实施例提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如第一方面任意一项或多项所述查询词分类模型的确定方法。
由上述技术方案可以看出,通过图像分类模型对历史查询结果中的图像进行识别,如果一个历史查询结果中包括了目标类型的图像,那么确定这个历史查询结果对应的历史查询词的类型为该目标类型。可以将识别出的该目标类型的历史查询词训练查询词分类模型,从而该查询词分类模型可以实现识别查询词的类型是否为目标类型的功能。当需要确定查询词的类型是否为目标类型时,不再需要人工标注,直接通过该查询词分类模型即可实现,提高了查询词类型的识别效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种查询词分类模型确定方法的方法流程图;
图2为本申请实施例提供的一种查询词分类模型确定装置的装置结构图;
图3为本申请实施例提供的一种查询词分类模型确定设备的结构图;
图4为本申请实施例提供的一种服务器的结构图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
由于通过人工识别、标注查询词类型的方式效率很低,远远跟不上用户所使用查询词的更新速度,难以适用于当前的网络搜索需求。
为此,本申请实施例提供了一种查询词分类模型的确定方法,该方法可以应用于具有图像、数据处理能力的电子设备中,例如该电子设备可以为个人计算机、服务器等。
在本申请实施例中,通过图像分类模型对历史查询结果中的图像进行识别,该图像分类模型主要用于识别图像的类型是否为目标类型,如果一个历史查询结果中包括了目标类型的图像,那么确定这个历史查询结果对应的历史查询词的类型为该目标类型。其中,该图像分类模型可以保存在前述电子设备本地,或者,该图像分类模型也可以保存在该电子设备能够调用到的网络位置或其他设备中。
在通过图像的类型识别出目标类型的历史查询词后,可以根据该历史查询词训练查询词分类模型,从而该查询词分类模型可以实现识别查询词的类型是否为目标类型的功能。当需要确定查询词的类型是否为目标类型时,不再需要人工标注,直接通过该查询词分类模型即可实现,提高了查询词类型的识别效率。
接下来结合附图介绍本申请实施例所提供的方案。图1为本申请实施例提供的一种查询词分类模型确定方法的方法流程图,所述方法包括:
S101:根据图像分类模型识别历史查询词所对应历史查询结果中是否包括所述目标类型的图像。
这里的历史查询词可以为某个用户或多个用户通过搜索引擎查询时所采用的查询词,历史查询词的数量一般为多个,一个历史查询词可以包括一个词,例如“汽车”,也可以包括多个词,例如“汽车黑色三厢”。历史查询结果可以为用户通过历史查询词查询得到的查询结果,一个历史查询词对应一个历史查询结果。历史查询结果中除了包括图像,还可以包括其他数据内容。
在任一个历史查询结果中,可以至少包括一张图像,通过图像分类模型可以识别历史查询结果中所包括的图像是否具有目标类型的。
在本申请实施例中,图像的类型可以体现出图像所展示内容的类型,例如一张展示有汽车的图像的类型可以为汽车类型,一张展示有敏感内容的图像的类型可以为敏感类型。
类型可以预先划分得到,划分粒度可以根据实际需求调整。在本申请实施例中的目标类型可以为某一种需要被识别出的类型。
当图像通过图像分类模型后,可以得到图像是否为目标类型的可能性,该可能性可以通过概率或百分数等不同形式体现。接下来可以通过预设条件确定该图像是否为目标类型,该预设条件可以是一个较高的概率,具体可以根据不同的场景需求而定。
例如预设条件为大于50%时,若一个图像通过图像分类模型识别是目标类型的概率为30%,那么可以确定该图像的类型不是目标类型;若一个图像通过图像分类模型识别是目标类型的概率为60%,那么可以确定该图像的类型是目标类型。
需要注意的是,该图像分类模型可以通过目标类型的图像集合进行训练得到。
目标类型的图像集合中包括了多个目标类型的图像。图像集合中的图像可以通过预先分类得到,也可以通过爬取特定类型网站得到。例如当目标类型为汽车类型时,可以通过爬取汽车论坛、车辆网站等获得图像,由于汽车论坛、车辆网站这些特定类型网站中所提供的图像多为汽车类型的图像,故通过爬取得到的图像会有很大比例属于汽车类型的图像。
在获取目标类型的图像集合后,可以根据该图像集合训练图像分类模型。故通过训练得到的图像分类模型能够识别图像的类型是否为所述目标类型。在训练过程中,可以采用目标类型的图像和非目标类型的图像进行训练,以提高图像分类模型的识别精度。
S102:将包括所述目标类型的图像的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词。
当一个历史查询结果中包括目标类型的图像时,可以认为该历史查询结果所对应历史查询词的类型可以为该目标类型。
查询词的类型可以体现出用户的查询意图,该查询意图与查询结果中可能出现哪些类型的图像有着直接的关联。例如当一个查询词的类型为汽车类型时,通过该查询词得到的查询结果中,会有很高的几率出现汽车类型的图像,或者图像中汽车类型图像的比例较高。
故当在历史查询结果中识别出目标类型的图像时,可以认为该历史查询结果对应的历史查询词的类型可以为目标类型。
由于搜索引擎在根据查询词进行查询时,获取的图像中有可能会存在一些不太符合查询词实际查询需求的图像。故为了提高准确性,还可以在历史查询结果中包括目标类型的图像,且目标类型的图像所占比例满足预定条件的情况下,确定该历史查询结果对应的历史查询词为目标类型。该预定条件可以是预先设定的比例值或者数量值,例如40%或者50个等。由此,当确定出一个目标类型的历史查询词,该历史查询词的实际查询需求符合目标类型的可能性更高。
S103:根据所述目标类型的历史查询词训练查询词分类模型。
由于查询词分类模型是根据S102所确定出的历史查询词训练的,这些历史查询词均为目标类型,故通过这些历史查询词训练得到的查询词分类模型能够识别查询词的类型是否为所述目标类型。在训练过程中,可以采用目标类型的历史查询词和非目标类型的历史查询词进行训练,以提高查询词分类模型的识别精度。
可见,通过图像分类模型对历史查询结果中的图像进行识别,如果一个历史查询结果中包括了目标类型的图像,那么确定这个历史查询结果对应的历史查询词的类型为该目标类型。可以将识别出的该目标类型的历史查询词训练查询词分类模型,从而该查询词分类模型可以实现识别查询词的类型是否为目标类型的功能。当需要确定查询词的类型是否为目标类型时,不再需要人工标注,直接通过该查询词分类模型即可实现,提高了查询词类型的识别效率。
上述实施例中主要介绍了查询词分类模型的确定方式,包括如何获取训练用数据和训练模型的过程。接下来,将在图1所对应实施例的基础上,针对查询分类模型的具体应用进行介绍。
当搜索引擎获取用户当前输入的查询词时,搜索引擎可以通过S103获得的查询词分类模型对当前查询词进行识别,以确定是当前查询词是否为目标类型。这里所述的搜索引擎可以配置于用户所使用的终端中,也可以配置于用户所使用终端具有数据连接的服务器中。
接下来以待识别查询词作为当前查询词为例介绍针对查询分类模型的具体应用。
需要说明的是,待识别查询词可以包括一个词也可以包括多个词,例如当用户当前输入查询词“飞机”进行查询时,可以将“飞机”作为待识别查询词;当用户当前输入查询词“飞机推进器”进行查询时,可以将“飞机推进器”作为待识别查询词。
当获取到用户当前输入的待识别查询词时,可以通过查询词分类模型对该待识别查询词的类型进行识别,以确定待识别查询词是否为目标类型。
当待识别查询词通过查询词分类模型后,可以得到待识别查询词是否为目标类型的可能性,该可能性可以通过概率或百分数等不同形式体现。接下来可以通过预设条件确定待识别查询词是否为目标类型,该预设条件可以是一个较高的概率,具体可以根据不同的场景需求而定。
例如预设条件为大于50%时,若待识别查询词通过查询词分类模型识别是目标类型的概率为30%,那么可以确定待识别查询词的类型不是目标类型;若待识别查询词通过查询词分类模型识别是目标类型的概率为60%,那么可以确定待识别查询词的类型是目标类型。
若识别出待识别查询词为目标类型,相当于确定了用户输入该待识别查询词的查询需求和目的。搜索引擎可以基于用户的查询需求和目的进一步优化待识别查询词对应的目标查询结果。具体的,可以根据图像分类模型识别待识别查询词所对应目标查询结果中图像的类型。其中,图像分类模型可以是S101中所使用的。
由于目标查询结果中包括有图像,故在将目标查询结果展示给用户之前,可以通过图像分类模型识别目标查询结果中图像的类型,以便确定出其中具体为目标类型的图像,从而可以在向用户展示目标查询结果时,可以取消展示不是目标类型的图像,或者也可以取消展示目标类型的图像。
例如当目标类型为汽车类型时,通过图像分类模型可以从目标查询结果中识别出汽车类型的图像,在向用户展示目标查询结果时,可以取消展示非汽车类型的图像,以希望所展示的图像能够更符合用户的查询需求、目的。
目标类型还可以为敏感类型,该敏感类型可以为色情、赌博、反动等。符合这种类型的查询需求需要予以控制,避免不良信息的扩散。故当目标类型为敏感类型时,搜索引擎可以通过图像分类模型识别出目标查询结果中敏感类型的图像,在向用户展示目标查询结果时,可以取消展示敏感类型的图像,仅展示非敏感类型的图像,以希望所展示的图像能够避免用户受到不良信息的影响。
在一些应用场景中,除了能够确定待识别查询词的类型是否为敏感类型,还可以确定待识别查询词的敏感类型对应的敏感等级。敏感等级可以标识待识别查询词所能体现的敏感程度。待识别查询词的敏感等级可以根据待识别查询词通过查询词分类模型得到的敏感类型概率确定,也可以通过其他方式确定。
当待识别查询词虽然是敏感类型,但是敏感等级不高时,在过滤目标查询结果中的图像时,可以放宽过滤标准,将目标查询结果中一些不那么敏感但是也符合用户查询需求的图像展示给用户,以满足用户的查询需求。
故此,本申请实施例中可以根据待识别查询词的敏感类型对应的敏感等级,确定图像分类模型识别敏感类型时所采用的确定条件。例如针对较低的敏感等级,图像分类模型识别敏感类型时所采用的确定条件可以较松,针对较高的敏感等级,图像分类模型识别敏感类型时所采用的确定条件可以较严。从而在不同的敏感等级下,同一个图像被图像分类模型识别为敏感类型的结果可以不同。例如,针对较低敏感等级的待识别查询词,图像分类模型将敏感类型概率较高的图像识别为敏感类型,而敏感类型概率较低的图像将不会被识别为敏感类型。针对较高敏感等级的待识别查询词,图像分类模型不仅会将敏感类型概率较高的图像识别为敏感类型,而且敏感类型概率较低的图像也将被识别为敏感类型。
图2是本申请实施例提供的一种查询词分类模型的确定装置的装置结构图,所述装置包括第一识别单元201、类型确定单元202和第一训练单元203:
所述第一识别单元201,用于根据图像分类模型识别历史查询词所对应历史查询结果中是否包括目标类型的图像;
所述类型确定单元202,用于将包括所述目标类型的图像的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词;
所述第一训练单元203,用于根据所述目标类型的历史查询词训练查询词分类模型,所述查询词分类模型用于识别查询词的类型是否为所述目标类型。
可选的,所述装置还包括获取单元和第二训练单元:
所述获取单元,用于获取所述目标类型的图像集合;
所述第二训练单元,用于根据所述图像集合训练所述图像分类模型,所述图像分类模型用于识别图像的类型是否为所述目标类型。
可选的,所述装置还包括第二识别单元和第三识别单元:
所述第二识别单元,用于根据所述查询词分类模型识别待识别查询词的类型是否为所述目标类型;若识别结果为是,触发第三识别单元;
所述第三识别单元,用于根据所述图像分类模型识别所述待识别查询词所对应目标查询结果中图像的类型。
可选的,若所述目标类型为敏感类型,所述第三识别单元还用于若识别所述目标查询结果中包括所述敏感类型的图像,取消对所述目标查询结果中所述敏感类型的图像的展示。
可选的,所述装置还包括条件确定单元:
所述条件确定单元,用于根据所述待识别查询词的敏感类型对应的敏感等级,确定所述图像分类模型识别敏感类型时所采用的确定条件。
可选的,所述类型确定单元还用于将包括所述目标类型的图像、且所述目标类型的图像所占比例满足预定条件的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词。
故此,本申请实施例中可以根据待识别查询词的敏感类型对应的敏感等级,确定图像分类模型识别敏感类型时所采用的确定条件。例如针对较低的敏感等级,图像分类模型识别敏感类型时所采用的确定条件可以较松,针对较高的敏感等级,图像分类模型识别敏感类型时所采用的确定条件可以较严。从而在不同的敏感等级下,同一个图像被图像分类模型识别为敏感类型的结果可以不同。例如,针对较低敏感等级的待识别查询词,图像分类模型将敏感类型概率较高的图像识别为敏感类型,而敏感类型概率较低的图像将不会被识别为敏感类型。针对较高敏感等级的待识别查询词,图像分类模型不仅会将敏感类型概率较高的图像识别为敏感类型,而且敏感类型概率较低的图像也将被识别为敏感类型。
图3是根据一示例性实施例示出的一种查询词分类模型的确定装置300的框图。例如,装置300可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图3,装置300可以包括以下一个或多个组件:处理组件302,存储器304,电源组件306,多媒体组件308,音频组件310,输入/输出(I/O)的接口312,传感器组件314,以及通信组件316。
处理组件302通常控制装置300的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件302可以包括一个或多个处理器320来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件302可以包括一个或多个模块,便于处理组件302和其他组件之间的交互。例如,处理部件302可以包括多媒体模块,以方便多媒体组件308和处理组件302之间的交互。
存储器304被配置为存储各种类型的数据以支持在设备300的操作。这些数据的示例包括用于在装置300上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件306为装置300的各种组件提供电力。电源组件306可以包括电源管理***,一个或多个电源,及其他与为装置300生成、管理和分配电力相关联的组件。
多媒体组件308包括在所述装置300和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件308包括一个前置摄像头和/或后置摄像头。当设备300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件310被配置为输出和/或输入音频信号。例如,音频组件310包括一个麦克风(MIC),当装置300处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器304或经由通信组件316发送。在一些实施例中,音频组件310还包括一个扬声器,用于输出音频信号。
I/O接口312为处理组件302和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件314包括一个或多个传感器,用于为装置300提供各个方面的状态评估。例如,传感器组件314可以检测到设备300的打开/关闭状态,组件的相对定位,例如所述组件为装置300的显示器和小键盘,传感器组件314还可以检测装置300或装置300一个组件的位置改变,用户与装置300接触的存在或不存在,装置300方位或加速/减速和装置300的温度变化。传感器组件314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件314还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件314还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件316被配置为便于装置300和其他设备之间有线或无线方式的通信。装置300可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件316经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件316还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
图4是本发明实施例中服务器的结构示意图。该服务器400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(central processing units,CPU)422(例如,一个或一个以上处理器)和存储器432,一个或一个以上存储应用程序442或数据444的存储介质430(例如一个或一个以上海量存储设备)。其中,存储器432和存储介质430可以是短暂存储或持久存储。存储在存储介质430的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器422可以设置为与存储介质430通信,在服务器400上执行存储介质430中的一系列指令操作。
服务器400还可以包括一个或一个以上电源426,一个或一个以上有线或无线网络接口450,一个或一个以上输入输出接口458,一个或一个以上键盘456,和/或,一个或一个以上操作***441,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器304,上述指令可由装置300的处理器320执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种查询词分类模型的确定方法,所述方法包括:
根据图像分类模型识别历史查询词所对应历史查询结果中是否包括目标类型的图像;
将包括所述目标类型的图像的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词;
根据所述目标类型的历史查询词训练查询词分类模型,所述查询词分类模型用于识别查询词的类型是否为所述目标类型。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:read-only memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及***实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及***实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种查询词分类模型的确定方法,其特征在于,所述方法包括:
根据图像分类模型识别历史查询词所对应历史查询结果中是否包括目标类型的图像;
将包括所述目标类型的图像的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词;
根据所述目标类型的历史查询词训练查询词分类模型,所述查询词分类模型用于识别查询词的类型是否为所述目标类型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标类型的图像集合;
根据所述图像集合训练所述图像分类模型,所述图像分类模型用于识别图像的类型是否为所述目标类型。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
根据所述查询词分类模型识别待识别查询词的类型是否为所述目标类型;
若是,根据所述图像分类模型识别所述待识别查询词所对应目标查询结果中图像的类型。
4.根据权利要求3所述的方法,其特征在于,若所述目标类型为敏感类型,所述根据所述图像分类模型识别所述待识别查询词所对应目标查询结果中图像的类型,包括:
若识别所述目标查询结果中包括所述敏感类型的图像,取消对所述目标查询结果中所述敏感类型的图像的展示。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
根据所述待识别查询词的敏感类型对应的敏感等级,确定所述图像分类模型识别敏感类型时所采用的确定条件。
6.根据权利要求1所述的方法,其特征在于,所述将包括所述目标类型的图像的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词,包括:
将包括所述目标类型的图像、且所述目标类型的图像所占比例满足预定条件的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词。
7.一种查询词分类模型的确定装置,其特征在于,所述装置包括第一识别单元、类型确定单元和第一训练单元:
所述第一识别单元,用于根据图像分类模型识别历史查询词所对应历史查询结果中是否包括目标类型的图像;
所述类型确定单元,用于将包括所述目标类型的图像的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词;
所述第一训练单元,用于根据所述目标类型的历史查询词训练查询词分类模型,所述查询词分类模型用于识别查询词的类型是否为所述目标类型。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括获取单元和第二训练单元:
所述获取单元,用于获取所述目标类型的图像集合;
所述第二训练单元,用于根据所述图像集合训练所述图像分类模型,所述图像分类模型用于识别图像的类型是否为所述目标类型。
9.一种查询词分类模型的确定设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
根据图像分类模型识别历史查询词所对应历史查询结果中是否包括目标类型的图像;
将包括所述目标类型的图像的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词;
根据所述目标类型的历史查询词训练查询词分类模型,所述查询词分类模型用于识别查询词的类型是否为所述目标类型。
10.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至6中一个或多个所述查询词分类模型的确定方法。
CN201811243106.9A 2018-10-24 2018-10-24 一种查询词分类模型的确定方法和装置 Pending CN111177521A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811243106.9A CN111177521A (zh) 2018-10-24 2018-10-24 一种查询词分类模型的确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811243106.9A CN111177521A (zh) 2018-10-24 2018-10-24 一种查询词分类模型的确定方法和装置

Publications (1)

Publication Number Publication Date
CN111177521A true CN111177521A (zh) 2020-05-19

Family

ID=70653487

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811243106.9A Pending CN111177521A (zh) 2018-10-24 2018-10-24 一种查询词分类模型的确定方法和装置

Country Status (1)

Country Link
CN (1) CN111177521A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666317A (zh) * 2020-07-06 2020-09-15 腾讯科技(深圳)有限公司 一种作弊信息的挖掘方法、作弊信息的识别方法及装置
CN112989089A (zh) * 2021-02-22 2021-06-18 北京三一智造科技有限公司 元件状态查询方法、装置、电子设备和存储介质
CN113204667A (zh) * 2021-04-13 2021-08-03 北京百度网讯科技有限公司 音频标注模型的训练与音频标注的方法、装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095187A (zh) * 2015-08-07 2015-11-25 广州神马移动信息科技有限公司 一种搜索意图识别方法及装置
CN105243135A (zh) * 2015-09-30 2016-01-13 百度在线网络技术(北京)有限公司 展现搜索结果的方法及装置
CN106844472A (zh) * 2016-12-22 2017-06-13 北京搜狗科技发展有限公司 一种搜索方法和装置、一种用于搜索的装置
CN106997379A (zh) * 2017-03-20 2017-08-01 杭州电子科技大学 一种基于图片文本点击量的相近文本的合并方法
CN107423304A (zh) * 2016-05-24 2017-12-01 百度在线网络技术(北京)有限公司 检索词分类方法及装置
CN107526769A (zh) * 2017-07-10 2017-12-29 北京百度网讯科技有限公司 基于人工智能的照片处理方法及装置、设备及可读介质
CN108363928A (zh) * 2018-02-08 2018-08-03 广西师范大学 关联医疗数据中的自适应差分隐私保护方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095187A (zh) * 2015-08-07 2015-11-25 广州神马移动信息科技有限公司 一种搜索意图识别方法及装置
CN105243135A (zh) * 2015-09-30 2016-01-13 百度在线网络技术(北京)有限公司 展现搜索结果的方法及装置
CN107423304A (zh) * 2016-05-24 2017-12-01 百度在线网络技术(北京)有限公司 检索词分类方法及装置
CN106844472A (zh) * 2016-12-22 2017-06-13 北京搜狗科技发展有限公司 一种搜索方法和装置、一种用于搜索的装置
CN106997379A (zh) * 2017-03-20 2017-08-01 杭州电子科技大学 一种基于图片文本点击量的相近文本的合并方法
CN107526769A (zh) * 2017-07-10 2017-12-29 北京百度网讯科技有限公司 基于人工智能的照片处理方法及装置、设备及可读介质
CN108363928A (zh) * 2018-02-08 2018-08-03 广西师范大学 关联医疗数据中的自适应差分隐私保护方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666317A (zh) * 2020-07-06 2020-09-15 腾讯科技(深圳)有限公司 一种作弊信息的挖掘方法、作弊信息的识别方法及装置
CN112989089A (zh) * 2021-02-22 2021-06-18 北京三一智造科技有限公司 元件状态查询方法、装置、电子设备和存储介质
CN113204667A (zh) * 2021-04-13 2021-08-03 北京百度网讯科技有限公司 音频标注模型的训练与音频标注的方法、装置
CN113204667B (zh) * 2021-04-13 2024-03-22 北京百度网讯科技有限公司 音频标注模型的训练与音频标注的方法、装置

Similar Documents

Publication Publication Date Title
CN105338409B (zh) 一种网络视频预加载方法及装置
US20180121040A1 (en) Method and device for managing notification messages
CN104834559B (zh) 通知消息显示方法及装置
CN105068976B (zh) 票务信息展示方法及装置
CN106897937B (zh) 一种展示社交分享信息的方法和装置
CN107315487B (zh) 一种输入处理方法、装置及电子设备
US20160314164A1 (en) Methods and devices for sharing cloud-based business card
CN106331328B (zh) 信息提示的方法及装置
CN111177521A (zh) 一种查询词分类模型的确定方法和装置
CN108230094B (zh) 车辆推荐方法及装置
CN107402767B (zh) 显示推送消息的方法和装置
CN105488074B (zh) 照片聚类的方法及装置
CN110213062B (zh) 处理消息的方法及装置
CN109842688B (zh) 一种内容推荐方法、装置、电子设备及存储介质
US20170289326A1 (en) Methods and Apparatuses for Interpreting a Phone Number
CN109799916B (zh) 一种候选项联想方法和装置
CN109145151B (zh) 一种视频的情感分类获取方法及装置
CN107908729B (zh) 界面展示方法及装置
CN108012258B (zh) 虚拟sim卡的数据流量管理方法、装置、终端及服务器
CN110020082B (zh) 一种搜索方法及装置
CN108108356B (zh) 一种文字翻译方法、装置及设备
US20170169467A1 (en) Information push method and device
CN110362760B (zh) 一种智能提示搜索结果的方法、装置及介质
CN112083811B (zh) 一种候选项展示方法和装置
CN110417987B (zh) 一种操作响应方法、装置、设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination