CN106484766A - 基于人工智能的搜索方法和装置 - Google Patents

基于人工智能的搜索方法和装置 Download PDF

Info

Publication number
CN106484766A
CN106484766A CN201610808298.8A CN201610808298A CN106484766A CN 106484766 A CN106484766 A CN 106484766A CN 201610808298 A CN201610808298 A CN 201610808298A CN 106484766 A CN106484766 A CN 106484766A
Authority
CN
China
Prior art keywords
search results
historical
training
search
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610808298.8A
Other languages
English (en)
Other versions
CN106484766B (zh
Inventor
王鹏
苏映滨
黄世维
路华
王凡
黄硕
周超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610808298.8A priority Critical patent/CN106484766B/zh
Publication of CN106484766A publication Critical patent/CN106484766A/zh
Application granted granted Critical
Publication of CN106484766B publication Critical patent/CN106484766B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了基于人工智能的搜索方法和装置。该方法的一具体实施方式包括:接收包含当前用户输入的搜索式的搜索请求,以及确定搜索式对应的搜索结果;基于与用户对搜索结果进行过的操作相关联的历史操作信息和与搜索结果的统计特征相关联的统计特征信息,对搜索结果进行排序;将排序后的搜索结果推送给当前用户。实现了将搜索结果的个性化特征与不同的排序算法基于统计特征对搜索结果的排序结果进行结合对搜索结果进行排序,在通过不同的排序算法基于统计性特征对搜索结果进行整体排序的基础上,基于个性化特征调整整体排序的结果,从而使得排序结果在较为准确地反映出整体需求的同时,满足用户对搜索结果的个性化需求。

Description

基于人工智能的搜索方法和装置
技术领域
本申请涉及计算机领域,具体涉及搜索领域,尤其涉及基于人工智能的搜索方法和装置。
背景技术
人工智能技术(Artificial Intelligence,简称AI)的快速发展为人们的日常工作和生活提供了便利。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家***等。人工智能越来越多地融入到应用中,结合人工智能的应用可以分析用户的个性化的需求,将用户期望得到的答案例如期望获取的搜索结果以较为靠前的次序反馈给用户。
用户在在站点(例如团购网站)进行搜索时,通常根据诸如浏览量的统计性特征对搜索结果(例如团购券)进行排序。然而,由于没有考虑用户的诸如用户希望再次购买浏览量较低的团购券的个性化的需求,导致不同需求的用户得到的排序结果为同一排序结果,无法满足用户对搜索结果的个性化需求。
发明信息
本申请提供了一种基于人工智能的搜索方法和装置,用于解决上述背景技术部分存在的技术问题。
第一方面,本申请提供了基于人工智能的搜索方法,该方法包括:接收包含当前用户输入的搜索式的搜索请求,以及确定搜索式对应的搜索结果;基于与用户对搜索结果进行过的操作相关联的历史操作信息和与搜索结果的统计特征相关联的统计特征信息,对搜索结果进行排序;将排序后的搜索结果推送给当前用户。
第二方面,本申请提供了基于人工智能的搜索装置,该装置包括:接收单元,配置用于接收包含当前用户输入的搜索式的搜索请求,以及确定搜索式对应的搜索结果;排序单元,配置用于基于与用户对搜索结果进行过的操作相关联的历史操作信息和与搜索结果的统计特征相关联的统计特征信息,对搜索结果进行排序;推送单元,配置用于将排序后的搜索结果推送给当前用户。
本申请提供的基于人工智能的搜索方法和装置,通过接收包含当前用户输入的搜索式的搜索请求,以及确定搜索式对应的搜索结果;基于与用户对搜索结果进行过的操作相关联的历史操作信息和与搜索结果的统计特征相关联的统计特征信息,对搜索结果进行排序;将排序后的搜索结果推送给当前用户。实现了将搜索结果的个性化特征与不同的排序算法基于统计特征对搜索结果的排序结果进行结合对搜索结果进行排序,在通过不同的排序算法基于统计性特征对搜索结果进行整体排序的基础上,基于个性化特征调整整体排序的结果,从而使得排序结果在较为准确地反映出整体需求的同时,满足用户对搜索结果的个性化需求。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了可以应用于本申请的基于人工智能的搜索方法或装置的示例性***架构;
图2示出了根据本申请的基于人工智能的搜索方法的一个实施例的流程图;
图3示出了根据本申请的基于人工智能的搜索方法的另一个实施例的流程图;
图4示出了适用于本申请的基于人工智能的搜索方法的一个示例性架构图;
图5示出了根据本申请的基于人工智能的搜索装置的一个实施例的结构示意图;
图6示出了适于用来实现本申请实施例的基于人工智能的搜索装置的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用于本申请的基于人工智能的搜索方法或装置的实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供传输链路的介质。网络104可以包括各种连接类型,例如有线、无线传输链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯应用,例如、团购类应用、搜索类应用、地图类应用等。
终端设备101、102、103可以是具有显示屏并且支持网络通信的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以接收终端设备101、102、103发送的搜索请求,对查找出的搜索结果进行排序,将排序后的搜索结果发送给终端设备101、102、103。
请参考图2,其示出了根据本申请的基于人工智能的搜索方法的一个实施例的流程200。需要说明的是,本申请实施例所提供的基于人工智能的搜索方法可以由图1中的服务器105执行。该方法包括以下步骤:
步骤201,接收包含当前用户输入的搜索式的搜索请求,以及确定搜索式对应的搜索结果。
在本实施例中,当前用户可以是指当前输入搜索式的用户。例如,当前用户在垂直类站点团购网站进行搜索时,可以首先在团购网站提供的输入框中输入包含餐厅类型的搜索式。此时,可以接收到包含用户输入的搜索式的搜索请求,然后,可以确定搜索式对应的搜索结果,即多个餐厅的团购券。
步骤202,基于历史操作信息和统计特征信息,对搜索结果进行排序。
在本实施例中,在通过步骤201接收接收包含当前用户输入的搜索式的搜索请求,以及确定搜索式对应的搜索结果之后,可以根据与用户对搜索结果进行过的操作相关联的历史操作信息和与搜索结果的统计特征相关联的统计特征信息,对搜索结果进行排序。
在本实施例的一些可选的实现方式中,搜索结果包括:垂直类站点的网络资源,操作包括:浏览操作、点击操作、购买操作、评论操作,统计特征信息包括:浏览量、点击量、购买量、评论量。
在本实施例中,搜索结果可以为垂直类站点的网络资源。例如,当用户在垂直类站点团购网站搜索餐厅的团购券时,搜索结果可以为多个餐厅商家的团购券。
在本实施例中,用户对搜索结果进行的操作可以包括但不限于:浏览操作、点击操作、购买操作、评论操作。搜索结果的统计特征信息可以包括但不限于:浏览量、点击量、购买量、评论量。
以用户在垂直类站点团购网站搜索餐厅的团购券为例,搜索结果对应的历史操作信息可以为一个集合。以用户在垂直类站点团购网站搜索餐厅的团购券,搜索结果为多个团购卷为例,每一个团购券对应的历史操作信息可以为一个集合,集合中可以包含用户对一个团购券依序的进行过的操作的标识,操作可以包含以下一项或多项:浏览、点击、购买、评论。例如,当用户点击一个团购券,购买了一个团购券,进行了评论,用户想再次购买该团购券再次点击了团购券,用户的历史操作信息可以为一个集合,该集合中依序包括:点击操作标识、购买操作标识、评论操作标识、点击操作标识。历史搜索结果的统计特征信息可以为团购券的浏览量、点击量、购买量、评论量。
在本实施例中,可以将用户的历史操作信息和表示搜索结果的统计特征的统计特征信息作为搜索结果排序的要素,对搜索结果进行排序。例如,可以针对历史操作信息和统计特征信息设置不同的权重,针对历史操作信息的各个操作和统计特征信息中的各个参数设置不同的权利,对搜索结果进行排序。
步骤203,将排序后的搜索结果推送给当前用户。
在本实施例中,在通过步骤202基于历史操作信息和统计特征信息,对搜索结果进行排序之后,可以将排序后的搜索结果推送给当前用户。
请参考图3,其示出了根据本申请的基于人工智能的搜索方法的另一个实施例的流程300。需要说明的是,本申请实施例所提供的基于人工智能的搜索方法可以由图1中的服务器105执行。该方法包括以下步骤:
步骤301,接收包含当前用户输入的搜索式的搜索请求,以及确定搜索式对应的搜索结果。
在本实施例中,当前用户进行搜索时,可以首先在站点提供的输入区域输入搜索式。例如,用户在垂直类站点团购网站进行搜索时,可以首先在团购网站提供的输入框中输入包含餐厅类型的搜索式。此时,可以接收到包含当前用户输入的搜索式的搜索请求,然后,可以确定搜索式对应的搜索结果,即多个餐厅的团购券。
步骤302,采用预设机器学习模型基于历史操作信息和统计特征信息,对搜索结果进行排序。
在本实施例中,在通过步骤301接收包含当前用户输入的搜索式的搜索请求之前,可以预先创建机器学习模型,预设机器学习模型可以为gbrank模型。然后,可以对gbrank模型进行训练。利用训练后的gbrank模型基于历史操作信息和搜索结果的统计特征信息,对搜索结果进行排序。
在本实施例中,可以采用以下方式对gbrank模型进行训练:获取多个历史搜索结果对应的历史操作信息和历史搜索结果的统计特征信息;将每一个历史操作信息和统计特征信息进行组合,得到多个训练样本;以pairwise方式将多个训练样本两两进行组合,得到多个训练样本对;分别生成训练样本对中的每一个训练样本对应的个性化训练特征向量,个性化训练特征向量包括:表示历史操作信息的分量、表示统计特征信息的分量;分别生成训练样本对中的每一个训练样本对应的整体训练特征向量,整体训练特征向量包括至少一个分量,其中,分量表示预设排序模型对历史搜索结果进行排序后得到的与历史搜索结果的位置相关联的参数,每一个分量对应一个预设排序模型;分别生成训练样本对中的每一个训练样本对应的gbrank模型的训练输入向量,训练输入向量包括:个性化训练特征向量、整体训练特征向量;基于训练输入向量,对gbrank模型进行训练。
在本实施例中,可以获取多个历史搜索结果对应的历史操作信息和每一个历史搜索结果的统计特征信息。
以用户在垂直类站点团购网站搜索餐厅的团购券为例,历史搜索结果可以为历史搜索中搜索出的团购券。一个历史搜索结果可以对应一个历史操作信息。历史搜索结果对应的历史操作信息可以为一个集合,集合中可以包含用户对历史搜索中搜索出的一个团购券依序的进行过的操作的标识,操作可以包含以下一项或多项:浏览、点击、购买、评论。例如,当用户点击一个团购券,购买了一个团购券,进行了评论,用户想再次购买该团购券再次点击了团购券,用户的历史操作信息可以为一个集合,该集合中依序包括:点击操作标识、购买操作标识、评论操作标识、点击操作标识。历史搜索结果的统计特征信息可以为团购券的浏览量、点击量、购买量、评论量。
在本实施例中,在获取多个历史搜索结果对应的历史操作信息和每一个历史搜索结果的统计特征信息之后,可以分别将历史搜索结果对应的历史操作信息和该历史操作信息对应的团购券的统计特征信息进行组合,得到多个训练样本。每一个训练样本中同时包含一个历史搜索结果对应的历史操作信息和该历史搜索结果的统计特征信息。
在得到多个训练样本之后,可以采用pairwise方式将多个训练样本两两进行组合,得到训练样本对。pairwise方式可以相当于在样本中首先选取出一个样本,再选取出一个相较于该样本更优的样本组成训练样本对。
例如,当用户点击一个团购券,仅进行浏览而未购买,用户再次点击该团购券并购买了团购券时,用户的历史操作信息可以为一个集合,该集合中依序包括:点击操作标识、点击操作标识、购买操作标识。又例如,当用户点击一个团购券,购买了一个团购券,进行了评论,用户想再次购买该团购券再次点击了团购券,用户的历史操作信息可以为一个集合,该集合中依序包括:点击操作标识、购买操作标识、评论操作标识、点击操作标识。
可以将包含由点击操作标识、点击操作标识、购买操作标识组成的历史操作信息的样本与包含由点击操作标识、购买操作标识、评论操作标识、点击操作标识组成的历史操作信息的样本组成训练样本对。在该训练样本对中,包含由点击操作标识、购买操作标识、评论操作标识、点击操作标识组成的历史操作信息的样本优于包含由点击操作标识、点击操作标识、购买操作标识组成的历史操作信息的样本。
在本实施例中,在以pairwise方式将多个训练样本两两进行组合,得到训练样本对之后,可以分别生成训练样本对中每一个训练样本对应的个性化训练特征向量和整体特征向量中。
在本实施例中,可以将每一个训练样本中的历史搜索结果对应的历史操作信息和历史搜索结果的统计特征信息分别利用向量表示,将表示历史搜索结果对应的历史操作信息的向量和表示历史搜索结果的统计特征信息的向量作为历史搜索结果对应的个性化训练特征向量的分量,得到多个历史搜索结果对应的个性化训练特征向量。
在本实施例中,训练样本对应的整体训练特征向量中可以包含多个分量,每一个分量为一个预设排序模型对历史搜索结果进行排序后得到的与历史搜索结果的位置相关联的参数。例如,精排序模型对多个历史搜索结果进行排序后得到的参数为指示在排序后历史搜索结果的位置的得分,在利用精排序模型对多个历史搜索结果进行排序之后,每一个历史搜索结果对应一个得分。粗排序模型对历史搜索结果进行排序后得到的参数为指示历史搜索结果所处的位置区间的档位,在利用粗排序模型对多个历史搜索结果进行排序后,每一个历史搜索结果对应一个档位,该档位表示历史搜索结果在粗排序模型对多个历史搜索结果进行排序之后该历史搜索结果所处的位置区间。
在本实施例中,在分别生成每一个历史搜索结果对应的个性化训练特征向量和整体训练特征向量之后,可以分别将每一个历史搜索结果对应的个性化训练特征向量和整体训练特征向量作为历史搜索结果对应的gbrank模型的训练输入向量的分量,得到每一个历史搜索结果对应的gbrank模型的训练输入向量。然后,可以将多个训练输入向量以pairwise方式依次输入到gbrank模型中。在每一次输入中,输入两个分别包含一个个性化训练特征向量的训练输入向量和包含一个优于该性化训练特征向量对应的个性化训练特征的个性化训练特征对应的向量的训练输入向量,对gbrank模型进行训练。
以用户在垂直类站点团购网站搜索餐厅的团购券,gbrank模型可以根据整体训练特征向量学习从整体对团购券进行排序,同时,根据个性化训练特征向量学习出的用户的何种操作更倾向于购买团购券,来调整整体对团购券进行排序中部分团购券的位置。
在本实施例中,在对gbrank模型进行训练之后,可以利用训练后的gbrank模型对当前用户输入的搜索式对应的搜索结果进行排序。即利用训练后的gbrank模型对通过步骤301接收到的当前用户输入的搜索式对应的搜索结果进行排序。
在本实施例中,可以采用以下方式对当前用户输入的搜索式对应的搜索结果进行排序:分别生成搜索结果中每一个搜索结果对应的个性化特征向量,个性化特征向量包括:表示搜索结果对应的历史操作信息的分量、表示搜索结果的统计特征信息的分量;分别生成搜索结果中每一个搜索结果对应的整体特征向量,整体特征向量包括至少一个分量,其中,分量表示预设排序模型对搜索结果进行排序后得到的与搜索结果的位置相关联的参数,每一个分量对应一个预设排序模型;分别生成搜索结果中每一个搜索结果对应的gbrank模型的输入向量,输入向量包括:个性化特征向量、整体特征向量;利用gbrank模型基于输入向量,得到输出结果,输出结果为排序后的搜索结果的位置。
在本实施例中,每一个通过步骤301确定出的当前用户输入的搜索式对应的搜索结果对应的历史操作信息可以为一个集合。以用户在垂直类站点团购网站搜索餐厅的团购券,搜索结果为多个团购卷为例,每一个团购券对应的历史操作信息可以为一个集合,集合中可以包含用户对一个团购券依序的进行过的操作的标识,操作可以包含以下一项或多项:浏览、点击、购买、评论。例如,当用户点击一个团购券,购买了一个团购券,进行了评论,用户想再次购买该团购券再次点击了团购券,用户的历史操作信息可以为一个集合,该集合中依序包括:点击操作标识、购买操作标识、评论操作标识、点击操作标识。历史搜索结果的统计特征信息可以为团购券的浏览量、点击量、购买量、评论量。
在本实施例中,可以将每一个搜索结果对应的历史操作信息和搜索结果的统计特征信息分别利用向量表示,将表示搜索结果对应的历史操作信息的向量和表示搜索结果的统计特征信息的向量作为搜索结果对应的个性化训练特征向量的分量,得到多个搜索结果对应的个性化训练特征向量。
在本实施例中,每一个通过步骤301确定出的当前用户输入的搜索式对应的搜索结果对应的整体特征向量中可以包含多个分量,每一个分量为一个预设排序模型对搜索结果进行排序后得到的与搜索结果的位置相关联的参数。例如,精排序模型对多个搜索结果进行排序后得到的参数为指示在排序后搜索结果的位置的得分,在利用精排序模型对多个搜索结果进行排序之后,每一个搜索结果对应一个得分。粗排序模型对搜索结果进行排序后得到的参数为指示搜索结果所处的位置区间的档位,在利用粗排序模型对多个搜索结果进行排序后,每一个搜索结果对应一个档位,该档位表示搜索结果在粗排序模型对多个搜索结果进行排序之后搜索结果所处的位置区间。
在本实施例中,在分别生成每一个搜索结果对应的个性化训练特征向量和整体训练特征向量之后,可以分别将每一个搜索结果对应的个性化训练特征向量和整体训练特征向量作为搜索结果对应的gbrank模型的输入向量的分量,得到每一个搜索结果对应的gbrank模型的输入向量。然后,可以将多个输入向量输入到gbrank模型中,得到输出结果。输出结果为每一个搜索结果在利用gbrank模型排序后所处的位置,该位置可以采用输入向量进行表示。
gbrank模型可以根据搜索结果对应的整体训练特征向量从整体对搜索结果进行排序,根据搜索结果对应的个性化训练特征向量确定用户的何种操作更倾向于购买团购券,来调整整体对搜索结果进行排序中部分搜索结果的位置。
以用户在垂直类站点团购网站搜索餐厅的团购券,搜索结果为多个团购卷为例,gbrank模型可以根据每一个团购券对应的整体训练特征向量,从整体上对多个团购券进行排序。同时,根据每一个团购券对应个性化训练特征向量确定用户的何种操作更倾向于购买团购券,来调整整体对多个团购券进行排序中部分团购券的位置。例如,当根据整体训练特征向量整体进行排序时,一家餐厅的团购券的浏览量由于小于另一家餐厅的团购券的浏览量,排在另一家餐厅之后。但根据个性化特征向量中的历史操作信息对应的分量,可以确定用户曾经购买过该餐厅的团购券并并且评论过该团购券,此时,可以将该家餐厅的团购券的位置调整至另一家餐厅的团购券的位置之前。
步骤303,将排序后的搜索结果推送给当前用户。
在本实施例中,在通过步骤302采用预设机器学习模型基于历史操作信息和统计特征信息,对搜索结果进行排序之后,可以将排序后的搜索结果推送给当前用户。
请参考图4,其示出了适用于本申请的基于人工智能的搜索方法的一个示例性架构图。
在图4中,示出了统一排序模型、精排序模型、粗排序模型、其他排序模型。
以用户在垂直类站点团购网站搜索餐厅的团购券,搜索结果中包含多个团购券为例,统一排序模型可以为gbrank模型。gbrank模型可以根据整体特征向量从整体对团购券进行排序,同时,根据个性化特征向量,来调整整体对团购券进行排序后部分团购券的位置,得到输出结果。
可以分别生成每一个团购券对应的个性化特征向量。每一个团购券对应的个性化特征向量包括:表示历史操作信息的分量、表示团购券的统计特征信息的分量。同时,可以分别生成每一个团购券对应的整体特征向量,整体特征向量包括多个分量。分量可以为精排序模型、粗排序模型、其他排序模型基于团购券的统计特征信息对团购券进行排序后得到的参数。精排序模型对多个团购券进行排序后得到的参数为指示在排序后团购券的位置的得分,在利用精排序模型对多个团购券进行排序之后,每一个团购券对应一个得分。粗排序模型对团购券进行排序后得到的参数为指示团购券所处的位置区间的档位,在利用粗排序模型对多个团购券进行排序后,每一个团购券对应一个档位,该档位表示团购券在粗排序模型对多个团购券行排序之后该团购券所处的位置区间。
在分别生成每一个团购券对应的性化特征向量和整体特征向量之后,可以生成每一个团购券对应的gbrank模型的输入向量。每一个团购券对应的gbrank模型的输入向量包含团购券对应的性化特征向量和整体特征向量。
gbrank模型可以基于多个输入向量,根据整体特征向量从整体对团购券进行排序,同时,根据个性化特征向量,来调整整体对团购券进行排序后部分团购券的位置,得到输出结果。输出结果为排序后团购券的位置,该位置可以采用输入向量进行表示。
请参考图5,其示出了根据本申请的基于人工智能的搜索装置的一个实施例的结构示意图。该装置实施例与图2所示的方法实施例相对应。
如图5所示,本实施例的基于人工智能的搜索装置500包括:接收单元501,排序单元502,推送单元503。其中,接收单元501配置用于接收包含当前用户输入的搜索式的搜索请求,以及确定搜索式对应的搜索结果;排序单元502配置用于基于与用户对搜索结果进行过的操作相关联的历史操作信息和与搜索结果的统计特征相关联的统计特征信息,对搜索结果进行排序;推送单元503配置用于将排序后的搜索结果推送给当前用户。
在本实施例的一些可选的实现方式中,搜索结果包括:垂直类站点的网络资源,操作包括:浏览操作、点击操作、购买操作、评论操作,统计特征信息包括:浏览量、点击量、购买量、评论量。
在本实施例的一些可选的实现方式中,排序单元502包括:个性化特征向量生成子单元,配置用于分别生成搜索结果中每一个搜索结果对应的个性化特征向量,个性化特征向量包括:表示搜索结果对应的历史操作信息的分量、表示搜索结果的统计特征信息的分量;整体特征向量生成子单元,配置用于分别生成搜索结果中每一个搜索结果对应的整体特征向量,整体特征向量包括至少一个分量,其中,分量表示预设排序模型对搜索结果进行排序后得到的与搜索结果的位置相关联的参数,每一个分量对应一个预设排序模型;输入向量生成子单元,配置用于分别生成搜索结果中每一个搜索结果对应的预设机器学习模型的输入向量,输入向量包括:个性化特征向量、整体特征向量;输出子单元,配置用于利用预设机器学习模型基于输入向量,得到输出结果,输出结果为排序后的搜索结果的位置。
在本实施例的一些可选的实现方式中,装置500还包括:训练单元(未示出),配置用于当预设机器学习模型为gbrank模型时,在接收包含当前用户输入的搜索式的搜索请求之前,获取多个历史搜索结果对应的历史操作信息和历史搜索结果的统计特征信息;将每一个历史操作信息和统计特征信息进行组合,得到多个训练样本;以pairwise方式将多个训练样本两两进行组合,得到多个训练样本对;分别生成训练样本对中的每一个训练样本对应的个性化训练特征向量,个性化训练特征向量包括:表示历史操作信息的分量、表示统计特征信息的分量;分别生成训练样本对中的每一个训练样本对应的整体训练特征向量,整体特征向量包括至少一个分量,其中,分量表示预设排序模型对历史搜索结果进行排序后得到的与历史搜索结果的位置相关联的参数,每一个分量对应一个预设排序模型;分别生成训练样本对中的每一个训练样本对应的gbrank模型的训练输入向量,训练输入向量包括:个性化训练特征向量、整体训练特征向量;基于训练输入向量,对gbrank模型进行训练。
在本实施例的一些可选的实现方式中,预设排序模型包括:精排序模型、粗排序模型,精排序模型对搜索结果或历史搜索结果进行排序后得到的参数为指示在排序后搜索结果或历史搜索结果的位置的得分,粗排序模型对搜索结果或历史搜索结果进行排序后得到的参数为指示搜索结果或历史搜索结果所处的位置区间的档位。
图6示出了适于用来实现本申请实施例的基于人工智能的搜索装置的计算机***的结构示意图。
如图6所示,计算机***600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有***600操作所需的各种程序和数据。CPU601、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述设备中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:接收包含当前用户输入的搜索式的搜索请求,以及确定所述搜索式对应的搜索结果;基于与用户对所述搜索结果进行过的操作相关联的历史操作信息和与所述搜索结果的统计特征相关联的统计特征信息,对所述搜索结果进行排序;将排序后的搜索结果推送给所述当前用户。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种基于人工智能的搜索方法,其特征在于,所述方法包括:
接收包含当前用户输入的搜索式的搜索请求,以及确定所述搜索式对应的搜索结果;
基于与用户对所述搜索结果进行过的操作相关联的历史操作信息和与所述搜索结果的统计特征相关联的统计特征信息,对所述搜索结果进行排序;
将排序后的所述搜索结果推送给所述当前用户。
2.根据权利要求1所述的方法,其特征在于,所述搜索结果包括:垂直类站点的网络资源,所述操作包括:浏览操作、点击操作、购买操作、评论操作,所述统计特征信息包括:浏览量、点击量、购买量、评论量。
3.根据权利要求2所述的方法,其特征在于,基于与用户对所述搜索结果进行过的操作相关联的历史操作信息和与所述搜索结果的统计特征相关联的统计特征信息,对所述搜索结果进行排序包括:
分别生成所述搜索结果中每一个搜索结果对应的个性化特征向量,所述个性化特征向量包括:表示搜索结果对应的历史操作信息的分量、表示搜索结果的统计特征信息的分量;
分别生成所述搜索结果中每一个搜索结果对应的整体特征向量,所述整体特征向量包括至少一个分量,其中,所述分量表示预设排序模型对所述搜索结果进行排序后得到的与搜索结果的位置相关联的参数,每一个分量对应一个预设排序模型;
分别生成所述搜索结果中每一个搜索结果对应的预设机器学习模型的输入向量,所述输入向量包括:个性化特征向量、整体特征向量;
利用预设机器学习模型基于所述输入向量,得到输出结果,所述输出结果为排序后的搜索结果的位置。
4.根据权利要求3所述的方法,其特征在于,所述预设机器学习模型为gbrank模型,在接收包含当前用户输入的搜索式的搜索请求之前,所述方法还包括:
获取多个历史搜索结果对应的历史操作信息和历史搜索结果的统计特征信息;
将每一个所述历史操作信息和所述统计特征信息进行组合,得到多个训练样本;
以pairwise方式将多个训练样本两两进行组合,得到多个训练样本对;
分别生成所述训练样本对中的每一个训练样本对应的个性化训练特征向量,所述个性化训练特征向量包括:表示所述历史操作信息的分量、表示所述统计特征信息的分量;
分别生成所述训练样本对中的每一个训练样本对应的整体训练特征向量,所述整体训练特征向量包括至少一个分量,其中,所述分量表示预设排序模型对所述历史搜索结果进行排序后得到的与历史搜索结果的位置相关联的参数,每一个分量对应一个预设排序模型;
分别生成所述训练样本对中的每一个训练样本对应的gbrank模型的训练输入向量,所述训练输入向量包括:个性化训练特征向量、整体训练特征向量;
基于所述训练输入向量,对所述gbrank模型进行训练。
5.根据权利要求4所述的方法,其特征在于,所述预设排序模型包括:精排序模型、粗排序模型,精排序模型对搜索结果或历史搜索结果进行排序后得到的参数为指示在排序后搜索结果或历史搜索结果的位置的得分,粗排序模型对搜索结果或历史搜索结果进行排序后得到的参数为指示搜索结果或历史搜索结果所处的位置区间的档位。
6.一种基于人工智能的搜索装置,其特征在于,所述装置包括:
接收单元,配置用于接收包含当前用户输入的搜索式的搜索请求,以及确定所述搜索式对应的搜索结果;
排序单元,配置用于基于与用户对所述搜索结果进行过的操作相关联的历史操作信息和与所述搜索结果的统计特征相关联的统计特征信息,对所述搜索结果进行排序;
推送单元,配置用于将排序后的所述搜索结果推送给所述当前用户。
7.根据权利要求6所述的装置,其特征在于,所述搜索结果包括:垂直类站点的网络资源,所述操作包括:浏览操作、点击操作、购买操作、评论操作,所述统计特征信息包括:浏览量、点击量、购买量、评论量。
8.根据权利要求7所述的装置,其特征在于,排序单元包括:
个性化特征向量生成子单元,配置用于分别生成所述搜索结果中每一个搜索结果对应的个性化特征向量,所述个性化特征向量包括:表示搜索结果对应的历史操作信息的分量、表示搜索结果的统计特征信息的分量;
整体特征向量生成子单元,配置用于分别生成所述搜索结果中每一个搜索结果对应的整体特征向量,所述整体特征向量包括至少一个分量,其中,所述分量表示预设排序模型对所述搜索结果进行排序后得到的与搜索结果的位置相关联的参数,每一个分量对应一个预设排序模型;
输入向量生成子单元,配置用于分别生成所述搜索结果中每一个搜索结果对应的预设机器学习模型的输入向量,所述输入向量包括:个性化特征向量、整体特征向量;
输出子单元,配置用于利用预设机器学习模型基于所述输入向量,得到输出结果,所述输出结果为排序后的搜索结果的位置。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
训练单元,配置用于当预设机器学习模型为gbrank模型时,在接收包含当前用户输入的搜索式的搜索请求之前,获取多个历史搜索结果对应的历史操作信息和历史搜索结果的统计特征信息;将每一个所述历史操作信息和所述统计特征信息进行组合,得到多个训练样本;以pairwise方式将多个训练样本两两进行组合,得到多个训练样本对;分别生成所述训练样本对中的每一个训练样本对应的个性化训练特征向量,所述个性化训练特征向量包括:表示所述历史操作信息的分量、表示所述统计特征信息的分量;分别生成所述训练样本对中的每一个训练样本对应的整体训练特征向量,所述整体训练特征向量包括至少一个分量,其中,所述分量表示预设排序模型对所述历史搜索结果进行排序后得到的与历史搜索结果的位置相关联的参数,每一个分量对应一个预设排序模型;分别生成所述训练样本对中的每一个训练样本对应的gbrank模型的训练输入向量,所述训练输入向量包括:个性化训练特征向量、整体训练特征向量;基于所述训练输入向量,对所述gbrank模型进行训练。
10.根据权利要求9所述的装置,其特征在于,所述预设排序模型包括:精排序模型、粗排序模型,精排序模型对搜索结果或历史搜索结果进行排序后得到的参数为指示在排序后搜索结果或历史搜索结果的位置的得分,粗排序模型对搜索结果或历史搜索结果进行排序后得到的参数为指示搜索结果或历史搜索结果所处的位置区间的档位。
CN201610808298.8A 2016-09-07 2016-09-07 基于人工智能的搜索方法和装置 Active CN106484766B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610808298.8A CN106484766B (zh) 2016-09-07 2016-09-07 基于人工智能的搜索方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610808298.8A CN106484766B (zh) 2016-09-07 2016-09-07 基于人工智能的搜索方法和装置

Publications (2)

Publication Number Publication Date
CN106484766A true CN106484766A (zh) 2017-03-08
CN106484766B CN106484766B (zh) 2019-10-22

Family

ID=58273657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610808298.8A Active CN106484766B (zh) 2016-09-07 2016-09-07 基于人工智能的搜索方法和装置

Country Status (1)

Country Link
CN (1) CN106484766B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291805A (zh) * 2017-05-15 2017-10-24 百度在线网络技术(北京)有限公司 一种用于控制推送信息的方法与装置
CN107862004A (zh) * 2017-10-24 2018-03-30 科大讯飞股份有限公司 智能排序方法及装置、存储介质、电子设备
WO2018218413A1 (en) * 2017-05-27 2018-12-06 Beijing Didi Infinity Technology And Development Co., Ltd. System and method for providing information for an on-demand service
CN109582865A (zh) * 2018-11-19 2019-04-05 北京奇虎科技有限公司 一种推送应用程序的方法及装置
CN111143695A (zh) * 2019-12-31 2020-05-12 腾讯科技(深圳)有限公司 一种搜索方法、装置、服务器及存储介质
CN111783452A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 模型训练方法、信息处理方法、装置、设备及存储介质
CN111782982A (zh) * 2019-05-20 2020-10-16 北京京东尚科信息技术有限公司 搜索结果的排序方法、装置和计算机可读存储介质
CN113343132A (zh) * 2021-06-30 2021-09-03 北京三快在线科技有限公司 一种模型训练的方法、信息展示的方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004772A (zh) * 2010-11-15 2011-04-06 百度在线网络技术(北京)有限公司 一种用于根据检索词进行搜索结果排序的方法及设备
CN102591969A (zh) * 2011-12-31 2012-07-18 北京百度网讯科技有限公司 基于用户历史行为提供搜索结果的方法及服务器
CN102999588A (zh) * 2012-11-15 2013-03-27 广州华多网络科技有限公司 一种多媒体应用的推荐方法和***
US20140297476A1 (en) * 2013-03-28 2014-10-02 Alibaba Group Holding Limited Ranking product search results
CN104951468A (zh) * 2014-03-28 2015-09-30 阿里巴巴集团控股有限公司 数据搜索处理方法和***
CN105630836A (zh) * 2014-11-05 2016-06-01 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004772A (zh) * 2010-11-15 2011-04-06 百度在线网络技术(北京)有限公司 一种用于根据检索词进行搜索结果排序的方法及设备
CN102591969A (zh) * 2011-12-31 2012-07-18 北京百度网讯科技有限公司 基于用户历史行为提供搜索结果的方法及服务器
CN102999588A (zh) * 2012-11-15 2013-03-27 广州华多网络科技有限公司 一种多媒体应用的推荐方法和***
US20140297476A1 (en) * 2013-03-28 2014-10-02 Alibaba Group Holding Limited Ranking product search results
CN104951468A (zh) * 2014-03-28 2015-09-30 阿里巴巴集团控股有限公司 数据搜索处理方法和***
CN105630836A (zh) * 2014-11-05 2016-06-01 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291805A (zh) * 2017-05-15 2017-10-24 百度在线网络技术(北京)有限公司 一种用于控制推送信息的方法与装置
WO2018218413A1 (en) * 2017-05-27 2018-12-06 Beijing Didi Infinity Technology And Development Co., Ltd. System and method for providing information for an on-demand service
CN107862004A (zh) * 2017-10-24 2018-03-30 科大讯飞股份有限公司 智能排序方法及装置、存储介质、电子设备
CN109582865A (zh) * 2018-11-19 2019-04-05 北京奇虎科技有限公司 一种推送应用程序的方法及装置
CN111782982A (zh) * 2019-05-20 2020-10-16 北京京东尚科信息技术有限公司 搜索结果的排序方法、装置和计算机可读存储介质
CN111143695A (zh) * 2019-12-31 2020-05-12 腾讯科技(深圳)有限公司 一种搜索方法、装置、服务器及存储介质
CN111783452A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 模型训练方法、信息处理方法、装置、设备及存储介质
CN111783452B (zh) * 2020-06-30 2024-04-02 北京百度网讯科技有限公司 模型训练方法、信息处理方法、装置、设备及存储介质
CN113343132A (zh) * 2021-06-30 2021-09-03 北京三快在线科技有限公司 一种模型训练的方法、信息展示的方法及装置

Also Published As

Publication number Publication date
CN106484766B (zh) 2019-10-22

Similar Documents

Publication Publication Date Title
CN106484766B (zh) 基于人工智能的搜索方法和装置
Shukla et al. E-shopping using mobile apps and the emerging consumer in the digital age of retail hyper personalization: An insight
CN107766940A (zh) 用于生成模型的方法和装置
CN107105031A (zh) 信息推送方法和装置
EP4181026A1 (en) Recommendation model training method and apparatus, recommendation method and apparatus, and computer-readable medium
CN109460514A (zh) 用于推送信息的方法和装置
CN107172151A (zh) 用于推送信息的方法和装置
CN106407425A (zh) 基于人工智能的推送信息的方法和装置
CN110008397B (zh) 一种推荐模型训练方法及装置
CN109785064A (zh) 一种基于多源信息融合的移动电子商务推荐方法和***
CN107305578A (zh) 人机智能问答方法和装置
CN107870984A (zh) 识别搜索词的意图的方法和装置
CN108664658A (zh) 一种考虑用户偏好动态变化的协同过滤视频推荐方法
CN108595493A (zh) 媒体内容的推送方法和装置、存储介质、电子装置
CN106407377A (zh) 基于人工智能的搜索方法和装置
TW201333732A (zh) 用於客製化網站之方法及系統
CN107506501A (zh) 搜索结果的展示方法及装置
CN107742128A (zh) 用于输出信息的方法和装置
CN109727047A (zh) 一种确定数据关联度的方法和装置、数据推荐方法和装置
CN106354856A (zh) 基于人工智能的深度神经网络强化搜索方法和装置
CN108268450A (zh) 用于生成信息的方法和装置
CN108140055A (zh) 触发应用信息
CN110263255A (zh) 用户属性信息的获取方法、***、服务器及存储介质
CN107315833A (zh) 基于应用程序的检索与下载的方法和装置
CN108121814A (zh) 搜索结果排序模型生成方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant