CN105677927A - 用于提供搜索结果的方法和装置 - Google Patents

用于提供搜索结果的方法和装置 Download PDF

Info

Publication number
CN105677927A
CN105677927A CN201610200781.8A CN201610200781A CN105677927A CN 105677927 A CN105677927 A CN 105677927A CN 201610200781 A CN201610200781 A CN 201610200781A CN 105677927 A CN105677927 A CN 105677927A
Authority
CN
China
Prior art keywords
information
webpage
demand
presented
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610200781.8A
Other languages
English (en)
Other versions
CN105677927B (zh
Inventor
秦首科
陈志扬
韩聪
韩友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610200781.8A priority Critical patent/CN105677927B/zh
Publication of CN105677927A publication Critical patent/CN105677927A/zh
Application granted granted Critical
Publication of CN105677927B publication Critical patent/CN105677927B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了用于提供搜索结果的方法和装置。所述方法的一具体实施方式包括:获取用户输入的查询关键词以及用户的特征信息;根据所述查询关键词和所述特征信息确定所述用户的需求信息;基于所述查询关键词和所述需求信息进行搜索,得出至少一个待展示网页;以及根据所述至少一个待展示网页生成交互式对话。该实施方式能够为用户提供包含关键内容的个性化搜索结果,减少了搜索结果中的冗余信息,缩短了用户获取信息的时间。

Description

用于提供搜索结果的方法和装置
技术领域
本申请涉及计算机技术领域,具体涉及终端技术领域,尤其涉及用于提供搜索结果的方法和装置。
背景技术
随着互联网技术的发展,互联网数据日益增长,用户在搜索网页时,可以获取包含大量信息的搜索结果。一般地,用户的搜索操作具有个性化的信息需求,大量的搜索结果虽然能够提供丰富的信息,但用户无法从中快速找到所有感兴趣的内容。另一方面,目前搜索结果的呈现方式比较单一,浏览器只能直接将搜索到的网页的名称或网址以列表方式在搜索结果界面中,用户点击对应的网址后展示网页的全部内容,未根据用户需求对搜索结果中的网页内容进行个性化的处理。
发明内容
有鉴于此,期望能够提供一种可提供准确、个性化信息的搜索处理方法,进一步地,还期望能够提供一种个性化的搜索处理方法。为了解决上述一个或多个问题,本申请提供了用于提供搜索结果的方法和装置。
第一方面,本申请提供了一种用于提供搜索结果的方法,包括:获取用户输入的查询关键词以及用户的特征信息;根据所述查询关键词和所述特征信息确定所述用户的需求信息;基于所述查询关键词和所述需求信息进行搜索,得出至少一个待展示网页;根据所述待展示网页生成交互式对话。
在一些可选的实现方式中,所述方法还包括:展示所述交互式对话。
在一些可选的实现方式中,所述基于所述查询关键词和所述特征信息确定所述用户的需求信息,包括:将所述查询关键词和所述特征信息输入已训练的需求信息识别模型,以识别出至少一个需求关键词,作为所述用户的需求信息。
在一些可选的实现方式中,所述基于所述查询关键词和所述特征信息确定所述用户的需求信息,还包括:基于所述需求信息识别模型识别出所述需求关键词的匹配等级;将所述需求关键词及对应的匹配等级作为所述用户的需求信息。
在一些可选的实现方式中,所述根据所述查询关键词和所述需求信息进行搜索,得出至少一个待展示网页,包括:根据所述查询关键词和所述需求关键词,采用搜索引擎搜索出多个匹配的网页;提取所述匹配的网页的关键内容信息;根据所述关键内容信息从所述匹配的网页中确定出至少一个所述待展示网页。
在一些可选的实现方式中,所述根据所述关键内容信息从所述匹配的网页中确定出至少一个所述待展示网页,包括:按照所述关键内容信息对所述匹配的网页进行排序;根据所述匹配的网页的排序确定出至少一个待展示网页;其中,所述关键内容信息包括以下至少一项:主题、文字量、所述查询关键词和所述需求关键词出现的次数、匹配的查询关键词和需求关键词的数量、所述查询关键词的相似关键词的出现次数、所述需求关键词的相似关键词的出现次数。
在一些可选的实现方式中,所述根据所述至少一个待展示网页生成交互式对话,包括:基于已训练的对话模板,根据所述至少一个待展示网页生成交互式对话。
在一些可选的实现方式中,所述基于已训练的对话模板,根据所述至少一个待展示网页生成交互式对话,包括:根据所述至少一个待展示网页从已训练的对话模板库中确定出目标对话模板;从所述至少一个待展示网页中提取出待展示信息;基于所述待展示信息和所述对话模板生成所述交互式对话。
在一些可选的实现方式中,所述的特征信息包括以下至少一项:年龄、性别、工作类型、关注点信息、位置信息、历史搜索记录。
第二方面,本申请提供了一种用于提供搜索结果的装置,包括:获取单元,用于获取用户输入的查询关键词以及用户的特征信息;确定单元,用于根据所述查询关键词和所述特征信息确定所述用户的需求信息;搜索单元,用于基于所述查询关键词和所述需求信息进行搜索,得出至少一个待展示网页;以及生成单元,用于根据所述待展示网页生成交互式对话。
在一些可选的实现方式中,所述装置还包括:展示单元,用于展示所述交互式对话。
在一些可选的实现方式中,所述确定单元用于按如下方式确定所述用户的需求信息:将所述查询关键词和所述特征信息输入已训练的需求信息识别模型,以识别出至少一个需求关键词,作为所述用户的需求信息。
在一些可选的实现方式中,所述确定单元进一步用于按如下方式确定所述用户的需求信息:基于所述需求信息识别模型识别出所述需求关键词的匹配等级;将所述需求关键词及对应的匹配等级作为所述用户的需求信息。
在一些可选的实现方式中,所述搜索单元用于按照如下方式进行搜索:根据所述查询关键词和所述需求关键词,采用搜索引擎搜索出多个匹配的网页;提取所述匹配的网页的关键内容信息;根据所述关键内容信息从所述匹配的网页中确定出至少一个所述待展示网页。
在一些可选的实现方式中,所述搜索单元进一步用于按照如下方式从所述匹配的网页中确定出至少一个所述待展示网页:按照所述关键内容信息对所述匹配的网页进行排序;根据所述匹配的网页的排序确定出至少一个待展示网页;其中,所述关键内容信息包括以下至少一项:主题、文字量、所述查询关键词和所述需求关键词出现的次数、匹配的查询关键词和需求关键词的数量、所述查询关键词的相似关键词的出现次数、所述需求关键词的相似关键词的出现次数。
在一些可选的实现方式中,所述生成单元进一步用于:基于已训练的对话模板,根据所述至少一个待展示网页生成交互式对话。
在一些可选的实现方式中,所述生成单元用于按照如下方式生成交互式对话:根据所述至少一个待展示网页从已训练的对话模板库中确定出目标对话模板;从所述至少一个待展示网页中提取出待展示信息;基于所述待展示信息和所述对话模板生成所述交互式对话。
在一些可选的实现方式中,所述的特征信息包括以下至少一项:年龄、性别、工作类型、关注点信息、位置信息、历史搜索记录。
本申请提供的用于提供搜索结果的方法和装置,通过获取用户输入的查询关键词以及用户的特征信息;随后基于查询关键词和特征信息确定用户的需求信息;而后根据查询关键词和所述需求信息进行搜索,得出至少一个待展示网页,最后根据待展示网页生成交互式对话,能够实现为用户提供包含关键内容的个性化搜索结果,减少了搜索结果中的冗余信息,缩短了用户获取信息的时间。
附图说明
通过阅读参照以下附图所作的对非限制性实施例详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性***架构图;
图2是根据本申请的用于提供搜索结果的方法的一个实施例的流程图;
图3是本申请的对话模板的示意图;
图4是根据本申请用于提供搜索结果的方法的一个应用场景的效果示意图;
图5是根据本申请的用于提供搜索结果的装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的终端设备或服务器的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户110可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有浏览器和/或各种搜索应用。
终端设备101、102、103可以是具有显示屏并且支持搜索功能的各种电子设备,包括但不限于智能手机、平板电脑、智能手表、电子书阅读器、MP3播放器(MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上的搜索应用提供后台支持的搜索服务器。后台搜索服务器可以基于接收到的搜索请求进行网页抓取,并将抓取结果反馈给终端设备。
需要说明的是,本申请实施例所提供的用于提供搜索结果的方法一般由终端设备101、102、103执行,相应地,用于提供搜索结果的装置一般设置于终端设备101、102、103中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的用于提供搜索结果的方法的一个实施例的流程200。所述的用于提供搜索结果的方法流程200,包括以下步骤:
步骤201,获取用户输入的查询关键词以及用户的特征信息。
在本实施例中,用于提供搜索结果方法运行于其上的电子设备(例如图1所示的终端设备101、102、103)可以接收用户的查询请求,获取查询请求中的查询关键词。同时,上述电子设备还可以获取发出查询请求的用户的特征信息。其中,用户的特征信息可以是表征用户固有属性的信息,可以包括用户的静态信息,例如用户标识(ID)、年龄、性别、工作类型等信息,也可以包括用户的动态行为信息,例如位置信息、历史搜索记录。用户的特征信息还可以包括根据上述静态信息和动态行为信息推测出的其他属性信息,例如关注点信息。
通常,用户在进行搜索操作以获取信息时,可以在搜索框中输入查询关键词进行查询,这时,上述电子设备可以获取用户输入的关键词,从内存中找出对应的用户ID(Identity,身份标识),并根据用户ID获取用户的特征信息。这些特征信息可以预先存储在上述电子设备的内存中,也可以存储在网络服务器中,例如云盘中。
在本实施例中,用户输入的查询关键词不限于用户通过输入应用键入的关键词,还可以包括用户在网页或应用中的划词操作所选中的关键词,以及通过语音模块输入的语音关键词。在一些可选的实施例中,上述电子设备可以对用户输入的关键词进行预处理,例如提取用户划词操作中所选定的词语中的实词,又例如对语音关键词进行语音解析得出文字关键词。
步骤202,根据查询关键词和特征信息确定用户的需求信息。
用户提供搜索结果的方法运行于其上的电子设备可以对获取的查询关键词和特征信息进行分析,从而得出用户的需求信息。用户的需求信息可以是用户的搜索意图信息,用于表征用户期望获取的信息。例如,当用户输入的关键词为“杭州”、“五一”,同时,用户的历史搜索记录中包含其他旅游城市的信息,则可以推断用户可能在五一假期去杭州旅游,用户的搜索意图信息可能包括:当前地理位置所在城市往返杭州的交通信息、杭州的酒店信息、杭州周边城市的旅游信息等,则用户的需求信息可以包含上述搜索意图对应的关键词。
在本实施例的一些可选的实现方式中,上述电子设备可以预先配置需求信息库。需求信息库中包含多种类型的需求信息,每一条需求信息可以与用户的一项或多项特征信息、以及查询关键词相关联。则在获取用户输入的查询关键词以及用户的特征信息之后,可以在需求信息库中查询出关联的需求信息。
在本实施例的另一些可选的实现方式中,上述电子设备可以采用机器学习的方法识别出用户的需求信息。具体地,可以采用如下方式确定用户的需求信息:将查询关键词和特征信息输入已训练的需求信息识别模型,以识别出至少一个需求关键词,作为用户的需求信息。
进一步地,需求信息识别模型的输入可以为至少一个查询关键词和特征信息,输出可以为需求关键词。可以基于已标记的数据或历史需求数据训练需求信息识别模型。已标记的数据中可以包括已标记的查询关键词、用户特征信息与需求关键词之间的对应关系。历史需求数据可以包括根据其他需求信息识别方法得出的查询关键词、用户特征信息与需求关键词之间的对应关系。进一步地,还可以建立测试数据集,根据测试数据集的测试结果对需求信息识别模型中的参数进行修正。
在进一步的实现方式中,需求信息识别模型的输出还可以包括需求关键词的匹配等级,则还可以基于需求信息识别模型识别出需求关键词的匹配等级,将需求关键词及对应的匹配等级作为用户的需求信息。需求关键词的匹配等级可以表征需求的相对强弱程度。当需求信息识别模型识别出多个需求关键词时,还可以对多个需求关键词进行排序,并按照排序确定重要度。重要度高表示需求关键词的需求较强烈,其匹配等级较高。举例而言,当用户输入“杭州”、“五一”后,如果识别出的需求关键词包括“北京到杭州机票”、“杭州酒店”、“苏州旅游信息”、以及“国庆杭州旅游信息”。需求信息识别模型可以确定出“北京到杭州机票”、“杭州酒店”的匹配等级较高,而“苏州旅游信息”、以及“国庆杭州旅游信息”的匹配等级相对较低。
在识别出需求关键词及其对应的匹配等级之后,可以按照匹配等级由高到低对需求关键词进行排序,得出需求关键词列表,作为确定出的需求信息。
步骤203,基于查询关键词和需求信息进行搜索,得出至少一个待展示网页。
在本实施例中,可以基于查询关键词和需求信息生成检索式,利用搜索引擎进行搜索,搜索结果中的网页即为待展示网页。搜索引擎可以按照检索式在网页数据库中抓取相关的一个或多个网页,作为待展示网页。搜索引擎抓取出的多个网页是按照相关度进行排序后的结果。
待展示网页可以包括多种类型的网页,例如包含论坛帖的网页、包含文章的网页、音频或视频播放的网页、在线商务网页等。在一些实施例中,还可以对待展示网页进行筛选,将音频或视频播放的网页、在线商务网页等不能快速为用户提供搜索结果的网页剔除。
在一些实施例中,可以采用如下方式搜索得出至少一个待展示网页:根据所述查询关键词和所述需求关键词,采用搜索引擎搜索出多个匹配的网页,提取匹配的网页的关键内容信息,根据关键内容信息从匹配的网页中确定出至少一个待展示网页。其中,关键内容信息可以包括但不限于:文字量、主题、查询关键词出现的次数、需求关键词出现的次数、匹配的查询关键词的数量、匹配的需求关键词的数量。在采用搜索引擎得出多个匹配的网页之后,可以统计上述关键内容信息,并将关键内容信息满足预设条件的匹配的网页作为待展示网页。例如可以将文字量大于300的网页作为待展示网页,将查询关键词出现的次数大于10且主题相关度大于0.8的网页作为待展示网页。可选地,还可以查询词库,得出与查询关键词和/或需求关键词的相似关键词,将匹配的网页中查询关键词的相似关键词的出现次数、需求关键词的相似关键词的出现次数作为关键内容信息,判断匹配的网页是否为待展示网页。
步骤204,根据至少一个待展示网页生成交互式对话。
上述电子设备可以采用自然语言处理方法将待展示网页转换为交互式对话。具体地,可以对待展示网页进行语义分析,根据语义分析的结果生成交互式对话中部分问题的答案,并为生成的答案配置对应的问题。在一些可选的实现方式中,可以根据用户的需求信息生成问题,并从待展示网页中查找出问题的答案,将多个问题和对应的答案组合生成多轮交互式对话。
上述电子设备还可以采用多种自然语言处理模型对待展示网页进行处理,例如隐马尔科夫模型、最大熵模型、支持向量机等,从而生成交互式对话。
在一些实施例中,可以根据待展示网页的内容和对话模板生成交互式对话。
在进一步的实施例中,对话模板可以是采用机器学习的方法训练得出的。上述电子设备可以基于已训练的对话模板,根据至少一个待展示网页生成交互式对话。具体来说,可以根据至少一个待展示网页从已训练的对话模板库中确定出目标对话模板,从至少一个待展示网页中提取出待展示信息,并基于待展示信息和对话模板生成交互式对话。进一步地,已训练的对话模板可以为根据多个对话文本生成的。具体来说,对话模板可以采用如下方式训练:基于问答类型的文本建立训练样本集和测试集,在利用训练样本集训练得出初始对话模板后,采用测试集进行测试并标记测试结果,根据测试结果对初始对话模板进行修正,得到已训练的对话模板。
对话模板可以是保存在上述电子设备的内存中的通用模板,其与网页的主题内容相关联。进一步地,对话模板相关联的主题内容或主题类型可以被预先配置并与对话模板关联地存储在对话模板库中。在本实施例中,上述电子设备可以根据待展示网页的主题内容或主题类型从对话模板库中找出相关联的目标对话模板。
在一些实施例中,对话模板可以是人工创建的模板,还可以是根据问答类型的网页中的问答内容生成的模板。上述电子设备可以将问答类型的网页中的通用内容提取出来,生成模板,例如可以从“去香港旅游该怎么玩?”中提取出“去**旅游该怎么玩?”进一步地,可以标记对话模板中未写入的内容的类型信息,例如标记问题“去**旅游该怎么玩?”中的“**”可以标记为地名信息,可以标记这个问题的答案为旅行安排。
在查找出对话模板之后,可以对待展示网页中的内容进行分析,提取出对话模板中需要的信息,即所述的待展示信息,将提取出的待展示信息与对话模板进行组合,生成交互式对话。例如,可以从待展示网页的内容中提取出地名信息,添加至模板“去**旅游该怎么玩?”中,若提取出多个地名信息,可以进一步分析地名信息与用户需求信息之间的关联度或统计地名信息出现的次数,将关联度最高或出现次数最多的地名信息添加至模板“去**旅游该怎么玩?”中生成一个问题。相应地,可以从待展示网页的内容中提取出旅行安排的相关信息生成这个问题的答案。
在本实施例中,交互式对话的形式可以为文字对话的形式,可以包括多轮对话,每一轮对话对应待展示网页中的一部分内容。这样,在用户仅输入查询关键词的情况下,也可以得出问答形式的搜索结果。
进一步参考图3,其示出了对话模板的一个示意图。如图3所示,对话模板300包括四轮对话,其中,答案对话框321、322、323、324分别对应于问题对话框311、312、313、314。图3所示为病症查询的一个示例性的对话模板,其中,对话框311、312、313、314、321、322、323、324中的横线部分表示待填入的内容。对话模板300可以预先标记这些横线部分待填入的内容的特征信息,例如可以预先标记对话框311、312中横线部分待填入的为病症名称,对话框321中横线部分待填入的为病症的症状,对话框322中横线部分待填入的为诊断方法,对话框323中横线部分待填入的为治疗方法,对话框324中横线部分待填入的为推荐的医院、医生的相关信息等。
在一些实施中,在生成交互式对话之后,用于提供搜索结果的方法流程200还可以包括:展示交互式对话。具体地,可以按照已配置的对话展示方式展示交互式对话。在一些可选的实现方式中,可以将交互式对话直接展示在搜索结果中,也可以将交互式对话以浮动窗口的形式展示在搜索结果的展示界面中。
继续参考图4,其示出了根据本申请用于提供搜索结果的方法的一个应用场景的效果示意图。当用户在搜索框411中输入“胃溃疡”时,上述电子设备可以根据用户历史搜索记录得出用户的需求信息包括:“症状”“检查”“治疗方式”,根据输入的关键词“胃溃疡”以及需求信息搜索出网页“胃溃疡的临床诊断及治疗”,并提供了该网页的URL。该网页包含胃溃疡的病症及治疗方法介绍的文章。上述电子设备可以基于图3所示的对话模板,从该网页中提取出相关内容,生成交互式对话,并以弹窗412的方式展示在搜索结果的界面中。这样,用户可以快速、方便地获取关键信息,而不需要通读网页中的全部内容。
本申请上述实施例的用于提供搜索结果的方法,通过分析用户需求并生成交互式对话的搜索结果,能够快速提供包含关键内容的搜索结果,减少了搜索结果中的冗余信息,缩短用户获取信息的时间,进一步地,还丰富了搜索结果的展示方式。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种用于提供搜索结果的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例所述的用于提供搜索结果的装置500包括:获取单元501、确定单元502、搜索单元503以及生成单元504。其中,获取单元501用于获取用户输入的查询关键词以及用户的特征信息;确定单元502用于根据查询关键词和特征信息确定所述用户的需求信息;搜索单元503用于基于查询关键词和需求信息进行搜索,得出至少一个待展示网页;生成单元504用于根据待展示网页生成交互式对话。
在本实施例中,获取单元501可以接收用户的查询请求,获取查询请求中的查询关键词以及发出查询请求的用户的特征信息。其中,用户的特征信息可以包括用户的静态信息、动态行为信息以及关注点等属性信息。在一些实施例中,获取单元501可以根据用户ID查找出用户的特征信息。
确定单元502可以对获取单元501获取的查询关键词和特征信息进行分析,从而得出用户的需求信息。具体地,确定单元502可以根据预先配置的需求信息库查找出获取单元501获取的查询关键词和特征信息对应的需求关键词,也可以采用机器学习的方法,基于获取单元501获取的查询关键词和特征信息识别出需求关键词和对应的匹配等级。
搜索单元503可以将获取单元501获取的查询关键词和确定单元502确定出的需求关键词作为搜索关键词进行搜索,利用搜索引擎得出多个匹配的网页,之后可以对匹配的网页的关键内容信息(例如文字量、主题、搜索关键词出现的次数等)进行分析,将关键内容信息满足预设条件的网页作为待展示网页。
生成单元504可以采用自然语言处理方法将待展示网页的内容转换为交互式对话。具体地,生成单元504可以从待展示网页中提取出对话模板需填入的信息并与对话模板进行组合,生成交互式对话。其中,交互式对话可以为多轮文字对话。
在一些可选的实施例中,用于提供搜索结果的装置500还可以包括展示单元505(未示出)。展示单元505用于展示生成单元504生成的交互式对话。
在本实施例的一些可选的实现方式中,确定单元502用于按如下方式确定所述用户的需求信息:将查询关键词和特征信息输入已训练的需求信息识别模型,以识别出至少一个需求关键词,作为用户的需求信息。
在进一步的实现方式中,确定单元503可以基于需求信息识别模型识别出需求关键词的匹配等级,并将需求关键词及对应的匹配等级作为用户的需求信息。
在一些可选的实现方式中,搜索单元503进一步用于按照如下方式从匹配的网页中确定出待展示网页:按照关键内容信息对所述匹配的网页进行排序;根据匹配的网页的排序确定出至少一个待展示网页;其中,关键内容信息包括以下至少一项:主题、文字量、查询关键词和所述需求关键词出现的次数、匹配的查询关键词和需求关键词的数量、查询关键词的相似关键词的出现次数、需求关键词的相似关键词的出现次数。
在一些可选的实现方式中,生成单元504可以基于已训练的对话模板,根据至少一个待展示网页生成交互式对话。进一步地,生成单元504可以用于按照如下方式生成交互式对话:根据至少一个待展示网页从已训练的对话模板库中确定出目标对话模板;从至少一个待展示网页中提取出待展示信息;基于待展示信息和对话模板生成所述交互式对话。
在一些可选的实现方式中,用户的特征信息可以包括以下至少一项:年龄、性别、工作类型、关注点信息、位置信息、历史搜索记录。
本领域技术人员可以理解,上述于提供搜索结果的装置500还包括一些其他公知结构,例如处理器、存储器等,为了不必要地模糊本公开的实施例,这些公知的结构在图5中未示出。
应当理解,装置500中记载的诸单元与参考图2描述的方法中的各个步骤相对应。由此,上文针对用于提供搜索结果的方法描述的操作和特征同样适用于装置500及其中包含的单元,在此不再赘述。装置500中的相应单元可以与终端设备和/或服务器中的单元相互配合以实现本申请实施例的方案。
本申请提供的用于提供搜索结果的装置,能够实现为用户提供包含关键内容的个性化搜索结果,减少了搜索结果中的冗余信息,缩短了用户获取信息的时间。
下面参考图6,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机***600的结构示意图。
如图6所示,计算机***600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有***600操作所需的各种程序和数据。CPU601、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、确定单元、搜索单元和生成单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取用户输入的查询关键词以及用户的特征信息的单元”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:获取用户输入的查询关键词以及用户的特征信息;根据所述查询关键词和所述特征信息确定所述用户的需求信息;基于所述查询关键词和所述需求信息进行搜索,得出至少一个待展示网页;以及根据所述至少一个待展示网页生成交互式对话。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (18)

1.一种用于提供搜索结果的方法,其特征在于,包括:
获取用户输入的查询关键词以及用户的特征信息;
根据所述查询关键词和所述特征信息确定所述用户的需求信息;
基于所述查询关键词和所述需求信息进行搜索,得出至少一个待展示网页;以及
根据所述至少一个待展示网页生成交互式对话。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
展示所述交互式对话。
3.根据权利要求1所述的方法,其特征在于,所述基于所述查询关键词和所述特征信息确定所述用户的需求信息,包括:
将所述查询关键词和所述特征信息输入已训练的需求信息识别模型,以识别出至少一个需求关键词,作为所述用户的需求信息。
4.根据权利要求3所述的方法,其特征在于,所述基于所述查询关键词和所述特征信息确定所述用户的需求信息,还包括:
基于所述需求信息识别模型识别出所述需求关键词的匹配等级;
将所述需求关键词及对应的匹配等级作为所述用户的需求信息。
5.根据权利要求3所述的方法,其特征在于,所述根据所述查询关键词和所述需求信息进行搜索,得出至少一个待展示网页,包括:
根据所述查询关键词和所述需求关键词,采用搜索引擎搜索出多个匹配的网页;
提取所述匹配的网页的关键内容信息;
根据所述关键内容信息从所述匹配的网页中确定出至少一个所述待展示网页。
6.根据权利要求5所述的方法,其特征在于,所述根据所述关键内容信息从所述匹配的网页中确定出至少一个所述待展示网页,包括:
按照所述关键内容信息对所述匹配的网页进行排序;
根据所述匹配的网页的排序确定出至少一个待展示网页;
其中,所述关键内容信息包括以下至少一项:主题、文字量、所述查询关键词和所述需求关键词出现的次数、匹配的查询关键词和需求关键词的数量、所述查询关键词的相似关键词的出现次数、所述需求关键词的相似关键词的出现次数。
7.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个待展示网页生成交互式对话,包括:
基于已训练的对话模板,根据所述至少一个待展示网页生成交互式对话。
8.根据权利要求7所述的方法,其特征在于,所述基于已训练的对话模板,根据所述至少一个待展示网页生成交互式对话,包括:
根据所述至少一个待展示网页从已训练的对话模板库中确定出目标对话模板;
从所述至少一个待展示网页中提取出待展示信息;
基于所述待展示信息和所述对话模板生成所述交互式对话。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述的特征信息包括以下至少一项:年龄、性别、工作类型、关注点信息、位置信息、历史搜索记录。
10.一种用于提供搜索结果的装置,其特征在于,包括:
获取单元,用于获取用户输入的查询关键词以及用户的特征信息;
确定单元,用于根据所述查询关键词和所述特征信息确定所述用户的需求信息;
搜索单元,用于基于所述查询关键词和所述需求信息进行搜索,得出至少一个待展示网页;以及
生成单元,用于根据所述至少一个待展示网页生成交互式对话。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
展示单元,用于展示所述交互式对话。
12.根据权利要求10所述的装置,其特征在于,所述确定单元用于按如下方式确定所述用户的需求信息:
将所述查询关键词和所述特征信息输入已训练的需求信息识别模型,以识别出至少一个需求关键词,作为所述用户的需求信息。
13.根据权利要求12所述的装置,其特征在于,所述确定单元进一步用于按如下方式确定所述用户的需求信息:
基于所述需求信息识别模型识别出所述需求关键词的匹配等级;
将所述需求关键词及对应的匹配等级作为所述用户的需求信息。
14.根据权利要求12所述的装置,其特征在于,所述搜索单元用于按照如下方式进行搜索:
根据所述查询关键词和所述需求关键词,采用搜索引擎搜索出多个匹配的网页;
提取所述匹配的网页的关键内容信息;
根据所述关键内容信息从所述匹配的网页中确定出至少一个所述待展示网页。
15.根据权利要求14所述的装置,其特征在于,所述搜索单元进一步用于按照如下方式从所述匹配的网页中确定出至少一个所述待展示网页:
按照所述关键内容信息对所述匹配的网页进行排序;
根据所述匹配的网页的排序确定出至少一个待展示网页;
其中,所述关键内容信息包括以下至少一项:主题、文字量、所述查询关键词和所述需求关键词出现的次数、匹配的查询关键词和需求关键词的数量、所述查询关键词的相似关键词的出现次数、所述需求关键词的相似关键词的出现次数。
16.根据权利要求10所述的装置,其特征在于,所述生成单元进一步用于:
基于已训练的对话模板,根据所述至少一个待展示网页生成交互式对话。
17.根据权利要求16所述的装置,其特征在于,所述生成单元用于按照如下方式生成交互式对话:
根据所述至少一个待展示网页从已训练的对话模板库中确定出目标对话模板;
从所述至少一个待展示网页中提取出待展示信息;
基于所述待展示信息和所述对话模板生成所述交互式对话。
18.根据权利要求10-17任一项所述的装置,其特征在于,所述的特征信息包括以下至少一项:年龄、性别、工作类型、关注点信息、位置信息、历史搜索记录。
CN201610200781.8A 2016-03-31 2016-03-31 用于提供搜索结果的方法和装置 Active CN105677927B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610200781.8A CN105677927B (zh) 2016-03-31 2016-03-31 用于提供搜索结果的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610200781.8A CN105677927B (zh) 2016-03-31 2016-03-31 用于提供搜索结果的方法和装置

Publications (2)

Publication Number Publication Date
CN105677927A true CN105677927A (zh) 2016-06-15
CN105677927B CN105677927B (zh) 2019-04-12

Family

ID=56225733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610200781.8A Active CN105677927B (zh) 2016-03-31 2016-03-31 用于提供搜索结果的方法和装置

Country Status (1)

Country Link
CN (1) CN105677927B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106469205A (zh) * 2016-08-31 2017-03-01 百度在线网络技术(北京)有限公司 一种确定用户的地理位置信息的方法与装置
CN106874507A (zh) * 2017-02-28 2017-06-20 百度在线网络技术(北京)有限公司 用于推送信息的方法、装置及服务器
CN107357875A (zh) * 2017-07-04 2017-11-17 北京奇艺世纪科技有限公司 一种语音搜索方法、装置及电子设备
CN107515951A (zh) * 2017-09-20 2017-12-26 广东中标数据科技股份有限公司 一种基于图形数据库的搜索方法、***和装置
CN108763264A (zh) * 2018-03-30 2018-11-06 斑马网络技术有限公司 基于车辆的智能搜索***及其搜索方法
CN110147485A (zh) * 2017-09-22 2019-08-20 北京京东尚科信息技术有限公司 一种识别搜索词的属性的方法和装置
CN110245289A (zh) * 2019-05-20 2019-09-17 中国平安财产保险股份有限公司 一种信息搜索方法以及相关设备
CN111291086A (zh) * 2020-01-15 2020-06-16 北京爱论答科技有限公司 一种课程内容搜索方法、***、设备及存储介质
CN113449050A (zh) * 2020-03-24 2021-09-28 北京四维图新科技股份有限公司 位置搜索方法、装置及存储介质
CN114492972A (zh) * 2022-01-17 2022-05-13 上海季丰电子股份有限公司 一种提供量产测试平台选型的方法
CN117493511A (zh) * 2023-11-02 2024-02-02 国农(重庆)生猪大数据产业发展有限公司 基于大语言模型的生猪领域自动问答***及方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685454A (zh) * 2008-09-28 2010-03-31 华为技术有限公司 人机交互方法及***
CN102325152A (zh) * 2011-07-11 2012-01-18 吴丽嫦 基于网页内容加载聊天室的方法及***
CN102385585A (zh) * 2010-08-27 2012-03-21 阿里巴巴集团控股有限公司 网页数据库的建立方法、网页搜索方法以及相关装置
CN102982025A (zh) * 2011-09-02 2013-03-20 北京百度网讯科技有限公司 一种搜索需求识别方法及装置
US20140067816A1 (en) * 2012-08-29 2014-03-06 Microsoft Corporation Surfacing entity attributes with search results
CN104133908A (zh) * 2014-08-07 2014-11-05 北京奇虎科技有限公司 在页面显示或生成讨论框的方法、服务器、客户端和***
CN104317920A (zh) * 2014-10-29 2015-01-28 中英融贯资讯(武汉)有限公司 基于智能匹配用户需求的信息推送方法及***
US20150302103A1 (en) * 2012-05-17 2015-10-22 Leo Jeremias Computer system and methods for chat enabled online search
CN105045889A (zh) * 2015-07-29 2015-11-11 百度在线网络技术(北京)有限公司 一种信息推送方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685454A (zh) * 2008-09-28 2010-03-31 华为技术有限公司 人机交互方法及***
CN102385585A (zh) * 2010-08-27 2012-03-21 阿里巴巴集团控股有限公司 网页数据库的建立方法、网页搜索方法以及相关装置
CN102325152A (zh) * 2011-07-11 2012-01-18 吴丽嫦 基于网页内容加载聊天室的方法及***
CN102982025A (zh) * 2011-09-02 2013-03-20 北京百度网讯科技有限公司 一种搜索需求识别方法及装置
US20150302103A1 (en) * 2012-05-17 2015-10-22 Leo Jeremias Computer system and methods for chat enabled online search
US20140067816A1 (en) * 2012-08-29 2014-03-06 Microsoft Corporation Surfacing entity attributes with search results
CN104133908A (zh) * 2014-08-07 2014-11-05 北京奇虎科技有限公司 在页面显示或生成讨论框的方法、服务器、客户端和***
CN104317920A (zh) * 2014-10-29 2015-01-28 中英融贯资讯(武汉)有限公司 基于智能匹配用户需求的信息推送方法及***
CN105045889A (zh) * 2015-07-29 2015-11-11 百度在线网络技术(北京)有限公司 一种信息推送方法及装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106469205B (zh) * 2016-08-31 2020-06-05 百度在线网络技术(北京)有限公司 一种确定用户的地理位置信息的方法与装置
CN106469205A (zh) * 2016-08-31 2017-03-01 百度在线网络技术(北京)有限公司 一种确定用户的地理位置信息的方法与装置
CN106874507A (zh) * 2017-02-28 2017-06-20 百度在线网络技术(北京)有限公司 用于推送信息的方法、装置及服务器
CN106874507B (zh) * 2017-02-28 2020-12-25 百度在线网络技术(北京)有限公司 用于推送信息的方法、装置及服务器
CN107357875A (zh) * 2017-07-04 2017-11-17 北京奇艺世纪科技有限公司 一种语音搜索方法、装置及电子设备
CN107515951A (zh) * 2017-09-20 2017-12-26 广东中标数据科技股份有限公司 一种基于图形数据库的搜索方法、***和装置
CN110147485A (zh) * 2017-09-22 2019-08-20 北京京东尚科信息技术有限公司 一种识别搜索词的属性的方法和装置
CN108763264A (zh) * 2018-03-30 2018-11-06 斑马网络技术有限公司 基于车辆的智能搜索***及其搜索方法
CN110245289A (zh) * 2019-05-20 2019-09-17 中国平安财产保险股份有限公司 一种信息搜索方法以及相关设备
CN111291086A (zh) * 2020-01-15 2020-06-16 北京爱论答科技有限公司 一种课程内容搜索方法、***、设备及存储介质
CN113449050A (zh) * 2020-03-24 2021-09-28 北京四维图新科技股份有限公司 位置搜索方法、装置及存储介质
CN113449050B (zh) * 2020-03-24 2024-04-16 北京四维图新科技股份有限公司 位置搜索方法、装置及存储介质
CN114492972A (zh) * 2022-01-17 2022-05-13 上海季丰电子股份有限公司 一种提供量产测试平台选型的方法
CN117493511A (zh) * 2023-11-02 2024-02-02 国农(重庆)生猪大数据产业发展有限公司 基于大语言模型的生猪领域自动问答***及方法
CN117493511B (zh) * 2023-11-02 2024-06-07 国农(重庆)生猪大数据产业发展有限公司 基于大语言模型的生猪领域自动问答***及方法

Also Published As

Publication number Publication date
CN105677927B (zh) 2019-04-12

Similar Documents

Publication Publication Date Title
CN105677927A (zh) 用于提供搜索结果的方法和装置
US11669579B2 (en) Method and apparatus for providing search results
US11172040B2 (en) Method and apparatus for pushing information
CN109190049B (zh) 关键词推荐方法、***、电子设备和计算机可读介质
CN102779114B (zh) 利用自动规则生成的非结构化数据支持
CN102549573B (zh) 用于提供高级搜索结果页面内容的***和方法
US10776885B2 (en) Mutually reinforcing ranking of social media accounts and contents
US9443014B2 (en) Custom web page themes
WO2019153685A1 (zh) 文本处理方法、装置、计算机设备和存储介质
US20150169525A1 (en) Augmented reality image annotation
US20120005686A1 (en) Annotating HTML Segments With Functional Labels
CN102549572A (zh) 用于提供高级搜索结果页面内容的***和方法
CN105630876A (zh) 跨应用的信息获取方法和装置
CN101288067A (zh) 从电子文档组装、提取和配置内容的方法和装置
US11182540B2 (en) Passively suggesting text in an electronic document
CN105426508A (zh) 网页生成方法和装置
CN106326386B (zh) 搜索结果的展示方法和装置
CN105677931A (zh) 信息搜索方法和装置
US20170235836A1 (en) Information identification and extraction
CN115982376B (zh) 基于文本、多模数据和知识训练模型的方法和装置
JP2011527062A (ja) ホームページ統合サービス提供システム及び方法
CN105701182A (zh) 信息推送方法和装置
Zeng Evaluation and enhancement of web content accessibility for persons with disabilities
CN110737824A (zh) 内容查询方法和装置
US20170235835A1 (en) Information identification and extraction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant