CN106776860A - 一种搜索摘要生成方法及装置 - Google Patents
一种搜索摘要生成方法及装置 Download PDFInfo
- Publication number
- CN106776860A CN106776860A CN201611070196.7A CN201611070196A CN106776860A CN 106776860 A CN106776860 A CN 106776860A CN 201611070196 A CN201611070196 A CN 201611070196A CN 106776860 A CN106776860 A CN 106776860A
- Authority
- CN
- China
- Prior art keywords
- user
- search
- portrait
- query word
- network address
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种搜索摘要生成方法及装置,该方法包括:获取与用户输入的查询词相关的目标网址;并且获取用户的用户画像,该用户画像用于描述用户的搜索习惯、搜索偏好、搜索频率、消费习惯、搜索关注点中的至少一种;最后,根据上述查询词和上述用户画像生成上述目标网址对应的搜索摘要,并展示该搜索摘要。本发明实施例将用户画像融入搜索摘要的生成与展示过程中,将用户画像作为生成搜索摘要的依据,可以有效保证生成的搜索摘要更符合用户的搜索习惯、偏好、关注点,从而能够使得用户根据搜索摘要即可快速、准确地识别出该链接是否为用户所需的链接,进而提高用户的搜索效率和准确性。
Description
技术领域
本发明涉及搜索引擎技术领域,具体而言,涉及一种搜索摘要生成方法及装置。
背景技术
目前,随着网络信息技术的发展,基于快速而准确的找到所需的信息需求,搜索引擎应运而生。用户在搜索***中进行检索时,搜索引擎根据用户提交的检索请求提供大量对应网站的统一资源定位符(Uniform Resource Locator,URL,也称网址)和摘要,用户通过阅读摘要来决定是否浏览该摘要对应的网站。因此,摘要的意义在于指导用户判断URL的价值。
一般来说,摘要指的是一篇文章的简短介绍,能准确全面地反映某一篇文章中心内容的简洁连贯的短文,但是搜索引擎采用的摘要概念不一样,它不一定是文章的简短介绍,它只是按照一定的规则在网页中提取的一段信息。搜索引擎中的摘要按照获取的方式不同可以分为两种摘要,一种是静态摘要,另一种是动态摘要,其中,静态摘要只是关于页面内容的一般信息,与用户输入的查询词无关,以文档的内容为中心;动态摘要就是在响应用户查询时,根据查询词在文档中出现的位置,提取出查询词周围相关的文字,在显示时将查询词标出并返回给用户,以查询为中心。当采用动态摘要时,对于一篇文档而言,当用户输入的查询词不同时,最终生成的摘要有所不同。
对于现有的技术方案,虽然动态摘要与用户输入的查询词关联起来,由文档中的若干与查询词相关的片段构成,该动态摘要包含了与用户输入的查询词相关的信息,但是,现有技术中的每个链接对应的动态摘要对于不同的用户而言存在针对性差的问题,导致用户根据现有的动态摘要不能快速、准确地识别出该链接是否为用户所需的链接,进而降低用户的搜索效率和准确性。
发明内容
有鉴于此,本发明实施例的目的在于提供一种搜索摘要生成方法及装置,以解决现有的动态摘要不能完全、准确反映出链接是否是用户感兴趣的内容,容易误导用户,进而降低用户的搜索效率和准确性的问题。
第一方面,本发明实施例提供了一种搜索摘要生成方法,该方法包括:
获取根据用户输入的查询词进行检索得到的与所述查询词相关的目标网址;
获取所述用户的用户画像,所述用户画像用于描述所述用户的搜索习惯、搜索偏好、搜索频率、消费习惯、搜索关注点中的至少一种;
根据所述查询词和所述用户画像生成所述目标网址对应的搜索摘要;
展示各个所述目标网址对应的所述搜索摘要。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述获取所述用户的用户画像之前,还包括:
获取所述用户的历史行为数据,所述历史行为数据包括用户基本信息、历史登陆信息、历史搜索记录、历史浏览记录、历史收藏记录、历史下载记录、历史评论记录和历史消费记录中的至少一种;和/或,
获取所述用户当前搜索行为的上下文信息,所述上下文信息包括当前时间、当前地点、当前环境、所述用户最近搜索的词语、所述用户最近浏览的网页中的至少一种;
根据所述用户的历史行为数据和/或所述上下文信息建立所述用户的用户画像。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述根据所述查询词和所述用户画像生成所述目标网址对应的搜索摘要,包括:
根据所述查询词,在所述目标网址对应的网页中的文档中提取出多个候选摘要句;
设置所述用户画像中各个特征标签的权重值;
按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的所述权重值对多个所述候选摘要句进行排序;
选取排序靠前的预设数量的所述候选摘要句生成所述目标网址相应的搜索摘要。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述根据所述查询词,在所述目标网址对应的网页中的文档中提取出多个候选摘要句,包括:
对所述目标网址对应的网页中的文档进行分词;
将所述查询词与分词后的所述文档进行匹配,计算出所述查询词在所述文档中出现的位置;以及将所述查询词的近义词与分词后的所述文档进行匹配,计算出所述查询词的近义词在所述文档中出现的位置;
在所述文档中,以所述查询词出现的位置和所述查询词的近义词出现的位置为基准,截取多个候选摘要句。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述设置所述用户画像中各个特征标签的权重值,包括:
计算用户历史上对所述用户画像中每个所述特征标签的操作集中度;
根据所述操作集中度确定各个所述特征标签的权重值。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的所述权重值对多个所述候选摘要句进行排序,包括:
采用逻辑回归模型或者梯度提升树模型按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的所述权重值对多个所述候选摘要句进行排序。
第二方面,本发明实施例还提供了一种搜索摘要生成装置,该装置包括:
目标网址获取模块,用于获取根据用户输入的查询词进行检索得到的与所述查询词相关的目标网址;
用户画像获取模块,用于获取所述用户的用户画像,所述用户画像用于描述所述用户的搜索习惯、搜索偏好、搜索频率、消费习惯、搜索关注点中的至少一种;
搜索摘要生成模块,用于根据所述查询词和所述用户画像生成所述目标网址对应的搜索摘要。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,所述装置还包括:
历史行为数据获取模块,用于获取所述用户的历史行为数据,所述历史行为数据包括用户基本信息、历史登陆信息、历史搜索记录、历史浏览记录、历史收藏记录、历史下载记录、历史评论记录和历史消费记录中的至少一种;和/或,
上下文信息获取模块,用于获取所述用户当前搜索行为的上下文信息,所述上下文信息包括当前时间、当前地点、当前环境、所述用户最近搜索的词语、所述用户最近浏览的网页中的至少一种;
用户画像建立模块,用于根据所述用户的历史行为数据和/或所述上下文信息建立所述用户的用户画像。
结合第二方面,本发明实施例提供了第二方面的第二种可能的实施方式,其中,所述搜索摘要生成模块包括:
候选摘要句提取子模块,用于根据所述查询词,在所述目标网址对应的网页中的文档中提取出多个候选摘要句;
特征标签权重值确定子模块,用于设置所述用户画像中各个特征标签的权重值;
候选摘要句排序子模块,用于按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的所述权重值对多个所述候选摘要句进行排序;
搜索摘要生成子模块,用于选取排序靠前的预设数量的所述候选摘要句生成所述目标网址相应的搜索摘要。
结合第二方面的第二种可能的实施方式,本发明实施例提供了第二方面的第三种可能的实施方式,其中,所述候选摘要句提取子模块,具体用于对所述目标网址对应的网页中的文档进行分词;将所述查询词与分词后的所述文档进行匹配,计算出所述查询词在所述文档中出现的位置;以及将所述查询词的近义词与分词后的所述文档进行匹配,计算出所述查询词的近义词在所述文档中出现的位置;在所述文档中,以所述查询词出现的位置和所述查询词的近义词出现的位置为基准,截取多个候选摘要句。
结合第二方面的第二种可能的实施方式,本发明实施例提供了第二方面的第四种可能的实施方式,其中,所述特征标签权重值确定子模块,具体用于计算用户历史上对所述用户画像中每个所述特征标签的操作集中度;根据所述操作集中度确定各个所述特征标签的权重值。
结合第二方面的第二种可能的实施方式,本发明实施例提供了第二方面的第四种可能的实施方式,其中,所述候选摘要句排序子模块,具体用于采用逻辑回归模型或者梯度提升树模型按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的所述权重值对多个所述候选摘要句进行排序。
结合第二方面,本发明实施例提供了第二方面的第五种可能的实施方式,其中,所述装置还包括:
搜索摘要展示模块,用于展示各个所述目标网址对应的搜索摘要,该搜素摘要为根据所述查询词和用户画像生成的。
在本发明实施例提供的搜索摘要生成方法及装置中,该方法包括:获取与用户输入的查询词相关的目标网址;并且获取用户的用户画像,该用户画像用于描述用户的搜索习惯、搜索偏好、搜索频率、消费习惯、搜索关注点中的至少一种;最后,根据上述查询词和上述用户画像生成该目标网址对应的的搜索摘要,并展示该搜索摘要。相较于现有技术,本发明将用户画像融入搜索摘要的生成与展示过程中,将用户画像作为生成搜索摘要的依据,可以有效保证生成的搜索摘要更符合用户的搜索习惯、偏好、关注点,从而能够使得用户根据搜索摘要即可快速、准确地识别出该链接是否为用户所需的链接,进而提高用户的搜索效率和准确性。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例所提供的一种搜索摘要生成方法的流程示意图;
图2示出了本发明实施例所提供的一种搜索摘要生成方法中搜索摘要生成过程的流程示意图;
图3示出了本发明实施例所提供的一种搜索摘要生成装置的结构示意图;
图4示出了本发明实施例所提供的一种搜索摘要生成装置中搜索摘要生成模块的结构示意图;
图5示出了本发明实施例所提供的另一种搜索摘要生成装置的结构示意图;
图6示出了本发明实施例所提供的一种各个目标网址对应的搜索摘要的展示效果示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
考虑到对于现有的技术方案,虽然动态摘要与用户输入的查询词关联起来,由文档中的若干与查询词相关的片段构成,该动态摘要包含了与用户输入的查询词相关的信息,但是,现有技术中的每个链接对应的动态摘要对于不同的用户而言存在针对性差的问题,导致用户根据现有的动态摘要不能快速、准确地识别出该链接是否为用户所需的链接,进而降低用户的搜索效率和准确性。基于此,本发明实施例提供了一种搜索摘要生成方法及装置,下面通过实施例进行描述。
如图1所示,本发明实施例提供了一种搜索摘要生成方法,该方法包括步骤S102-S106,具体如下:
步骤S102:获取根据用户输入的查询词进行检索得到的与该查询词相关的目标网址;
步骤S104:获取上述用户的用户画像,该用户画像用于描述上述用户的搜索习惯、搜索偏好、搜索频率、消费习惯、搜索关注点中的至少一种;
步骤S106:根据上述查询词和上述用户画像生成上述目标网址对应的搜索摘要;
步骤S108:展示各个目标网址对应的上述搜索摘要。
具体的,由用户终端接收用户输入的查询词,用户可以通过搜索界面输入查询词,也可以通过语音的方式输入查询词,然后,用户终端将该查询词发送至服务器,服务器根据该查询词进行检索,检索得到与该查询词相关的目标网址;
其中,生成搜索摘要的过程可以由用户终端来执行,也可以由服务器来执行,具体为:
当生成搜索摘要的过程由用户终端来执行时,服务器将检索到的与查询词相关的目标网址和各个目标网址对应的网页发送至用户终端;用户终端根据获取到的查询词和用户画像生成上述目标网址对应的搜索摘要,最后,由用户终端依次展示各个目标网址、以及各个目标网址对应的搜索摘要;
当生成搜索摘要的过程由服务器来执行时,服务器根据接收到的查询词进行检索,得到与该查询词相关的目标网址;服务器根据获取到的查询词和用户画像生成上述目标网址对应的搜索摘要,并将各个目标网址和各个目标网址对应的搜索摘要发送至用户终端,最后,由用户终端依次展示各个目标网址、以及各个目标网址对应的搜索摘要。
具体的,上述展示各个目标网址对应的上述搜索摘要,具体包括在标题名称展示区逐条展示与用户输入的查询词相关的各个目标网址对应的标题名称、以及在搜索摘要展示区逐条展示各个目标网址对应的搜索摘要,其中,该为根据上述查询词和用户画像生成的,标题名称上携带有目标网址网址标识;
由于将用户画像融入搜索摘要的生成与展示过程中,将用户画像作为生成搜索摘要的依据,最终在搜索摘要展示区展示的搜索摘要更符合用户的搜索习惯、偏好、关注点,用户能够根据搜索摘要即可快速、准确地识别出该链接是否为用户所需的链接,具体的,当用户终端接收到用户点击指令时,打开并显示该目标网址对应的网页内容,此时用户可以浏览全部网页内容;
进一步的,在显示目标网址对应的网页内容之前,上述展示各个目标网址对应的上述搜索摘要,还包括对网页内容中与搜索摘要相关的内容进行标记,该标记包括:加粗标记、颜色标记、下弧线标记中的一种或多种;然后,再显示标记后的该目标网址对应的网页内容,这样能够使得用户快速查看到搜索摘要附近的相关内容;
在本发明提供的实施例中,将用户画像融入搜索摘要的生成与展示过程中,将用户画像作为生成搜索摘要的依据,可以有效保证生成的搜索摘要更符合用户的搜索习惯、偏好、关注点,从而能够使得用户根据搜索摘要即可快速、准确地识别出该链接是否为用户所需的链接,进而提高用户的搜索效率和准确性。
另外,需要说明的是,在本发明提供的实施例中对步骤S102和步骤S104的先后执行顺序不做限定,进一步的,为了将获得的与查询词相关的多个目标网址的显示顺序和用户的用户画像相关联,上述展示各个目标网址对应的所述搜索摘要,包括:按照目标网址对应的网页内容与用户画像关联度由高到低的顺序依次展示各个所述目标网址和所述目标网址对应的所述搜索摘要,这样,能够使得用户优先查看与用户画像最相关的目标网址。
进一步的,需要预先针对每个用户分别建立用户画像,用户画像精准地描述了用户行为习惯、消费习惯等重要信息,每个用户的用户画像均存在一定的差异,能够对后续生成各个目标网址的搜索摘要过程提供有效的理论依据,基于此,上述获取上述用户的用户画像之前,还包括:
获取上述用户的历史行为数据,该历史行为数据包括用户基本信息、历史登陆信息、历史搜索记录、历史浏览记录、历史收藏记录、历史下载记录、历史评论记录和历史消费记录中的至少一种;和/或,
获取上述用户当前搜索行为的上下文信息,该上下文信息包括当前时间、当前地点、当前环境、上述用户最近搜索的词语、上述用户最近浏览的网页中的至少一种;
根据上述用户的历史行为数据和/或上述上下文信息建立上述用户的用户画像。
具体的,上述用户基本信息可以包括:用户年龄、用户学历、用户所在位置信息、用户性别、用户职业,另外,在本发明提供的实施例中,每个用户对应的用户画像可以是根据用户的历史行为数据生成的,也可以是根据用户当前搜索行为的上下文信息生成的,还可以是同时根据用户的历史行为数据和用户当前搜索行为的上下文信息生成的,其中,考虑到用户历史行为数据主要反映的是对用户前期搜索习惯等大数据,对用户的当前意图的敏感性稍弱,因此,在建立用户的用户画像过程中增加当前搜索行为的上下文信息,如查询时间、地点、环境、最近检索词、最近浏览网页等,能够更加准确地识别用户当前的意图,从而进一步提高了最终呈现的搜索摘要的精准度。
例如,根据用户的历史行为数据和用户当前搜索行为的上下文信息生成用户画像时,后续根据该用户画像生成各个目标网址对应的搜索摘要过程中,以上下文信息为当前时间为例,对于体育新闻类搜索行为,分为当前时间为赛季和非赛季,当当前时间为赛季时,生成的搜索摘要应该包含实时赛事实况的相关信息,该信息可能是当前用户最关注的信息。
进一步的,考虑到获取到的用户的历史行为数据可能包含一些非格式化的数据或者冗余的数据,该数据不仅需要庞大的存储开销,而且不易于大数据分析,基于此,在获取上述用户的历史行为数据之后,还包括:对获取到的用户的历史行为数据进行清洗去重处理和格式化处理。
在本发明提供的实施例中,通过预先为每个用户建立相应的用户画像,后续在生成目标网址对应的搜索摘要时,将当前搜索用户对应的用户画像考虑进去,针对于同一目标网址,即使不同用户输入的查询词相同,但最终呈现出的该目标网址相应的搜索摘要也可能有所不同,使得最终呈现给用户的搜索摘要更具有针对性,且更具有指导价值。
其中,如图2所示,上述步骤S106:根据上述查询词和上述用户画像生成上述目标网址对应的搜索摘要,具体包括:
步骤S1062:根据上述查询词,在上述目标网址对应的网页中的文档中提取出多个候选摘要句;
步骤S1064:设置上述用户画像中各个特征标签的权重值;
步骤S1066:按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的上述权重值对多个上述候选摘要句进行排序;
步骤S1068:选取排序靠前的预设数量的上述候选摘要句生成上述目标网址相应的搜索摘要。
具体的,上述步骤S1062:根据上述查询词,在上述目标网址对应的网页中的文档中提取出多个候选摘要句,具体包括:
对上述目标网址对应的网页中的文档进行分词;
将上述查询词与分词后的上述文档进行匹配,计算出上述查询词在上述文档中出现的位置;以及将上述查询词的近义词与分词后的上述文档进行匹配,计算出上述查询词的近义词在上述文档中出现的位置;
在上述文档中,以上述查询词出现的位置和上述查询词的近义词出现的位置为基准,截取多个候选摘要句。
具体的,考虑到用户画像中的各个特征标签对用户综合偏好的影响程度有所不同,通过为各个特征标签设置不同的权重值的方式,可以更进一步的提升最终生成的搜索摘要针对性和准确性,基于此,上述步骤S1064:设置上述用户画像中各个特征标签的权重值,具体包括:
计算用户历史上对上述用户画像中每个上述特征标签的操作集中度;
根据上述操作集中度确定各个上述特征标签的权重值。
例如,通过对某一用户的历史行为数据进行分析得知,该用户的消费水平主要集中在购买价格偏低的商品(属于低消费群体),且该用户的品牌偏好主要集中在购买大品牌的商品(属于大品牌爱好者),该用户所购买的商品种类中日常生活用品类偏多,但该用户所购买的商品种类比较多样,该用户的用户画像中关于消费水平对应的特征标签为低消费群体,关于品牌偏好对应的特征标签为大品牌爱好者,关于商品种类对应的特征标签为日常生活用品类,然而,由于该用户的用户画像中消费水平和品牌偏好的操作集中度高于商品种类的操作集中度,此时,可以设置为消费水平和品牌偏好的权重值大于商品种类的权重值;
对应的,最终为每个商品链接生成的搜索摘要可以更注重说明关于品牌的介绍,以及品牌的打折、促销、换购等相关信息,此时,从该搜索摘要中用户可以快速、准确地识别出该链接是否为用户所需的链接,有助于用户打开有效的链接,过滤掉无效的链接。
具体的,上述步骤S1066:按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的上述权重值对多个上述候选摘要句进行排序,具体包括:
采用逻辑回归模型或者梯度提升树模型按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的上述权重值对多个上述候选摘要句进行排序。
其中,可以利用逻辑回归模型或者梯度提升树模型对选取出的候选摘要句进行排序,将候选摘要句和用户画像中的各个特征标签的权重值作为输入参数输入至模型中,即可输出各个候选摘要句与用户画像关联度的排序结果。
在本发明提供的实施例中,通过为用户画像中的各个特征标签设置不同的权重值,参考各个特征标签的权重值确定各个候选摘要句与用户画像之间的关联度,并按照关联度由高到低的顺序对各个候选摘要句进行排序,最后,选取排序靠前的预设数量的候选摘要句作为最终显示的搜索摘要,这样,能够更进一步的提升最终生成的搜索摘要针对性和准确性。
在本发明实施例提供的搜索摘要生成方法中,首先,获取与用户输入的查询词相关的目标网址;并且获取用户的用户画像,该用户画像用于描述用户的搜索习惯、搜索偏好、搜索频率、消费习惯、搜索关注点中的至少一种;最后,根据上述查询词和上述用户画像生成该目标网址对应的搜索摘要,并展示该搜索摘要。本发明实施例将用户画像融入搜索摘要的生成与展示过程中,将用户画像作为生成搜索摘要的依据,可以有效保证生成的搜索摘要更符合用户的搜索习惯、偏好、关注点,从而能够使得用户根据搜索摘要即可快速、准确地识别出该链接是否为用户所需的链接,进而提高用户的搜索效率和准确性;进一步的,考虑到用户历史行为数据主要反映的是对用户前期搜索习惯等大数据,对用户的当前意图的敏感性稍弱,因此,在建立用户的用户画像过程中增加当前搜索行为的上下文信息,能够更加准确地识别用户当前的意图,从而进一步提高了最终呈现的搜索摘要的精准度;更进一步的,通过为用户画像中的各个特征标签设置不同的权重值,参考各个特征标签的权重值确定各个候选摘要句与用户画像之间的关联度,并按照关联度由高到低的顺序对各个候选摘要句进行排序,最后,选取排序靠前的预设数量的候选摘要句作为最终显示的搜索摘要,这样,能够更进一步的提升最终生成的搜索摘要针对性和准确性。
本发明实施例还提供一种搜索摘要生成装置,如图3所示,该装置包括:
目标网址获取模块302,用于获取根据用户输入的查询词进行检索得到的与所述查询词相关的目标网址;
用户画像获取模块304,用于获取上述用户的用户画像,该用户画像用于描述上述用户的搜索习惯、搜索偏好、搜索频率、消费习惯、搜索关注点中的至少一种;
搜索摘要生成模块306,用于根据上述查询词和上述用户画像生成上述目标网址对应的搜索摘要。
具体的,上述搜索摘要生成装置可以设置于用户终端侧,也可以设置于服务器侧,具体为:
(1)当上述搜索摘要生成装置设置于用户终端侧时,服务器将检索到的与查询词相关的目标网址和各个目标网址对应的网页发送至用户终端;用户终端根据获取到的查询词和用户画像生成上述目标网址对应的搜索摘要,在各个目标网址对应的网页中提取出目标网址相应的搜索摘要,最后,由用户终端依次展示各个目标网址、以及各个目标网址对应的搜索摘要;
(2)当上述搜索摘要生成装置设置于服务器侧时,服务器根据接收到的查询词进行检索,得到与该查询词相关的目标网址;服务器根据获取到的查询词和用户画像生成上述目标网址对应的搜索摘要,在各个目标网址对应的网页中提取出目标网址相应的搜索摘要,并将各个目标网址和各个目标网址对应的搜索摘要发送至用户终端,最后,由用户终端依次展示各个目标网址、以及各个目标网址对应的搜索摘要。
在本发明提供的实施例中,将用户画像融入搜索摘要的生成与展示过程中,将用户画像作为生成搜索摘要的依据,可以有效保证生成的搜索摘要更符合用户的搜索习惯、偏好、关注点,从而能够使得用户根据搜索摘要即可快速、准确地识别出该链接是否为用户所需的链接,进而提高用户的搜索效率和准确性。
进一步的,需要预先针对每个用户分别建立用户画像,用户画像精准地描述了用户行为习惯、消费习惯等重要信息,每个用户的用户画像均存在一定的差异,能够对后续生成各个目标网址的搜索摘要过程提供有效的理论依据,基于此,上述装置还包括:
历史行为数据获取模块,用于获取上述用户的历史行为数据,该历史行为数据包括用户基本信息、历史登陆信息、历史搜索记录、历史浏览记录、历史收藏记录、历史下载记录、历史评论记录和历史消费记录中的至少一种;和/或,
上下文信息获取模块,用于获取上述用户当前搜索行为的上下文信息,该上下文信息包括当前时间、当前地点、当前环境、上述用户最近搜索的词语、上述用户最近浏览的网页中的至少一种;
用户画像建立模块,用于根据上述用户的历史行为数据和/或上述上下文信息建立上述用户的用户画像。
在本发明提供的实施例中,通过预先为每个用户建立相应的用户画像,后续在生成目标网址对应的搜索摘要时,将当前搜索用户对应的用户画像考虑进去,针对于同一目标网址,即使不同用户输入的查询词相同,但最终呈现出的该目标网址相应的搜索摘要也可能有所不同,使得最终呈现给用户的搜索摘要更具有针对性,且更具有指导价值。
进一步的,如图4所示,上述搜索摘要生成模块306包括:
候选摘要句提取子模块3062,用于根据上述查询词,在上述目标网址对应的网页中的文档中提取出多个候选摘要句;
特征标签权重值确定子模块3064,用于设置上述用户画像中各个特征标签的权重值;
候选摘要句排序子模块3066,用于按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的上述权重值对多个上述候选摘要句进行排序;
搜索摘要生成子模块3068,用于选取排序靠前的预设数量的上述候选摘要句生成上述目标网址相应的搜索摘要。
进一步的,上述候选摘要句提取子模块3062,具体用于对上述目标网址对应的网页中的文档进行分词;将上述查询词与分词后的上述文档进行匹配,计算出上述查询词在上述文档中出现的位置;以及将上述查询词的近义词与分词后的上述文档进行匹配,计算出上述查询词的近义词在上述文档中出现的位置;在上述文档中,以上述查询词出现的位置和上述查询词的近义词出现的位置为基准,截取多个候选摘要句。
进一步的,考虑到用户画像中的各个特征标签对用户综合偏好的影响程度有所不同,通过为各个特征标签设置不同的权重值的方式,可以更进一步的提升最终生成的搜索摘要针对性和准确性,基于此,上述特征标签权重值确定子模块3064,具体用于计算用户历史上对上述用户画像中每个上述特征标签的操作集中度;根据上述操作集中度确定各个上述特征标签的权重值。
进一步的,上述候选摘要句排序子模块3066,具体用于采用逻辑回归模型或者梯度提升树模型按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的上述权重值对多个上述候选摘要句进行排序。
在本发明提供的实施例中,通过为用户画像中的各个特征标签设置不同的权重值,参考各个特征标签的权重值确定各个候选摘要句与用户画像之间的关联度,并按照关联度由高到低的顺序对各个候选摘要句进行排序,最后,选取排序靠前的预设数量的候选摘要句作为最终显示的搜索摘要,这样,能够更进一步的提升最终生成的搜索摘要针对性和准确性。
进一步的,如图5所示,上述装置还包括:
搜索摘要展示模块308,用于展示各个目标网址对应的搜索摘要,该搜素摘要为根据所述查询词和用户画像生成的。
具体的,由于上述搜索摘要生成装置也可以设置于用户终端侧,此时,用户终端包括上述生成装置,具体包括:
目标网址获取模块302,用于获取根据用户输入的查询词进行检索得到的与该查询词相关的目标网址,即接收服务器发送的与查询词相关的目标网址和各个目标网址对应的网页;
用户画像获取模块304,用于获取上述用户的用户画像,该用户画像用于描述上述用户的搜索习惯、搜索偏好、搜索频率、消费习惯、搜索关注点中的至少一种;
搜索摘要生成模块306,用于根据上述查询词和上述用户画像生成上述目标网址对应的搜索摘要;
搜索摘要展示模块308,用于展示各个上述目标网址对应的上述搜索摘要。
具体的,如图6所示,给出了一种各个目标网址对应的搜索摘要的展示效果示意图,其中,由用户终端接收用户输入的查询词,用户可以通过搜索界面上的查询词输入区11输入查询词,也可以通过语音输入区22采用语音的方式输入查询词;
上述搜索摘要展示模块308,具体用于在标题名称展示区331逐条展示与用户输入的查询词相关的各个目标网址对应的标题名称、以及在搜索摘要展示区332逐条展示各个目标网址对应的搜索摘要,其中,该为根据上述查询词和用户画像生成的,标题名称上携带有目标网址网址标识;
由于将用户画像融入搜索摘要的生成与展示过程中,将用户画像作为生成搜索摘要的依据,最终在搜索摘要展示区332展示的搜索摘要更符合用户的搜索习惯、偏好、关注点,用户能够根据搜索摘要即可快速、准确地识别出该链接是否为用户所需的链接,具体的,当用户终端接收到用户点击指令时,打开并显示该目标网址对应的网页内容,此时用户可以浏览全部网页内容;
进一步的,在显示目标网址对应的网页内容之前,上述搜索摘要展示模块308,还用于对网页内容中与搜索摘要相关的内容进行标记,该标记包括:加粗标记、颜色标记、下弧线标记中的一种或多种;然后,再显示标记后的该目标网址对应的网页内容,这样能够使得用户快速查看到搜索摘要附近的相关内容;
另外,为了将获得的与查询词相关的多个目标网址的显示顺序和用户的用户画像相关联,上述搜索摘要展示模块308,具体用于按照目标网址对应的网页内容与用户画像关联度由高到低的顺序依次展示各个目标网址对应的上述搜索摘要,这样,能够使得用户优先查看与用户画像最相关的目标网址。
在本发明实施例提供的搜索摘要生成装置中,首先,获取与用户输入的查询词相关的目标网址;并且获取用户的用户画像,该用户画像用于描述用户的搜索习惯、搜索偏好、搜索频率、消费习惯、搜索关注点中的至少一种;最后,根据上述查询词和上述用户画像生成该目标网址对应的搜索摘要,并展示该搜索摘要。本发明实施例将用户画像融入搜索摘要的生成与展示过程中,将用户画像作为生成搜索摘要的依据,可以有效保证生成的搜索摘要更符合用户的搜索习惯、偏好、关注点,从而能够使得用户根据搜索摘要即可快速、准确地识别出该链接是否为用户所需的链接,进而提高用户的搜索效率和准确性;进一步的,考虑到用户历史行为数据主要反映的是对用户前期搜索习惯等大数据,对用户的当前意图的敏感性稍弱,因此,在建立用户的用户画像过程中增加当前搜索行为的上下文信息,能够更加准确地识别用户当前的意图,从而进一步提高了最终呈现的搜索摘要的精准度;更进一步的,通过为用户画像中的各个特征标签设置不同的权重值,参考各个特征标签的权重值确定各个候选摘要句与用户画像之间的关联度,并按照关联度由高到低的顺序对各个候选摘要句进行排序,最后,选取排序靠前的预设数量的候选摘要句作为最终显示的搜索摘要,这样,能够更进一步的提升最终生成的搜索摘要针对性和准确性。
本发明实施例所提供的搜索摘要生成装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的***、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (13)
1.一种搜索摘要生成方法,其特征在于,所述方法包括:
获取根据用户输入的查询词进行检索得到的与所述查询词相关的目标网址;
获取所述用户的用户画像,所述用户画像用于描述所述用户的搜索习惯、搜索偏好、搜索频率、消费习惯、搜索关注点中的至少一种;
根据所述查询词和所述用户画像生成所述目标网址对应的搜索摘要;
展示各个所述目标网址对应的所述搜索摘要。
2.根据权利要求1所述的方法,其特征在于,所述获取所述用户的用户画像之前,还包括:
获取所述用户的历史行为数据,所述历史行为数据包括用户基本信息、历史登陆信息、历史搜索记录、历史浏览记录、历史收藏记录、历史下载记录、历史评论记录和历史消费记录中的至少一种;和/或,
获取所述用户当前搜索行为的上下文信息,所述上下文信息包括当前时间、当前地点、当前环境、所述用户最近搜索的词语、所述用户最近浏览的网页中的至少一种;
根据所述用户的历史行为数据和/或所述上下文信息建立所述用户的用户画像。
3.根据权利要求1所述的方法,其特征在于,所述根据所述查询词和所述用户画像生成所述目标网址对应的搜索摘要,包括:
根据所述查询词,在所述目标网址对应的网页中的文档中提取出多个候选摘要句;
设置所述用户画像中各个特征标签的权重值;
按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的所述权重值对多个所述候选摘要句进行排序;
选取排序靠前的预设数量的所述候选摘要句生成所述目标网址相应的搜索摘要。
4.根据权利要求3所述的方法,其特征在于,所述根据所述查询词,在所述目标网址对应的网页中的文档中提取出多个候选摘要句,包括:
对所述目标网址对应的网页中的文档进行分词;
将所述查询词与分词后的所述文档进行匹配,计算出所述查询词在所述文档中出现的位置;以及将所述查询词的近义词与分词后的所述文档进行匹配,计算出所述查询词的近义词在所述文档中出现的位置;
在所述文档中,以所述查询词出现的位置和所述查询词的近义词出现的位置为基准,截取多个候选摘要句。
5.根据权利要求3所述的方法,其特征在于,所述设置所述用户画像中各个特征标签的权重值,包括:
计算用户历史上对所述用户画像中每个所述特征标签的操作集中度;
根据所述操作集中度确定各个所述特征标签的权重值。
6.根据权利要求3所述的方法,其特征在于,所述按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的所述权重值对多个所述候选摘要句进行排序,包括:
采用逻辑回归模型或者梯度提升树模型按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的所述权重值对多个所述候选摘要句进行排序。
7.一种搜索摘要生成装置,其特征在于,所述装置包括:
目标网址获取模块,用于获取根据用户输入的查询词进行检索得到的与所述查询词相关的目标网址;
用户画像获取模块,用于获取所述用户的用户画像,所述用户画像用于描述所述用户的搜索习惯、搜索偏好、搜索频率、消费习惯、搜索关注点中的至少一种;
搜索摘要生成模块,用于根据所述查询词和所述用户画像生成所述目标网址对应的搜索摘要。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
历史行为数据获取模块,用于获取所述用户的历史行为数据,所述历史行为数据包括用户基本信息、历史登陆信息、历史搜索记录、历史浏览记录、历史收藏记录、历史下载记录、历史评论记录和历史消费记录中的至少一种;和/或,
上下文信息获取模块,用于获取所述用户当前搜索行为的上下文信息,所述上下文信息包括当前时间、当前地点、当前环境、所述用户最近搜索的词语、所述用户最近浏览的网页中的至少一种;
用户画像建立模块,用于根据所述用户的历史行为数据和/或所述上下文信息建立所述用户的用户画像。
9.根据权利要求7所述的装置,其特征在于,所述搜索摘要生成模块包括:
候选摘要句提取子模块,用于根据所述查询词,在所述目标网址对应的网页中的文档中提取出多个候选摘要句;
特征标签权重值确定子模块,用于设置所述用户画像中各个特征标签的权重值;
候选摘要句排序子模块,用于按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的所述权重值对多个所述候选摘要句进行排序;
搜索摘要生成子模块,用于选取排序靠前的预设数量的所述候选摘要句生成所述目标网址相应的搜索摘要。
10.根据权利要求9所述的装置,其特征在于,所述候选摘要句提取子模块,具体用于对所述目标网址对应的网页中的文档进行分词;将所述查询词与分词后的所述文档进行匹配,计算出所述查询词在所述文档中出现的位置;以及将所述查询词的近义词与分词后的所述文档进行匹配,计算出所述查询词的近义词在所述文档中出现的位置;在所述文档中,以所述查询词出现的位置和所述查询词的近义词出现的位置为基准,截取多个候选摘要句。
11.根据权利要求9所述的装置,其特征在于,所述特征标签权重值确定子模块,具体用于计算用户历史上对所述用户画像中每个所述特征标签的操作集中度;根据所述操作集中度确定各个所述特征标签的权重值。
12.根据权利要求9所述的装置,其特征在于,所述候选摘要句排序子模块,具体用于采用逻辑回归模型或者梯度提升树模型按照候选摘要句与用户画像关联度由高到低的顺序根据各个特征标签的所述权重值对多个所述候选摘要句进行排序。
13.根据权利要求7所述的装置,其特征在于,所述装置还包括:
搜索摘要展示模块,用于展示各个所述目标网址对应的所述搜索摘要,所述搜索摘要为根据所述查询词和用户画像生成的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611070196.7A CN106776860A (zh) | 2016-11-28 | 2016-11-28 | 一种搜索摘要生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611070196.7A CN106776860A (zh) | 2016-11-28 | 2016-11-28 | 一种搜索摘要生成方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106776860A true CN106776860A (zh) | 2017-05-31 |
Family
ID=58904161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611070196.7A Pending CN106776860A (zh) | 2016-11-28 | 2016-11-28 | 一种搜索摘要生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106776860A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107277630A (zh) * | 2017-07-20 | 2017-10-20 | 海信集团有限公司 | 语音提示信息的显示方法及装置 |
CN107832414A (zh) * | 2017-11-07 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN108415970A (zh) * | 2018-02-08 | 2018-08-17 | 北京三快在线科技有限公司 | 检索结果排序方法、装置、电子设备及存储介质 |
CN108920717A (zh) * | 2018-07-27 | 2018-11-30 | 百度在线网络技术(北京)有限公司 | 用于显示信息的方法及装置 |
CN109325180A (zh) * | 2018-09-21 | 2019-02-12 | 北京字节跳动网络技术有限公司 | 文章摘要推送方法、装置、终端设备、服务器及存储介质 |
WO2019128364A1 (zh) * | 2017-12-29 | 2019-07-04 | 北京京东尚科信息技术有限公司 | 对象搜索方法、***和计算机***、计算机可读存储介质 |
CN110147505A (zh) * | 2017-08-24 | 2019-08-20 | 北京国双科技有限公司 | 一种页面展示方法、服务器及存储介质 |
CN110245289A (zh) * | 2019-05-20 | 2019-09-17 | 中国平安财产保险股份有限公司 | 一种信息搜索方法以及相关设备 |
CN110929021A (zh) * | 2018-08-31 | 2020-03-27 | 阿里巴巴集团控股有限公司 | 文本信息生成方法和文本信息生成装置 |
CN111080339A (zh) * | 2019-11-18 | 2020-04-28 | 口口相传(北京)网络技术有限公司 | 基于场景的类目偏好数据生成方法及装置 |
CN112182451A (zh) * | 2020-09-18 | 2021-01-05 | 武汉绿色网络信息服务有限责任公司 | 网页内容摘要生成方法、设备、存储介质及装置 |
CN112825076A (zh) * | 2019-11-20 | 2021-05-21 | 北京搜狗科技发展有限公司 | 一种信息推荐方法、装置和电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163229A (zh) * | 2011-04-13 | 2011-08-24 | 北京百度网讯科技有限公司 | 一种用于生成搜索结果的摘要的方法与设备 |
CN102184221A (zh) * | 2011-05-06 | 2011-09-14 | 北京航空航天大学 | 一种基于用户偏好的实时视频摘要生成方法 |
CN104090886A (zh) * | 2013-12-09 | 2014-10-08 | 深圳市腾讯计算机***有限公司 | 构建用户实时画像的方法及装置 |
CN104268142A (zh) * | 2014-08-05 | 2015-01-07 | 河海大学 | 基于可拒绝策略的元搜索结果排序算法 |
CN105447191A (zh) * | 2015-12-21 | 2016-03-30 | 北京奇虎科技有限公司 | 提供图文引导步骤的智能摘要方法及相应装置 |
-
2016
- 2016-11-28 CN CN201611070196.7A patent/CN106776860A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163229A (zh) * | 2011-04-13 | 2011-08-24 | 北京百度网讯科技有限公司 | 一种用于生成搜索结果的摘要的方法与设备 |
CN102184221A (zh) * | 2011-05-06 | 2011-09-14 | 北京航空航天大学 | 一种基于用户偏好的实时视频摘要生成方法 |
CN104090886A (zh) * | 2013-12-09 | 2014-10-08 | 深圳市腾讯计算机***有限公司 | 构建用户实时画像的方法及装置 |
CN104268142A (zh) * | 2014-08-05 | 2015-01-07 | 河海大学 | 基于可拒绝策略的元搜索结果排序算法 |
CN105447191A (zh) * | 2015-12-21 | 2016-03-30 | 北京奇虎科技有限公司 | 提供图文引导步骤的智能摘要方法及相应装置 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107277630A (zh) * | 2017-07-20 | 2017-10-20 | 海信集团有限公司 | 语音提示信息的显示方法及装置 |
CN110147505A (zh) * | 2017-08-24 | 2019-08-20 | 北京国双科技有限公司 | 一种页面展示方法、服务器及存储介质 |
CN107832414B (zh) * | 2017-11-07 | 2021-10-22 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN107832414A (zh) * | 2017-11-07 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
WO2019128364A1 (zh) * | 2017-12-29 | 2019-07-04 | 北京京东尚科信息技术有限公司 | 对象搜索方法、***和计算机***、计算机可读存储介质 |
CN108415970A (zh) * | 2018-02-08 | 2018-08-17 | 北京三快在线科技有限公司 | 检索结果排序方法、装置、电子设备及存储介质 |
CN108920717A (zh) * | 2018-07-27 | 2018-11-30 | 百度在线网络技术(北京)有限公司 | 用于显示信息的方法及装置 |
CN110929021B (zh) * | 2018-08-31 | 2024-05-31 | 阿里巴巴集团控股有限公司 | 文本信息生成方法和文本信息生成装置 |
CN110929021A (zh) * | 2018-08-31 | 2020-03-27 | 阿里巴巴集团控股有限公司 | 文本信息生成方法和文本信息生成装置 |
CN109325180A (zh) * | 2018-09-21 | 2019-02-12 | 北京字节跳动网络技术有限公司 | 文章摘要推送方法、装置、终端设备、服务器及存储介质 |
CN109325180B (zh) * | 2018-09-21 | 2021-01-05 | 北京字节跳动网络技术有限公司 | 文章摘要推送方法、装置、终端设备、服务器及存储介质 |
CN110245289A (zh) * | 2019-05-20 | 2019-09-17 | 中国平安财产保险股份有限公司 | 一种信息搜索方法以及相关设备 |
CN111080339A (zh) * | 2019-11-18 | 2020-04-28 | 口口相传(北京)网络技术有限公司 | 基于场景的类目偏好数据生成方法及装置 |
CN111080339B (zh) * | 2019-11-18 | 2024-01-30 | 口口相传(北京)网络技术有限公司 | 基于场景的类目偏好数据生成方法及装置 |
CN112825076A (zh) * | 2019-11-20 | 2021-05-21 | 北京搜狗科技发展有限公司 | 一种信息推荐方法、装置和电子设备 |
CN112825076B (zh) * | 2019-11-20 | 2024-03-01 | 北京搜狗科技发展有限公司 | 一种信息推荐方法、装置和电子设备 |
CN112182451A (zh) * | 2020-09-18 | 2021-01-05 | 武汉绿色网络信息服务有限责任公司 | 网页内容摘要生成方法、设备、存储介质及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106776860A (zh) | 一种搜索摘要生成方法及装置 | |
US10896214B2 (en) | Artificial intelligence based-document processing | |
US9348935B2 (en) | Systems and methods for augmenting a keyword of a web page with video content | |
KR100650404B1 (ko) | 온라인 광고 시스템 및 방법 | |
CN107862553A (zh) | 广告实时推荐方法、装置、终端设备及存储介质 | |
CN102693271B (zh) | 一种网络信息推荐方法及*** | |
US8209616B2 (en) | System and method for interfacing a web browser widget with social indexing | |
US9798820B1 (en) | Classification of keywords | |
CN107784092A (zh) | 一种推荐热词的方法、服务器及计算机可读介质 | |
US20190163714A1 (en) | Search result aggregation method and apparatus based on artificial intelligence and search engine | |
US20140172415A1 (en) | Apparatus, system, and method of providing sentiment analysis result based on text | |
US20130054672A1 (en) | Systems and methods for contextualizing a toolbar | |
US20130054356A1 (en) | Systems and methods for contextualizing services for images | |
CN103339623A (zh) | 涉及因特网搜索的方法和设备 | |
CA3070612A1 (en) | Click rate estimation | |
CN103092923A (zh) | 搜索引擎的基于菜单的登广告 | |
US11681765B2 (en) | System and method for integrating content into webpages | |
CN103365839A (zh) | 一种搜索引擎的推荐搜索方法和装置 | |
US11113722B2 (en) | Providing content related to sentiment of product feature | |
US20120246561A1 (en) | Systems and methods for extended content harvesting for contextualizing | |
WO2012051470A1 (en) | Systems and methods for using a behavior history of a user to augment content of a webpage | |
US9672269B2 (en) | Method and system for automatically identifying related content to an electronic text | |
US20100318427A1 (en) | Enhancing database management by search, personal search, advertising, and databases analysis efficiently using core-set implementations | |
CN103718178A (zh) | 利用从结构化文档中提取的特征来改善搜索关联性 | |
US20210073224A1 (en) | Query rewrite for low performing queries based on customer behavior |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |