具体实施方式
为了使得本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另外定义,本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
为了保持本发明实施例的以下说明清楚且简明,本发明省略了已知功能和已知部件的详细说明。
本发明第一实施例提供了一种输入联想词的构建方法,该方法的流程如图1所示,包括步骤S101至S103:
S101,基于预定搜索词获取预定时间段内具有预定热度的文章的标题内容。
通常情况下,某个文章在短时间内如果有大量用户阅读或转发等操作,则该文章会变成热文。本发明实施例获取该热文的标题内容,以便后续通过该标题内容构建输入联想词。对于热文(具有预定热度的文章),其还可以是文章中含有大量较热的搜索词的文章,也可以是点击率达到预定点击率的文章,还可以是评论数量达到预定评论数量的文章,又可以是文章主题为预定主题的文章等,本实施例不进行限定。
S102,按照预定关键词提取策略对标题内容进行关键词提取,以得到多个关键词。
其中,预定关键词提取策略可以是较为通用的term重要性原则,当然,也可以是其它的关键词提取策略。如果预定时间段内具有预定热度的文章有很多,则分别获取每个预定热度的文章的标题内容,并分别对每个标题内容进行关键词提取。对于标题较长的文章,其可能得到更多的关键词。
例如,文章标题为《周XX2018将举办全球演唱会》,则切分后为:周XX|2018|举办|全球|演唱会,根据term重要性原则以及词性标注,生成特定的关键词,如周XX2018演唱会、周XX演唱会、周XX举办全球演唱会。
S103,按照预定显示规则在输入联想词列表中显示关键词。
本发明实施例对具有预定热度的文章的标题内容进行关键词提取,利用得到的多个关键词丰富输入联想词,在用户搜索较热的搜索词时,由于事先已经根据较热的文章进行了输入联想词的补充,因此,基于该搜索词的输入联想词列表会有较多的输入联想词,用户可以根据输入联想词列表中显示的输入联想词进行相关搜索,用户体验较好。
本发明第二实施例提供了一种输入联想词的构建方法,该方法的流程如图2所示,包括步骤S201至S208:
S201,检测预定搜索词是否满足预定搜索条件。如果是,则执行S202,否则,继续执行S201。
其中,预定搜索条件至少包括以下之一:预定搜索词的搜索次数达到预定次数,以预定搜索词为主题的文章的阅读次数达到预定次数。
S202,在预定搜索词满足预定搜索条件的情况下,检测预定搜索词的输入联想词数量是否达到输入联想词列表显示数量的预定倍数。如果是,则执行S208,否则,执行S203。
具体实现时,预定倍数可以是1倍,也可以是10倍,如果预定倍数设置的较大,则可以一直不断补充预定搜索词的输入联想词。
上述过程设置了双重认证条件,即只有上述两种条件均被满足的情况下,才会补充该预定搜索词的输入联想词。
S203,在未达到输入联想词列表显示数量的预定倍数的情况下,获取预定时间段内具有预定热度的文章的标题内容。
通常情况下,某个文章在短时间内如果有大量用户阅读或转发等操作,则该文章会变成热文。本发明实施例获取该热文的标题内容,以便后续通过该标题内容构建输入联想词。对于热文(具有预定热度的文章),其还可以是文章中含有大量较热的搜索词的文章,也可以是点击率达到预定点击率的文章,还可以是评论数量达到预定评论数量的文章,又可以是文章主题为预定主题的文章等,本实施例不进行限定。
S204,按照预定关键词提取策略对标题内容进行关键词提取,以得到多个关键词。
其中,预定关键词提取策略可以是较为通用的term重要性原则,当然,也可以是其它的关键词提取策略。如果预定时间段内具有预定热度的文章有很多,则分别获取每个预定热度的文章的标题内容,并分别对每个标题内容进行关键词提取。对于标题较长的文章,其可能得到更多的关键词。
例如,文章标题为《周XX2018将举办全球演唱会》,则切分后为:周XX|2018|举办|全球|演唱会,根据term重要性原则以及词性标注,生成特定的关键词,如周XX2018演唱会、周XX演唱会、周XX举办全球演唱会。
S205,按照预定显示规则在输入联想词列表中显示关键词。
具体的,可以将每个关键词对应文章的预定热度设置为每个关键词的热度;按照每个关键词的热度为所有关键词进行排序;按照排序的结果在输入联想词列表中显示关键词。为每个输入联想词赋予初始热度后,就可以将用户更为关注的输入联想词在输入联想词列表中显示。
例如,苏AA突然获得全运会金牌,关于苏AA的文章会大量被用户阅读,在某一时间内关于苏AA的文章数量或文章阅读量都会大幅度上升,成为热门文章,则此时可以获取具有预定热度的文章的标题内容,例如,文章标题为《全运会苏AA短跑为国夺金破亚洲记录》的热文,对应的得到的关键词可以是:全运会苏AA、苏AA夺金、苏AA破记录等。当用户知道苏AA后,会大量搜索关于苏AA的内容。如果没有采用本发明实施例,则以苏AA为搜索词进行搜索时会显示如图3所示的界面;但采用了本发明实施例后,由于已经根据较热的文章的标题进行了关键词提取,已经丰富了输入联想词,因此,其显示的界面会如图4所示。
S206,按照预定周期统计每个关键词的点击情况,并根据点击情况对所有关键词进行重新排序。
随着用户对输入联想词的点击操作增加,每个输入联想词的点击情况会不同,为了更加准确的确定用户最想看到的输入联想词,因此根据点击情况对所有关键词进行重新排序。
S207,按照重新排序的结果在输入联想词列表中显示关键词。
S208,停止对该预定搜索词继续进行输入联想词的构建。
本发明实施例对具有预定热度的文章的标题内容进行关键词提取,利用得到的多个关键词丰富输入联想词,在用户搜索较热的搜索词时,由于事先已经根据较热的文章进行了输入联想词的补充,因此,基于该搜索词的输入联想词列表会有较多的输入联想词,用户可以根据输入联想词列表中显示的输入联想词进行相关搜索,用户体验较好。
本发明第三实施例提供了一种输入联想词的构建装置,该装置的结构示意如图5所示,包括:
获取模块10,用于基于预定搜索词获取预定时间段内具有预定热度的文章的标题内容;提取模块20,与获取模块10耦合,用于按照预定关键词提取策略对标题内容进行关键词提取,以得到多个关键词;显示模块30,与提取模块20耦合,用于按照预定显示规则在输入联想词列表中显示关键词。
通常情况下,某个文章在短时间内如果有大量用户阅读或转发等操作,则该文章会变成热文。本发明实施例获取该热文的标题内容,以便后续通过该标题内容构建输入联想词。对于热文(具有预定热度的文章),其还可以是文章中含有大量较热的搜索词的文章,也可以是点击率达到预定点击率的文章,还可以是评论数量达到预定评论数量的文章,又可以是文章主题为预定主题的文章等,本实施例不进行限定。
其中,预定关键词提取策略可以是较为通用的term重要性原则,当然,也可以是其它的关键词提取策略。如果预定时间段内具有预定热度的文章有很多,则分别获取每个预定热度的文章的标题内容,并分别对每个标题内容进行关键词提取。对于标题较长的文章,其可能得到更多的关键词。
其中,显示模块30具体用于:将每个关键词对应文章的预定热度设置为每个关键词的热度;按照每个关键词的热度为所有关键词进行排序;按照排序的结果在输入联想词列表中显示关键词。为每个输入联想词赋予初始热度后,就可以将用户更为关注的输入联想词在输入联想词列表中显示。
本发明实施例的获取模块10可以包括:第一检测单元,用于检测预定搜索词是否满足预定搜索条件,其中,预定搜索条件至少包括以下之一:预定搜索词的搜索次数达到预定次数,以预定搜索词为主题的文章的阅读次数达到预定次数;第二检测单元,与第一检测单元耦合,用于在预定搜索词满足预定搜索条件的情况下,检测预定搜索词的输入联想词数量是否达到输入联想词列表显示数量的预定倍数;获取单元,与第二检测单元耦合,用于在未达到输入联想词列表显示数量的预定倍数的情况下,获取预定时间段内具有预定热度的文章的标题内容。上述过程设置了双重认证条件,即只有上述两种条件均被满足的情况下,才会补充该预定搜索词的输入联想词。
随着用户对输入联想词的点击操作增加,每个输入联想词的点击情况会不同,为了更加准确的确定用户最想看到的输入联想词,因此,可以根据点击情况对所有关键词进行重新排序,则上述装置还可以包括:统计模块40,用于按照预定周期统计每个关键词的点击情况,并根据点击情况对所有关键词进行重新排序;显示模块30,与统计模块40耦合,还用于按照重新排序的结果在输入联想词列表中显示关键词。
例如,突然间苏炳天拿了金牌,则关于苏炳天的文章会大量被用户阅读,在某一时间内关于苏炳天的文章数量或文章阅读量都会大幅度上升,成为热门文章;将这些热门文章的标题作为原始预料进行关键词提取,并生成多个关键词,这些关键词也会由于文章的热度不同而被赋予不同的热度,因而存在一个排序;当用户搜索苏炳天时,由于是刚热起来的词,因此输入联想词列表中关于苏炳天的输入联想词没有达到一定的数量,此时,就将上面生成的具有一定热度的关键词显示在输入联想词列表中,并根据用户点击的情况来调整输入联想词列表中各个关键词的显示顺序。
本发明第四实施例提供了一种存储介质,存储有计算机程序,该计算机程序被处理器执行时实现本发明任意实施例提供的方法,如下步骤S1至S3:
S1,基于预定搜索词获取预定时间段内具有预定热度的文章的标题内容;
S2,按照预定关键词提取策略对标题内容进行关键词提取,以得到多个关键词;
S3,按照预定显示规则在输入联想词列表中显示关键词。
其中,具有预定热度的文章至少包括以下之一:点击率达到预定点击率,评论数量达到预定评论数量,文章主题为预定主题。
计算机程序被处理器执行按照预定显示规则在输入联想词列表中显示关键词步骤时,具体被处理器执行如下步骤:将每个关键词对应文章的预定热度设置为每个关键词的热度;按照每个关键词的热度为所有关键词进行排序;按照排序的结果在输入联想词列表中显示关键词。
计算机程序被处理器执行获取预定时间段内具有预定热度的文章的标题内容步骤时,具体被处理器执行如下步骤:检测预定搜索词是否满足预定搜索条件,其中,预定搜索条件至少包括以下之一:预定搜索词的搜索次数达到预定次数,以预定搜索词为主题的文章的阅读次数达到预定次数;在预定搜索词满足预定搜索条件的情况下,检测预定搜索词的输入联想词数量是否达到输入联想词列表显示数量的预定倍数;在未达到输入联想词列表显示数量的预定倍数的情况下,获取预定时间段内具有预定热度的文章的标题内容。
计算机程序被处理器执行按照预定显示规则在输入联想词列表中显示关键词的步骤之后,还被处理器执行如下步骤:按照预定周期统计每个关键词的点击情况,并根据点击情况对所有关键词进行重新排序;按照重新排序的结果在输入联想词列表中显示关键词。
本发明实施例对具有预定热度的文章的标题内容进行关键词提取,利用得到的多个关键词丰富输入联想词,在用户搜索较热的搜索词时,由于事先已经根据较热的文章进行了输入联想词的补充,因此,基于该搜索词的输入联想词列表会有较多的输入联想词,用户可以根据输入联想词列表中显示的输入联想词进行相关搜索,用户体验较好。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行上述实施例记载的方法步骤。可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
本发明第五实施例提供了一种电子设备,如图6所示,该电子设备至少包括存储器901和处理器902,存储器901上存储有计算机程序,处理器902在执行存储器901上的计算机程序时实现本发明任意实施例提供的方法,示例性的,计算机程序步骤如下S11至S13:
S11,基于预定搜索词获取预定时间段内具有预定热度的文章的标题内容;
S12,按照预定关键词提取策略对标题内容进行关键词提取,以得到多个关键词;
S13,按照预定显示规则在输入联想词列表中显示关键词。
其中,具有预定热度的文章至少包括以下之一:点击率达到预定点击率,评论数量达到预定评论数量,文章主题为预定主题。
处理器902在执行存储器901上存储的按照预定显示规则在输入联想词列表中显示关键词的计算算计程序时,具体执行如下计算机程序:将每个关键词对应文章的预定热度设置为每个关键词的热度;按照每个关键词的热度为所有关键词进行排序;按照排序的结果在输入联想词列表中显示关键词。
处理器902在执行存储器901上存储的获取预定时间段内具有预定热度的文章的标题内容的计算算计程序时,具体执行如下计算机程序:检测预定搜索词是否满足预定搜索条件,其中,预定搜索条件至少包括以下之一:预定搜索词的搜索次数达到预定次数,以预定搜索词为主题的文章的阅读次数达到预定次数;在预定搜索词满足预定搜索条件的情况下,检测预定搜索词的输入联想词数量是否达到输入联想词列表显示数量的预定倍数;在未达到输入联想词列表显示数量的预定倍数的情况下,获取预定时间段内具有预定热度的文章的标题内容。
处理器902在执行存储器901上存储的按照预定显示规则在输入联想词列表中显示关键词的计算算计程序之后,还执行如下计算机程序:按照预定周期统计每个关键词的点击情况,并根据点击情况对所有关键词进行重新排序;按照重新排序的结果在输入联想词列表中显示关键词。
此外,尽管已经在本文中描述了示例性实施例,其范围包括任何和所有基于本发明的具有等同元件、修改、省略、组合(例如,各种实施例交叉的方案)、改编或改变的实施例。权利要求书中的元件将被基于权利要求中采用的语言宽泛地解释,并不限于在本说明书中或本申请的实施期间所描述的示例,其示例将被解释为非排他性的。因此,本说明书和示例旨在仅被认为是示例,真正的范围和精神由以下权利要求以及其等同物的全部范围所指示。
以上描述旨在是说明性的而不是限制性的。例如,上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外,在上述具体实施方式中,各种特征可以被分组在一起以简单化本发明。这不应解释为一种不要求保护的公开的特征对于任一权利要求是必要的意图。相反,本发明的主题可以少于特定的公开的实施例的全部特征。从而,以下权利要求书作为示例或实施例在此并入具体实施方式中,其中每个权利要求独立地作为单独的实施例,并且考虑这些实施例可以以各种组合或排列彼此组合。本发明的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。
以上对本发明多个实施例进行了详细说明,但本发明不限于这些具体的实施例,本领域技术人员在本发明构思的基础上,能够做出多种变型和修改实施例,这些变型和修改都应落入本发明所要求保护的范围之内。