CN108334626B - 新闻栏目的生成方法、装置和计算机设备 - Google Patents

新闻栏目的生成方法、装置和计算机设备 Download PDF

Info

Publication number
CN108334626B
CN108334626B CN201810145847.7A CN201810145847A CN108334626B CN 108334626 B CN108334626 B CN 108334626B CN 201810145847 A CN201810145847 A CN 201810145847A CN 108334626 B CN108334626 B CN 108334626B
Authority
CN
China
Prior art keywords
articles
keywords
matched
article
strategy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810145847.7A
Other languages
English (en)
Other versions
CN108334626A (zh
Inventor
孙志杰
李跃洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Priority to CN201810145847.7A priority Critical patent/CN108334626B/zh
Publication of CN108334626A publication Critical patent/CN108334626A/zh
Application granted granted Critical
Publication of CN108334626B publication Critical patent/CN108334626B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提出一种新闻栏目的生成方法、装置和计算机设备,上述新闻栏目的生成方法包括:获得用户输入的关键词,根据所述关键词获取与所述关键词匹配的文章;获得所述用户从策略库中选择的筛选策略;根据所述筛选策略对与所述关键词匹配的文章进行筛选并排序;根据排序结果生成新闻栏目的内容列表。本申请可以显著降低创建一个新的新闻栏目所需的时间,进而可以在发生一些热点事件需要紧急创建热点栏目时,实现快速验证上线。

Description

新闻栏目的生成方法、装置和计算机设备
技术领域
本申请涉及互联网技术领域,尤其涉及一种新闻栏目的生成方法、装置和计算机设备。
背景技术
新闻推荐领域的一个特点是需要根据当前热点持续不断的扩展新闻栏目,在每一个新闻栏目下聚合该相关领域的新闻资讯。当需要扩展一个新闻栏目时,首先由相关负责人手动筛选出一部分和栏目匹配的关键词,这些关键词是后续筛选文章的基础,但是不是所有通过关键词筛选出来的文章都会放到这个栏目下面,这时候就需要通过制定策略从这些文章中筛选出用户更感兴趣的文章,比如对文章进行打分排序。策略一般根据人为的经验制定,在现有相关技术中,相关负责人针对一个新增的栏目制定了一些策略,然后交由开发人员去实现这些策略,策略上线后再交由该频道负责人观察最终效果。如果效果不理想再由负责人重新去挑选关键词、筛选策略。循环往复,人员沟通成本、策略开发时间成本都很高,这样一个栏目上线的流程就会被大大拉长,综合下来完成一个新的频道可能需要一个月的时间周期,但新闻有其本身的高时效性,针对一些热点事件建立临时频道的场景,现有的新闻栏目的创建方法周期太长无法满足需求。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种新闻栏目的生成方法,以显著降低创建一个新的新闻栏目所需的时间,进而可以在发生一些热点事件需要紧急创建热点栏目时,实现快速验证上线。
本申请的第二个目的在于提出一种新闻栏目的生成装置。
本申请的第三个目的在于提出一种计算机设备。
本申请的第四个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本申请第一方面实施例提出了一种新闻栏目的生成方法,包括:获得用户输入的关键词,根据所述关键词获取与所述关键词匹配的文章;获得所述用户从策略库中选择的筛选策略;根据所述筛选策略对与所述关键词匹配的文章进行筛选并排序;根据排序结果生成新闻栏目的内容列表。
本申请实施例的新闻栏目的生成方法中,获得用户输入的关键词之后,根据上述关键词获取与上述关键词匹配的文章,获得上述用户从策略库中选择的筛选策略,然后根据上述筛选策略对与上述关键词匹配的文章进行筛选并排序,最后根据排序结果生成新闻栏目的内容列表,从而可以实现只需提供关键词并选择需要的策略,就可以立刻看到筛选好的新闻栏目的内容列表,如果效果不理想,可以直接调整关键词和策略,调整后的效果立即可见,可以显著降低创建一个新的新闻栏目所需的时间,进而可以在发生一些热点事件需要紧急创建热点栏目时,实现快速验证上线。
为达上述目的,本申请第二方面实施例提出了一种新闻栏目的生成装置,包括:获得模块,用于获得用户输入的关键词,根据所述关键词获取与所述关键词匹配的文章;以及获得所述用户从策略库中选择的筛选策略;筛选模块,用于根据所述筛选策略对与所述关键词匹配的文章进行筛选并排序;生成模块,用于根据排序结果生成新闻栏目的内容列表。
本申请实施例的新闻栏目的生成装置中,获得模块获得用户输入的关键词之后,根据上述关键词获取与上述关键词匹配的文章,获得上述用户从策略库中选择的筛选策略,然后筛选模块根据上述筛选策略对与上述关键词匹配的文章进行筛选并排序,最后生成模块根据排序结果生成新闻栏目的内容列表,从而可以实现只需提供关键词并选择需要的策略,就可以立刻看到筛选好的新闻栏目的内容列表,如果效果不理想,可以直接调整关键词和策略,调整后的效果立即可见,可以显著降低创建一个新的新闻栏目所需的时间,进而可以在发生一些热点事件需要紧急创建热点栏目时,实现快速验证上线。
为达上述目的,本申请第三方面实施例提出一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上所述的方法。
为了实现上述目的,本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请新闻栏目的生成方法一个实施例的流程图;
图2为本申请新闻栏目的生成方法另一个实施例的流程图;
图3为本申请新闻栏目的生成方法再一个实施例的流程图;
图4为本申请新闻栏目的生成方法中策略库的示意图;
图5为本申请新闻栏目的生成装置一个实施例的结构示意图;
图6为本申请计算机设备一个实施例的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
图1为本申请新闻栏目的生成方法一个实施例的流程图,如图1所示,上述新闻栏目的生成方法可以包括:
步骤101,获得用户输入的关键词,根据上述关键词获取与上述关键词匹配的文章。
步骤102,获得上述用户从策略库中选择的筛选策略。
步骤103,根据上述筛选策略对与上述关键词匹配的文章进行筛选并排序。
步骤104,根据排序结果生成新闻栏目的内容列表。
本实施例中,上述用户为频道负责人,即负责创建新闻栏目的人,现有相关技术中,主要问题在于频道负责人人工定义的策略,需要交由专门的开发人员开发,这样的流程耗时费力。本实施例中,对文章筛选可能用到的策略进行了整理汇总,生成了一个策略库,支持对各种策略的自动解析,这样频道负责人只需要输入关键词,并从策略库中选择需要的筛选策略,就可以立刻看到筛选好的新闻栏目的内容列表,如果效果不理想,可以直接调整关键词和筛选策略,调整后的效果立即可见。
上述新闻栏目的生成方法中,获得用户输入的关键词之后,根据上述关键词获取与上述关键词匹配的文章,获得上述用户从策略库中选择的筛选策略,然后根据上述筛选策略对与上述关键词匹配的文章进行筛选并排序,最后根据排序结果生成新闻栏目的内容列表,从而可以实现只需提供关键词并选择需要的筛选策略,就可以立刻看到筛选好的新闻栏目的内容列表,如果效果不理想,可以直接调整关键词和筛选策略,调整后的效果立即可见,可以显著降低创建一个新的新闻栏目所需的时间,进而可以在发生一些热点事件需要紧急创建热点栏目时,实现快速验证上线。
图2为本申请新闻栏目的生成方法另一个实施例的流程图,本实施例中,本申请图1所示实施例中的筛选策略包括加权策略,如图2所示,本申请图1所示实施例中,步骤103可以包括:
步骤201,对与上述关键词匹配的文章中符合上述加权策略的文章的基础分数,进行加权计算,获得符合上述加权策略的文章的加权分数。
步骤202,根据上述加权分数对符合上述加权策略的文章进行排序。
具体地,文章在数据流上会经过一个审核打分机制得到一个相应的基础分数,本实施例中,对符合加权策略的文章的基础分数进行加权计算,获得符合上述加权策略的文章的加权分数。
然后,再根据上述加权分数对符合上述加权策略的文章进行排序。
本实施例的一种实现方式中,上述加权策略包括内容质量;这样,步骤201可以为:在与上述关键词匹配的文章中,获取内容质量大于或等于预定阈值的文章;计算获取的文章的基础分数与内容质量维度对应的权重的乘积,作为上述获取的文章的加权分数。
其中,上述预定阈值可以在具体实现时根据***性能和/或实现需求等自行设定,本实施例对上述预定阈值的大小不作限定。本实施例中,文章在数据流上会经过一个审核打分机制得到一个相应的内容质量评分,这里内容质量大于或等于预定阈值可以为文章的内容质量评分大于或等于预定阈值。
加权策略中会设定内容质量维度对应的权重,对于内容质量大于或等于预定阈值的文章,计算文章的基础分数与内容质量维度对应的权重的乘积,作为上述文章的加权分数。
本实施例的另一种实现方式中,上述加权策略可以包括关键词;这时,步骤201可以为:在与上述关键词匹配的文章中,获取包括指定关键词的文章;计算获取的文章的基础分数与关键词维度对应的权重的乘积,作为上述获取的文章的加权分数。
具体地,用户可以在输入的关键词中指定至少一个关键词,并设定加权策略中关键词维度对应的权重,这样,如果文章中包括指定关键词,则计算文章的基础分数与关键词维度对应的权重的乘积,作为上述文章的加权分数。
本实施例的再一种实现方式中,上述加权策略包括时效;这时,步骤201可以为:在与上述关键词匹配的文章中,获取发布时间在设定的时效范围内的文章;计算获取的文章的基础分数与时效维度对应的权重的乘积,作为上述获取的文章的加权分数。
因为创建的是新闻栏目,新闻对时效性的要求较高,因此对于文章的发布时间要求时效性。可以设定加权策略中,时效维度对应的权重,获取发布时间在设定的时效范围内的文章,然后计算获取的文章的基础分数与时效维度对应的权重的乘积,作为上述获取的文章的加权分数。
本实施例的再一种实现方式中,上述加权策略包括地域;这时步骤201可以为:在与上述关键词匹配的文章中,获取所描述事件的发生地点与浏览者的所在地相匹配的文章;计算获取的文章的基础分数与地域维度对应的权重的乘积,作为上述获取的文章的加权分数。
具体地,文章中所描述事件的发生地点与浏览者的所在地匹配可以为:文章中所描述事件的发生地点与浏览者的所在地相同,或者文章中所描述事件的发生地点与浏览者的所在地不同,但距离在设定的距离范围内。其中,上述浏览者是指浏览新闻栏目的用户,可以通过浏览者使用的终端确定上述浏览者的所在地。
设定加权策略中,地域维度对应的权重,然后对于所描述事件的发生地点与浏览者的所在地相匹配的文章,计算文章的基础分数与地域维度对应的权重的乘积,作为上述文章的加权分数。
本实施例的再一种实现方式中,上述加权策略包括图片;这时,步骤201可以为:在与上述关键词匹配的文章中,获取包括图片的文章;计算获取的文章的基础分数与图片维度对应的权重的乘积,作为上述获取的文章的加权分数。
具体地,可以设定加权策略中图片维度对应的权重,对于包括图片的文章,计算文章的基础分数与图片维度对应的权重的乘积,作为上述文章的加权分数。
需要说明的是,上述加权策略可以单独使用,也可以组合使用。当组合使用时,需要计算组合使用的各加权策略对应的权重的乘积,再乘以符合组合使用的加权策略的文章的基础分数,作为加权分数。举例来说,上述加权策略可以包括内容质量、指定关键词和图片,则可以在与上述关键词匹配的文章中,获取内容质量大于或等于预定阈值,包括指定关键词,以及包括图片的文章;计算内容维度对应的权重、关键词维度对应的权重和图片维度对应的权重的乘积,再乘以获取的文章的基础分数,作为上述获取的文章的加权分数。
上述实施例可以实现根据选择的加权策略对符合加权策略的文章进行加权排序,使符合加权策略的文章有更大的可能性出现在最终创建的新闻栏目当中。
图3为本申请新闻栏目的生成方法再一个实施例的流程图,本实施例中,本申请图1所示实施例中的筛选策略包括过滤策略,如图3所示,本申请图1所示实施例中,步骤103可以包括:
步骤301,从与上述关键词匹配的文章中将符合上述过滤策略的文章删除。
本实施例的一种实现方式中,上述过滤策略包括内容质量;这时,步骤301可以为:在与上述关键词匹配的文章中,获取内容质量小于预定阈值的文章;从与上述关键词匹配的文章中将获取的文章删除。
本实施例中,文章在数据流上会经过一个审核打分机制得到一个相应的内容质量评分,这里内容质量小于预定阈值可以为文章的内容质量评分小于预定阈值。
当过滤策略包括内容质量时,对于内容质量小于预定阈值的文章,则予以删除。
本实施例的另一种实现方式中,上述过滤策略包括时效;这时步骤301可以为:在与上述关键词匹配的文章中,获取发布时间不在设定的时效范围内的文章;从与上述关键词匹配的文章中将获取的文章删除。
因为创建的是新闻栏目,新闻对时效性的要求较高,因此对于文章的发布时间要求时效性。当过滤策略包括时效时,对于发布时间不在设定的时效范围内的文章,则予以删除。
本实施例的再一种实现方式中,上述过滤策略包括地域;这时,步骤301可以为:在与上述关键词匹配的文章中,获取所描述事件的发生地点与浏览者的所在地不匹配的文章;从与上述关键词匹配的文章中将获取的文章删除。
具体地,所描述事件的发生地点与浏览者的所在地不匹配可以为:文章中所描述事件的发生地点与浏览者的所在地不同,并且距离不在设定的距离范围内。当过滤策略包括地域时,对于所描述事件的发生地点与浏览者的所在地不匹配的文章,则予以删除。
本实施例的再一种实现方式中,上述过滤策略包括用户喜好;这时,步骤301可以为:在与上述关键词匹配的文章中,获取兴趣点与浏览者的喜好不匹配的文章;从与上述关键词匹配的文章中将获取的文章删除。
具体地,兴趣点与浏览用户的喜好不匹配可以为:文章的兴趣点与浏览用户的用户模型中的兴趣点不匹配。当过滤策略包括用户喜好时,对于兴趣点与浏览用户的喜好不匹配的文章,则予以删除。
本实施例的再一种实现方式中,上述过滤策略包括图片;这时,步骤301可以为:在与上述关键词匹配的文章中,获取不包括图片的文章;从与上述关键词匹配的文章中将获取的文章删除。
当上述过滤策略包括图片时,对于不包括图片的文章,予以删除。
同样,上述过滤策略可以单一使用,可以组合使用。举例来说,上述过滤策略可以包括内容质量、时效和图片,则可以从与上述关键词匹配的文章中,分别获取内容质量小于预定阈值的文章、发布时间不在设定的时效范围内的文章以及不包括图片的文章,然后将获取的文章删除,从而实现从不同维度对文章进行筛选。
上述实施例可以实现根据选择的过滤策略对与上述关键词匹配的文章进行筛选,将符合过滤策略的文章删除出去。
本申请实施例中,策略库主要构成可以参见图4,图4为本申请新闻栏目的生成方法中策略库的示意图,策略库主要包含两部分的内容,加权策略和过滤策略。其中,“加权策略”依据内容质量、关键词、时效、地域和/或有无图片对文章进行判定,对符合加权策略的文章提高优先级,优先级高的文章有更大的可能性出现在最终创建的新闻栏目当中。“过滤策略”则依据内容质量、时效、地域、用户喜好和/或有无图片等条件将期望排除的文章剔除出去。
对于与上述关键词匹配的文章中,不符合加权策略和过滤策略的文章,则可以在对符合上述加权策略的文章排序之后,在符合上述加权策略的文章序列之后,按照基础分数对不符合加权策略和过滤策略的文章进行排序。
图5为本申请新闻栏目的生成装置一个实施例的结构示意图,本申请实施例中的新闻栏目的生成装置可以作为新闻栏目生成引擎,实现本申请实施例提供的新闻栏目的生成方法。如图5所示,上述新闻栏目的生成装置可以包括:获得模块51、筛选模块52和生成模块53;
其中,获得模块51,用于获得用户输入的关键词,根据上述关键词获取与上述关键词匹配的文章;以及获得上述用户从策略库中选择的筛选策略;
筛选模块52,用于根据上述筛选策略对与上述关键词匹配的文章进行筛选并排序;
生成模块53,用于根据排序结果生成新闻栏目的内容列表。
本实施例中,上述用户为频道负责人,即负责创建新闻栏目的人,现有相关技术中,主要问题在于频道负责人人工定义的策略,需要交由专门的开发人员开发,这样的流程耗时费力。本实施例中,对文章筛选可能用到的策略进行了整理汇总,生成了一个策略库,支持对各种策略的自动解析,这样频道负责人只需要输入关键词,并从策略库中选择需要的筛选策略,就可以立刻看到筛选好的新闻栏目的内容列表,如果效果不理想,可以直接调整关键词和筛选策略,调整后的效果立即可见。
本实施例中,筛选模块52,具体用于当上述筛选策略包括加权策略时,对与上述关键词匹配的文章中符合上述加权策略的文章的基础分数,进行加权计算,获得符合上述加权策略的文章的加权分数,根据上述加权分数对符合上述加权策略的文章进行排序。
具体地,文章在数据流上会经过一个审核打分机制得到一个相应的基础分数,本实施例中,筛选模块52对符合加权策略的文章的基础分数进行加权计算,获得符合上述加权策略的文章的加权分数,然后,再根据上述加权分数对符合上述加权策略的文章进行排序。
本实施例的一种实现方式中,筛选模块52,具体用于当上述加权策略包括内容质量时,在与上述关键词匹配的文章中,获取内容质量大于或等于预定阈值的文章,计算获取的文章的基础分数与内容质量维度对应的权重的乘积,作为上述获取的文章的加权分数。
其中,上述预定阈值可以在具体实现时根据***性能和/或实现需求等自行设定,本实施例对上述预定阈值的大小不作限定。本实施例中,文章在数据流上会经过一个审核打分机制得到一个相应的内容质量评分,这里内容质量大于或等于预定阈值可以为文章的内容质量评分大于或等于预定阈值。
加权策略中会设定内容质量维度对应的权重,对于内容质量大于或等于预定阈值的文章,筛选模块52计算文章的基础分数与内容质量维度对应的权重的乘积,作为上述文章的加权分数。
本实施例的另一种实现方式中,筛选模块52,具体用于当上述加权策略包括关键词时,在与上述关键词匹配的文章中,获取包括指定关键词的文章;计算获取的文章的基础分数与关键词维度对应的权重的乘积,作为上述获取的文章的加权分数。
具体地,用户可以在输入的关键词中指定至少一个关键词,并设定加权策略中关键词维度对应的权重,这样,如果文章中包括指定关键词,则筛选模块52计算文章的基础分数与关键词维度对应的权重的乘积,作为上述文章的加权分数。
本实施例的再一种实现方式中,筛选模块52,具体用于当上述加权策略包括时效时,在与上述关键词匹配的文章中,获取发布时间在设定的时效范围内的文章;计算获取的文章的基础分数与时效维度对应的权重的乘积,作为上述获取的文章的加权分数。
因为创建的是新闻栏目,新闻对时效性的要求较高,因此对于文章的发布时间要求时效性。可以设定加权策略中,时效维度对应的权重,获取发布时间在设定的时效范围内的文章,然后筛选模块52计算获取的文章的基础分数与时效维度对应的权重的乘积,作为上述获取的文章的加权分数。
本实施例的再一种实现方式中,筛选模块52,具体用于当上述加权策略包括地域时,在与上述关键词匹配的文章中,获取所描述事件的发生地点与浏览者的所在地相匹配的文章;计算获取的文章的基础分数与地域维度对应的权重的乘积,作为上述获取的文章的加权分数。
具体地,文章中所描述事件的发生地点与浏览者的所在地匹配可以为:文章中所描述事件的发生地点与浏览者的所在地相同,或者文章中所描述事件的发生地点与浏览者的所在地不同,但距离在设定的距离范围内。其中,上述浏览者是指浏览新闻栏目的用户,可以通过浏览者使用的终端确定上述浏览者的所在地。
设定加权策略中,地域维度对应的权重,然后对于所描述事件的发生地点与浏览者的所在地相匹配的文章,筛选模块52计算文章的基础分数与地域维度对应的权重的乘积,作为上述文章的加权分数。
本实施例的再一种实现方式中,筛选模块52,具体用于当上述加权策略包括图片时,在与上述关键词匹配的文章中,获取包括图片的文章;计算获取的文章的基础分数与图片维度对应的权重的乘积,作为上述获取的文章的加权分数。
具体地,可以设定加权策略中图片维度对应的权重,对于包括图片的文章,筛选模块52计算文章的基础分数与图片维度对应的权重的乘积,作为上述文章的加权分数。
需要说明的是,上述加权策略可以单独使用,也可以组合使用。当组合使用时,需要计算组合使用的各加权策略对应的权重的乘积,再乘以符合组合使用的加权策略的文章的基础分数,作为加权分数。举例来说,上述加权策略可以包括内容质量、指定关键词和图片,则可以在与上述关键词匹配的文章中,获取内容质量大于或等于预定阈值,包括指定关键词,以及包括图片的文章;筛选模块52计算内容维度对应的权重、关键词维度对应的权重和图片维度对应的权重的乘积,再乘以获取的文章的基础分数,作为上述获取的文章的加权分数。
上述筛选模块52可以实现根据选择的加权策略对符合加权策略的文章进行加权排序,使符合加权策略的文章有更大的可能性出现在最终创建的新闻栏目当中。
另一方面,筛选模块52,具体用于当上述筛选策略包括过滤策略时,从与上述关键词匹配的文章中将符合上述过滤策略的文章删除。
本实施例的一种实现方式中,筛选模块52,具体用于当上述过滤策略包括内容质量时,在与上述关键词匹配的文章中,获取内容质量小于预定阈值的文章;从与上述关键词匹配的文章中将获取的文章删除。
本实施例中,文章在数据流上会经过一个审核打分机制得到一个相应的内容质量评分,这里内容质量小于预定阈值可以为文章的内容质量评分小于预定阈值。
当过滤策略包括内容质量时,对于内容质量小于预定阈值的文章,则筛选模块52予以删除。
本实施例的另一种实现方式中,筛选模块52,具体用于当上述过滤策略包括时效时,在与上述关键词匹配的文章中,获取发布时间不在设定的时效范围内的文章;从与上述关键词匹配的文章中将获取的文章删除。
因为创建的是新闻栏目,新闻对时效性的要求较高,因此对于文章的发布时间要求时效性。当过滤策略包括时效时,对于发布时间不在设定的时效范围内的文章,则筛选模块52予以删除。
本实施例的再一种实现方式中,筛选模块52,具体用于当上述过滤策略包括地域时,在与上述关键词匹配的文章中,获取所描述事件的发生地点与浏览者的所在地不匹配的文章;从与上述关键词匹配的文章中将获取的文章删除。
具体地,所描述事件的发生地点与浏览者的所在地不匹配可以为:文章中所描述事件的发生地点与浏览者的所在地不同,并且距离不在设定的距离范围内。当过滤策略包括地域时,对于所描述事件的发生地点与浏览者的所在地不匹配的文章,则筛选模块52予以删除。
本实施例的再一种实现方式中,筛选模块52,具体用于当上述过滤策略包括用户喜好时,在与上述关键词匹配的文章中,获取兴趣点与浏览者的喜好不匹配的文章;从与上述关键词匹配的文章中将获取的文章删除。
具体地,兴趣点与浏览用户的喜好不匹配可以为:文章的兴趣点与浏览用户的用户模型中的兴趣点不匹配。当过滤策略包括用户喜好时,对于兴趣点与浏览用户的喜好不匹配的文章,则筛选模块52予以删除。
本实施例的再一种实现方式中,筛选模块52,具体用于当上述过滤策略包括图片时,在与上述关键词匹配的文章中,获取不包括图片的文章;从与上述关键词匹配的文章中将获取的文章删除。
当上述过滤策略包括图片时,对于不包括图片的文章,筛选模块52予以删除。
同样,上述过滤策略可以单一使用,可以组合使用。举例来说,上述过滤策略可以包括内容质量、时效和图片,则可以从与上述关键词匹配的文章中,分别获取内容质量小于预定阈值的文章、发布时间不在设定的时效范围内的文章以及不包括图片的文章,然后筛选模块52将获取的文章删除,从而实现从不同维度对文章进行筛选。
上述筛选模块52可以实现根据选择的过滤策略对与上述关键词匹配的文章进行筛选,将符合过滤策略的文章删除出去。
本申请实施例中,策略库主要构成可以参见图4,策略库主要包含两部分的内容,加权策略和过滤策略。其中,“加权策略”依据内容质量、关键词、时效、地域和/或有无图片对文章进行判定,对符合加权策略的文章提高优先级,优先级高的文章有更大的可能性出现在最终创建的新闻栏目当中。“过滤策略”则依据内容质量、时效、地域、用户喜好和/或有无图片等条件将期望排除的文章剔除出去。
对于与上述关键词匹配的文章中,不符合加权策略和过滤策略的文章,则筛选模块52可以在对符合上述加权策略的文章排序之后,在符合上述加权策略的文章序列之后,按照基础分数对不符合加权策略和过滤策略的文章进行排序。
上述新闻栏目的生成装置中,获得模块51获得用户输入的关键词之后,根据上述关键词获取与上述关键词匹配的文章,获得上述用户从策略库中选择的筛选策略,然后筛选模块52根据上述筛选策略对与上述关键词匹配的文章进行筛选并排序,最后生成模块53根据排序结果生成新闻栏目的内容列表,从而可以实现只需提供关键词并选择需要的筛选策略,就可以立刻看到筛选好的新闻栏目的内容列表,如果效果不理想,可以直接调整关键词和筛选策略,调整后的效果立即可见,可以显著降低创建一个新的新闻栏目所需的时间,进而可以在发生一些热点事件需要紧急创建热点栏目时,实现快速验证上线。
图6为本申请计算机设备一个实施例的结构示意图,上述计算机设备可以包括存储器、处理器及存储在上述存储器上并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时,可以实现本申请实施例提供的新闻栏目的生成方法。
其中,上述计算机设备可以为服务器,例如:包括新闻栏目生成引擎的服务器,本实施例对上述计算机设备的具体形态不作限定。
图6示出了适于用来实现本申请实施方式的示例性计算机设备12的框图。图6显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及***组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
***存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图6所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图6中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本申请实施例提供的新闻栏目的生成方法。
本申请实施例还提供一种非临时性计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时可以实现本申请实施例提供的新闻栏目的生成方法。
上述非临时性计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(Read Only Memory;以下简称:ROM)、可擦式可编程只读存储器(ErasableProgrammable Read Only Memory;以下简称:EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LocalArea Network;以下简称:LAN)或广域网(Wide Area Network;以下简称:WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(Random AccessMemory;以下简称:RAM),只读存储器(Read Only Memory;以下简称:ROM),可擦除可编辑只读存储器(Erasable Programmable Read Only Memory;以下简称:EPROM)或闪速存储器,光纤装置,以及便携式光盘只读存储器(Compact Disc Read Only Memory;以下简称:CD-ROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(ProgrammableGate Array;以下简称:PGA),现场可编程门阵列(Field Programmable Gate Array;以下简称:FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (14)

1.一种新闻栏目的生成方法,其特征在于,包括:
获得用户输入的关键词,根据所述关键词获取与所述关键词匹配的文章,所述用户为负责创建新闻栏目的人;
获得所述用户从策略库中选择的筛选策略,其中,所述筛选策略包括:加权策略、过滤策略,所述加权策略依据内容质量、关键词、时效、地域和/或有无图片对文章进行判定;所述过滤策略则依据内容质量、时效、地域、用户喜好和/或有无图片将期望排除的文章剔除出去;
根据所述筛选策略对与所述关键词匹配的文章进行筛选并排序;
根据排序结果生成新闻栏目的内容列表,所述内容列表显示在所述新闻栏目中;
其中,所述方法还包括:
所述用户调整所述关键词和所述筛选策略,根据调整后的关键词和筛选策略,生成新的内容列表;
所述根据所述筛选策略对与所述关键词匹配的文章进行筛选并排序包括:
从与所述关键词匹配的文章中将符合所述过滤策略的文章删除;对与所述关键词匹配的文章中符合所述加权策略的文章的基础分数,进行加权计算,获得符合所述加权策略的文章的加权分数;根据所述加权分数对符合所述加权策略的文章进行排序;
所述对与所述关键词匹配的文章中符合所述加权策略的文章的基础分数,进行加权计算,获得符合所述加权策略的文章的加权分数包括:在与所述关键词匹配的文章中,获取内容质量大于或等于预定阈值的文章;计算获取的文章的基础分数与内容质量维度对应的权重的乘积,作为所述获取的文章的加权分数;和/或在与所述关键词匹配的文章中,获取包括指定关键词的文章;和/或当所述加权策略包括时效时,在与所述关键词匹配的文章中,获取发布时间在设定的时效范围内的文章;计算获取的文章的基础分数与关键词维度对应的权重的乘积,作为所述获取的文章的加权分数;和/或在与所述关键词匹配的文章中,获取所描述事件的发生地点与浏览者的所在地相匹配的文章;计算获取的文章的基础分数与地域维度对应的权重的乘积,作为所述获取的文章的加权分数;和/或在与所述关键词匹配的文章中,获取包括图片的文章;计算获取的文章的基础分数与图片维度对应的权重的乘积,作为所述获取的文章的加权分数。
2.根据权利要求1所述的方法,其特征在于,所述过滤策略包括内容质量;
所述从与所述关键词匹配的文章中将符合所述过滤策略的文章删除包括:
在与所述关键词匹配的文章中,获取内容质量小于预定阈值的文章;
从与所述关键词匹配的文章中将获取的文章删除。
3.根据权利要求1所述的方法,其特征在于,所述过滤策略包括时效;
所述从与所述关键词匹配的文章中将符合所述过滤策略的文章删除包括:
在与所述关键词匹配的文章中,获取发布时间不在设定的时效范围内的文章;
从与所述关键词匹配的文章中将获取的文章删除。
4.根据权利要求1所述的方法,其特征在于,所述过滤策略包括地域;
所述从与所述关键词匹配的文章中将符合所述过滤策略的文章删除包括:
在与所述关键词匹配的文章中,获取所描述事件的发生地点与浏览者的所在地不匹配的文章;
从与所述关键词匹配的文章中将获取的文章删除。
5.根据权利要求1所述的方法,其特征在于,所述过滤策略包括用户喜好;
所述从与所述关键词匹配的文章中将符合所述过滤策略的文章删除包括:
在与所述关键词匹配的文章中,获取兴趣点与浏览者的喜好不匹配的文章;
从与所述关键词匹配的文章中将获取的文章删除。
6.根据权利要求1所述的方法,其特征在于,所述过滤策略包括图片;
所述从与所述关键词匹配的文章中将符合所述过滤策略的文章删除包括:
在与所述关键词匹配的文章中,获取不包括图片的文章;
从与所述关键词匹配的文章中将获取的文章删除。
7.一种新闻栏目的生成装置,其特征在于,包括:
获得模块,用于获得用户输入的关键词,根据所述关键词获取与所述关键词匹配的文章;以及获得所述用户从策略库中选择的筛选策略,所述用户为负责创建新闻栏目的人;
筛选模块,用于根据所述筛选策略对与所述关键词匹配的文章进行筛选并排序,其中,所述筛选策略包括:加权策略、过滤策略,所述加权策略依据内容质量、关键词、时效、地域和/或有无图片对文章进行判定;所述过滤策略则依据内容质量、时效、地域、用户喜好和/或有无图片将期望排除的文章剔除出去;
生成模块,用于根据排序结果生成新闻栏目的内容列表,所述内容列表显示在所述新闻栏目中;
调整模块,所述用户调整所述关键词和所述筛选策略,用于根据调整后的关键词和筛选策略,生成新的内容列表;
所述筛选模块,具体用于从与所述关键词匹配的文章中将符合所述过滤策略的文章删除,对与所述关键词匹配的文章中符合所述加权策略的文章的基础分数,进行加权计算,获得符合所述加权策略的文章的加权分数,根据所述加权分数对符合所述加权策略的文章进行排序;
所述筛选模块,具体用于当所述加权策略包括内容质量时,在与所述关键词匹配的文章中,获取内容质量大于或等于预定阈值的文章,计算获取的文章的基础分数与内容质量维度对应的权重的乘积,作为所述获取的文章的加权分数;和/或当所述加权策略包括关键词时,在与所述关键词匹配的文章中,获取包括指定关键词的文章;计算获取的文章的基础分数与关键词维度对应的权重的乘积,作为所述获取的文章的加权分数;和/或当所述加权策略包括时效时,在与所述关键词匹配的文章中,获取发布时间在设定的时效范围内的文章;计算获取的文章的基础分数与时效维度对应的权重的乘积,作为所述获取的文章的加权分数;和/或当所述加权策略包括地域时,在与所述关键词匹配的文章中,获取所描述事件的发生地点与浏览者的所在地相匹配的文章;计算获取的文章的基础分数与地域维度对应的权重的乘积,作为所述获取的文章的加权分数;和/或当所述加权策略包括图片时,在与所述关键词匹配的文章中,获取包括图片的文章;计算获取的文章的基础分数与图片维度对应的权重的乘积,作为所述获取的文章的加权分数。
8.根据权利要求7所述的装置,其特征在于,
所述筛选模块,具体用于当所述过滤策略包括内容质量时,在与所述关键词匹配的文章中,获取内容质量小于预定阈值的文章;从与所述关键词匹配的文章中将获取的文章删除。
9.根据权利要求7所述的装置,其特征在于,
所述筛选模块,具体用于当所述过滤策略包括时效时,在与所述关键词匹配的文章中,获取发布时间不在设定的时效范围内的文章;从与所述关键词匹配的文章中将获取的文章删除。
10.根据权利要求7所述的装置,其特征在于,
所述筛选模块,具体用于当所述过滤策略包括地域时,在与所述关键词匹配的文章中,获取所描述事件的发生地点与浏览者的所在地不匹配的文章;从与所述关键词匹配的文章中将获取的文章删除。
11.根据权利要求7所述的装置,其特征在于,
所述筛选模块,具体用于当所述过滤策略包括用户喜好时,在与所述关键词匹配的文章中,获取兴趣点与浏览者的喜好不匹配的文章;从与所述关键词匹配的文章中将获取的文章删除。
12.根据权利要求7所述的装置,其特征在于,
所述筛选模块,具体用于当所述过滤策略包括图片时,在与所述关键词匹配的文章中,获取不包括图片的文章;从与所述关键词匹配的文章中将获取的文章删除。
13.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-6中任一所述的方法。
14.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN201810145847.7A 2018-02-12 2018-02-12 新闻栏目的生成方法、装置和计算机设备 Active CN108334626B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810145847.7A CN108334626B (zh) 2018-02-12 2018-02-12 新闻栏目的生成方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810145847.7A CN108334626B (zh) 2018-02-12 2018-02-12 新闻栏目的生成方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN108334626A CN108334626A (zh) 2018-07-27
CN108334626B true CN108334626B (zh) 2022-06-10

Family

ID=62929241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810145847.7A Active CN108334626B (zh) 2018-02-12 2018-02-12 新闻栏目的生成方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN108334626B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635082A (zh) * 2018-11-26 2019-04-16 平安科技(深圳)有限公司 政策影响分析方法、装置、计算机设备和存储介质
CN111737580B (zh) * 2020-06-30 2021-01-29 深圳市中电网络技术有限公司 信息验证方法、装置、计算机设备和可读存储介质
CN111859887A (zh) * 2020-07-21 2020-10-30 北京北斗天巡科技有限公司 一种基于深度学习的科技新闻自动写作***
CN113221010B (zh) * 2021-05-26 2023-06-02 支付宝(杭州)信息技术有限公司 事件传播状态的显示方法、装置和电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8849809B1 (en) * 2010-03-11 2014-09-30 Google Inc. Automated identification of news events
CN105404699A (zh) * 2015-12-29 2016-03-16 广州神马移动信息科技有限公司 一种搜索财经文章的方法、装置及服务器
CN106776741A (zh) * 2016-11-18 2017-05-31 北京奇虎科技有限公司 一种搜索方法和装置
CN107025312A (zh) * 2017-05-19 2017-08-08 北京金山安全软件有限公司 基于视频内容的信息提供方法和装置
CN107077509A (zh) * 2016-11-25 2017-08-18 深圳前海达闼云端智能科技有限公司 一种改进浏览体验的方法、装置和设备
CN107436922A (zh) * 2017-07-05 2017-12-05 北京百度网讯科技有限公司 文本标签生成方法和装置
CN107679038A (zh) * 2017-10-16 2018-02-09 北京神州泰岳软件股份有限公司 一种文本段落的抽取方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8849809B1 (en) * 2010-03-11 2014-09-30 Google Inc. Automated identification of news events
CN105404699A (zh) * 2015-12-29 2016-03-16 广州神马移动信息科技有限公司 一种搜索财经文章的方法、装置及服务器
CN106776741A (zh) * 2016-11-18 2017-05-31 北京奇虎科技有限公司 一种搜索方法和装置
CN107077509A (zh) * 2016-11-25 2017-08-18 深圳前海达闼云端智能科技有限公司 一种改进浏览体验的方法、装置和设备
CN107025312A (zh) * 2017-05-19 2017-08-08 北京金山安全软件有限公司 基于视频内容的信息提供方法和装置
CN107436922A (zh) * 2017-07-05 2017-12-05 北京百度网讯科技有限公司 文本标签生成方法和装置
CN107679038A (zh) * 2017-10-16 2018-02-09 北京神州泰岳软件股份有限公司 一种文本段落的抽取方法及装置

Also Published As

Publication number Publication date
CN108334626A (zh) 2018-07-27

Similar Documents

Publication Publication Date Title
CN108334626B (zh) 新闻栏目的生成方法、装置和计算机设备
CN1538351B (zh) 为视频序列生成视频缩略图的方法和计算机
CN108197198B (zh) 一种兴趣点搜索方法、装置、设备和介质
US9215243B2 (en) Identifying and ranking pirated media content
CN109522950B (zh) 图像评分模型训练方法及装置和图像评分方法及装置
CN109753601B (zh) 推荐信息点击率确定方法、装置及电子设备
CN107633023B (zh) 一种图像去重方法和装置
CN109977300A (zh) 企业舆情获取方法、装置、终端及计算机存储介质
CN111125574A (zh) 用于生成信息的方法和装置
CN108804452B (zh) 多媒体资源封面展示方法及装置
US20160357811A1 (en) Webpage content search
CN113076416A (zh) 信息热度评估方法、装置和电子设备
CN108345700B (zh) 文章代表图片的选取方法、装置和计算机设备
CN111199540A (zh) 图像质量评价方法、装置、电子设备及存储介质
CN110674400A (zh) 排序方法、装置、电子设备及计算机可读存储介质
CN111783812B (zh) 违禁图像识别方法、装置和计算机可读存储介质
CN109409419B (zh) 用于处理数据的方法和装置
US11341138B2 (en) Method and system for query performance prediction
CN106445922B (zh) 确定多媒体资源的标题的方法及装置
JP2020123321A (ja) クリップボードデータに基づく検索処理方法および装置
CN111641868A (zh) 预览视频生成方法、装置及电子设备
CN111263241A (zh) 媒体数据的生成方法、装置、设备及存储介质
JP2020042771A (ja) データ分析方法及びデータ分析システム
CN113221572B (zh) 一种信息处理方法、装置、设备及介质
CN114237588A (zh) 一种代码仓库选择方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant