CN111859973A - 用于生成解说词的方法和装置 - Google Patents

用于生成解说词的方法和装置 Download PDF

Info

Publication number
CN111859973A
CN111859973A CN201910277162.2A CN201910277162A CN111859973A CN 111859973 A CN111859973 A CN 111859973A CN 201910277162 A CN201910277162 A CN 201910277162A CN 111859973 A CN111859973 A CN 111859973A
Authority
CN
China
Prior art keywords
news
cluster
target
commentary
news cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910277162.2A
Other languages
English (en)
Other versions
CN111859973B (zh
Inventor
�田�浩
陈曦
王健宇
卢大明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu com Times Technology Beijing Co Ltd
Baidu USA LLC
Original Assignee
Baidu com Times Technology Beijing Co Ltd
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu com Times Technology Beijing Co Ltd, Baidu USA LLC filed Critical Baidu com Times Technology Beijing Co Ltd
Priority to CN201910277162.2A priority Critical patent/CN111859973B/zh
Priority to JP2019218379A priority patent/JP7030095B2/ja
Priority to US16/703,718 priority patent/US11687711B2/en
Publication of CN111859973A publication Critical patent/CN111859973A/zh
Application granted granted Critical
Publication of CN111859973B publication Critical patent/CN111859973B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • G06V20/43Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of news video content
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本申请实施例公开了用于生成解说词的方法和装置。该方法的一具体实施方式包括:获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇,新闻簇中的各个新闻针对同一个新闻事件;基于至少一个新闻簇确定目标新闻簇;对于目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分;基于目标新闻,生成目标新闻簇的解说词,其中,目标新闻为目标新闻簇中适合生成解说词的得分最高的新闻。该实施方式减少了所需占用的CPU资源、存储资源和I/O资源。

Description

用于生成解说词的方法和装置
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于生成解说词的方法和装置。
背景技术
随着网络技术的发展,世界各地的各类新闻可以通过各种媒体发布给用户。对于同一个新闻事件,各种媒体(例如新闻类网站或者新闻类应用)会编辑出不同的新闻,不同媒体发出的新闻的侧重点会存在一定的差异,但是报道同一新闻事件的各个新闻中也会存在或多或少的重合信息。
对于用户来说,可能需要阅读多篇新闻报道才能从中提取出自己想要的信息,这就会导致用户的获取新闻的效率较低。为了帮助用户提高新闻获取的效率,可以对同一新闻事件的多篇新闻进行聚合,去除多篇新闻中的冗余信息,提取针对新闻事件的解说词。
发明内容
本申请实施例提出了用于生成解说词的方法和装置。
第一方面,本申请实施例提供了一种用于生成解说词的方法,该方法包括:获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇,新闻簇中的各个新闻针对同一个新闻事件;基于至少一个新闻簇确定目标新闻簇;对于目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分;基于目标新闻,生成目标新闻簇的解说词,其中,目标新闻为目标新闻簇中适合生成解说词的得分最高的新闻。
在一些实施例中,该方法还包括:生成与所述解说词对应的语音和/或视频。
在一些实施例中,该方法还包括:将与所述解说词对应的语音和/或视频发送给终端设备,以供终端设备呈现所收到的语音和/或视频。
在一些实施例中,基于至少一个新闻簇确定目标新闻簇,包括:将至少一个新闻簇中的每个新闻簇确定为目标新闻簇。
在一些实施例中,基于至少一个新闻簇确定目标新闻簇,包括:将至少一个新闻簇中的每个新闻簇按照该新闻簇内最近第二预设时长内所生成的新闻数目从多到少的顺序进行排序;将至少一个新闻簇中排序在预设排序范围内的每个新闻簇确定为目标新闻簇。
在一些实施例中,基于至少一个新闻簇确定目标新闻簇,包括:将至少一个新闻簇中的每个优质新闻簇确定为目标新闻簇,其中,优质新闻簇所包括的新闻中所包括的图像数目大于预设最少图像数目以及所包括的视频数目大于预设最少视频数目。
在一些实施例中,基于至少一个新闻簇确定目标新闻簇,包括:对于至少一个新闻簇中的每个新闻簇,基于该新闻簇中的各个新闻确定该新闻簇对应的新闻事件主题以及所确定的新闻事件主题的当前出现频度;确定至少一个新闻簇中每个新闻簇对应的新闻事件主题的当前出现频度减去该新闻事件主题的历史出现频度的频度差值;将至少一个新闻簇中对应的新闻事件主题的频度差值大于预设频度差值阈值的新闻簇确定为目标新闻簇。
在一些实施例中,基于目标新闻,生成目标新闻簇的解说词,包括:将目标新闻中所包括的文本确定为目标文本;删除目标文本中所包括的不适合解说文本,其中,不适合解说文本为预先确定的不适合解说文本集合中的文本;将目标文本中所包括的书面语替换为相同语义的口语;将对目标文本进行提取摘要所得到的摘要文本确定为目标新闻簇的解说词。
在一些实施例中,将对目标文本进行提取摘要所得到的摘要文本确定为目标新闻簇的解说词,包括:按照预设最快语速和预设最长音频时长确定解说词最多字数;对目标文本进行摘要提取,且所提取的摘要文本的字数少于解说词最多字数;将所提取的摘要文本确定为目标新闻簇的解说词。
在一些实施例中,对于目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分,包括:提取该新闻在至少一种特征下的特征值;基于所提取的至少一种特征值,确定该新闻的适合生成解说词的得分。
在一些实施例中,对于目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分,包括:将该新闻所包括的文本输入预先训练的得分计算模型,得到该新闻的适合生成解说词的得分,其中,得分计算模型用于表征文本和文本适合生成解说词的得分之间的对应关系。
第二方面,本申请实施例提供了一种用于生成解说词的装置,该装置包括:获取单元,被配置成获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇,新闻簇中的各个新闻针对同一个新闻事件;目标新闻簇确定单元,被配置成基于至少一个新闻簇确定目标新闻簇;得分确定单元,被配置成对于目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分;解说词生成单元,被配置成基于目标新闻,生成目标新闻簇的解说词,其中,目标新闻为目标新闻簇中适合生成解说词的得分最高的新闻。
在一些实施例中,该装置还包括:语音和/或视频生成单元,被配置成生成与所述解说词对应的语音和/或视频。
在一些实施例中,该装置还包括:发送单元,被配置成将与所述解说词对应的语音和/或视频发送给终端设备,以供所述终端设备呈现所收到的语音和/或视频。
在一些实施例中,目标新闻簇确定单元进一步被配置成:将至少一个新闻簇中的每个新闻簇确定为目标新闻簇。
在一些实施例中,目标新闻簇确定单元进一步被配置成:将至少一个新闻簇中的每个新闻簇按照该新闻簇内最近第二预设时长内所生成的新闻数目从多到少的顺序进行排序;将至少一个新闻簇中排序在预设排序范围内的每个新闻簇确定为目标新闻簇。
在一些实施例中,目标新闻簇确定单元进一步被配置成:将至少一个新闻簇中的每个优质新闻簇确定为目标新闻簇,其中,优质新闻簇所包括的新闻中所包括的图像数目大于预设最少图像数目以及所包括的视频数目大于预设最少视频数目。
在一些实施例中,目标新闻簇确定单元进一步被配置成:对于至少一个新闻簇中的每个新闻簇,基于该新闻簇中的各个新闻确定该新闻簇对应的新闻事件主题以及所确定的新闻事件主题的当前出现频度;确定至少一个新闻簇中每个新闻簇对应的新闻事件主题的当前出现频度减去该新闻事件主题的历史出现频度的频度差值;将至少一个新闻簇中对应的新闻事件主题的频度差值大于预设频度差值阈值的新闻簇确定为目标新闻簇。
在一些实施例中,解说词生成单元包括:目标文本确定模块,被配置成将目标新闻中所包括的文本确定为目标文本;删除模块,被配置成删除目标文本中所包括的不适合解说文本,其中,不适合解说文本为预先确定的不适合解说文本集合中的文本;替换模块,被配置成将目标文本中所包括的书面语替换为相同语义的口语;解说词确定模块,被配置成将对目标文本进行提取摘要所得到的摘要文本确定为目标新闻簇的解说词。
在一些实施例中,将解说词确定模块进一步被配置成:按照预设最快语速和预设最长音频时长确定解说词最多字数;对目标文本进行摘要提取,且所提取的摘要文本的字数少于解说词最多字数;将所提取的摘要文本确定为目标新闻簇的解说词。
在一些实施例中,得分确定单元进一步被配置成:提取该新闻在至少一种特征下的特征值;基于所提取的至少一种特征值,确定该新闻的适合生成解说词的得分。
在一些实施例中,得分确定单元进一步被配置成:将该新闻所包括的文本输入预先训练的得分计算模型,得到该新闻的适合生成解说词的得分,其中,得分计算模型用于表征文本和文本适合生成解说词的得分之间的对应关系。
第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该计算机程序被一个或多个处理器执行时实现如第一方面中任一实现方式描述的方法。
第五方面,本申请实施例提供了另一种服务器,包括:接口;存储器,其上存储有一个或多个程序;以及一个或多个处理器,在操作上连接到上述接口和上述存储器,用于:获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇,新闻簇中的各个新闻针对同一个新闻事件;基于上述至少一个新闻簇确定目标新闻簇;对于上述目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分;基于目标新闻,生成上述目标新闻簇的解说词,其中,上述目标新闻为上述目标新闻簇中适合生成解说词的得分最高的新闻。
第六方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,当上述计算机程序被一个或多个处理器执行时,使得上述一个或多个处理器:获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇,新闻簇中的各个新闻针对同一个新闻事件;基于上述至少一个新闻簇确定目标新闻簇;对于上述目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分;基于目标新闻,生成上述目标新闻簇的解说词,其中,上述目标新闻为上述目标新闻簇中适合生成解说词的得分最高的新闻。
目前,在为新闻簇生成解说词时,现有技术中往往对于针对每个新闻事件的新闻簇都生成相应的解说词,为每个新闻簇生成解说词都需要占用CPU(Central ProcessingUnit,中央处理器)资源、存储资源(例如,内存资源和硬盘资源)和I/O(input/output,输入/输出)资源。而本申请实施例提供的用于生成解说词的方法和装置,通过基于至少一个新闻簇确定目标新闻簇,并且只为所确定的目标新闻簇生成解说词,而不是为每个新闻簇都生成解说词,即减少了生成解说词的新闻簇数目,从而有效地来减少了整个过程所需要占用的CPU资源、存储资源和I/O资源。另外,现有技术中为多篇针对同一新闻事件的新闻生成解说词时,大都将从多篇新闻中抽取出的句子拼接在一起,经常出现逻辑错乱或者语义不同的问题,而本申请实施例提供的用于生成解说词的方法和装置,通过基于目标新闻簇中适合生成解说词的得分最高的目标新闻生成解说词,而不是从目标新闻簇中的多篇新闻中抽取句子拼接在一起,可以减少所生成的解说词的逻辑混乱或者语义不同的问题。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请的一个实施例可以应用于其中的示例性***架构图;
图2A是根据本申请的用于生成解说词的方法的一个实施例的流程图;
图2B是根据本申请的步骤204的一个实施例的分解流程图;
图3是根据本申请的用于生成解说词的方法的一个应用场景的示意图;
图4是根据本申请的用于生成解说词的方法的又一个实施例的流程图;
图5是根据本申请的用于生成解说词的装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的服务器的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于生成解说词的方法或用于生成解说词的装置的实施例的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的新闻类网站提供支持的后台网站服务器。后台网站服务器可以对接收到的新闻类页面请求等数据进行分析等处理,并将处理结果(例如新闻类网页页面数据)反馈给终端设备。
需要说明的是,本申请实施例所提供的用于生成解说词的方法一般由服务器105执行,相应地,用于生成解说词的装置一般设置于服务器105中。
需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供新闻网页页面服务),也可以实现成单个软件或软件模块,在此不做具体限定。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2A,其示出了根据本申请的用于生成解说词的方法的一个实施例的流程200。该用于生成解说词的方法,包括以下步骤:
步骤201,获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇。
在本实施例中,用于生成解说词的方法的执行主体(例如图1所示的服务器105)可以本地或者远程地从与上述执行主体网络连接的电子设备获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇,其中,每个新闻簇中的各个新闻针对同一个新闻事件,不同新闻簇所针对的新闻事件不同。
这里,新闻事件可以是最近第三预设时长内(例如,三个月之内)发生的事件。
这里,新闻可以是各种形式的针对新闻事件的电子数据,且新闻均可以对应标记有对应的生成时间。新闻可以包括以下至少一项:文本、图像、音频和视频。例如,新闻可以是网页,新闻也可以是各种文档,文档中可以包括以下至少一项:文本、图像、音频和视频。新闻还可以仅仅是文本、图像或者视频。
实践中,所获取的新闻可以标记有对应的新闻事件。这样,上述执行主体可以首先获取最近第一预设时长内(例如,一天之内)所生成的新闻,然后将所获取的至少一个新闻按照对应的新闻事件的不同组成不同的新闻簇。
可以理解的是,当所获取的新闻没有标记对应的新闻事件时,上述执行主体可以首先获取最近第一预设时长内(例如,一天之内)所生成的新闻,然后对所获取的新闻采用各种实现方式进行聚类,将聚类到同一类别的新闻组成一个新闻簇,不同聚类的新闻属于不同的新闻簇,继而可以得到至少一个新闻簇。例如,实践中,新闻一般都会有新闻标题,上述执行主体可以对所获取的各个新闻的新闻标题进行聚类,将新闻标题的聚类作为该新闻标题对应的新闻的聚类。
步骤202,基于至少一个新闻簇确定目标新闻簇。
在本实施例中,上述执行主体(例如图1所示的服务器)可以采用各种实现方式基于至少一个新闻簇确定目标新闻簇。
这里,目标新闻簇可以是一个新闻簇,也可以是至少两个新闻簇。
当目标新闻簇为一个新闻簇时,上述执行主体可以将所确定的一个新闻簇作为目标新闻簇执行步骤203和步骤204。
当所确定的目标新闻簇为至少两个新闻簇时,上述执行主体可以将所确定的至少两个新闻簇中每个新闻簇分别作为目标新闻簇执行步骤203和步骤204。即,假设所确定的目标新闻簇为N个新闻簇,N为大于等2的正整数,那么上述执行主体可以对于所确定的N个新闻簇中的每个新闻簇,均以该新闻簇作为目标新闻簇执行步骤203和步骤204。
在本实施例的一些可选的实现方式中,步骤202可以如下进行:
首先,将步骤201所确定的至少一个新闻簇中的每个新闻簇按照该新闻簇内最近第二预设时长内所生成的新闻数目从多到少的顺序进行排序。
这里,第二预设时长可以与第一预设时长相同,也可以与第一预设时长不同。
其次,将至少一个新闻簇中排序在预设排序范围内的每个新闻簇确定为目标新闻簇。
这里,预设排序范围可以是各种形式的。例如,预设排序范围可以是比例或者百分比形式。作为示例,预设排序范围可以是前10%到前20%之间。又例如,排序范围还可以是排序序号范围。作为示例,预设排序范围可以是排序序号的前10名到前20名之间。
实践中,按照预设排序范围所确定的目标新闻簇可以去掉至少一个新闻簇中的最近第二预设时长内生成的新闻数目最多的以及最少的新闻簇,即目标新闻簇针对的不是最热的新闻事件也不是最冷的新闻事件,而是中等热度的新闻事件。对于最火的新闻事件,由于大多数人都已经知道这件新闻事件,用户阅读为最火的新闻事件所生成的解说词的概率会比较低,因此,不为最火的新闻事件对应的新闻簇生成解说词,可以减少资源(例如CPU资源、存储资源和I/O资源)消耗。反之,对于最冷的新闻事件,表明大家对这个新闻事件没有兴趣,基本没有人知道这件新闻事件,即使为最冷的新闻事件生成解说词,用户也会不感兴趣,继而用户阅读为最冷的新闻事件所生成的解说词的概率也会比较低,因此,不为最冷的新闻事件对应的新闻簇生成解说词,也可以减少资源(例如CPU资源、存储资源和I/O资源)消耗。可以理解的是,这里的最热的新闻事件或者最冷的新闻事件可以是至少一个新闻事件。
在本实施例的一些可选的实现方式中,步骤202还可以如下进行:
将至少一个新闻簇中的每个优质新闻簇确定为目标新闻簇。
这里,优质新闻簇所包括的新闻中所包括的图像数目大于预设最少图像数目以及所包括的视频数目大于预设最少视频数目。例如,预设最少图像数目和预设最少视频数目可以为5。
这里,预设最少图像数目和预设最少视频数目可以是由技术人员根据对大量历史新闻的统计分析而预先设定的数目。预设最少图像数目和预设最少视频数目也可以根据需要被重新设定。
实践中,如果新闻簇中的新闻所包括的图像数目比较多且所包括的视频的数目也比较多,表明该新闻簇比较生动有趣,容易引起用户的阅读兴趣,为这样的新闻簇生成解说词也会引起用户的兴趣,继而增加用户阅读为优质新闻簇生成的解说词的概率。因此,只为优质新闻簇的新闻簇生成解说词,可以减少资源(例如CPU资源、存储资源和I/O资源)消耗。
在本实施例的一些可选的实现方式中,步骤202也可以如下进行:
首先,对于至少一个新闻簇中的每个新闻簇,基于该新闻簇中的各个新闻确定该新闻簇对应的新闻事件主题以及所确定的新闻事件主题的当前出现频度。
这里,可以采用各种实现方式确定新闻簇对应的新闻事件主题以及所确定的新闻事件主题的当前出现频度。这里,新闻簇对应的新闻事件主题表征了新闻簇中的各个新闻所表达的语义。实践中,新闻事件主题可以包括至少一个词语或短语,而所确定的新闻事件主题的当前出现频度是指所确定的新闻事件主题在该新闻簇的各个新闻中的出现频度。
例如,可以通过使用LDA(文档主题生成模型,Latent Dirichlet Allocation),基于步骤201中所确定的新闻簇中的各个新闻,确定该新闻簇中的各个新闻对应的新闻事件主题,并将所确定的新闻事件主题的概率分布值确定为所确定的新闻事件主题的当前出现频度。
其次,确定至少一个新闻簇中每个新闻簇对应的新闻事件主题的当前出现频度减去该新闻事件主题的历史出现频度的频度差值。
这里,该新闻事件的历史出现频度可以是基于历史新闻中与该新闻簇对应的新闻事件主题相同的历史新闻而确定的。
最后,将至少一个新闻簇中对应的新闻事件主题的频度差值大于预设频度差值阈值的新闻簇确定为目标新闻簇。
这里,如果新闻簇对应的新闻事件主题的频度差值大于预设频度差值阈值,表明该新闻簇对应的新闻事件本来是不突出的,但受到了突然的关注,那么该新闻簇就应该被重视起来,为这样的新闻簇生成解说词可以会有更多的用户阅读。
需要说明的是,上述执行主体还可以结合使用上述第一种、第二种以及第三种可选实现方式中的至少两种实现方式来确定目标新闻簇。
步骤203,对于目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分。
在本实施例中,用于生成解说词的方法的执行主体可以采用各种实现方式,对于目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分。
在本实施例的一些可选的实现方式中,步骤203可以如下进行:
首先,提取该新闻在至少一种特征下的特征值。
例如,至少一种特征可以包括但不限于以下特征:新闻所包括的文字字数、新闻所包括的不同词语的词语数量、新闻所包括的图像数量、新闻所包括的视频数量、新闻被阅读的次数、新闻被转发的次数、目标新闻簇中各个新闻所包括的文字字数之和、目标新闻簇中各个新闻所包括的不同词语的词语数量之和、目标新闻簇中各个新闻所包括的图像数量之和、目标新闻簇中各个新闻所包括的视频数量之和、目标新闻簇中各个新闻被阅读的次数之和、目标新闻簇中各个新闻被转发的次数之和。
其次,基于所提取的至少一种特征值,确定该新闻的适合生成解说词的得分。
这里,可以采用各种实现方式基于上述所提取的至少一种特征值,确定该新闻的适合生成解说词的得分。
例如,可以将上述所提取的至少一种特征值,按照为每种特征预先设定的权重进行加权求和,并将加权求和的结果确定为该新闻的适合生成解说词的得分。
又例如,还可以首先确定以下比值:
(1)新闻所包括的文字字数与目标新闻簇中各个新闻所包括的文字字数之和的比值;
(2)新闻所包括的不同词语的词语数量与目标新闻簇中各个新闻所包括的不同词语的词语数量之和的比值;
(3)新闻所包括的图像数量与目标新闻簇中各个新闻所包括的图像数量之和的比值;
(4)新闻所包括的视频数量与目标新闻簇中各个新闻所包括的视频数量之和的比值;
(5)新闻被阅读的次数与目标新闻簇中各个新闻被阅读的次数之和的比值;
(6)新闻被转发的次数与目标新闻簇中各个新闻被转发的次数之和的比值。
然后,可以将上述所确定的每个比值,按照为该比值预先确定的权重进行加权求和,并将加权求和的结果确定为该新闻的适合生成解说词的得分。
在本实施例的一些可选的实现方式中,步骤203也可以如下进行:
将该新闻所包括的文本输入预先训练的得分计算模型,得到该新闻的适合生成解说词的得分。
这里,得分计算模型用于表征文本和文本适合生成解说词的得分之间的对应关系。
作为示例,得分计算模型可以是技术人员基于大量的对文本进行特征提取所得到的特征向量和该文本适合生成解说词的得分标注结果的统计而预先制定的、存储有多个特征向量与适合生成解说词的得分的对应关系的对应关系表;也可以是技术人员基于对大量数据的统计而预先设置并存储至上述电子设备中的、对文本进行特征提取所得到的特征向量中的一个或多个数值进行数值计算以得到用于表征该文本适合生成解说词的得分的计算公式。
在一些实现方式中,上述执行主体可以预先按照以下步骤训练得分计算模型:
首先,可以获取训练样本集。
这里,训练样本可以包括历史新闻所包括的文本和历史新闻对应的适合生成解说词的标注得分。例如,可以通过人工针对历史新闻标注适合生成解说词的标注得分。
其次,可以确定初始得分计算模型的模型结构以及初始化初始得分计算模型的模型参数。
这里,训练得分计算模型的执行主体可以与用于生成解说词的方法的执行主体相同或者不同。如果相同,则训练得分计算模型的执行主体可以在训练得到得分计算模型后将训练好的得分计算模型的模型结构信息和模型参数的参数值存储在本地。如果不同,则训练得分计算模型的执行主体可以在训练得到得分计算模型后将训练好的得分计算模型的模型结构信息和模型参数的参数值发送给用于生成解说词的方法的执行主体。
这里,由于得分计算模型可以包括各种类型的计算模型,对于不同类型的计算模型,所需要确定的模型结构信息也不相同。
可选地,初始得分计算模型可以包括卷积神经网络。由于卷积神经网络是一个多层的神经网络,每层由多个二维平面组成,而每个平面由多个独立神经元组成,则这里需要确定卷积神经网络类型的初始得分计算模型包括哪些层(例如,卷积层,池化层,激励函数层等等),层与层之间的连接顺序关系,以及每个层都包括哪些参数(例如,权重weight、偏置bias、卷积的步长)等等。其中,卷积层可以用于提取特征。针对每个卷积层可以确定有多少个卷积核,每个卷积核的大小,每个卷积核中的各个神经元的权重,每个卷积核对应的偏置项,相邻两次卷积之间的步长,是否需要填充,填充多少像素点和填充用的数值(一般是填充为0)等等。而池化层可以用于对输入的信息进行下采样(Down Sample),以压缩数据和参数的量,减少过拟合。针对每个池化层可以确定该池化层的池化方法(例如,取区域平均值或者取区域最大值)。激励函数层用于对输入的信息进行非线性计算。针对每个激励函数层可以确定具体的激励函数。例如,激活函数可以是ReLU以及ReLU各种变种激活函数、Sigmoid函数、Tanh(双曲正切)函数、Maxout函数等等。
然后,可以初始化初始得分计算模型的模型参数。实践中,可以将初始得分计算模型的各个模型参数用一些不同的小随机数进行初始化。“小随机数”用来保证模型不会因权重过大而进入饱和状态,从而导致训练失败,“不同”用来保证模型可以正常地学习。
接着,可以将训练样本集中的训练样本中的历史新闻所包括的文本和历史新闻对应的适合生成解说词的得分分别作为初始得分计算模型的输入和期望输出,利用机器学习方法训练初始得分计算模型。
具体地,可以首先将训练样本集中的训练样本中的历史新闻所包括的文本输入初始得分计算模型,得到历史新闻所包括的文本对应的得分。然后,可以计算所得到的得分与该训练样本中的标注得分之间的差异。最后,可以基于计算所得的差异,调整初始得分计算模型的模型参数,并在满足预设的训练结束条件的情况下,结束训练。例如,这里预设的训练结束条件可以包括以下至少一项:训练时间超过第四预设时长,训练次数超过预设次数,计算所得的差异小于预设差异阈值。
这里,可以采用各种实现方式基于所得到的得分与该训练样本中的标注得分之间的差异调整初始得分计算模型的模型参数。例如,可以采用随机梯度下降(SGD,StochasticGradient Descent)、牛顿法(Newton's Method)、拟牛顿法(Quasi-Newton Methods)、共轭梯度法(Conjugate Gradient)、启发式优化方法以及其他现在已知或者未来开发的各种优化算法。
最后,可以将训练得到的初始得分计算模型确定为预先训练的得分计算模型。
步骤204,基于目标新闻,生成目标新闻簇的解说词。
由于已经在步骤203中确定了目标新闻簇中的每个新闻的适合生成解说词的得分,这里,上述执行主体可以首先将目标新闻簇中适合生成解说词的得分最高的新闻确定为目标新闻。然后,可以采用各种实现方式,基于目标新闻,生成目标新闻簇的解说词。
在本实施例的一些可选的实现方式中,步骤204可以如下进行:对目标新闻所包括的文本进行摘要提取,并将摘要提取所得到的摘要文本确定为目标新闻簇的解说词。
在本实施例的一些可选的实现方式中,步骤204也可以包括如图2B所示的步骤2041到步骤2047。
请参考图2B,其示出了根据本申请的步骤204的一个实施例的分解流程图:
步骤2041,将目标新闻中所包括的文本确定为目标文本。
这里,上述执行主体可以首先将目标新闻簇中适合生成解说词的得分最高的新闻确定为目标新闻。然后,可以将目标新闻中所包括的文本确定为目标文本。
步骤2042,删除目标文本中所包括的不适合解说文本。
这里,上述执行主体可以删除目标文本中所包括的不适合解说文本。其中,不适合解说文本可以为预先确定的不适合解说文本集合中的文本。实践中,不适合解说文本集合可以是技术人员基于对大量历史新闻中所提取的不适合解说的文本(例如,“本报记者讯”,“请看上图”,“请看下图”,“来自前方记者的报道”,“来自前方记者的重大新闻”,“前方记者发来报道”,“新闻记者采访了现场观众”等)的统计而预先制定的文本集合。
经过步骤2042,可以减少目标文本中的无效信息,继而可以增加最后所生成的解说词的有效信息内容比例。
步骤2043,将目标文本中所包括的书面语替换为相同语义的口语。
这里,上述执行主体可以采用各种实现方式将目标文本中所包括的书面语替换为相同语义的口语。这里,上述书面语和口语可以分别为预先确定的书面语和口语对应关系表中的书面语和对应的口语。实践中,上述书面语和口语对应关系表可以是由技术人员基于对大量语料中所提取的书面语和对应相同语义的口语的统计而预先制定的对应关系表。
经过步骤2043,目标文本中的书面语被替换为口语,可以使得目标文本更适合解说使用。
步骤2044,将对目标文本进行提取摘要所得到的摘要文本确定为目标新闻簇的解说词。
在一些实现方式中,上述执行主体可以直接将对目标文本进行提取摘要所得到的摘要文本确定为目标新闻簇的解说词。
在一些实现方式中,步骤2044也可以如下进行:
首先,按照预设最快语速和预设最长音频时长确定解说词最多字数。
这里,预设最快语速用于表征如果要为解说词生成对应的语音,那么所生成的语音单位时间(例如,1秒)内所包括的最多字数。
这里,预设最长音频时长用于表征如果要为解说词生成对应的语音,那么所生成的语音的最长播放时长。例如,如果要为解说词生成对应的短视频,那么预设最长音频时长可以为90秒。
这里,预设最快语速和预设最长音频时长可以是由技术人员预先确定的,当然也可以提供修改预设最快语速和预设最长音频时长的界面,以对预设最快语速和预设最长音频时长进行修改。
有了预设最快语速和预设最长音频时长,即可以将预设最快语速和预设最长音频时长的乘积确定为解说词最多字数。
其次,对目标文本进行摘要提取。
这里,可以采用各种实现方式对目标文本进行摘要提取,且所提取的摘要文本的字数少于所确定的解说词最多字数。
最后,将所提取的摘要文本确定为目标新闻簇的解说词。
这里,可以将所提取的字数少于解说词最多字数的摘要文本确定为目标新闻簇的解说词。
按照上述实现方式确定的解说词的字数可以满足预设最快语速和预设最长音频时长的要求。
需要说明的是,对文本进行摘要提取是目前广泛研究和应用的现有技术,在此不再赘述。
采用图2B所示的可选实现方式实现的步骤204,可以使得目标新闻所包括的文本减少不适合解说的文本比例,继而增加适合解说的文本比例,以及通过将书面语替换为口语,目标新闻所包括的文本更适合生成符合人类讲话习惯的解说词。
继续参见图3,图3是根据本实施例的用于生成解说词的方法的应用场景的一个示意图。在图3的应用场景中,对新闻类网站提供支持的服务器301可以首先获取最近第一预设时长(例如,1天)内所生成的新闻组成的至少一个新闻簇302;之后,服务器301基于至少一个新闻簇302确定目标新闻簇303;然后,服务器301对于目标新闻簇303中的每个新闻,确定该新闻的适合生成解说词的得分;最后,服务器301基于目标新闻304,生成目标新闻簇的解说词305。
通常情况下,在为新闻簇生成解说词时,往往对于针对每个新闻事件的新闻簇都生成相应的解说词,由于为每个新闻簇生成解说词都需要占用CPU资源、存储资源和I/O资源。而本申请的上述实施例提供的用于生成解说词的方法,通过基于至少一个新闻簇确定目标新闻簇,并且只为所确定的目标新闻簇生成解说词,而不是为每个新闻簇都生成解说词,即减少了生成解说词的新闻簇数目,从而有效地来减少了整个过程所需要占用的CPU资源、存储资源和I/O资源。另外,现有技术中为多篇针对同一新闻事件的新闻簇生成解说词时,大都将从多篇新闻中抽取出的句子拼接在一起,经常出现逻辑错乱或者语义不同的问题,而本申请的上述实施例提供的用于生成解说词的方法,通过基于目标新闻簇中适合生成解说词的得分最高的目标新闻生成解说词,而不是从目标新闻簇中的多篇新闻中抽取句子拼接在一起,可以减少所生成的解说词的逻辑混乱或者语义不同的问题。
进一步参考图4,其示出了用于生成解说词的方法的又一个实施例的流程400。该用于生成解说词的方法的流程400,包括以下步骤:
步骤401,获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇。
步骤402,基于至少一个新闻簇确定目标新闻簇。
步骤403,对于目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分。
步骤404,基于目标新闻,生成目标新闻簇的解说词
在本实施例中,步骤401、步骤402、步骤403和步骤404的具体操作与图2A所示的实施例中步骤201、步骤202、步骤203和步骤204的操作基本相同,在此不再赘述。
步骤405,生成与解说词对应的语音和/或视频。
在本实施例中,用于生成解说词的方法的执行主体(例如图1所示的服务器105)可以在步骤404中生成目标新闻簇的解说词后,生成与步骤404中所生成的目标新闻簇的解说词对应的语音和/或视频。
这里,上述执行主体可以利用语音合成技术,生成与目标新闻簇的解说词对应的语音。
需要说明的是,语音合成技术是目前广泛研究和应用的现有技术,在此不再赘述。
这里,上述执行主体可以采用各种实现方式生成与目标新闻簇的解说词对应的视频。
例如,上述执行主体生成与目标新闻簇的解说词对应的视频可以如下进行:
首先,可以将目标新闻簇的解说词划分成至少一句话。
其次,可以利用语音合成技术,生成与划分得到的每句话对应的语音。
接着,可以为划分得到的每句话生成一张对应的图像。例如,所生成的图像中呈现了该句话,或者所生成的图像呈现该句话中所涉及的事物。
最后,可以按照划分得到的每句话在解说词中的先后顺序,生成目标新闻簇的解说词对应的视频,其中,所生成的该句话对应的语音作为所生成的视频中与该句话对应的音频部分,将所生成的该句话对应的图像播放对应的语音的播放时长的视频作为与该句话对应的视频部分。
步骤406,将与解说词对应的语音和/或视频发送给终端设备。
在本实施例中,上述执行主体可以将步骤405中所生成的与解说词对应的语音和/或视频发送给终端设备。这里,终端设备可以是与上述执行主体网络连接的电子设备。这样,上述终端设备可以响应于接收到上述执行主体发送的语音和/或视频,呈现所收到的语音和/或视频,继而实现了在终端设备上呈现目标新闻簇的解说词对应的语音和/或视频。用户在终端设备上通过收听或收看到所呈现的目标新闻簇的解说词对应的语音和/或视频,就可以快速了解目标新闻簇所针对的新闻事件,而不需用户通过阅读文字来了解目标新闻簇所针对的新闻事件,提高了用户获取新闻事件信息的效率。
从图4中可以看出,与图2A对应的实施例相比,本实施例中的用于生成解说词的方法的流程400多出了为目标新闻簇的解说词生成对应的语音和/或视频,以及将与解说词对应的语音和/或视频发送给终端设备的步骤。由此,本实施例描述的方案可以在终端设备呈现所收到的目标新闻簇对应的语音和/或视频。用户在终端设备上通过收听或收看到所呈现的目标新闻簇的解说词对应的语音和/或视频,就可以快速了解目标新闻簇所针对的新闻事件,而不需用户通过阅读文字来了解目标新闻簇所针对的新闻事件,提高了用户通过终端设备获取新闻事件信息的效率,也就是扩展了终端设备的呈现信息的功能。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种用于生成解说词的装置的一个实施例,该装置实施例与图2A所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的用于生成解说词的装置500包括:获取单元501、目标新闻簇确定单元502、得分确定单元503和解说词生成单元504。其中,获取单元501,被配置成获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇,新闻簇中的各个新闻针对同一个新闻事件;目标新闻簇确定单元502,被配置成基于上述至少一个新闻簇确定目标新闻簇;得分确定单元503,被配置成对于上述目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分;而解说词生成单元504,被配置成基于目标新闻,生成上述目标新闻簇的解说词,其中,上述目标新闻为上述目标新闻簇中适合生成解说词的得分最高的新闻。
在本实施例中,用于生成解说词的装置500的获取单元501、目标新闻簇确定单元502、得分确定单元503和解说词生成单元504的具体处理及其所带来的技术效果可分别参考图2A对应实施例中步骤201、步骤202、步骤203和步骤204的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,上述装置500还可以包括:语音和/或视频生成单元505,被配置成生成与所述解说词对应的语音和/或视频。
在本实施例的一些可选的实现方式中,上述装置500还可以包括:发送单元506,被配置成将与所述解说词对应的语音和/或视频发送给终端设备,以供所述终端设备呈现所收到的语音和/或视频。
在本实施例的一些可选的实现方式中,上述目标新闻簇确定单元502可以进一步被配置成:将上述至少一个新闻簇中的每个新闻簇确定为上述目标新闻簇。
在本实施例的一些可选的实现方式中,上述目标新闻簇确定单元502也可以进一步被配置成:将上述至少一个新闻簇中的每个新闻簇按照该新闻簇内最近第二预设时长内所生成的新闻数目从多到少的顺序进行排序;将上述至少一个新闻簇中排序在预设排序范围内的每个新闻簇确定为上述目标新闻簇。
在本实施例的一些可选的实现方式中,上述目标新闻簇确定单元502还可以进一步被配置成:将上述至少一个新闻簇中的每个优质新闻簇确定为上述目标新闻簇,其中,优质新闻簇所包括的新闻中所包括的图像数目大于预设最少图像数目以及所包括的视频数目大于预设最少视频数目。
在本实施例的一些可选的实现方式中,上述目标新闻簇确定单元502还可以进一步被配置成:对于上述至少一个新闻簇中的每个新闻簇,基于该新闻簇中的各个新闻确定该新闻簇对应的新闻事件主题以及所确定的新闻事件主题的当前出现频度;确定上述至少一个新闻簇中每个新闻簇对应的新闻事件主题的当前出现频度减去该新闻事件主题的历史出现频度的频度差值;将上述至少一个新闻簇中对应的新闻事件主题的频度差值大于预设频度差值阈值的新闻簇确定为上述目标新闻簇。
在本实施例的一些可选的实现方式中,上述解说词生成单元504可以包括:目标文本确定模块5041,被配置成将上述目标新闻中所包括的文本确定为目标文本;删除模块5042,被配置成删除上述目标文本中所包括的不适合解说文本,其中,不适合解说文本为预先确定的不适合解说文本集合中的文本;替换模块5043,被配置成将上述目标文本中所包括的书面语替换为相同语义的口语;解说词确定模块5044,被配置成将对上述目标文本进行提取摘要所得到的摘要文本确定为上述目标新闻簇的解说词。
在本实施例的一些可选的实现方式中,上述解说词确定模块5044可以进一步被配置成:按照预设最快语速和预设最长音频时长确定解说词最多字数;对上述目标文本进行摘要提取,且所提取的摘要文本的字数少于上述解说词最多字数;将所提取的摘要文本确定为上述目标新闻簇的解说词。
在本实施例的一些可选的实现方式中,上述得分确定单元503可以进一步被配置成:提取该新闻在至少一种特征下的特征值;基于所提取的至少一种特征值,确定该新闻的适合生成解说词的得分。
在本实施例的一些可选的实现方式中,上述得分确定单元503还可以进一步被配置成:将该新闻所包括的文本输入预先训练的得分计算模型,得到该新闻的适合生成解说词的得分,其中,上述得分计算模型用于表征文本和文本适合生成解说词的得分之间的对应关系。
需要说明的是,本申请实施例提供的用于生成解说词的装置中各单元的实现细节和技术效果可以参考本申请中其它实施例的说明,在此不再赘述。
下面参考图6,其示出了适于用来实现本申请实施例的服务器的计算机***600的结构示意图。图6示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机***600包括一个或多个中央处理单元(CPU,CentralProcessing Unit)601,其可以根据存储在只读存储器(ROM,Read Only Memory)602中的程序或者从存储部分608加载到随机访问存储器(RAM,Random Access Memory)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有***600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O,Input/Output)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT,Cathode Ray Tube)、液晶显示器(LCD,Liquid Crystal Display)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN(局域网,Local AreaNetwork)卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、目标新闻簇确定单元、得分确定单元和解说词生成单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇,新闻簇中的各个新闻针对同一个新闻事件;基于至少一个新闻簇确定目标新闻簇;对于目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分;基于目标新闻,生成目标新闻簇的解说词,其中,目标新闻为目标新闻簇中适合生成解说词的得分最高的新闻。
作为又一方面,本申请实施例还提供了另一种服务器,包括:接口;存储器,其上存储有一个或多个程序;以及一个或多个处理器,在操作上连接到上述接口和上述存储器,用于:获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇,新闻簇中的各个新闻针对同一个新闻事件;基于至少一个新闻簇确定目标新闻簇;对于目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分;基于目标新闻,生成目标新闻簇的解说词,其中,目标新闻为目标新闻簇中适合生成解说词的得分最高的新闻。
作为又一方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,当上述计算机程序被一个或多个处理器执行时,使得上述一个或多个处理器:获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇,新闻簇中的各个新闻针对同一个新闻事件;基于至少一个新闻簇确定目标新闻簇;对于目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分;基于目标新闻,生成目标新闻簇的解说词,其中,目标新闻为目标新闻簇中适合生成解说词的得分最高的新闻。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (24)

1.一种用于生成解说词的方法,包括:
获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇,新闻簇中的各个新闻针对同一个新闻事件;
基于所述至少一个新闻簇确定目标新闻簇;
对于所述目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分;
基于目标新闻,生成所述目标新闻簇的解说词,其中,所述目标新闻为所述目标新闻簇中适合生成解说词的得分最高的新闻。
2.根据权利要求1所述的方法,其中,所述方法还包括:
生成与所述解说词对应的语音和/或视频。
3.根据权利要求2所述的方法,其中,所述方法还包括:
将与所述解说词对应的语音和/或视频发送给终端设备,以供所述终端设备呈现所收到的语音和/或视频。
4.根据权利要求3所述的方法,其中,所述基于所述至少一个新闻簇确定目标新闻簇,包括:
将所述至少一个新闻簇中的每个新闻簇确定为所述目标新闻簇。
5.根据权利要求3所述的方法,其中,所述基于所述至少一个新闻簇确定目标新闻簇,包括:
将所述至少一个新闻簇中的每个新闻簇按照该新闻簇内最近第二预设时长内所生成的新闻数目从多到少的顺序进行排序;
将所述至少一个新闻簇中排序在预设排序范围内的每个新闻簇确定为所述目标新闻簇。
6.根据权利要求3所述的方法,其中,所述基于所述至少一个新闻簇确定目标新闻簇,包括:
将所述至少一个新闻簇中的每个优质新闻簇确定为所述目标新闻簇,其中,优质新闻簇所包括的新闻中所包括的图像数目大于预设最少图像数目以及所包括的视频数目大于预设最少视频数目。
7.根据权利要求3所述的方法,其中,所述基于所述至少一个新闻簇确定目标新闻簇,包括:
对于所述至少一个新闻簇中的每个新闻簇,基于该新闻簇中的各个新闻确定该新闻簇对应的新闻事件主题以及所确定的新闻事件主题的当前出现频度;
确定所述至少一个新闻簇中每个新闻簇对应的新闻事件主题的当前出现频度减去该新闻事件主题的历史出现频度的频度差值;
将所述至少一个新闻簇中对应的新闻事件主题的频度差值大于预设频度差值阈值的新闻簇确定为所述目标新闻簇。
8.根据权利要求3所述的方法,其中,所述基于目标新闻,生成所述目标新闻簇的解说词,包括:
将所述目标新闻中所包括的文本确定为目标文本;
删除所述目标文本中所包括的不适合解说文本,其中,不适合解说文本为预先确定的不适合解说文本集合中的文本;
将所述目标文本中所包括的书面语替换为相同语义的口语;
将对所述目标文本进行提取摘要所得到的摘要文本确定为所述目标新闻簇的解说词。
9.根据权利要求8所述的方法,其中,所述将对所述目标文本进行提取摘要所得到的摘要文本确定为所述目标新闻簇的解说词,包括:
按照预设最快语速和预设最长音频时长确定解说词最多字数;
对所述目标文本进行摘要提取,且所提取的摘要文本的字数少于所述解说词最多字数;
将所提取的摘要文本确定为所述目标新闻簇的解说词。
10.根据权利要求3所述的方法,其中,所述对于所述目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分,包括:
提取该新闻在至少一种特征下的特征值;
基于所提取的至少一种特征值,确定该新闻的适合生成解说词的得分。
11.根据权利要求3所述的方法,其中,所述对于所述目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分,包括:
将该新闻所包括的文本输入预先训练的得分计算模型,得到该新闻的适合生成解说词的得分,其中,所述得分计算模型用于表征文本和文本适合生成解说词的得分之间的对应关系。
12.一种用于生成解说词的装置,包括:
获取单元,被配置成获取最近第一预设时长内所生成的新闻组成的至少一个新闻簇,新闻簇中的各个新闻针对同一个新闻事件;
目标新闻簇确定单元,被配置成基于所述至少一个新闻簇确定目标新闻簇;
得分确定单元,被配置成对于所述目标新闻簇中的每个新闻,确定该新闻的适合生成解说词的得分;
解说词生成单元,被配置成基于目标新闻,生成所述目标新闻簇的解说词,其中,所述目标新闻为所述目标新闻簇中适合生成解说词的得分最高的新闻。
13.根据权利要求12所述的装置,其中,所述装置还包括:
语音和/或视频生成单元,被配置成生成与所述解说词对应的语音和/或视频。
14.根据权利要求13所述的装置,其中,所述装置还包括:
发送单元,被配置成将与所述解说词对应的语音和/或视频发送给终端设备,以供所述终端设备呈现所收到的语音和/或视频。
15.根据权利要求14所述的装置,其中,所述目标新闻簇确定单元进一步被配置成:
将所述至少一个新闻簇中的每个新闻簇确定为所述目标新闻簇。
16.根据权利要求14所述的装置,其中,所述目标新闻簇确定单元进一步被配置成:
将所述至少一个新闻簇中的每个新闻簇按照该新闻簇内最近第二预设时长内所生成的新闻数目从多到少的顺序进行排序;
将所述至少一个新闻簇中排序在预设排序范围内的每个新闻簇确定为所述目标新闻簇。
17.根据权利要求14所述的装置,其中,所述目标新闻簇确定单元进一步被配置成:
将所述至少一个新闻簇中的每个优质新闻簇确定为所述目标新闻簇,其中,优质新闻簇所包括的新闻中所包括的图像数目大于预设最少图像数目以及所包括的视频数目大于预设最少视频数目。
18.根据权利要求14所述的装置,其中,所述目标新闻簇确定单元进一步被配置成:
对于所述至少一个新闻簇中的每个新闻簇,基于该新闻簇中的各个新闻确定该新闻簇对应的新闻事件主题以及所确定的新闻事件主题的当前出现频度;
确定所述至少一个新闻簇中每个新闻簇对应的新闻事件主题的当前出现频度减去该新闻事件主题的历史出现频度的频度差值;
将所述至少一个新闻簇中对应的新闻事件主题的频度差值大于预设频度差值阈值的新闻簇确定为所述目标新闻簇。
19.根据权利要求14所述的装置,其中,所述解说词生成单元包括:
目标文本确定模块,被配置成将所述目标新闻中所包括的文本确定为目标文本;
删除模块,被配置成删除所述目标文本中所包括的不适合解说文本,其中,不适合解说文本为预先确定的不适合解说文本集合中的文本;
替换模块,被配置成将所述目标文本中所包括的书面语替换为相同语义的口语;
解说词确定模块,被配置成将对所述目标文本进行提取摘要所得到的摘要文本确定为所述目标新闻簇的解说词。
20.根据权利要求19所述的装置,其中,所述将解说词确定模块进一步被配置成:
按照预设最快语速和预设最长音频时长确定解说词最多字数;
对所述目标文本进行摘要提取,且所提取的摘要文本的字数少于所述解说词最多字数;
将所提取的摘要文本确定为所述目标新闻簇的解说词。
21.根据权利要求14所述的装置,其中,所述得分确定单元进一步被配置成:
提取该新闻在至少一种特征下的特征值;
基于所提取的至少一种特征值,确定该新闻的适合生成解说词的得分。
22.根据权利要求14所述的装置,其中,所述得分确定单元进一步被配置成:
将该新闻所包括的文本输入预先训练的得分计算模型,得到该新闻的适合生成解说词的得分,其中,所述得分计算模型用于表征文本和文本适合生成解说词的得分之间的对应关系。
23.一种服务器,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-11中任一所述的方法。
24.一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被一个或多个处理器执行时实现如权利要求1-11中任一所述的方法。
CN201910277162.2A 2019-04-08 2019-04-08 用于生成解说词的方法和装置 Active CN111859973B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910277162.2A CN111859973B (zh) 2019-04-08 2019-04-08 用于生成解说词的方法和装置
JP2019218379A JP7030095B2 (ja) 2019-04-08 2019-12-02 ナレーションを生成するための方法、装置、サーバー、コンピュータ可読記憶媒体及びコンピュータプログラム
US16/703,718 US11687711B2 (en) 2019-04-08 2019-12-04 Method and apparatus for generating commentary

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910277162.2A CN111859973B (zh) 2019-04-08 2019-04-08 用于生成解说词的方法和装置

Publications (2)

Publication Number Publication Date
CN111859973A true CN111859973A (zh) 2020-10-30
CN111859973B CN111859973B (zh) 2024-06-25

Family

ID=72663583

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910277162.2A Active CN111859973B (zh) 2019-04-08 2019-04-08 用于生成解说词的方法和装置

Country Status (3)

Country Link
US (1) US11687711B2 (zh)
JP (1) JP7030095B2 (zh)
CN (1) CN111859973B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111583907B (zh) * 2020-04-15 2023-08-15 北京小米松果电子有限公司 信息处理方法、装置及存储介质
JP7287992B2 (ja) * 2021-01-28 2023-06-06 ヤフー株式会社 情報処理装置、情報処理システム、情報処理方法、及びプログラム
CN113727134A (zh) * 2021-08-31 2021-11-30 康键信息技术(深圳)有限公司 一种直播聊天信息分发方法及***

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259666A (ja) * 1999-03-11 2000-09-22 Nippon Hoso Kyokai <Nhk> トピック抽出装置
CN1795506A (zh) * 2003-05-26 2006-06-28 皇家飞利浦电子股份有限公司 用于产生视听节目内容的视听概要的***和方法
CN103020159A (zh) * 2012-11-26 2013-04-03 百度在线网络技术(北京)有限公司 一种面向事件的新闻展现方法和装置
US20150332666A1 (en) * 2012-12-10 2015-11-19 Wibbitz Ltd. Method for Automatically Transforming Text Into Video
US20160300110A1 (en) * 2015-04-09 2016-10-13 Facebook, Inc. Systems and methods for defining and analyzing video clusters based on video image frames
CN107066537A (zh) * 2017-03-06 2017-08-18 广州神马移动信息科技有限公司 热点新闻生成方法、设备、电子设备
JP2017201437A (ja) * 2016-05-02 2017-11-09 日本放送協会 ニュース素材抽出装置及びプログラム
US20180143980A1 (en) * 2016-11-22 2018-05-24 Facebook, Inc. Generating News Headlines on Online Social Networks
CN108170773A (zh) * 2017-12-26 2018-06-15 百度在线网络技术(北京)有限公司 新闻事件挖掘方法、装置、计算机设备和存储介质
CN108595388A (zh) * 2018-04-23 2018-09-28 乐山师范学院 一种面向网络新闻报道的大事记自动生成方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05232982A (ja) * 1992-02-24 1993-09-10 Nippon Telegr & Teleph Corp <Ntt> 時間長指定型記事読み上げ方法
JP3565288B2 (ja) * 1995-02-16 2004-09-15 ソニー株式会社 情報表示方法
JP2000339250A (ja) 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> 対話メッセージ生成方法、その装置、そのプログラムを記録した媒体
US8229957B2 (en) 2005-04-22 2012-07-24 Google, Inc. Categorizing objects, such as documents and/or clusters, with respect to a taxonomy and data structures derived from such categorization
JP2006338086A (ja) 2005-05-31 2006-12-14 Nomura Research Institute Ltd 話題規模管理装置
JP4900915B2 (ja) 2006-06-29 2012-03-21 Kddi株式会社 コンテンツ配信方法および装置
JP4871119B2 (ja) 2006-12-27 2012-02-08 日本電信電話株式会社 音声合成方法、音声合成装置、プログラム、記録媒体
US9535911B2 (en) * 2007-06-29 2017-01-03 Pulsepoint, Inc. Processing a content item with regard to an event
KR20170006203A (ko) 2015-07-07 2017-01-17 삼성전자주식회사 뉴스 콘텐트와 관련된 정보를 제공하는 전자 장치 및 그 방법
JP2017102652A (ja) 2015-12-01 2017-06-08 Necパーソナルコンピュータ株式会社 記事配信システム、情報処理装置およびプログラム
EP3506083A4 (en) 2016-08-29 2019-08-07 Sony Corporation INFORMATION PRESENTATION DEVICE AND INFORMATION PRESENTATION PROCEDURE
JP6971719B2 (ja) 2017-08-31 2021-11-24 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
US20190129942A1 (en) * 2017-10-30 2019-05-02 Northern Light Group, Llc Methods and systems for automatically generating reports from search results
JP6816214B2 (ja) 2018-05-21 2021-01-20 ネイバー コーポレーションNAVER Corporation Aiヘッドラインニュース

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259666A (ja) * 1999-03-11 2000-09-22 Nippon Hoso Kyokai <Nhk> トピック抽出装置
CN1795506A (zh) * 2003-05-26 2006-06-28 皇家飞利浦电子股份有限公司 用于产生视听节目内容的视听概要的***和方法
CN103020159A (zh) * 2012-11-26 2013-04-03 百度在线网络技术(北京)有限公司 一种面向事件的新闻展现方法和装置
US20150332666A1 (en) * 2012-12-10 2015-11-19 Wibbitz Ltd. Method for Automatically Transforming Text Into Video
US20160300110A1 (en) * 2015-04-09 2016-10-13 Facebook, Inc. Systems and methods for defining and analyzing video clusters based on video image frames
US20170147883A1 (en) * 2015-04-09 2017-05-25 Facebook, Inc. Systems and methods for defining and analyzing video clusters based on video image frames
JP2017201437A (ja) * 2016-05-02 2017-11-09 日本放送協会 ニュース素材抽出装置及びプログラム
US20180143980A1 (en) * 2016-11-22 2018-05-24 Facebook, Inc. Generating News Headlines on Online Social Networks
CN107066537A (zh) * 2017-03-06 2017-08-18 广州神马移动信息科技有限公司 热点新闻生成方法、设备、电子设备
CN108170773A (zh) * 2017-12-26 2018-06-15 百度在线网络技术(北京)有限公司 新闻事件挖掘方法、装置、计算机设备和存储介质
CN108595388A (zh) * 2018-04-23 2018-09-28 乐山师范学院 一种面向网络新闻报道的大事记自动生成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄丽霞: "面向慕课视频的关键词提取研究与应用", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 1, pages 138 - 4593 *

Also Published As

Publication number Publication date
US11687711B2 (en) 2023-06-27
US20200320253A1 (en) 2020-10-08
JP2020173774A (ja) 2020-10-22
JP7030095B2 (ja) 2022-03-04
CN111859973B (zh) 2024-06-25

Similar Documents

Publication Publication Date Title
CN111798879B (zh) 用于生成视频的方法和装置
US10824874B2 (en) Method and apparatus for processing video
CN111866610B (zh) 用于生成信息的方法和装置
CN107193792B (zh) 基于人工智能的生成文章的方法和装置
US12001474B2 (en) Information determining method and apparatus, computer device, and storage medium
CN108989882B (zh) 用于输出视频中的音乐片段的方法和装置
CN111800671B (zh) 用于对齐段落和视频的方法和装置
CN109582825B (zh) 用于生成信息的方法和装置
CN106354856B (zh) 基于人工智能的深度神经网络强化搜索方法和装置
US11687711B2 (en) Method and apparatus for generating commentary
JP7355865B2 (ja) ビデオ処理方法、装置、デバイスおよび記憶媒体
CN112188312A (zh) 用于确定新闻的视频素材的方法和装置
CN113360660A (zh) 文本类别识别方法、装置、电子设备和存储介质
CN109472028B (zh) 用于生成信息的方法和装置
CN112800230B (zh) 文本处理方法、装置、计算机可读存储介质及电子设备
CN109670111A (zh) 用于推送信息的方法和装置
CN112672202B (zh) 弹幕处理方法、设备和存储介质
US10699127B1 (en) Method and apparatus for adjusting parameter
CN111866609B (zh) 用于生成视频的方法和装置
CN110688487A (zh) 一种文本分类的方法和装置
CN116842262A (zh) 图书推荐信息的生成方法、装置及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant