CN114970494A - 一种评论生成方法、装置、电子设备和存储介质 - Google Patents
一种评论生成方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN114970494A CN114970494A CN202110211022.2A CN202110211022A CN114970494A CN 114970494 A CN114970494 A CN 114970494A CN 202110211022 A CN202110211022 A CN 202110211022A CN 114970494 A CN114970494 A CN 114970494A
- Authority
- CN
- China
- Prior art keywords
- comment
- target
- description
- information
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 230000011218 segmentation Effects 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 31
- 230000001960 triggered effect Effects 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 94
- 239000013598 vector Substances 0.000 claims description 43
- 238000000605 extraction Methods 0.000 claims description 10
- 230000006399 behavior Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 4
- 239000003550 marker Substances 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 19
- 238000013473 artificial intelligence Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 13
- 230000003993 interaction Effects 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及计算机技术领域,尤其涉及一种评论生成方法、装置、电子设备和存储介质,用以提高评论生成效率和准确性。其中,方法包括:响应于目标对象针对目标多媒体内容触发的评论请求,对目标多媒体内容的第一描述信息进行分词处理,获得第一描述信息中的各个分词;以及基于目标对象的第二描述信息以及预设的候选对象描述特征集合,获得针对目标对象的目标描述特征;基于目标描述特征以及各个分词,预测目标对象针对目标多媒体内容待发布的评论信息。本申请在生成评论时同时学习对象的个性化表示,待为用户提供自动化评论功能时,同时使用目标多媒体内容与对象的个性化描述信息,快速准确的生成评论,提升自动评论对当前对象的个性化需求。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种评论生成方法、装置、电子设备和存储介质。
背景技术
随着互联网技术的飞速发展,各种社交应用平台也应运而生,具体包括各种即时通信应用、内容分享平台等,现有的这些社交应用平台都有社交功能,用户可以在社交应用平台上发表文章、视频、图片等多媒体内容,平台联系人之间可以互相转发、点赞、评论,对发表的内容进行互动讨论,发布评论。
以视频评论为例,在相关技术中为用户生成视频评论时,一般通过相似视频的评论搬运,或者基于视频内容进行评论生成实现,生成的评论对所有用户基本一样,导致生成的评论不够准确,使得评论的采纳率不高。
发明内容
本申请实施例提供一种评论生成方法、装置、电子设备和存储介质,用以提高评论生成效率和准确性。
本申请实施例提供的一种评论生成方法,包括:
响应于目标对象针对目标多媒体内容触发的评论请求,对所述目标多媒体内容的第一描述信息进行分词处理,获得所述第一描述信息中的各个分词;以及
基于所述目标对象的第二描述信息以及预设的候选对象描述特征集合,获得针对所述目标对象的目标描述特征;
基于所述目标描述特征以及所述各个分词,预测所述目标对象针对所述目标多媒体内容待发布的评论信息。
本申请实施例提供的一种评论生成装置,包括:
分词处理单元,用于响应于目标对象针对目标多媒体内容触发的评论请求,对所述目标多媒体内容的第一描述信息进行分词处理,获得所述第一描述信息中的各个分词;以及
特征提取单元,用于基于所述目标对象的第二描述信息以及预设的候选对象描述特征集合,获得针对所述目标对象的目标描述特征;
预测单元,用于基于所述目标描述特征以及所述各个分词,预测所述目标对象针对所述目标多媒体内容待发布的评论信息。
可选的,所述分词处理单元具体用于:
将所述目标多媒体内容的第一描述信息,输入已训练的评论生成模型;
基于所述已训练的评论生成模型中的编码部分对所述第一描述信息进行分词和编码处理,获得所述第一描述信息中的各个分词,以及所述各个分词的词向量。
可选的,所述预测单元具体用于:
将所述各个分词的词向量以及所述目标描述特征,输入所述已训练的评论生成模型中的解码部分,基于所述解码部分进行解码处理,获取所述已训练的评论生成模型输出的所述评论信息;
其中,所述已训练的评论生成模型是基于训练样本数据集训练得到的,所述训练样本数据集中的每个训练样本包括样本对象的对象画像,样本多媒体内容的描述信息,以及所述样本对象针对所述样本多媒体内容所发布的真实评论。
可选的,若所述评论信息包括多个评论词,所述预测单元具体用于:
采用循环迭代方式,依次生成所述评论信息中的各个评论词;其中,在一次循环迭代过程中,执行以下操作:
将上一次输出的评论词输入所述解码部分,其中,第一次输入所述解码部分的为预先设置的起始标志词;
基于所述上一次输出的评论词,所述各个分词的词向量,以及所述目标描述特征进行解码处理,生成本次输出的评论词。
可选的,所述装置还包括:
模型训练单元,用于是通过下列方式训练得到所述已训练的评论生成模型:
从所述训练样本数据集中选取训练样本;
根据所述训练样本对未训练的评论生成模型进行循环迭代训练,以获得所述已训练的评论生成模型,其中,每一次训练迭代训练包括以下操作:
将所述训练样本中样本对象的对象画像,以及样本多媒体内容的描述信息输入未训练的评论生成模型,获取所述未训练的评论生成模型输出的预测评论;
基于所述预测评论与相应的训练样本中的真实评论之间的误差,对所述未训练的评论生成模型进行参数调整。
可选的,所述模型训练单元具体用于:
从所述训练样本数据集中选取包含的样本对象的评论次数达到第三预设阈值的训练样本,或者,选取包含的样本多媒体内容的被评论次数达到第四预设阈值的训练样本。
本申请实施例提供的一种电子设备,包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行上述任意一种评论生成方法的步骤。
本申请实施例提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任意一种评论生成方法的步骤。
本申请实施例提供一种计算机可读存储介质,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使所述电子设备执行上述任意一种评论生成方法的步骤。
本申请有益效果如下:
本申请实施例提供了一种评论生成方法、装置、电子设备和存储介质,由于本申请在生成评论时同时学习对象的个性化表示,待为用户提供自动化评论功能时,同时使用目标多媒体内容与对象的个性化描述信息,快速准确的生成评论,提升自动评论对当前对象的个性化需求,进一步提升自动评论的对象采纳率,增强自动评论功能对对象互动的辅助效果。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中的一种应用场景的一个可选的示意图;
图2为本申请实施例中的一种评论生成方法的流程示意图;
图3为本申请实施例中的一种用户个性化自动评论生成方法流程图;
图4为本申请实施例中的一种用户个性化评论生成模型的构建流程图;
图5为本申请实施例中的一种评论生成模型的结构示意图;
图6为本申请实施例中的一个可选的评论生成模型的训练方法的流程示意图;
图7为本申请实施例中的一种针对评论量较少的用户的用户向量获取方法;
图8为本申请实施例中的一种评论生成装置的组成结构示意图;
图9为应用本申请实施例中的一种电子设备的组成结构示意图;
图10为应用本申请实施例的另一种电子设备的组成结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请技术方案保护的范围。
下面对本申请实施例中涉及的部分概念进行介绍。
多媒体内容:组合两种或两种以上媒体的一种人机交互式信息交流和传播媒体。媒体包括文字、图片、声音、影片等。在本申请实施例中,多媒体内容可以是文章、资讯、视频、音乐等内容。
描述信息:在本申请实施例中,描述信息分为多媒体内容的描述信息和对象的描述信息,其中,多媒体内容的描述信息主要是用于描述多媒体内容属性的,以多媒体内容为视频为例,视频的描述信息主要是指视频文本内容,包括标题文本、基于自动语音识别(Automatic Speech Recognition,ASR)识别的对白文本、基于光学字符识别(OpticalCharacter Recognition,OCR)识别的字幕文本等。对象的描述信息包括对象的对象画像和对象的对象标识中的一种或多种,其中对象主要是指用于,对象画像可以是用户画像。在本申请实施例中,第一描述信息和第二描述信息都是指描述信息,第一和第二是为了进行区分而限定的,具体的,第一描述信息即多媒体内容的描述信息,第二描述信息即对象的描述信息。
候选对象描述特征集合:为本申请实施例中预先构建的一个特征集合,该特征集合包含很多候选对象的描述特征,该描述特征还可以是深度向量表示的形式,可以基于机器学习得到。其中,候选对象是指样本对象。
用户画像:又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,主要包括用户的年龄、性别、职业、行为偏好等基础信息。用户画像在各领域得到了广泛的应用。在实际操作的过程中通常会以最为浅显和贴近生活的话语将用户的属性、行为与期待联结起来。作为实际用户的虚拟代表,用户画像所形成的用户角色是根据用户一段时间内的多媒体操作数据以及喜好构造的,形成的用户角色需要有代表性能代表产品的主要受众和目标群体。在本申请实施例中,候选对象和目标对象的用户画像都可以表示为信息标签权重集合,其中信息标签主要是用于描述用户的兴趣爱好的,也可称作兴趣标签。该集合包含至少一个兴趣标签,以及各个兴趣标签对应的权重。
人工智能(Artificial intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请的实施例提供的方案涉及人工智能、自然语言处理和机器学习等技术。在本申请实施例中提出的训练评论生成模型的方法可分为两部分,包括训练部分和应用部分;其中,训练部分就涉及到机器学习这一技术领域,在训练部分中,通过机器学习这一技术训练评论生成模型,使得本申请实施例中给出的包含样本对象和样本多媒体内容的训练样本来训练评论生成模型,训练样本通过评论生成模型后,获取评论生成模型输出的预测评论,结合训练样本标注的真实评论,通过优化算法不断调整模型参数;应用部分用于使用在训练部分训练得到的评论生成模型来对生成目标对象针对目标多媒体内容待发布的评论。另外,还需要说明的是,本申请实施例中评论生成模型可以是在线训练也可以是离线训练,在此不做具体限定。
下面对本申请实施例的设计思想进行简要介绍:
随着信息技术和互联网的飞速发展,在线资讯、影音、短视频、电子书籍、网络文章以及论坛帖子等允许读者或观众发表评论的多媒体内容越来越受到人们的欢迎,成为人们日常生活中获取信息的一种主要的途径。人们可以通过一些主要的网络门户网站或大型的新闻网站或短视频应用程序(Application,APP)等,获取和浏览各种以图片、文字或视频形式呈现的多媒体内容。
以多媒体内容为视频为例,在相关技术中为用户生成视频评论时,一般通过相似视频的评论搬运,或者基于视频内容进行评论生成实现,生成的评论对所有用户基本一样,导致生成的评论不够准确,使得评论的采纳率不高。
有鉴于此,本申请实施例提出了一种评论生成方法、装置、电子设备和存储介质,由于本申请在生成评论时同时学习用户的个性化表示,待为用户提供自动化评论功能时,同时使用目标多媒体内容与用户的个性化描述信息,快速准确的生成评论,提升自动评论对当前用户的个性化需求,进一步提升自动评论的用户采纳率,增强自动评论功能对用户互动的辅助效果。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请中的实施例及实施例中的描述特征可以相互组合。
如图1所示,其为本申请实施例的应用场景示意图。该应用场景图中包括两个终端设备110和一个服务器120。终端设备110上设有客户端,可通过终端设备110登录客户端。本申请实施例涉及的客户端可以是软件,也可以是网页、小程序等,服务器120则是与软件或是网页、小程序等相对应的后台服务器,不限制客户端的具体类型。
需要说明的是,图1所示只是举例说明,实际上终端设备和服务器的数量不受限制,在本申请实施例中不做具体限定。
其中,终端设备110与服务器120之间可以通过通信网络进行通信。在一种可选的实施方式中,通信网络是有线网络或无线网络。终端设备110以及服务器120可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
在本申请实施例中,终端设备110为用户使用的电子设备,该电子设备可以是个人计算机、手机、平板电脑、笔记本、电子书阅读器、智能电视、智能家居等具有一定计算能力并且运行有即时通讯类软件及网站或者社交类软件及网站的计算机设备。服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
其中,评论生成模型可部署于服务器120上进行训练,服务器120中可存储有大量训练样本,用于训练评论生成模型。可选的,在基于本申请实施例中的训练方法训练得到评论生成模型之后,可直接将训练好的评论生成模型部署于服务器120或终端设备110上。在本申请实施例中,可以将评论生成模型部署于服务器120上,在本申请实施例中,评论生成模型主要用于在目标对象意图对目标多媒体内容进行评论时,自动生成针对目标对象的个性化评论。
在一种可能的应用场景中,本申请中的训练样本可以采用云存储技术进行存储。云存储(cloudstorage)是在云计算概念上延伸和发展出来的一个新的概念,分布式云存储***(以下简称存储***)是指通过集群应用、网格技术以及分布存储文件***等功能,将网络中大量各种不同类型的存储设备(存储设备也称之为存储节点)通过应用软件或应用接口集合起来协同工作,共同对外提供数据存储和业务访问功能的一个存储***。
在一种可能的应用场景中,为了便于降低通信时延,可以在各个地区部署服务器120,或为了负载均衡,可以由不同的服务器120分别去服务各个终端备10对应的地区。多个服务器120以通过区块链实现数据的共享,多个服务器120相当于多个服务器120组成的数据共享***。例如终端设备110位于地点a,与服务器120之间进行通信连接,终端设备110位于地点b,与其他服务器120之间通信连接。
对于数据共享***中的每个服务器120,均具有与该服务器120对应的节点标识,数据共享***中的每个服务器120均可以存储有数据共享***中其他服务器120的节点标识,以便后续根据其他服务器120的节点标识,将生成的区块广播至数据共享***中的其他服务器120。每个服务器120中可维护一个如下表所示的节点标识列表,将服务器120名称和节点标识对应存储至该节点标识列表中。其中,节点标识可为IP(InternetProtocol,网络之间互联的协议)地址以及其他任一种能够用于标识该节点的信息,表1中仅以IP地址为例进行说明。
表1
服务器名称 | 节点标识 |
节点1 | 119.115.151.174 |
节点2 | 118.116.189.145 |
… | … |
节点N | 119.124.789.258 |
下面结合上述描述的应用场景,参考附图来描述本申请示例性实施方式提供的评论生成方法,需要注意的是,上述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。
需要说明的是,本申请实施例中的评论生成方法可以由服务器或终端设备单独执行,也可以由服务器和终端设备共同执行。
参阅图2所示,为本申请实施例提供的一种评论生成方法的实施流程图,这里是以由终端设备执行为例来说明的。该方法的具体实施流程如下:
S21:终端设备响应于目标对象针对目标多媒体内容触发的评论请求,对目标多媒体内容的第一描述信息进行分词处理,获得第一描述信息中的各个分词;以及
S22:终端设备基于目标对象的第二描述信息以及预设的候选对象描述特征集合,获得针对目标对象的目标描述特征;
其中,多媒体内容指在线资讯、影音、短视频、电子书籍、网络文章以及论坛帖子等允许读者或观众发表评论的网络内容。在本申请实施例中主要是以视频为例进行详细介绍的。
在本申请实施例中,当目标对象意图对目标多媒体内容进行评论时,即可触发评论请求,例如:用户在观看视频过程中,点击发弹幕的控件,或者是用户在观看短视频时,点击评论控件等等,此时即可基于本申请实施例中的评论自动生成方法,来生成目标对象针对目标多媒体内容的个性化评论。通过自动评论生成,提升目标对象输入评论速度,降低目标对象输入评论成本,提升目标对象互动效率与体验。
具体的,首选需要对目标对象进行特征提取,对目标多媒体内容进行分词。进一步地,通过步骤S23来生成评论。
S23:终端设备基于目标描述特征以及各个分词,预测目标对象针对目标多媒体内容待发布的评论信息。
由于本申请实施例在生成评论时同时学习用户的个性化表示,待为用户提供自动化评论功能时,同时使用目标多媒体内容与用户的个性化描述信息,快速准确的生成评论,提升自动评论对当前用户的个性化需求,进一步提升自动评论的用户采纳率,增强自动评论功能对用户互动的辅助效果。
需要说明的是,在本申请实施例中,需要预先构建候选对象描述特征集合,该特征集合包含很多候选对象的描述特征,该描述特征还可以是深度向量表示的形式,可以基于机器学习得到。其中,候选对象是指样本对象。
在一种可选的实施方式中,本申请实施例中的候选对象都是发布评论的次数达到一定阈值的,即高频评论对象。
在一种可选的实施方式中,在执行步骤S22时,具体可分为以下两种情况:
情况一、目标对象为候选对象之一。
该情况下,目标对象的第二描述信息包含目标对象的对象标识,即用户ID,此时即可基于用户ID,从候选对象描述特征集合查询该ID对应的描述特征,即为目标对象的目标描述特征。
情况二、目标对象不为候选对象之一。
在目标对象发表评论次数较少或未发表过评论时,对应的评论次数会小于设定的阈值,即该目标对象为低频评论对象,此时可从预设的候选对象描述特征集合中筛选出一些相似对象,基于这些相似对象的描述特征来对进一步确定该目标对象的目标描述特征。
具体的,在查找相似对象时,主要是基于第二描述信息中的对象画像,确定各个候选对象与目标对象之间的相似度,进而基于相似度筛选的。最终,从候选对象描述特征集合中获得相似度达到第一预设阈值的至少一个候选对象的描述特征,并基于获得的至少一个候选对象的描述特征,确定目标对象的目标描述特征。
在本申请实施例中,考虑到查询到的相似度达到第一预设阈值的候选对象的数量不确定,在基于获得的至少一个候选对象的描述特征,确定目标对象的目标描述特征时,也可划分为以下两种方式:
方式一、若查询到的至少一个候选对象未达到设定数量,则将对应的相似度作为权重,对查询到的至少一个候选对象的描述特征进行加权求和,得到目标描述特征。
例如,设定数量为5,假设查询到的候选对象有4个,对应的描述特征的向量分别为D1,D2,D3和D4,对应的权重即候选对象与目标对象之间的相似度,假设分别为s1,s2,s3,s4。则,目标对象的目标描述特征D=s1·D1+s2·D2+s3·D3+s4·D4。
方式二、若查询到的至少一个候选对象达到设定数量,则根据对应的相似度,筛选出符合设定数量的候选对象,以及将对应的相似度作为权重,对筛选出的各个候选对象的描述特征进行加权求和,获得目标描述特征。
例如,设定数量为5,假设查询到的候选对象有8个,此时即可按照相似度排序,选取相似度前5的候选对象,假设对应的描述特征的向量分别为D1,D2,D3,D4和D5,对应的权重即候选对象与目标对象之间的相似度,假设分别为s1,s2,s3,s4和s5,则目标对象的目标描述特征D=s1·D1+s2·D2+s3·D3+s4·D4+s5·D5。
在本申请实施例中,高频评论用户直接基于用户ID即可查询到用户向量表示,低频评论用户需要找到相似的高频评论用户,进而基于相似的高频用户表示来计算得到此低频用户的向量表示。
需要说明的是,本申请实施例中的候选对象描述特征集合也称用户个性化向量表,该表只存储了高频用户向量表示,在为评论低频用户查询高频相似用户时,通过与高频用户比对画像相似度,将相似度满足一定阈值至少一个用户的向量加权求和作为当前低频用户的向量表示。通过使用视频内容与用户个性化表示同时用于生成评论,使得自动生成的评论更加符合当前用户的个性化需求,达到为用户定制自动评论的效果。
在一种可选的实施方式中,基于目标对象与候选对象之间的对象画像的相似程度,来获得两个对象的相似度。其中,对象画像包括至少一个信息标签,以及至少一个信息标签对应的标签权重,信息标签是根据对象历史行为分析得到的,可以用来表示对象的兴趣,因此也可称作兴趣标签。
例如,用户A的用户画像为{(刘某某,0.231),(搞笑段子,0.226),…,(烘焙,0.097)},其中数值为用户对此兴趣标签的偏好权重,用户画像通过在用户的历史播放行为上迭代学习构建。
在本申请实施例中,两个用户的相似度为这两个用户的兴趣标签重合度权重和。具体的,对于任意一个候选对象,首先需要获取该候选对象的对象画像,进一步地,分别将目标对象的对象画像中的各个兴趣标签,与该候选对象的对象画像中的各个兴趣标签进行比对,确定两两兴趣标签之间的重合度;进而将兴趣标签的重合度与对应的权重的乘积之和,作为目标对象与该候选对象之间的相似度。
其中,每两个兴趣标签之间的文本相似度可以作为这两个兴趣标签的重合度,每两个兴趣标签对应的权重是根据每两个兴趣标签中的各个兴趣标签的标签权重确定的。例如,目标对象中的兴趣标签A与候选对象中的兴趣标签B之间的重合度为0.8(重合度的取值范围可以是0~1),兴趣标签A对应的标签权重为a,兴趣标签B对应的标签权重为b,则这两个兴趣标签的重合度对应的权重为(a+b)/2,最终,这两个兴趣标签的重合度与对应的权重的乘积x1=1*(a+b)/2=(a+b)/2。
假设xi表示两个兴趣标签的重合度与对应的权重的乘积(i=1,2,…,6),目标对象与该候选对象之间的相似度即为每两个兴趣标签的重合度与对应的权重的乘积之和,即x1+x2+…+x6。
当然,为了提高计算速度,还可直接比较两个兴趣标签是否完全一致,若完全一致,则对应的重合度为1,否则,则为0,实际上计算方式有很多中,在此不做具体限定。
在上述实施方式中,通过用户画像相似度计算得到计算用户之间的相似性,用户画像为用户的兴趣标签权重集合。
需要说明的是,本申请实施例中的评论生成方法还可基于机器学习来实现,具体的,通过将目标多媒体内容的第一描述信息,输入已训练的评论生成模型;基于已训练的评论生成模型中的编码部分对第一描述信息进行分词和编码处理,获得第一描述信息中的各个分词,以及各个分词的词向量;进而将各个分词的词向量以及目标描述特征,输入已训练的评论生成模型中的解码部分,基于解码部分进行解码处理,获取已训练的评论生成模型输出的评论信息。
其中,本申请实施例中的已训练的评论生成模型是基于训练样本数据集训练得到的,训练样本数据集中的每个训练样本包括样本对象的对象画像,样本多媒体内容的描述信息,以及样本对象针对样本多媒体内容所发布的真实评论。
以多媒体内容为视频为例,参阅图3所示,其为本申请实施例中的一种用户个性化自动评论生成方法流程图。在本申请实施例中,基于视频库和用户评论库来训练生成用户个性化评论生成模型,其中,视频库中存储的是样本多媒体内容及描述信息,用户评论库中存储的是样本对象针对样本多媒体内容所发布的真实评论,和样本多媒体内容的描述信息。另外,通过模型训练还可导出用户向量,构建用户向量库,即本申请实施例中所列举的候选对象描述特征集合。
在用户意图对视频进行评论时,例如用户在客户端点击评论按钮进行评论时,即可基于用户画像获取用户向量,进而基于视频内容与用户向量生成用户个性化评论。其中,用户画像存储在用户画像库中,可基于用户ID从用户画像库中查询相应的画像信息。
在本申请实施例中,基于当前视频内容与用户信息自动生成符合用户个性化的评论,提升用户直接使用自动评论进行交互,提升评论互动体验。
参阅图4所示,其为本申请实施例中的一种用户个性化评论生成模型的构建流程图,基于平台大量的用户视频评论数据,构建用户个性化评论自动生成模型,并将训练好的用户深度表示导出用户向量表示库,为后期基于用户个性化特征生成视频评论使用。具体过程为,将视频库中的视频的描述信息,以及用户评论库中用户的描述信息输入评论生成模型,获取该模型输出的该用户针对该视频的评论,并将获取到的评论与用户评论库中对应的该用户对该视频的真实评论进行对比,对模型参数进行调整,不断迭代训练得到训练好的评论生成模型。
下面对本申请实施例中的评论生成模型进行详细介绍:
参阅图5所示,其为本申请实施例中的一种评论生成模型的结构示意图。该模型是基于Transformer Encoder-Decoder(变换器编码-解码)模型构建自动评论生成模型,具体包括两部分:编码部分和解码部分。
在本申请实施例中,用户个性化评论生成模型训练数据如下所示,为了使用户个性化评论自动生成模型与用户向量表示学习的更加充分,选取评论量大于UC(即第三预设阈值)的用户、评论量大于VC(即第四预设阈值)的视频,训练数据中只保留这部分用户与视频的评论。生成的用户向量表中也只有高频评论用户部分。例如选取发布超1000条评论的用户,选取被评论超1500条的视频。其中,第三预设阈值与第四预设阈值可以相同,也可以不同,在此不做具体限定。
其中,针对同一个视频文本而言,可以由不同的用户发表不同的评论,针对不同的视频文本而言,也可以由同一个用户发表不同的评论。因而,训练样本的数据结构可以是:视频1文本内容,用户ID1,用户评论1;视频1文本内容,用户ID2,用户评论2;视频2文本内容,用户ID1,用户评论3;视频2文本内容,用户ID3,用户评论4;视频2文本内容,用户ID4,用户评论5;…;视频v文本内容,用户IDu,用户评论c。
其中,每一条训练样本都包括视频的描述信息,用户的描述信息,以及该用户对该视频发布的一条真实评论。视频文本内容标识视频的描述信息,用户ID表示用户的描述信息,另外用户的描述信息还可进一步包含用户的画像信息,或者直接根据用户ID从用户画像库中查询。
在本申请实施例中,用户个性化自动评论生成模型的Encoder部分输入特征为视频文本内容,包括标题文本、基于ASR识别的对白文本、基于OCR识别的字幕文本。考虑到对白文本与字幕文本可能较长,因而可通过提取关键词保留关键信息。视频文本内容通过分词、ID化查询向量转换为词向量表示,例如图5所示的词1,词2,…,词n。之后,经过Transformer Encoder(编码)部分构建视频文本深度表示,即图5所示的词1表示,词2表示,…,词n表示。
在一种可选的实施方式中,若最终模型要输出的评论信息包括多个评论词,则在基于解码部分对各个分词的词向量(即图5所示的词1表示,词2表示…)以及目标描述特征(即图5中的用户表示)进行解码处理,获取已训练的评论生成模型输出的评论信息时,需要采用循环迭代方式,依次生成评论信息中的各个评论词。其中,在每一次循环迭代过程中,都执行以下操作:
首先,需要将上一次输出的评论词再重新输入解码部分,进而基于上一次输出的评论词,各个分词的词向量,以及目标描述特征进行解码处理,生成本次输出的评论词。
其中,第一次输入解码部分的为预先设置的起始标志词,例如图5所示,在生成评论词1时,对应输入的起始标志词为<S>,之后,在生成评论词2时,对应输入评论词1,…,在生成评论词n时,对应输入评论词n-1。
也就是说,在模型Decoder(解码)部分在生成每个评论词时,都会以上一步生成的评论词为输入,并且将当前用户向量与各个分词的词向量同时作为模型输入特征,通过当前用户ID查询用户向量表示,在具体生成词的时候基于拷贝机制,计算从原始视频文本中拷贝词汇还是从词表选择词汇生成。
在训练阶段,通过比对生成的评论词与训练样本中的真实评论的差异计算损失,通过误差反向传播更新模型参数与用户向量表示。通过这样实现使得模型生成的评论既能符合当前视频内容,且满足用户个性化需求。
参阅图6所示,其为本申请实施例中的一种评论生成模型的训练方法的流程示意图,该方法可以由服务器或终端设备单独执行,也可以由服务器和终端设备共同执行,这里是以该方法由服务器执行为例来说明的。该方法的具体实施流程如下:
步骤S601:服务器从训练样本数据集中选取训练样本;
步骤S602:服务器将训练样本中样本对象的对象画像,以及样本多媒体内容的描述信息输入未训练的评论生成模型;
步骤S603:服务器获取未训练的评论生成模型输出的预测评论;
步骤S604:服务器基于预测评论与相应的训练样本中的真实评论之间的误差,对未训练的评论生成模型进行参数调整;
步骤S605:服务器判断进行参数调整后的评论生成模型是否收敛,如果是,则执行步骤S606,否则,返回步骤S601;
步骤S606:服务器将本次进行参数调整后得到的评论生成模型作为已训练的评论生成模型。
其中,在步骤S601中,从训练样本数据集中选取训练样本时,具体是选取包含的样本对象的评论次数达到第三预设阈值的训练样本,或者,选取包含的样本多媒体内容的被评论次数达到第四预设阈值的训练样本。另外,也可在构建训练样本数据集时,只选取符合上述条件的训练样本来构建数据集,这样在从训练样本数据集中选取时即可随机选取,不需要参考上述条件。
在使用上述构建的基于用户与视频的个性化评论生成模型为用户构建个性化评论时,首先获取的视频文本内容,依据模型Encoder格式要求输入模型构建视频文本的深度表示,模型Decoder部分基于当前用户向量与上一步生成的词汇逐步生成个性化自动评论。
参阅图7所示,其为本申请实施例中所列举的一种针对评论量较少的用户的用户向量获取方法。在为评论低频用户查询高频相似用户时,通过与高频用户比对画像相似度,将相似度满足一定阈值的top k个用户的向量加权求和作为当前低频用户的向量表示。通过使用视频内容与用户个性化表示同时用于生成评论,使得自动生成的评论更加符合当前用户的个性化需求,达到为用户定制自动评论的效果。
综上所述,本申请提出了一种用户个性化自动评论生成方法,在为用户生成自动评论时,引入用户深度向量描述,学习用户的个性化描述,待为用户提供自动化评论功能时,同时使用视频内容与用户个性化信息,提升自动评论对当前用户的个性化需求,进一步提升自动评论的用户采纳率,增强自动评论功能对用户互动的辅助效果,提升用户的视频互动效率。
基于相同的发明构思,本申请实施例还提供一种评论生成装置。如图8所示,其为本申请实施例提出的一种评论生成装置800的结构示意图,可以包括:
分词处理单元801,用于响应于目标对象针对目标多媒体内容触发的评论请求,对目标多媒体内容的第一描述信息进行分词处理,获得第一描述信息中的各个分词;以及
特征提取单元802,用于基于目标对象的第二描述信息以及预设的候选对象描述特征集合,获得针对目标对象的目标描述特征;
预测单元803,用于基于目标描述特征以及各个分词,预测目标对象针对目标多媒体内容待发布的评论信息。
可选的,特征提取单元802具体用于:
若目标对象为候选对象之一,则基于第二描述信息中的对象标识,从候选对象描述特征集合中查询对应的目标描述特征;
若目标对象不为候选对象之一,则基于第二描述信息中的对象画像,确定各个候选对象与目标对象之间的相似度;从候选对象描述特征集合中获得相似度达到第一预设阈值的至少一个候选对象的描述特征;基于获得的至少一个候选对象的描述特征,确定目标对象的目标描述特征;
其中,候选对象为评论次数达到第二预设阈值的对象。
可选的,特征提取单元802具体用于:
若查询到的至少一个候选对象未达到设定数量,则将对应的相似度作为权重,对查询到的至少一个候选对象的描述特征进行加权求和,得到目标描述特征;
若查询到的至少一个候选对象达到设定数量,则根据对应的相似度,筛选出符合设定数量的候选对象,以及将对应的相似度作为权重,对筛选出的各个候选对象的描述特征进行加权求和,获得目标描述特征。
可选的,特征提取单元802具体用于:
对于任意一个候选对象,获取任意一个候选对象的对象画像,其中,对象画像包括至少一个信息标签,以及至少一个信息标签对应的标签权重,信息标签是根据对象历史行为分析得到的;
分别将目标对象的对象画像中的各个信息标签,与任意一个候选对象的对象画像中的至少一个信息标签进行比对,确定每两个信息标签之间的重合度;
将每两个信息标签之间的重合度与对应的权重的乘积之和,作为目标对象与任意一个候选对象之间的相似度,其中,每两个信息标签对应的权重是根据每两个信息标签中的各个信息标签的标签权重确定的。
可选的,分词处理单元801具体用于:
将目标多媒体内容的第一描述信息,输入已训练的评论生成模型;
基于已训练的评论生成模型中的编码部分对第一描述信息进行分词和编码处理,获得第一描述信息中的各个分词,以及各个分词的词向量。
可选的,预测单元803具体用于:
将各个分词的词向量以及目标描述特征,输入已训练的评论生成模型中的解码部分,基于解码部分进行解码处理,获取已训练的评论生成模型输出的评论信息;
其中,已训练的评论生成模型是基于训练样本数据集训练得到的,训练样本数据集中的每个训练样本包括样本对象的对象画像,样本多媒体内容的描述信息,以及样本对象针对样本多媒体内容所发布的真实评论。
可选的,若评论信息包括多个评论词,预测单元803具体用于:
采用循环迭代方式,依次生成评论信息中的各个评论词;其中,在一次循环迭代过程中,执行以下操作:
将上一次输出的评论词输入解码部分,其中,第一次输入解码部分的为预先设置的起始标志词;
基于上一次输出的评论词,各个分词的词向量,以及目标描述特征进行解码处理,生成本次输出的评论词。
可选的,装置还包括:
模型训练单元804,用于是通过下列方式训练得到已训练的评论生成模型:
从训练样本数据集中选取训练样本;
根据训练样本对未训练的评论生成模型进行循环迭代训练,以获得已训练的评论生成模型,其中,每一次训练迭代训练包括以下操作:
将训练样本中样本对象的对象画像,以及样本多媒体内容的描述信息输入未训练的评论生成模型,获取未训练的评论生成模型输出的预测评论;
基于预测评论与相应的训练样本中的真实评论之间的误差,对未训练的评论生成模型进行参数调整。
可选的,模型训练单元804具体用于:
从训练样本数据集中选取包含的样本对象的评论次数达到第三预设阈值的训练样本,或者,选取包含的样本多媒体内容的被评论次数达到第四预设阈值的训练样本。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
在介绍了本申请示例性实施方式的评论生成方法和装置之后,接下来,介绍根据本申请的另一示例性实施方式的电子设备。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为***、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“***”。
与上述方法实施例基于同一发明构思,本申请实施例中还提供了一种电子设备。该电子设备可以用于生成用户评论。在一种实施例中,该电子设备可以是服务器,如图1所示的服务器120。在该实施例中,电子设备的结构可以如图9所示,包括存储器901,通讯模块903以及一个或多个处理器902。
存储器901,用于存储处理器902执行的计算机程序。存储器901可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。
存储器901可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器901也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);或者存储器901是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器901可以是上述存储器的组合。
处理器902,可以包括一个或多个中央处理单元(central processing unit,CPU)或者为数字处理单元等等。处理器902,用于调用存储器901中存储的计算机程序时实现上述评论生成方法。
通讯模块903用于与终端设备和其他服务器进行通信。
本申请实施例中不限定上述存储器901、通讯模块903和处理器902之间的具体连接介质。本申请实施例在图9中以存储器901和处理器902之间通过总线904连接,总线904在图9中以粗线描述,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线904可以分为地址总线、数据总线、控制总线等。为便于描述,图9中仅用一条粗线描述,但并不描述仅有一根总线或一种类型的总线。
存储器901中存储有计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于实现本申请实施例的评论生成方法。处理器902用于执行上述的评论生成方法,如图2所示。
在另一种实施例中,电子设备也可以是其他电子设备,如图1所示的终端设备110。在该实施例中,电子设备的结构可以如图10所示,包括:通信组件1010、存储器1020、显示单元1030、摄像头1040、传感器1050、音频电路1060、蓝牙模块1070、处理器1080等部件。
通信组件1010用于与服务器进行通信。在一些实施例中,可以包括电路无线保真(Wireless Fidelity,WiFi)模块,WiFi模块属于短距离无线传输技术,电子设备通过WiFi模块可以帮助用户收发信息。
存储器1020可用于存储软件程序及数据。处理器1080通过运行存储在存储器1020的软件程序或数据,从而执行终端设备110的各种功能以及数据处理。存储器1020可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器1020存储有使得终端设备110能运行的操作***。本申请中存储器1020可以存储操作***及各种应用程序,还可以存储执行本申请实施例评论生成方法的代码。
显示单元1030还可用于显示由用户输入的信息或提供给用户的信息以及终端设备110的各种菜单的图形用户界面(graphical user interface,GUI)。具体地,显示单元1030可以包括设置在终端设备110正面的显示屏1032。其中,显示屏1032可以采用液晶显示器、发光二极管等形式来配置。显示单元1030可以用于显示本申请实施例中的多媒体内容播放画面。
显示单元1030还可用于接收输入的数字或字符信息,产生与终端设备110的用户设置以及功能控制有关的信号输入,具体地,显示单元1030可以包括设置在终端设备110正面的触摸屏1031,可收集用户在其上或附近的触摸操作,例如点击按钮,拖动滚动框等。
其中,触摸屏1031可以覆盖在显示屏1032之上,也可以将触摸屏1031与显示屏1032集成而实现终端设备110的输入和输出功能,集成后可以简称触摸显示屏。本申请中显示单元1030可以显示应用程序以及对应的操作步骤。
摄像头1040可用于捕获静态图像,用户可以将摄像头1040拍摄的图像通过应用发布评论。摄像头1040可以是一个,也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给处理器1080转换成数字图像信号。
终端设备还可以包括至少一种传感器1050,比如加速度传感器1051、距离传感器1052、指纹传感器1053、温度传感器1054。终端设备还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。
音频电路1060、扬声器1061、麦克风1062可提供用户与终端设备110之间的音频接口。音频电路1060可将接收到的音频数据转换后的电信号,传输到扬声器1061,由扬声器1061转换为声音信号输出。终端设备110还可配置音量按钮,用于调节声音信号的音量。另一方面,麦克风1062将收集的声音信号转换为电信号,由音频电路1060接收后转换为音频数据,再将音频数据输出至通信组件1010以发送给比如另一终端设备110,或者将音频数据输出至存储器1020以便进一步处理。
蓝牙模块1070用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如,终端设备可以通过蓝牙模块1070与同样具备蓝牙模块的可穿戴电子设备(例如智能手表)建立蓝牙连接,从而进行数据交互。
处理器1080是终端设备的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器1020内的软件程序,以及调用存储在存储器1020内的数据,执行终端设备的各种功能和处理数据。在一些实施例中,处理器1080可包括一个或多个处理单元;处理器1080还可以集成应用处理器和基带处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,基带处理器主要处理无线通信。可以理解的是,上述基带处理器也可以不集成到处理器1080中。本申请中处理器1080可以运行操作***、应用程序、用户界面显示及触控响应,以及本申请实施例的评论生成方法。另外,处理器1080与显示单元1030耦接。
在一些可能的实施方式中,本申请提供的评论生成方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的评论生成方法中的步骤,例如,计算机设备可以执行如图2中所示的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算装置上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被命令执行***、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请实施例上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请实施例各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和更改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和更改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些更改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (15)
1.一种评论生成方法,其特征在于,该方法包括:
响应于目标对象针对目标多媒体内容触发的评论请求,对所述目标多媒体内容的第一描述信息进行分词处理,获得所述第一描述信息中的各个分词;以及
基于所述目标对象的第二描述信息以及预设的候选对象描述特征集合,获得针对所述目标对象的目标描述特征;
基于所述目标描述特征以及所述各个分词,预测所述目标对象针对所述目标多媒体内容待发布的评论信息。
2.如权利要求1所述的方法,其特征在于,所述基于所述目标对象的第二描述信息以及预设的候选对象描述特征集合,获得针对所述目标对象的目标描述特征,具体包括:
若所述目标对象为候选对象之一,则基于所述第二描述信息中的对象标识,从所述候选对象描述特征集合中查询对应的目标描述特征;
若所述目标对象不为候选对象之一,则基于所述第二描述信息中的对象画像,确定各个候选对象与所述目标对象之间的相似度;从所述候选对象描述特征集合中获得相似度达到第一预设阈值的至少一个候选对象的描述特征;基于获得的所述至少一个候选对象的描述特征,确定所述目标对象的目标描述特征;
其中,所述候选对象为评论次数达到第二预设阈值的对象。
3.如权利要求2所述的方法,其特征在于,所述基于获得的所述至少一个候选对象的描述特征,确定所述目标对象的目标描述特征,具体包括:
若查询到的所述至少一个候选对象未达到设定数量,则将对应的相似度作为权重,对查询到的所述至少一个候选对象的描述特征进行加权求和,得到所述目标描述特征;
若查询到的所述至少一个候选对象达到设定数量,则根据对应的相似度,筛选出符合所述设定数量的候选对象,以及将对应的相似度作为权重,对筛选出的各个候选对象的描述特征进行加权求和,获得所述目标描述特征。
4.如权利要求2或3所述的方法,其特征在于,所述基于所述第二描述信息中的对象画像,确定各个候选对象与所述目标对象之间的相似度,具体包括:
对于任意一个候选对象,获取所述任意一个候选对象的对象画像,其中,所述对象画像包括至少一个信息标签,以及所述至少一个信息标签对应的标签权重,所述信息标签是根据对象历史行为分析得到的;
分别将所述目标对象的对象画像中的各个信息标签,与所述任意一个候选对象的对象画像中的至少一个信息标签进行比对,确定每两个信息标签之间的重合度;
将所述每两个信息标签之间的重合度与对应的权重的乘积之和,作为所述目标对象与所述任意一个候选对象之间的相似度,其中,所述每两个信息标签对应的权重是根据所述每两个信息标签中的各个信息标签的标签权重确定的。
5.如权利要求1所述的方法,其特征在于,所述对所述目标多媒体内容的第一描述信息进行分词处理,获得所述第一描述信息中的各个分词,具体包括:
将所述目标多媒体内容的第一描述信息,输入已训练的评论生成模型;
基于所述已训练的评论生成模型中的编码部分对所述第一描述信息进行分词和编码处理,获得所述第一描述信息中的各个分词,以及所述各个分词的词向量。
6.如权利要求5所述的方法,其特征在于,所述基于所述目标描述特征以及所述各个分词,预测所述目标对象针对所述目标多媒体内容待发布的评论信息,具体包括:
将所述各个分词的词向量以及所述目标描述特征,输入所述已训练的评论生成模型中的解码部分,基于所述解码部分进行解码处理,获取所述已训练的评论生成模型输出的所述评论信息;
其中,所述已训练的评论生成模型是基于训练样本数据集训练得到的,所述训练样本数据集中的每个训练样本包括样本对象的对象画像,样本多媒体内容的描述信息,以及所述样本对象针对所述样本多媒体内容所发布的真实评论。
7.如权利要求6所述的方法,其特征在于,若所述评论信息包括多个评论词,所述将所述各个分词的词向量以及所述目标描述特征,输入所述已训练的评论生成模型中的解码部分,基于所述解码部分进行解码处理,获取所述已训练的评论生成模型输出的所述评论信息,具体包括:
采用循环迭代方式,依次生成所述评论信息中的各个评论词;其中,在一次循环迭代过程中,执行以下操作:
将上一次输出的评论词输入所述解码部分,其中,第一次输入所述解码部分的为预先设置的起始标志词;
基于所述上一次输出的评论词,所述各个分词的词向量,以及所述目标描述特征进行解码处理,生成本次输出的评论词。
8.如权利要求5~7任一项所述的方法,其特征在于,所述已训练的评论生成模型是通过下列方式训练得到的:
从所述训练样本数据集中选取训练样本;
根据所述训练样本对未训练的评论生成模型进行循环迭代训练,以获得所述已训练的评论生成模型,其中,每一次训练迭代训练包括以下操作:
将所述训练样本中样本对象的对象画像,以及样本多媒体内容的描述信息输入未训练的评论生成模型,获取所述未训练的评论生成模型输出的预测评论;
基于所述预测评论与相应的训练样本中的真实评论之间的误差,对所述未训练的评论生成模型进行参数调整。
9.如权利要求8所述的方法,其特征在于,所述从所述训练样本数据集中选取训练样本,具体包括:
从所述训练样本数据集中选取包含的样本对象的评论次数达到第三预设阈值的训练样本,或者,选取包含的样本多媒体内容的被评论次数达到第四预设阈值的训练样本。
10.一种评论生成装置,其特征在于,包括:
分词处理单元,用于响应于目标对象针对目标多媒体内容触发的评论请求,对所述目标多媒体内容的第一描述信息进行分词处理,获得所述第一描述信息中的各个分词;以及
特征提取单元,用于基于所述目标对象的第二描述信息以及预设的候选对象描述特征集合,获得针对所述目标对象的目标描述特征;
预测单元,用于基于所述目标描述特征以及所述各个分词,预测所述目标对象针对所述目标多媒体内容待发布的评论信息。
11.如权利要求10所述的装置,其特征在于,所述特征提取单元具体用于:
若所述目标对象为候选对象之一,则基于所述第二描述信息中的对象标识,从所述候选对象描述特征集合中查询对应的目标描述特征;
若所述目标对象不为候选对象之一,则基于所述第二描述信息中的对象画像,确定各个候选对象与所述目标对象之间的相似度;从所述候选对象描述特征集合中获得相似度达到第一预设阈值的至少一个候选对象的描述特征;基于获得的所述至少一个候选对象的描述特征,确定所述目标对象的目标描述特征;
其中,所述候选对象为评论次数达到第二预设阈值的对象。
12.如权利要求11所述的装置,其特征在于,所述特征提取单元具体用于:
若查询到的所述至少一个候选对象未达到设定数量,则将对应的相似度作为权重,对查询到的所述至少一个候选对象的描述特征进行加权求和,得到所述目标描述特征;
若查询到的所述至少一个候选对象达到设定数量,则根据对应的相似度,筛选出符合所述设定数量的候选对象,以及将对应的相似度作为权重,对筛选出的各个候选对象的描述特征进行加权求和,获得所述目标描述特征。
13.如权利要求11或12所述的装置,其特征在于,所述特征提取单元具体用于:
对于任意一个候选对象,获取所述任意一个候选对象的对象画像,其中,所述对象画像包括至少一个信息标签,以及所述至少一个信息标签对应的标签权重,所述信息标签是根据对象历史行为分析得到的;
分别将所述目标对象的对象画像中的各个信息标签,与所述任意一个候选对象的对象画像中的至少一个信息标签进行比对,确定每两个信息标签之间的重合度;
将所述每两个信息标签之间的重合度与对应的权重的乘积之和,作为所述目标对象与所述任意一个候选对象之间的相似度,其中,所述每两个信息标签对应的权重是根据所述每两个信息标签中的各个信息标签的标签权重确定的。
14.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行权利要求1~9中任一所述方法的步骤。
15.一种计算机可读存储介质,其特征在于,其包括程序代码,当所述程序代码在电子设备上运行时,所述程序代码用于使所述电子设备执行权利要求1~9中任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110211022.2A CN114970494A (zh) | 2021-02-25 | 2021-02-25 | 一种评论生成方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110211022.2A CN114970494A (zh) | 2021-02-25 | 2021-02-25 | 一种评论生成方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114970494A true CN114970494A (zh) | 2022-08-30 |
Family
ID=82973246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110211022.2A Pending CN114970494A (zh) | 2021-02-25 | 2021-02-25 | 一种评论生成方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114970494A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116320621A (zh) * | 2023-05-17 | 2023-06-23 | 苏州极易科技股份有限公司 | 一种基于nlp的流媒体内容分析方法及*** |
-
2021
- 2021-02-25 CN CN202110211022.2A patent/CN114970494A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116320621A (zh) * | 2023-05-17 | 2023-06-23 | 苏州极易科技股份有限公司 | 一种基于nlp的流媒体内容分析方法及*** |
CN116320621B (zh) * | 2023-05-17 | 2023-08-04 | 苏州极易科技股份有限公司 | 一种基于nlp的流媒体内容分析方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111444428B (zh) | 基于人工智能的信息推荐方法、装置、电子设备及存储介质 | |
CN112328849B (zh) | 用户画像的构建方法、基于用户画像的对话方法及装置 | |
CN116720004B (zh) | 推荐理由生成方法、装置、设备及存储介质 | |
CN114238690A (zh) | 视频分类的方法、装置及存储介质 | |
CN114036398B (zh) | 内容推荐和排序模型训练方法、装置、设备以及存储介质 | |
CN113705299A (zh) | 一种视频识别的方法、装置及存储介质 | |
CN112989212B (zh) | 媒体内容推荐方法、装置和设备及计算机存储介质 | |
CN115114395B (zh) | 内容检索及模型训练方法、装置、电子设备和存储介质 | |
CN113515942A (zh) | 文本处理方法、装置、计算机设备及存储介质 | |
CN111625715B (zh) | 信息提取方法、装置、电子设备及存储介质 | |
CN111666416A (zh) | 用于生成语义匹配模型的方法和装置 | |
CN113704460A (zh) | 一种文本分类方法、装置、电子设备和存储介质 | |
CN114707513A (zh) | 一种文本语义识别方法、装置、电子设备和存储介质 | |
CN114201516A (zh) | 一种用户画像构建的方法、信息推荐的方法以及相关装置 | |
CN115269828A (zh) | 用于生成评论回复的方法、设备和介质 | |
CN114970494A (zh) | 一种评论生成方法、装置、电子设备和存储介质 | |
CN116932731A (zh) | 面向5g消息的多模态知识问答方法及*** | |
CN116628345A (zh) | 一种内容推荐方法、装置、电子设备和存储介质 | |
CN116956183A (zh) | 多媒体资源推荐方法、模型训练方法、装置及存储介质 | |
CN116958852A (zh) | 视频与文本的匹配方法、装置、电子设备和存储介质 | |
CN116977701A (zh) | 视频分类模型训练的方法、视频分类的方法和装置 | |
CN112149426B (zh) | 阅读任务处理方法及相关设备 | |
CN115130461A (zh) | 一种文本匹配方法、装置、电子设备及存储介质 | |
CN114282094A (zh) | 一种资源排序方法、装置、电子设备和存储介质 | |
CN117540024B (zh) | 一种分类模型的训练方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40073413 Country of ref document: HK |