CN115604392A - 彩印信息生成方法、装置、设备以及计算机程序产品 - Google Patents
彩印信息生成方法、装置、设备以及计算机程序产品 Download PDFInfo
- Publication number
- CN115604392A CN115604392A CN202110723595.3A CN202110723595A CN115604392A CN 115604392 A CN115604392 A CN 115604392A CN 202110723595 A CN202110723595 A CN 202110723595A CN 115604392 A CN115604392 A CN 115604392A
- Authority
- CN
- China
- Prior art keywords
- color printing
- printing information
- information
- color
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007639 printing Methods 0.000 title claims abstract description 296
- 238000000034 method Methods 0.000 title claims abstract description 76
- 238000004590 computer program Methods 0.000 title claims abstract description 15
- 238000012549 training Methods 0.000 claims description 45
- 239000013598 vector Substances 0.000 claims description 45
- 230000015654 memory Effects 0.000 claims description 18
- 238000004891 communication Methods 0.000 abstract description 24
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 23
- 238000012545 processing Methods 0.000 description 13
- 238000013527 convolutional neural network Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000004913 activation Effects 0.000 description 6
- 210000002569 neuron Anatomy 0.000 description 6
- 230000036651 mood Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42017—Customized ring-back tones
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Signal Processing (AREA)
- Accessory Devices And Overall Control Thereof (AREA)
Abstract
本发明公开了一种彩印信息生成方法、装置、设备以及计算机程序产品,涉及通信技术领域。彩印信息生成方法包括以下步骤:获取用户的视频彩铃信息;基于所述视频彩铃信息,生成所述用户的彩印信息。采用本发明提供的彩印信息生成方法,取消了用户在订购彩印业务时的编辑或者定制彩印信息的步骤,从消除了编辑彩印信息的受限因素,以利于彩印业务的推广。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种彩印信息生成方法、装置、设备以及计算机程序产品。
背景技术
彩印业务是在主叫终端在拨打被叫终端时,接通前、通话中、挂断后,由***自动把被叫预先设定好的彩印信息,如心情、笑话、客户关怀、防骚扰/虚假/诈骗电话等,以USSD(Unstructured Supplementary Service Data、非结构化补充数据业务)或闪信方式推送到主叫终端上,使主叫终端或被叫终端可以显示个性化移动彩印信息,以达到展示个性、信息传递、防诈骗等目的。
但是用户在订购彩印业务时,彩印信息编辑的受限因素较多。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种彩印信息生成方法、装置、设备以及计算机程序产品,旨在解决用户在订购彩印业务时,彩印信息编辑的受限因素较多的技术问题。
为实现上述目的,第一方面,本发明提供一种彩印信息生成方法,包括:
获取用户的视频彩铃信息;
基于所述视频彩铃信息,生成所述用户的彩印信息。
在一实施例中,所述基于所述视频彩铃信息,生成所述用户的彩印信息,包括:
将所述视频彩铃信息输入预训练的彩印信息生成网络,得到所述彩印信息生成网络输出的彩印信息。
在一实施例中,所述将所述视频彩铃信息输入预训练的彩印信息生成网络,得到所述彩印信息生成网络输出的彩印信息之前,所述方法还包括:
获取训练样本集和预构建的对抗生成网络;其中,所述训练样本集中的每组训练样本包括同一用户样本的视频彩铃样本和彩印信息样本;所述对抗生成网络包括生成网络和判别网络;
将所述视频彩铃样本输入所述生成网络,得到所述视频彩铃样本对应的彩印生成样本;
通过所述判别网络,对所述每组训练样本中的所述彩印信息样本和所述彩印生成样本的真实性进行判别,得到相应的判别结果;
基于所述每组训练样本对应的所述判别结果和所述彩印生成样本,对所述对抗生成网络进行对抗训练,并将训练后的所述生成网络确定为彩印信息生成网络。
在一实施例中,所述彩印信息生成网络包括图像特征提取器与解码器;
所述将所述视频彩铃信息输入预训练的彩印信息生成网络,得到所述彩印信息生成网络输出的彩印信息,包括:
将所述视频彩铃信息输入所述图像特征提取器,得到所述图像特征提取器输出的图像特征向量;
将所述图像特征向量输入所述解码器,得到所述解码器输出的所述彩印信息。
在一实施例中,所述彩印信息生成网络还包括噪音特征提取器;
所述将所述图像特征向量输入所述解码器,得到所述解码器输出的彩印信息之前,所述方法还包括:
将所述视频彩铃信息对应的随机噪声输入所述噪音特征提取器,得到所述噪音特征提取器输出的噪声特征向量;
所述将所述图像特征向量输入所述解码器,得到所述解码器输出的彩印信息,包括:
将所述图像特征向量和所述噪音特征向量输入所述解码器,得到所述解码器输出的彩印信息。
在一实施例中,所述基于所述视频彩铃信息,生成所述用户的彩印信息,包括:
从所述视频彩铃信息抽取出预设数量帧视频帧图像;
基于所述预设数量帧视频帧图像,生成所述用户的所述彩印信息。
在一实施例中,所述基于所述视频彩铃信息,生成所述用户的彩印信息之后,所述方法还包括:
将所述彩印信息发送至所述用户的终端设备,并接收所述用户的选择操作;
若所述选择操作为确定操作,则将所述彩印信息确定为所述用户的定制彩印信息。
第二方面,本发明还提供了一种彩印信息生成装置,包括:
彩铃获取模块,用于获取用户的视频彩铃信息;
彩印生成模块,用于基于所述视频彩铃信息,生成所述用户的彩印信息。
第三方面,本发明还提供了一种彩印信息生成设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如上述的方法。
第四方面,本发明还提供了一种计算机程序产品,包括可执行的程序代码,其中,所述程序代码在由处理器执行时执行如上所述的方法。
本发明实施例提出的一种彩印信息生成方法,通过用户定制的视频彩铃信息生成属于该用户的彩印信息,取消了用户在订购彩印业务时的编辑或者定制彩印信息的步骤,从消除了编辑彩印信息的受限因素,以利于彩印业务的推广。
附图说明
图1为本发明彩印信息生成方法第一实施例的流程示意图;
图2为本发明彩印信息生成方法第二实施例的流程示意图;
图3为本发明彩印信息生成方法一实施例的彩印信息生成网络的组成示意图;
图4为本发明彩印信息生成方法第三实施例的流程示意图;
图5为本发明彩印信息生成方法一实施例的判别网络的组成示意图;
图6为本发明彩印信息生成方法第四实施例的流程示意图;
图7为本发明彩印信息生成方法第五实施例的流程示意图;
图8为本发明彩印信息生成装置的功能模块示意图;
图9为本发明彩印信息生成方法的推荐电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相关技术中,彩印业务是通信服务商在用户通话过程中附加信息传递的增值业务。在主、被叫用户进行通话过程中,由***自动把用户预先设定好的彩印信息如心情、笑话、客户关怀、防骚扰/虚假/诈骗电话等推送到与该用户通话的对方终端上,使对方终端的使用者在通话结束后看到彩印信息,以达到彰显个性、分享心情、商情传递等目的。如主叫终端的用户订购有彩印业务时,在主叫终端拨打被叫终端时、接通前、通话中或者挂断后,由***自动把被叫预先设定好的彩印信息,如心情、笑话、客户关怀、防骚扰/虚假/诈骗电话等,以USSD或闪信方式推送到被叫终端上,使被叫终端可以显示个性化移动彩印信息。同理,如被叫终端的用户订购有彩印业务时,在主叫终端拨打被叫终端时、接通前、通话中或者挂断后,由***自动把被叫预先设定好的彩印信息推送到主叫终端上,使主叫终端可以显示个性化移动彩印信息。
但是,用户在定制编辑自身个性化的彩印信息时,受限因素较多,如时间因素,某些用户觉得编辑浪费时间,或者受到用户的性格因素限制,如某一些用户具有选择困难,难以编辑出自身想要的彩印信息。因此,彩印信息的编辑限制了彩印业务的推广。
为此,本发明实施例提供了一种彩印信息生成方法,通过用户定制的视频彩铃信息生成属于该用户的彩印信息,取消了用户编辑或者定制彩印信息的步骤,以利于彩印业务的推广。
下面结合一些具体实施例进一步阐述本申请的发明构思。
本发明实施例提供了一种彩印信息生成方法第一实施例。参阅图1,图1为本发明彩印信息生成方法第一实施例的流程示意图。
本实施例中,方法包括以下步骤:
步骤S101、获取用户的视频彩铃信息。
视频彩铃是通信服务商提供的一项短视频内容业务。在用户定制有视频彩铃业务后,其余用户使用支持视频彩铃功能的主叫终端在VoLTE(Voice over Long-TermEvolution、长期演进语音承载)网络下向该用户的具备视频彩铃功能的被叫终端发起音频或视频呼叫时,***向主叫终端播放的该用户定制的视频彩铃信息,以提升其余用户呼叫等待的体验。
视频彩铃信息可为用户根据自身喜好或者需求定制或者编辑的一段视频,即为被叫用户在定制视频彩铃业务时,从通信服务商的***平台上选择或者上传至该***平台的原始视频文件。该视频彩铃信息包括多帧图像,以及与多帧图像匹配的音频数据。
本发明实施例中,在用户通过手机、平板或者计算机等终端设备登录通信服务商的云端并进入到彩印定购服务界面后,可基于用户在彩印定购服务界面输入的相应指令,触发云端自动调用后台数据库中存储的该用户订购的视频彩铃信息。
例如,彩印定购服务界面上可显示“自动生成彩印”虚拟按键。用户可通过点击“自动生成彩印”虚拟按键输入获取命令,终端设备将该获取命令发送至云端。响应于接收到的获取命令,云端自动调用后台数据库中存储的该用户订购的视频彩铃数据。
可以理解的,还可以所在用户订购彩印服务时,在彩印定购服务界面设置一“确定订购”虚拟按键,通过用户在终端设备上点击“确定订购”虚拟按键的方式输入获取命令,终端设备将该获取命令发送至云端。从而在用户确定订购彩印业务后自动调用后台数据库中存储的该用户订购的视频彩铃数据。
步骤S102、基于视频彩铃信息,生成用户的彩印信息。
在云端平台获取到用户订购的视频彩铃数据后,云端平台可基于视频彩铃信息,生成用户的彩印信息。彩印信息为用户定制彩印业务后,作为被叫终端被其余用户的主叫终端拨打时、接通前、通话中或者挂断后,推送至主叫终端上的心情信息、笑话信息、客户关怀信息、防骚扰/虚假/诈骗电话提示信息等文本信息或图文信息,以USSD或闪信方式推送到主叫终端。
本步骤中,由于每个用户定制的视频彩铃信息可在一定程度上反应出该用户的个人喜好,或者需求。而彩印业务也为用户向其余用户推动个性化信息,以达到展示个性、信息传递、防诈骗等目的。因此,本实施例中,可基于用户本身定制的个性化的视频彩铃信息,生成属于该用户的彩印信息,该彩印信息具有用户的视频彩铃信息风格,从而可以体现该用户的个人喜好或者需求,且不需要用户自身进行编辑,可以节约用户编辑彩印信息的时间,或者降低用户编辑彩印信息的难度,从而尽可能地减少彩印信息编辑时的受限因素,以利于彩印业务的推广。
本实施例中,步骤S102可基于视频彩铃信息的视频帧等图像信息生成文本或者图文形式的彩印信息,还可基于视频彩铃信息的播放文本信息生成文本或者图文形式的彩印信息,还可基于现有彩印信息的内在规律学习得到文本或者图文形式的彩印信息,本实施例对此并不加以限制。
在本发明彩印信息生成方法第一实施例的基础上,提出本发明彩印信息生成方法第二实施例。参阅图2,图2为本发明彩印信息生成方法的流程示意图。
本实施例中,方法包括以下步骤:
步骤S201、获取用户的视频彩铃信息。
步骤S201可参考步骤S101、此处不再赘述。
步骤S202、将所述视频彩铃信息输入预训练的彩印信息生成网络,得到所述彩印信息生成网络输出的彩印信息。
彩印信息生成网络根据输入的视频彩铃信息,自动输出彩印信息。
该由于输入的视频彩铃信息具有用户的个人风格,从而输出的彩印信息体现该用户的个人喜好或者需求。彩印信息生成网络不需要用户自身进行编辑,可以节约用户编辑彩印信息的时间,或者降低用户编辑彩印信息的难度,从而尽可能地减少彩印信息编辑时的受限因素,以利于彩印业务的推广。
参阅图3,本实施例中,彩印信息生成网络包括图像特征提取器与解码器。
此时,步骤S202包括:
步骤A10、将视频彩铃信息输入图像特征提取器,得到图像特征提取器输出的图像特征向量。
本实施例中,图像特征提取器包括深度卷积神经网络inceptionV3模型、两层全连接层。输入图像特征提取器的图像大小为299×299大小的归一化结果图像,利用预训练的深度卷积神经网络inceptionV3模型对图像进行预处理,抽取出图像的特征表示,将图像编码为固定长度的向量,将inceptionV3模型的最后一个卷积层作为输出,输出形状为(8,8,2048)的向量,并将其压缩成(64,2048)的向量。随后(64,2048)的向量输入至图像特征提取器中两层CNN全连接层。CNN全连接层的激活函数设置为ReLU函数,最后一层CNN全连接层输出为(None,64,512)的图像特征向量。
步骤A20、将图像特征向量输入解码器,得到解码器输出的彩印信息。
本实施例中,解码器为LSTM(Long Short-Term Memory、长短期记忆)解码器。解码器中包括至少两层LSTM层和全连接层。每层LSTM层含512个LSTM神经元,激活函数设置为ReLU函数。将(None,64,512)的图像特征向量输入至LSTM层,LSTM层输出形状为(None,64,512)的向量。(None,64,512)的向量输入至全连接层。全连接层的全连接神经元个数为flashSMS_vocab_size,激活函数设置为softmax函数。该层输出数据的形状为(None,flashSMS_vocab_size),从而将(None,64,512)的向量的输出形状转换成最终输出的维度,即彩印信息。其中,彩印信息可为文本信息。
因此,本实施例中,将视频彩铃信息输入训练好的生成网络生成文本形式的彩印信息。从而基于用户的个性化订购的视频彩铃,生成属于该用户的个性化的彩印信息,使得生成的彩印信息较为匹配用户的真实选择,从而节约了用户编辑文本的时间,降低了彩印业务推广的难度。
进一步的,本实施例中,彩印信息生成网络还包括噪音特征提取器。噪音特征提取器通过LSTM(Long Short-Term Memory、长短期记忆)神经元从噪音中提取出噪声特征向量。
此时,步骤A20之前还包括:
将视频彩铃信息对应的随机噪声输入噪音特征提取器,得到噪音特征提取器输出的噪声特征向量。
随机噪声可以是从正态分布的噪声中随机选择的噪音数据,使该彩印信息生成网络更加鲁棒。此时,当通过对抗生成网络GAN获取该彩印信息生成网络,在对抗生成网络GAN的基础上加入了一个条件:随机噪声。从而使得对抗生成网络GAN变为条件生成对抗网络。使用这个额外的条件变量:随机噪声,对对抗生成网络GAN的生成器数据的生成具有指导作用。
步骤A20适应性变为:
将图像特征向量和噪音特征向量输入解码器,得到解码器输出的彩印信息。
本实施例中,通过噪音特征指导与监督解码器生成彩印信息,以使得彩印信息生成网络生成的彩印信息更加符合用户的真实选择。
在本发明彩印信息生成方法第二实施例的基础上,提出本发明彩印信息生成方法第三实施例。参阅图4,图4为本发明彩印信息生成方法第三实施例的流程示意图。
本实施例中,彩印信息生成网络可通过以下方式训练得到,即步骤S101或者步骤S201之前,方法还包括:
步骤S301、获取训练样本集和预构建的对抗生成网络;其中,训练样本集中的每组训练样本包括同一用户样本的视频彩铃样本和彩印信息样本;对抗生成网络包括生成网络和判别网络。
本步骤中,可从通信服务商的现有视频彩铃数据和彩印数据中收集得到样本集。样本集每组训练样本包括同一用户样本的视频彩铃样本和彩印信息样本。其中,与用户订购的视频彩铃样本对应的真实匹配的彩铃风格的彩印信息样本可增加一标识,标识标记为1。
视频彩铃样本均可抽取出预设数量帧视频帧图像,并对该预设数量帧视频帧图像进行归一化处理,得到299×299大小的归一化结果图像。具体步骤可参考上述实施例的步骤S202和步骤S203。此处不再赘述。
此外,还需要对彩印信息样本进行文本清洗并将文本序列化。具体为,统一彩印信息样本中的字母大小写,如将大写字母转换成小写字母。还可将彩印信息样本中的每个单词转换为整数序列。同时取所有彩印信息样本中最长样本的长度M作为彩印信息样本的编码序列长度。并将每一条彩印信息样本的长度均填充至M。
其中,通信服务商的现有视频彩铃数据和彩印数据中收集得到样本集可划分为训练样本集和测试集。如样本集的90%划为训练集,10%划为测试集。训练样本集用于训练彩印信息生成网络,测试集用于测试彩印信息生成网络。
步骤S302、将视频彩铃样本输入生成网络,得到视频彩铃样本对应的彩印生成样本。
收集生成器生成的匹配视频彩铃信息的彩印生成样本。其中,彩印生成样本可增加一标识,标识标记为0。
彩印生成样本仍可进行文本序列化处理,具体处理步骤可参考彩印信息样本的文本序列化处理步骤,此处不再赘述。
步骤S303、通过判别网络,对每组训练样本中的彩印信息样本和彩印生成样本的真实性进行判别,得到相应的判别结果。
本实施例中,将生成网络输出的匹配视频彩铃样本的彩印生成样本与输入的视频彩铃样本相连接,并一同输入至判别网络。参阅图5,本实施例中,判别网络可由第一分支网络、第二分支网络和全连接神经网络组成。
第一分支网络的第一层为词嵌入层。词嵌入层的输入设置为彩印生成样本,输出设置为固定形状128维度的向量。
第一分支网络的第二、三层为两个隐藏层,均设置64个LSTM神经元,每一层的激活函数均设置为Relu函数。
第二分支网络包括图像特征提取器和两层全连接层。首先将视频彩铃样本的299×299大小的归一化结果图像输入至图像特征提取器,图像特征提取器可为利用预训练的深度卷积神经网络inceptionV3模型。深度卷积神经网络inceptionV3模型对归一化结果图像进行预处理,抽取出图像的特征表示,将图像编码为固定长度的向量,将inceptionV3模型的最后一个卷积层作为输出,输出形状为(8,8,2048)的向量,并将其压缩成(64,2048)的向量。然后将(64,2048)的向量输入至两个CNN全连接层,输出形状为(None,64,512)的向量。
全连接神经网络包括合并层和两层全连接层。其中,最后一层全连接层为输出层。
将第一分支网络分支和第二分支网络的输出结果:128维度的向量和(None,64,512)的向量进行合并拼接形成新的向量。
第一层全连接层包含16个神经元,激活函数设置为Relu函数。
第六层输出层含1个Dense神经元,激活函数设置可设置为sigmoid函数,输出层的判别结果为1或0,其中真为1,假为0。
步骤S304、基于每组训练样本对应的判别结果和彩印生成样本,对对抗生成网络进行对抗训练,并将训练后的生成网络确定为彩印信息生成网络。
本步骤中,判别网络学习给予用户订购的视频彩铃和对应的真实匹配视频彩铃风格的彩印生成样本较高的分数,给予用户订购的视频彩铃和对应生成的匹配视频彩铃风格的彩印生成样本较低的分数,从而更新判别网络的参数。可以理解的,生成网络学习的目标是使生成的匹配视频彩铃的彩印生成样本与真实的匹配视频彩铃风格的彩印信息样本越接近越好,从而最大化判别网络输出的分数(真为1,假为0)。输出的分数可视作回报更新生成网络的模型参数。
如,首先初始化生成网络和判别网络的模型参数,每个训练循环中,先固定生成器的参数,训练判别器,然后固定判别器的参数,训练生成器,直至判别器无法分辨对应被叫订购视频彩铃的彩印文本是真实的还是生成器生成的,收敛后导出模型权重,训练完毕的生成器即可实时生成对应被叫视频彩铃风格的彩印文本内容。
本实施例中,可将训练回合数设置为1000,批处理大小设置为100(batch_size=100),选择categorical crossentropy多类交叉熵函数作为损失函数,即目标函数,并通过梯度下降优化算法,如adam优化器用于改善传统梯度下降的学习速度(optimizer='adam')。对抗生成网络通过梯度下降,可以找到使目标函数最小的最优权重值,对抗生成网络通过训练会自主学习到权重值。
本步骤中,将判别网络的输出结果,送入目标函数,从而相应的权重值。
其中,目标函数可表示为:
其中,L为目标函数,N为样本集中训练样本的总组数,θ为生成网络的模型参数,ci为第i个视频彩铃,xi为ci对应的第i个彩印生成样本,D(ci,xi)为判别网络的输出值,当D(ci,xi)为1时,则更新模型参数以增加Pθ(xi|ci),当D(ci,xi)为0时,则更新模型参数以减小Pθ(xi|ci),Pθ(xi|ci)为生成网络基于ci对应生成的xi被判别网络判别为真的概率。
在训练过程中对生成网络的模型进行更新,并在训练结束后,将训练后的生成网络确定为彩印信息生成网络。
本实施例中,通过上述步骤训练得到的彩印信息生成网络可根据输入的视频彩铃信息生成风格匹配的彩印信息,从而为用户精准推荐合适的彩印内容,提升用户对彩印业务的体验和彩印的订购比率,利于彩印业务的推广。
在本发明彩印信息生成方法第一实施例至第三实施例的基础上,提出本发明彩印信息生成方法第四实施例。参阅图6,图6为本发明彩印信息生成方法的流程示意图。
本实施例中,方法包括以下步骤:
步骤S401、获取用户的视频彩铃信息。
步骤S402、从视频彩铃信息抽取出预设数量帧视频帧图像。
视频彩铃信息为一段视频,包括多帧视频帧图像。从视频彩铃信息的所有视频帧图像抽取出预设数量帧视频帧图像可以是随机抽取,以降低计算量,提高生成网络的计算速度。还可以是基于预设规则抽取,如抽取有显示字幕的视频帧图像,或者抽取有特定元素,如某一虚拟人物,某特效等的视频帧图像。基于预设规则抽取预设数量帧视频帧图像,可以使得生成的彩印信息与该用户的视频彩铃信息更加匹配。本实施例对视频帧图像抽取的具体规则并不加以限制。
步骤S403、基于预设数量帧视频帧图像,生成所述用户的所述彩印信息。
具体而言,本步骤中可对所有视频帧图像进行归一化处理,得到归一化结果图像。
从用户订购的视频彩铃中提取出相应数量帧图像,并将每帧视频帧图像的图片形状转换为299×299。同时为了确保数据都在同一范围内,需要对数据做标准化处理,对每一帧视频帧图像的每一个像素按比例压缩至0到1的范围内,然后将每一帧图片的像素值分别对应减去全局均值图片的像素值以实现归一化。
其中,全局均值图片的像素值是彩印信息生成网络在训练过程中通过计算训练样本集中每一帧图像样本的每一个位置的像素值的均值所得到。经处理后的所有视频帧图像的图像像素值都将被归一化为均值为0、方差为1的图像数据。此时,视频彩铃的视频帧图像可表示为:C={c1,c2,...,cN},其中cN是空间位置N处的特征向量。
然后基于归一化结果图像,生成用户的彩印信息。
具体而言,将视频彩铃信息,即归一化结果图像输入预训练的彩印信息生成网络,得到彩印信息生成网络输出的彩印信息。
在本发明彩印信息生成方法第一实施例至第四实施例的基础上,提出本发明彩印信息生成方法第五实施例。参阅图7,图7为本发明彩印信息生成方法的流程示意图。彩印信息生成方法应用于通信服务商的云端平台。
本实施例中,方法包括以下步骤:
步骤S501、云端平台获取用户的视频彩铃信息。
步骤S502、云端平台基于视频彩铃信息,生成用户的彩印信息。
步骤S503、云端平台将彩印信息发送至用户的终端设备,并接收用户的选择操作。
该用户的终端设备可为用户登录通信服务商的云端平台时的终端设备,终端设备接收到云端平台发送的彩印信息后,将彩印信息展示在终端设备的显示界面上。可以理解的,终端设备可以是用户登录通信服务商的***云端平台时的平板、计算机等终端设备。此外,用户通过平板、计算机等设备登录通信服务商的***云端平台时,云端平台还可通过短信通知等形式将生成的彩印信息发送至用户个人移动终端上,如智能手机上。
终端设备可具有一显示屏。在用户通过终端设备登录通信服务商的***平台,并订购彩印业务时,可选择相应的自动生成操作生成彩印信息。***平台在根据后台存储的该用户的视频彩铃信息,生成彩印信息后,将其发送至终端设备。终端设备接收到该彩印信息后,将该彩印信息显示在终端设备的显示界面上。并在显示界面上显示出“确定”虚拟按键以及“取消”虚拟按键,或者“重新生成”虚拟按键等。用户可通过鼠标点击或者触摸屏的点击等操作选择上述的虚拟按键,从而将相应的选择操作发送至***平台。
步骤S504、若选择操作为确定操作,则云端平台将彩印信息确定为用户的定制彩印信息。
本实施例中,若用户对***平台生成的彩印信息满意,则可通过鼠标点击或者触摸屏的点击等操作选择上述的“确定”虚拟按键,从而将该彩印信息订购为自身的定制彩印信息。
若用户对***平台生成的彩印信息不满意,则可通过鼠标点击或者触摸屏的点击等操作选择上述的“取消”虚拟按键,从而取消顶盖该彩印信息为自身的定制彩印信息。或者通过鼠标点击或者触摸屏的点击等操作选择上述的“重新生成”虚拟按键,从而向***平台发送重新生成的指令。***平台重新生成新的彩印信息,从重新发送至用户的终端设备供用户选择。
在用户确定基于生成的彩印信息订购彩印业务后,在用户的个人移动终端拨打其他用户的被叫终端时、接通前、通话中或者挂断后,由***自动把主叫生成的该彩印信息,以USSD或闪信方式推送到被叫终端上,使被叫终端可以显示该生成的彩印信息。同理,在其他用户的主叫终端拨打该用户的个人移动终端时、接通前、通话中或者挂断后,由***自动把该生成的彩印信息推送到主叫终端上,使主叫终端可以显示该生成的彩印信息。
本实施例中,通过将选择交于用户,可提升用户的订购体验。
可以理解的,在其他实施例中,彩印生成方法可应用于用户的终端设备上。在用户通过手机、平板或者计算机等终端设备登录通信服务商的云端并进入到彩印定购服务界面后,可基于用户在彩印定购服务界面输入的相应指令,触发云端自动调用后台数据库中存储的该用户订购的视频彩铃信息。云端平台将调用的视频彩铃信息发送至用户此时登录的终端设备。终端设备基于接收到的视频彩铃信息执行前述任一实施例所述的彩印信息生成方法,从而生成彩印信息。彩印信息生成方法的具体步骤此处不再赘述。此时,在生成彩印信息后,终端设备可直接将彩印信息展示于显示界面,以接收用户的选择操作。
此外,参阅图8,本发明实施例还提供了一种彩印信息生成装置,包括:
彩铃获取模块10,用于获取用户的视频彩铃信息;
彩印生成模块20,用于基于视频彩铃信息,生成用户的彩印信息。
在一实施例中,彩印生成模块20,还用于将所述视频彩铃信息输入预训练的彩印信息生成网络,得到所述彩印信息生成网络输出的彩印信息。
在一实施例中,彩印信息生成装置还包括:
获取训练样本集和预构建的对抗生成网络;其中,所述训练样本集中的每组训练样本包括同一用户样本的视频彩铃样本和彩印信息样本;所述对抗生成网络包括生成网络和判别网络;
将所述视频彩铃样本输入所述生成网络,得到所述视频彩铃样本对应的彩印生成样本;
通过所述判别网络,对所述每组训练样本中的所述彩印信息样本和所述彩印生成样本的真实性进行判别,得到相应的判别结果;
基于所述每组训练样本对应的所述判别结果和所述彩印生成样本,对所述对抗生成网络进行对抗训练,并将训练后的所述生成网络确定为彩印信息生成网络。
在一实施例中,所述彩印信息生成网络包括图像特征提取器与解码器;彩印生成模块20,还用于将所述视频彩铃信息输入所述图像特征提取器,得到所述图像特征提取器输出的图像特征向量;将所述图像特征向量输入所述解码器,得到所述解码器输出的所述彩印信息。
在一实施例中,所述彩印信息生成网络还包括噪音特征提取器;
彩印生成模块20,还用于将所述视频彩铃信息对应的随机噪声输入所述噪音特征提取器,得到所述噪音特征提取器输出的噪声特征向量;将所述图像特征向量和所述噪音特征向量输入所述解码器,得到所述解码器输出的彩印信息。
在一实施例中,彩印信息生成装置还包括:
视频帧图像抽取模块,用于从所述视频彩铃信息抽取出预设数量帧视频帧图像;
处理模块,用于基于预设数量帧视频帧图像,生成所述用户的彩印信息。
在一实施例中,彩印信息生成装置还包括:
信息接发模块,用于将所述彩印信息发送至所述用户的终端设备,并接收所述用户的选择操作;
彩印订购确定模块,用于若所述选择操作为确定操作,则将所述彩印信息确定为所述用户的定制彩印信息。
本发明彩印信息生成装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
参照图9,图9为本发明实施例方案涉及的彩印信息生成方法的推荐设备结构示意图。
该彩印信息生成设备包括:至少一个处理器301、存储器302以及存储在存储器上并可在处理器上运行的彩印信息生成程序,彩印信息生成程序配置为实现如前的彩印信息生成方法的步骤。
处理器301可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器301可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器301也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(CentralProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器301可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。
存储器302可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器302还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器302中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器301所执行以实现本申请中方法实施例提供的彩印信息生成方法。
基于区块链的密钥处理设备还包括有:通信接口303。处理器301、存储器302和通信接口303之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与通信接口303相连。
通信接口303可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器301和存储器302。在一些实施例中,处理器301、存储器302和通信接口303被集成在同一芯片或电路板上;在一些其他实施例中,处理器301、存储器302和通信接口303中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
本领域技术人员可以理解,图1中示出的结构并不构成对彩印信息生成设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
此外,本发明实施例还提出一种计算机程序产品,计算机程序产品上存储有程度代码,程度代码被处理器执行时实现如上文的彩印信息生成方法的步骤。因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机程序产品实施例中未披露的技术细节,请参照本申请方法实施例的描述。确定为示例,程序指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,上述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种彩印信息生成方法,其特征在于,包括:
获取用户的视频彩铃信息;
基于所述视频彩铃信息,生成所述用户的彩印信息。
2.根据权利要求1所述的彩印信息生成方法,其特征在于,所述基于所述视频彩铃信息,生成所述用户的彩印信息,包括:
将所述视频彩铃信息输入预训练的彩印信息生成网络,得到所述彩印信息生成网络输出的彩印信息。
3.根据权利要求2所述的彩印信息生成方法,其特征在于,所述将所述视频彩铃信息输入预训练的彩印信息生成网络,得到所述彩印信息生成网络输出的彩印信息之前,所述方法还包括:
获取训练样本集和预构建的对抗生成网络;其中,所述训练样本集中的每组训练样本包括同一用户样本的视频彩铃样本和彩印信息样本;所述对抗生成网络包括生成网络和判别网络;
将所述视频彩铃样本输入所述生成网络,得到所述视频彩铃样本对应的彩印生成样本;
通过所述判别网络,对所述每组训练样本中的所述彩印信息样本和所述彩印生成样本的真实性进行判别,得到相应的判别结果;
基于所述每组训练样本对应的所述判别结果和所述彩印生成样本,对所述对抗生成网络进行对抗训练,并将训练后的所述生成网络确定为彩印信息生成网络。
4.根据权利要求2或3所述的彩印信息生成方法,其特征在于,所述彩印信息生成网络包括图像特征提取器与解码器;
所述将所述视频彩铃信息输入预训练的彩印信息生成网络,得到所述彩印信息生成网络输出的彩印信息,包括:
将所述视频彩铃信息输入所述图像特征提取器,得到所述图像特征提取器输出的图像特征向量;
将所述图像特征向量输入所述解码器,得到所述解码器输出的所述彩印信息。
5.根据权利要求4所述的彩印信息生成方法,其特征在于,所述彩印信息生成网络还包括噪音特征提取器;
所述将所述图像特征向量输入所述解码器,得到所述解码器输出的彩印信息之前,所述方法还包括:
将所述视频彩铃信息对应的随机噪声输入所述噪音特征提取器,得到所述噪音特征提取器输出的噪声特征向量;
所述将所述图像特征向量输入所述解码器,得到所述解码器输出的彩印信息,包括:
将所述图像特征向量和所述噪音特征向量输入所述解码器,得到所述解码器输出的彩印信息。
6.根据权利要求1所述的彩印信息生成方法,其特征在于,所述基于所述视频彩铃信息,生成所述用户的彩印信息,包括:
从所述视频彩铃信息抽取出预设数量帧视频帧图像;
基于所述预设数量帧视频帧图像,生成所述用户的所述彩印信息。
7.根据权利要求1所述的彩印信息生成方法,其特征在于,所述基于所述视频彩铃信息,生成所述用户的彩印信息之后,所述方法还包括:
将所述彩印信息发送至所述用户的终端设备,并接收所述用户的选择操作;
若所述选择操作为确定操作,则将所述彩印信息确定为所述用户的定制彩印信息。
8.一种彩印信息生成装置,其特征在于,包括:
彩铃获取模块,用于获取用户的视频彩铃信息;
彩印生成模块,用于基于所述视频彩铃信息,生成所述用户的彩印信息。
9.一种彩印信息生成设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如权利要求1至7中任一项所述的方法。
10.一种计算机程序产品,其特征在于,包括可执行的程序代码,其中,所述程序代码在由处理器执行时执行如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110723595.3A CN115604392A (zh) | 2021-06-28 | 2021-06-28 | 彩印信息生成方法、装置、设备以及计算机程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110723595.3A CN115604392A (zh) | 2021-06-28 | 2021-06-28 | 彩印信息生成方法、装置、设备以及计算机程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115604392A true CN115604392A (zh) | 2023-01-13 |
Family
ID=84841280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110723595.3A Pending CN115604392A (zh) | 2021-06-28 | 2021-06-28 | 彩印信息生成方法、装置、设备以及计算机程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115604392A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101237488A (zh) * | 2008-02-22 | 2008-08-06 | 华为技术有限公司 | 实现彩铃业务的装置和方法及获取彩铃文件的装置 |
CN101959152A (zh) * | 2010-10-21 | 2011-01-26 | 杭州东信北邮信息技术有限公司 | 一种基于彩铃平台实现文字彩铃的方法和*** |
CN110598651A (zh) * | 2019-09-17 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、装置及存储介质 |
-
2021
- 2021-06-28 CN CN202110723595.3A patent/CN115604392A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101237488A (zh) * | 2008-02-22 | 2008-08-06 | 华为技术有限公司 | 实现彩铃业务的装置和方法及获取彩铃文件的装置 |
CN101959152A (zh) * | 2010-10-21 | 2011-01-26 | 杭州东信北邮信息技术有限公司 | 一种基于彩铃平台实现文字彩铃的方法和*** |
CN110598651A (zh) * | 2019-09-17 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102893590B (zh) | 向电话提供呈现和社交网络信息 | |
CN110178132A (zh) | 使用语言模型对消息中接收到的图像的自动建议响应 | |
CN110619889B (zh) | 体征数据识别方法、装置、电子设备和存储介质 | |
CN109189544B (zh) | 用于生成表盘的方法和装置 | |
CN108156317A (zh) | 通话语音控制方法、装置及存储介质和移动终端 | |
CN108920640A (zh) | 基于语音交互的上下文获取方法及设备 | |
CN113284500B (zh) | 音频处理方法、装置、电子设备及存储介质 | |
US20210375288A1 (en) | Transcription generation technique selection | |
CN115604392A (zh) | 彩印信息生成方法、装置、设备以及计算机程序产品 | |
CN110532448B (zh) | 基于神经网络的文档分类方法、装置、设备及存储介质 | |
CN111031183A (zh) | 彩铃播放方法、电子设备及存储介质 | |
CN110070385A (zh) | 广告评论方法、装置、电子设备及存储介质 | |
CN114998961A (zh) | 虚拟三维人脸生成方法、人脸生成模型的训练方法及装置 | |
CN114648442A (zh) | 图像风格迁移方法及装置 | |
CN114463466A (zh) | 智能卡卡面图案定制方法、装置、电子设备及介质 | |
CN115841437A (zh) | 一种图像增强的方法、装置及设备 | |
CN110008907B (zh) | 一种年龄的估计方法、装置、电子设备和计算机可读介质 | |
CN109933969B (zh) | 验证码识别方法、装置、电子设备及可读存储介质 | |
CN116911304B (zh) | 一种文本推荐方法及装置 | |
CN115941844A (zh) | 一种基于彩印信息的彩铃智能筛选方法和装置 | |
CN116416688A (zh) | 活体检测方法、装置、设备与存储介质 | |
CN110796020B (zh) | 一种心情指数分析方法及相关装置 | |
CN117493661A (zh) | 事务推荐方法、装置、存储介质及设备 | |
CN113849757A (zh) | 网页加载耗时计算方法、装置、存储介质以及终端 | |
CN115730361A (zh) | 交互界面的生成方法及装置、电子设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |