CN113220936B - 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质 - Google Patents

基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质 Download PDF

Info

Publication number
CN113220936B
CN113220936B CN202110623686.XA CN202110623686A CN113220936B CN 113220936 B CN113220936 B CN 113220936B CN 202110623686 A CN202110623686 A CN 202110623686A CN 113220936 B CN113220936 B CN 113220936B
Authority
CN
China
Prior art keywords
user
video
data
matrix
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110623686.XA
Other languages
English (en)
Other versions
CN113220936A (zh
Inventor
马晓波
岳晓光
高鹏
武跃
史建焘
侯云峰
李岩泽
廉士勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Heilongjiang Radio And Television Station
Original Assignee
Heilongjiang Radio And Television Station
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Heilongjiang Radio And Television Station filed Critical Heilongjiang Radio And Television Station
Priority to CN202110623686.XA priority Critical patent/CN113220936B/zh
Publication of CN113220936A publication Critical patent/CN113220936A/zh
Application granted granted Critical
Publication of CN113220936B publication Critical patent/CN113220936B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种视频推荐方法,尤其涉及基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质,属于网络信息处理技术领域。具体包括,首先,对数据集进行预处理;其次,通过随机向量对用户特征生成随机矩阵编码;再其次,将数据编码矩阵传输至第一全连接层,获得用户特征向量;再其次,将视频特征传输至简化卷积网络中生成简化文本卷积网络编码,并生成视频特征矩阵;再其次,将视频特征矩阵传输至第二全连接层,获得电影特征向量;再其次,通过用户特征向量和电影特征向量,计算预测评分,将其与真实评分进行拟合训练;最后通过预测评分对用户进行视频推荐。解决了现有技术中存在的视频推荐方法计算量大、信息编码繁琐的技术问题。

Description

基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装 置及存储介质
技术领域
本申请涉及一种视频推荐方法,尤其涉及基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质,属于网络信息处理技术领域。
背景技术
面向目前互联网信息的海量性和结构复杂性,推荐算法的价值日益彰显。在目前深度学习技术发展迅速并且在很多领域都取得了显著的成果,不过目前将其应用在视频推荐算法的研究较少。
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。目前,深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。
现有的将深度学习和推荐***结合起来的解决方案是对原始数据进行one-hot编码,这是因为大部分算法是基于向量空间中的度量来进行计算的,并且为了使非偏序关系的变量取值不具有偏序性,到圆点是等距的。使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点。这样就会让特征之间的距离计算更加合理。离散特征进行one-hot编码后,每一维度的特征都可以看做是连续的特征。将离散特征通过one-hot编码映射到欧式空间后,在回归,分类,聚类等机器学习算法中得以加以利用。
目前所使用的one-hot编码在类别的数量很多时,特征空间会变得非常大。在这种情况下,一般可以用PCA来减少维度。而且one hot encoding+PCA这种组合在实际中也非常有用。但是这样做会带来很多额外的计算负担,使得***设计更为复杂,而且在实际应用场景中,很多时候比如用户id这种对于计算结果意义不大却具有很高维度的信息没有必要进行额外的编码来增加***设计难度和复杂程度。
因此,本发明提出了基于随机矩阵编码和简化卷积网络对这些信息进行编码处理,在保持了整个深度学习模型架构的同时也降低了计算量,简化了信息编码过程。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于此,为解决现有技术中存在的视频推荐方法计算量大、信息编码繁琐的技术问题,本发明提供了一种基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质,在数据类别处理字段中将其转换成数字作为输入,使得嵌入层的维度降低,计算使用的时间和功率消耗小。解决了现有技术中存在的视频推荐方法计算量大、信息编码繁琐的技术问题。
基于随机矩阵编码和简化卷积网络的视频智能推荐方法,包括以下步骤:
S1.对数据集进行预处理;
S2.通过随机向量对用户特征生成随机矩阵编码,并生成数据编码矩阵;
S3.将步骤S2所述的数据编码矩阵传输至第一全连接层,获得用户特征向量;
S4.将视频特征传输至简化卷积网络中生成简化文本卷积网络编码,并生成视频特征矩阵;
S5.将步骤S4所述的视频特征矩阵传输至第二全连接层,获得视频特征向量;
S6.通过用户特征向量和视频特征向量,计算预测评分,将其与真实评分进行拟合训练;
S7.通过预测评分对用户进行视频推荐。
优选的,步骤S1所述对数据集进行预处理的具体方法是:将数据分为用户特征和视频特征;所述用户特征具体包括:用户职业和视频类型、用户年龄、用户性别和用户视频ID;所述视频特征具体包括:视频名称和用户名。
优选的,步骤S2所述通过随机向量对用户特征生成随机矩阵编码的具体方法是:将Gender字段的F和M转化为O和1;将Age字段转化成0-6七个连续数字;Genres字段中的类别转化为字符串到数字的字典,将每个电影的Genres字段转成数字列表;Zip-code字段、timestamps字段、UserID字段、OccupationID字段和MovieID字段保持不变。
优选的,步骤S4所述将视频特征传输至简化卷积网络中的具体方法包括以下步骤:
S4.1.在简化卷积网络的嵌入层中输入视频特征,由视频特征中的每一个单词嵌入向量,生成嵌入矩阵;
S4.2.在简化卷积网络的卷积层中使用多个不同尺寸的卷积核在嵌入矩阵上做卷积,多个不同尺寸是每次卷积覆盖几个单词;
S4.3.在简化卷积网络的max pooling层对卷积层的向量进行降维并拼接得到一个长向量。
优选的,步骤S3所述获得用户特征向量的具体方法是:使用激活函数TensorFlow中自带的relu函数。
优选的,步骤S5所述获得视频特征向量的具体方法是:将步骤S4.3所述的长向量传输至第二全连接层使用dropout做正规化,得到视频特征向量;获得视频特征向量使用激活函数f(x)=tanh(x)的双曲正切函数。
优选的,步骤S6所述通过用户特征向量和视频特征向量,计算预测评分的具体方法是:使用向量乘法算预测评分。
优选的,步骤S6将其与真实评分进行拟合训练的具体方法是,通过以下公式计算:
其中,M为样本总数,ym为预测评分,为真实评分。
一种计算机装置,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现基于随机矩阵编码和简化卷积网络的视频智能推荐方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现基于随机矩阵编码和简化卷积网络的视频智能推荐方法。
本发明的有益效果如下:基于随机矩阵编码和简化卷积网络的视频智能推荐方法,在数据类别处理字段中将这些字段转换成了数字作为输入,所以嵌入层的维度相对于传统所用的one hot编码输入较低,计算所使用的时间和功耗较小。另一方面,在得到训练模型后可以根本上解决用户和视频的冷启动问题,当新用户或者新视频加入到***后,可以简单的将目前已有的视频或用户特征矩阵与用户和视频特征进行计算来得到用户对不同视频的可能评分,而且借此还可以实现对于用户和视频的聚类,只要计算对应的特征向量和特征矩阵的余弦相似度即可,借此结果也可对协同过滤算法进行优化。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明实施例所述的推荐方法的流程示意图;
图2为本发明实施例所述的推荐方法的模型结构示意图;
图3为本发明实施例所述的推荐方法算法流程示意图;
图4为本发明实施例所述UserID编码矩阵示意图。
具体实施方式
为了使本申请实施例中的技术方案及优点更加清楚明白,以下结合附图对本申请的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本申请的一部分实施例,而不是所有实施例的穷举。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例、参照图1-4说明本实施方式,基于随机矩阵编码和简化卷积网络的视频智能推荐方法,包括以下步骤:
步骤一、对数据集进行预处理;数据集为一般应用场景下视频网站所能收集到的数据,本实施例以Movielens数据集为例,MovieLens数据集包含多个用户对多部电影的评级数据,也包括电影元数据信息和用户属性信息。这个数据集经常用来做推荐***,机器学习算法的测试数据集。尤其在推荐***领域。此数据集的抽象程度较高,其中1M版本的数据集便包含了6000个用户在近4000部电影上的1亿条评论,其中用户信息包括用户ID、性别、年龄、职业ID和邮编等字段,其中邮编字段在训练过程中没有使用因为该字段在实际应用环境中较难获取。电影数据包括电影ID、电影名和电影风格等字段,评分数据则是分别有用户ID、电影ID、评分和时间戳等字段。
本实施例中对于数据集进行预处理的具体方法是:将数据分为用户特征和视频特征;所述用户特征具体包括:用户职业和视频类型、用户年龄、用户性别和用户视频ID;所述视频特征具体包括:视频名称和用户名。
具体参照表1和表2。表1为Movielens用户数据样例表,表2为Movielens用户评分数据样例表。
表1Movielens用户数据样例
表2为Movielens用户评分数据样例
UserID MovieID Rating timestamps
0 1193 5 978300760
1 661 3 978302109
2 914 3 978301968
3 3408 4 978300275
4 2355 5 978824291
其中,表2中的Rating字段就是我们学习的目标,是对应用户对于电影的实际评分。
步骤二、通过随机向量对用户特征生成随机矩阵编码,并生成数据编码矩阵;具体方法是:将Gender(用户性别)字段的F和M转化为O和1;将Age(用户年龄)字段转化成0-6七个连续数字;具体是指将用户的年龄划分为七个年龄段,比如0-15统一映射成1,15-25映射成2,如此映射。Genres(视频类型)字段是分类字段,所以将先将其中的类别转化为字符串到数字的字典,又因为有些电影是多个Genres(视频类型)的组合,所以将每个电影的Genres(视频类型)字段转成数字列表;Zip-code(邮政编码)字段、timestamps(视频时长)字段、UserID(用户名)字段、OccupationID(用户职业)字段和MovieID(视频ID)字段保持不变。
本实施例将以UserID为例,建立随机矩阵编码样例对表2中的五个用户ID进行编码,假如之后的全连接层需要的输入特征向量维度为8,对这五个UserID编码后(选取的随机数区间为[0,1]),结果矩阵参照图4。其中每一行便是一个ID所对应的特征向量,将该矩阵作为用户ID所对应的编码矩阵投入下一层进行计算。
关于随机矩阵编码算法的具体思路如下:
1、针对所要处理的信息进行梳理,筛选出对训练结果意义不大,数量众多但是不可或缺的数据维度,比如用户id这一用户特征,它可以用来唯一标识用户身份,但是这一用户信息只是单纯的数字,对于推测用户喜好意义不大,数据量较多,符合算法的适用条件。
2、针对数据量和所使用深度学习模型的架构定义算法所产生的向量大小,在这种情形下我们及假设用户的数据数量为x,用户所期望得到的向量维度为y,用户定义的随机数区间大小为[a,b],用户所定义区间内最小分割单位为c,这时对于用户数据中的任意一条,出现完全相同的向量的概率如公式:x/((b-a)/c)^y。
比如数据集有20000条数据,所使用的神经网络需要维度为16的向量作为输入,此时定义算法生成的编码区间为[0,1]之间的浮点数就是较为合理的,因为此时两个向量的相似概率已经非常逼近于0。
3、在完成以上两步后需要将数据进行预处理,首先根据实验要求合理判断实验数据所需要进行编码精细度,比如若是所用数据包含用户年龄字段,如果用户年龄对于实验结果具有重要意义,可以根据需要建立每一个用户年龄和特征向量的映射,如果用户年龄对实验结果意义不大,一个较为合理的做法则是将用户年龄划分为若干个年龄段以减少该特征的计算量,从而整体上降低算法运算需求。
4、具体随机每一个随机向量中随机数的产生可以根据自身所使用的变成语言调用具体的随机数函数实现,给出的推荐取值方式为取区间为[-1,1]的浮点数。在生成所有向量后将其组合后便建立了原始数据和矩阵之间的映射,以便于用在之后的深度学习算法中。
步骤三、将步骤二所述的数据编码矩阵传输至第一全连接层,获得用户特征向量;具体方法是:使用激活函数TensorFlow中自带的relu函数。
步骤四、将视频特征传输至简化卷积网络中生成简化文本卷积网络编码,并生成视频特征矩阵;具体方法包括以下步骤:
步骤四一、在简化卷积网络的嵌入层中输入视频特征,由视频特征中的每一个单词嵌入向量,生成嵌入矩阵;
步骤四二、在简化卷积网络的卷积层中使用多个不同尺寸的卷积核在嵌入矩阵上做卷积,多个不同尺寸是每次卷积覆盖几个单词;
步骤四三、在简化卷积网络的max pooling层对卷积层的向量进行降维并拼接得到一个长向量。
步骤五、将步骤四所述的视频特征矩阵传输至第二全连接层,获得视频特征向量;
获得视频特征向量的具体方法是:将步骤四三所述的长向量传输至第二全连接层使用dropout做正规化,得到视频特征向量;获得视频特征向量使用激活函数f(x)=tanh(x)的双曲正切函数。
关于嵌入层,本实施例以"I play football with……"为例,每个单词使用一个形状为1*6的行向量表示,然后这4个单词以垂直方式堆积成一个二维矩阵。该二维矩阵的形状为单词数量*7。
关于卷积层,本实施例以3个不同尺寸的卷积核为例,分别为2个45、2个35和2个2*5的卷积核。卷积核的一个维度是确定的,与词向量的维度d相等。那么这里的数据就是序列数据,从而卷积操作就不再是图像中的二维卷积,而是一维卷积,该卷积核只在高度维度上平移。
关于max pooling层,在卷积之后,进行了最大池化,将每个特征最大池化之后的结果也以垂直方式堆积。
关于第二全连接层,在池化操作后,进行全连接的计算,通过激活函数激活即可。
步骤六、通过用户特征向量和视频特征向量,计算预测评分,将预测评分与真实评分进行拟合训练;使用均方误差函数优化损失进行训练,使用tensorboard查看loss在1附近。
其中,计算预测评分的具体方法是:使用向量乘法算预测评分;
其中,与真实评分进行拟合训练的具体方法是,通过以下公式计算:
其中,M为样本总数,ym为预测评分,为真实评分。
本实施例中M取用户评分表条目的总数,最终学习得出的用户对视频的评分和表2中的Rating字段使用最小化均方误差进行拟合训练,对于整体全数据集,采用其中90%作为训练集,10%作为验证集。
其中,训练过程中使用Mini_batching作为优化算法,即小批的梯度下降,这种算法把数据分为若干个批,按批来更新参数,这样,一个批中的一组数据共同决定了本次梯度的方向,下降起来就不容易跑偏,减少了随机性。另一方面因为批的样本数与整个数据集相比小了很多,计算量也不是很大。
步骤七、通过预测评分对用户进行视频推荐。
本发明的计算机装置可以是包括有处理器以及存储器等装置,例如包含中央处理器的单片机等。并且,处理器用于执行存储器中存储的计算机程序时实现上述的基于CREO软件的可修改由关系驱动的推荐数据的推荐方法的步骤。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
计算机可读存储介质实施例
本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质,包括但不限于非易失性存储器、易失性存储器、铁电存储器等,计算机可读存储介质上存储有计算机程序,当计算机装置的处理器读取并执行存储器中所存储的计算机程序时,可以实现上述的基于CREO软件的可修改由关系驱动的建模数据的建模方法的步骤。
所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (3)

1.基于随机矩阵编码和简化卷积网络的视频智能推荐方法,其特征在于,包括以下步骤:
S1.对数据集进行预处理,所述数据集包含多个用户对多部电影的评级数据,也包括电影元数据信息和用户属性信息;将数据分为用户特征和视频特征;所述用户特征具体包括:用户职业和视频类型、用户年龄、用户性别和用户视频ID;所述视频特征具体包括:视频名称和用户名;
S2.通过随机向量对用户特征生成随机矩阵编码,并生成数据编码矩阵,具体方法是:将Gender字段的F和M转化为O和1;将Age字段转化成0-6七个连续数字;Genres字段中的类别转化为字符串到数字的字典,将每个视频的Genres字段转成数字列表;Zip-code字段、timestamps字段、UserID字段、OccupationID字段和MovieID字段保持不变;
对所要处理的信息进行梳理,筛选对训练结果没有意义,数量多且不可或缺的数据维度;
对数据量和所使用深度学习模型的架构定义算法所产生的向量大小,设用户的数据数量为x,用户期望得到的向量维度为y,用户定义的随机数区间大小为[a,b],用户所定义区间内最小分割单位为c,这时对于用户数据中的任意一条,出现完全相同的向量的概率如公式:x/((b-a)/c)^y;
将数据进行预处理,根据实验要求判断实验数据需要进行编码的精细度;
每一个随机向量中随机数的产生根据自身所使用的编程语言调用具体的随机数函数实现,给出的推荐取值为取区间为[-1,1]的浮点数;在生成所有向量后将其组合建立原始数据和矩阵之间的映射;
S3.将步骤S2所述的数据编码矩阵传输至第一全连接层,获得用户特征向量,具体方法是:使用激活函数TensorFlow中自带的relu函数;
S4.将视频特征传输至简化卷积网络中生成简化文本卷积网络编码,并生成视频特征矩阵,具体方法包括以下步骤:
S4.1.在简化卷积网络的嵌入层中输入视频特征,由视频特征中的每一个单词嵌入向量,生成嵌入矩阵;
S4.2.在简化卷积网络的卷积层中使用多个不同尺寸的卷积核在嵌入矩阵上做卷积,多个不同尺寸是每次卷积覆盖几个单词;
S4.3.在简化卷积网络的maxpooling层对卷积层的向量进行降维并拼接得到一个长向量;
S5.将步骤S4所述的视频特征矩阵传输至第二全连接层,获得视频特征向量,具体方法是:将步骤S4.3所述的长向量传输至第二全连接层使用dropout做正规化,得到视频特征向量;获得视频特征向量使用激活函数f(x)=tanh(x)的双曲正切函数;
S6.通过用户特征向量和视频特征向量,计算预测评分,将其与真实评分进行拟合训练,具体方法是:使用向量乘法算预测评分;进行拟合训练的具体方法是,通过以下公式计算:
其中,M为样本总数,ym为预测评分,为真实评分;
S7.通过预测评分对用户进行视频推荐。
2.一种计算机装置,其特征在于:包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现权利要求1所述的基于随机矩阵编码和简化卷积网络的视频智能推荐方法的步骤。
3.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1所述的基于随机矩阵编码和简化卷积网络的视频智能推荐方法。
CN202110623686.XA 2021-06-04 2021-06-04 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质 Active CN113220936B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110623686.XA CN113220936B (zh) 2021-06-04 2021-06-04 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110623686.XA CN113220936B (zh) 2021-06-04 2021-06-04 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN113220936A CN113220936A (zh) 2021-08-06
CN113220936B true CN113220936B (zh) 2023-08-15

Family

ID=77082764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110623686.XA Active CN113220936B (zh) 2021-06-04 2021-06-04 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN113220936B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114266422B (zh) * 2022-03-02 2022-06-21 北京唯捷创芯精测科技有限责任公司 一种面向集成电路封测的卷盘数量预测方法及预测装置
CN115034847A (zh) * 2022-05-25 2022-09-09 山东大学 基于深度学习的产品推荐方法、***、存储介质及设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008092301A1 (fr) * 2007-01-26 2008-08-07 Daoben Li Procédé et système de multiplexage par répartition en code
CN101324926A (zh) * 2008-07-25 2008-12-17 重庆大学 一种面向复杂模式分类的特征选择方法
CN102970707A (zh) * 2012-12-20 2013-03-13 李惠 基于压缩感知的无线传输数据丢失恢复方法
CN110012356A (zh) * 2019-04-16 2019-07-12 腾讯科技(深圳)有限公司 视频推荐方法、装置和设备及计算机存储介质
CN110019943A (zh) * 2017-09-11 2019-07-16 ***通信集团浙江有限公司 视频推荐方法、装置、电子设备和存储介质
CN110555132A (zh) * 2019-08-13 2019-12-10 北京工业大学 一种基于注意力模型的降噪自编码器推荐方法
CN110650340A (zh) * 2019-04-25 2020-01-03 长沙理工大学 一种时空复用的压缩视频成像方法
CN111382307A (zh) * 2018-12-27 2020-07-07 深圳Tcl新技术有限公司 一种基于深度神经网络的视频推荐方法、***及存储介质
CN111782934A (zh) * 2020-05-11 2020-10-16 中山大学新华学院 一种缓解数据稀疏性的电影推荐***和方法
WO2020224219A1 (zh) * 2019-05-06 2020-11-12 平安科技(深圳)有限公司 中文分词方法、装置、电子设备及可读存储介质
WO2021042826A1 (zh) * 2019-09-05 2021-03-11 苏宁云计算有限公司 一种视频播放完整度预测方法及装置
CN112883070A (zh) * 2021-01-22 2021-06-01 东北大学 一种带有差分隐私的生成式对抗网络推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190385063A1 (en) * 2018-06-15 2019-12-19 Google Llc Sparse recovery autoencoder

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008092301A1 (fr) * 2007-01-26 2008-08-07 Daoben Li Procédé et système de multiplexage par répartition en code
CN101324926A (zh) * 2008-07-25 2008-12-17 重庆大学 一种面向复杂模式分类的特征选择方法
CN102970707A (zh) * 2012-12-20 2013-03-13 李惠 基于压缩感知的无线传输数据丢失恢复方法
CN110019943A (zh) * 2017-09-11 2019-07-16 ***通信集团浙江有限公司 视频推荐方法、装置、电子设备和存储介质
CN111382307A (zh) * 2018-12-27 2020-07-07 深圳Tcl新技术有限公司 一种基于深度神经网络的视频推荐方法、***及存储介质
CN110012356A (zh) * 2019-04-16 2019-07-12 腾讯科技(深圳)有限公司 视频推荐方法、装置和设备及计算机存储介质
CN110650340A (zh) * 2019-04-25 2020-01-03 长沙理工大学 一种时空复用的压缩视频成像方法
WO2020224219A1 (zh) * 2019-05-06 2020-11-12 平安科技(深圳)有限公司 中文分词方法、装置、电子设备及可读存储介质
CN110555132A (zh) * 2019-08-13 2019-12-10 北京工业大学 一种基于注意力模型的降噪自编码器推荐方法
WO2021042826A1 (zh) * 2019-09-05 2021-03-11 苏宁云计算有限公司 一种视频播放完整度预测方法及装置
CN111782934A (zh) * 2020-05-11 2020-10-16 中山大学新华学院 一种缓解数据稀疏性的电影推荐***和方法
CN112883070A (zh) * 2021-01-22 2021-06-01 东北大学 一种带有差分隐私的生成式对抗网络推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Recommendation System Based on Deep Learning;Tianhan Gao 等;International Conference on Broadband and Wireless Computing, Communication and Applications;535–543 *

Also Published As

Publication number Publication date
CN113220936A (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
Wen et al. Generalized incomplete multiview clustering with flexible locality structure diffusion
Zhang et al. Vector of locally and adaptively aggregated descriptors for image feature representation
Wang et al. Weakly supervised patchnets: Describing and aggregating local patches for scene recognition
Zhang et al. Learning object-to-class kernels for scene classification
US11288324B2 (en) Chart question answering
Yu et al. Learning image representations from the pixel level via hierarchical sparse coding
CN111133453B (zh) 人工神经网络
Huang et al. Object-location-aware hashing for multi-label image retrieval via automatic mask learning
CN113220936B (zh) 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质
Champ et al. A comparative study of fine-grained classification methods in the context of the LifeCLEF plant identification challenge 2015
CN112749274B (zh) 基于注意力机制和干扰词删除的中文文本分类方法
CN111626340B (zh) 一种分类方法、装置、终端及计算机存储介质
Chadha et al. Voronoi-based compact image descriptors: Efficient region-of-interest retrieval with VLAD and deep-learning-based descriptors
CN117529755A (zh) 图像识别***中的迁移学习
CN112836702B (zh) 一种基于多尺度特征提取的文本识别方法
Rahman et al. Dtcth: a discriminative local pattern descriptor for image classification
CN111444390A (zh) 一种基于Spark和深度哈希的视频并行检索方法
CN115204301A (zh) 视频文本匹配模型训练、视频文本匹配方法和装置
Mo et al. Class-incremental grouping network for continual audio-visual learning
Peng et al. Swin transformer-based supervised hashing
Yu et al. A novel discriminative dictionary pair learning constrained by ordinal locality for mixed frequency data classification
Ke et al. Quasi non-negative quaternion matrix factorization with application to color face recognition
Jia et al. Theme-aware aesthetic distribution prediction with full-resolution photographs
Bibi et al. Deep features optimization based on a transfer learning, genetic algorithm, and extreme learning machine for robust content-based image retrieval
CN114398980A (zh) 跨模态哈希模型的训练方法、编码方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant