CN104636486A - 一种基于非负交替方向变换的用户特征抽取方法及抽取装置 - Google Patents

一种基于非负交替方向变换的用户特征抽取方法及抽取装置 Download PDF

Info

Publication number
CN104636486A
CN104636486A CN201510087359.1A CN201510087359A CN104636486A CN 104636486 A CN104636486 A CN 104636486A CN 201510087359 A CN201510087359 A CN 201510087359A CN 104636486 A CN104636486 A CN 104636486A
Authority
CN
China
Prior art keywords
matrix
user
sigma
gamma
user characteristics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510087359.1A
Other languages
English (en)
Other versions
CN104636486B (zh
Inventor
罗辛
夏云霓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Wanjiaan Interconnected Technology Co ltd
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201510087359.1A priority Critical patent/CN104636486B/zh
Publication of CN104636486A publication Critical patent/CN104636486A/zh
Application granted granted Critical
Publication of CN104636486B publication Critical patent/CN104636486B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明提出了一种基于非负交替方向变换的用户特征抽取方法及抽取装置。抽取装置,包括数据接收模块、数据存储模块和执行模块,其中,所述数据接收模块与数据存储模块连接,数据接收模块用于接收服务器采集的用户行为统计数据,并将所接收的服务器采集的用户行为统计数据传递给数据存储模块进行存储,所述数据存储模块与执行模块相连接,执行模块执行服务器发送的进行用户特征抽取的指令,并将抽取的用户特征数据存入数据存储模块中。本发明直接作用于用户行为统计矩阵中的已知数据集合,能够处理具备大量缺失值的、极端稀疏的用户行为统计矩阵,收敛速度快,数据还原准确度高,能够解决大数据处理环境中的用户特征抽取问题。

Description

一种基于非负交替方向变换的用户特征抽取方法及抽取装置
技术领域
本发明涉及计算机大数据处理技术领域,特别涉及电子商务***中一种基于非负交替方向变换的用户特征抽取方法及抽取装置。
背景技术
现代大型电子商务***,其用户数量和信息数量十分巨大。此类***中,用户的各种客观行为,如点击、浏览、评论、搜索等等,随***运营时间累积,汇集成为庞大的用户历史行为数据集,数据量至少在TB量级,为典型的大数据环境。
在大型电子商务***中,一种典型的数据描述结构是用户行为统计矩阵,其中的每一行对应一个用户,每一列对应于一个项目;项目指***中任何可能由用户操作的客观物体,如新闻、图片、商品;每个矩阵元素对应单个用户对单个项目的历史行为数据,该数据是使用该用户对该项目的客观历史行为数据,利用符合自然规律的数学统计方法进行量化计算构成。大型电子商务***中,用户和项目数量十分巨大,对应用户行为统计矩阵也十分巨大。同时,一个用户不可能操作所有的项目,一个项目也不可能被所有的用户操作;一般而言,用户行为统计矩阵中的已知数据远少于未知数据,是极端稀疏的。
***运营过程中,基于用户行为统计矩阵中的已知数据,从中抽取用户特征,可对用户的行为进行有效的分析,从中挖掘包括用户类别、行为模式等规律。在用户特征的抽取过程中,保持用户特征的非负性,是一个关键,这是因为非负的用户特征更加符合电子商务***中用户行为数据为正数的自然规律,能更好地对用户行为进行表征。现有非负特征抽取技术多用于计算机视觉领域,其基本特点是对于给定的图形或者图像,将其视为一个满秩矩阵,并对其进行非负条件限制下的矩阵因式分解,从而抽取出该图形或图像的局部物体特征。但是,电子商务***中的用户特征抽取问题,与计算机视觉中的非负物体特征抽取问题,具备很大区别。这是因为计算机视觉中的非负物体特征抽取所处理的图形、图像所转化的矩阵是满秩矩阵,不具备缺失值,此类矩阵的非负矩阵因式分解问题可以借助常规的矩阵迭代运算进行处理;但电子商务***中的非负用户行为抽取问题,所处理的用户行为统计矩阵,通常情况下是极端稀疏的,其中具备大量的缺失值,无法使用传统的矩阵因式分解处理,而需要用能作用于稀疏矩阵的非负隐特征分析处理。但是,现有非负矩阵隐特征分析方法,具备收敛速度慢、数据还原准确度低的缺点。
因此,如何针对大型电子商务***中的、具备大量缺失值的用户行为统计矩阵,进行收敛速度快、数据还原准确度高的非负隐特征分析,从而获取能够良好描述用户行为自然规律的用户特征,是对现代大型电子商务***所产生的海量数据进行分析所需要处理的一个关键问题。
发明内容
为了克服上述现有技术中存在的缺陷,本发明的目的是提供一种基于非负交替方向变换的用户特征抽取方法及抽取装置,本发明直接作用于用户行为统计矩阵中的已知数据集合,能够处理具备大量缺失值的、极端稀疏的用户行为统计矩阵,收敛速度快,数据还原准确度高,能够解决大数据处理环境中的用户特征抽取问题。
为了实现本发明的上述目的,本发明提供了一种基于非负交替方向变换的用户特征抽取方法,包括以下步骤:
S1.服务器对抽取装置发出进行用户特征抽取的指令;
S2.抽取装置接收指令并初始化参数,初始化参数包括:特征空间维数f、对偶学习速率η、拉格朗日增强因子λ、用户特征矩阵X、用户训练辅助矩阵X_U、X_D和X_C、项目特征矩阵Y、项目训练辅助矩阵Y_U、Y_D和Y_C、迭代控制变量t、迭代上限n、收敛判定阈值
S3.抽取装置构造累积绝对误差ε(P,Q,X,Y),其中P为用户特征约束矩阵,Q为项目特征约束矩阵;
S4.抽取装置使用约束条件对累积绝对误差ε(P,Q,X,Y)进行约束,保证矩阵P、Q的参数在训练过程中的非负性;
S5.抽取装置构造统一损失函数L(P,Q,X,Y,Γ,Κ),其中Γ和Κ均为对偶参数;
S6.抽取装置判断迭代训练控制变量t是否已达到上限n,若是,则执行步骤S9,若否,则执行步骤S7;
S7.抽取装置判断统一损失函数L相对于P,Q,X,Y,Γ和Κ是否在用户行为统计矩阵中的已知数据集合C上收敛,若是,则执行步骤S9,若否,则执行步骤S8;
S8.抽取装置在用户行为统计矩阵中的已知数据集合C中的已知数据上对P,Q,X,Y,Γ和Κ进行迭代训练,再执行步骤S6;
S9.抽取装置将通过迭代训练获取的用户特征矩阵X和项目特征矩阵Y输出,存储至数据模块中的获取特征存储单元。
本方法中,步骤S2中特征空间维数f为用户特征所处特征空间的维度,决定特征向量的维数,为正实数集合内的任意正整数。
对偶学习速率η为统一损失函数中,对拉格朗日乘子进行训练的学习速率,为区间(0.0001,0.05)内的浮点数。
拉格朗日增强因子λ为统一损失函数中,对约束条件进行规约表达的因数,为区间(0.01,0.1)内的任意小数。
用户特征矩阵X为需要抽取的特征,是一个|A|×f的矩阵,其中A代表装置的存储单元所存储的用户集合。X的每一行对应一个用户,X的每一行向量是一个用户的特征向量。本发明实施例中,用户特征矩阵X中每个元素的初始值设置为开区间(0.4,0.8)范围内的随机数。
用户训练辅助矩阵X_U、X_D和X_C为用以辅助迭代训练用户特征的数据结构,均为|A|×f的矩阵。
项目特征矩阵Y为需要抽取的特征,是一个|B|×f的矩阵,其中B代表装置的存储单元所存储的项目集合。Y的每一行对应一个项目,Y的每一行向量是全部用户对一个项目进行操作的特征向量。
项目训练辅助矩阵Y_U、Y_D和Y_C为用以辅助迭代训练用户特征的数据结构,均为|B|×f的矩阵。
迭代控制变量t为控制特征训练过程的变量,迭代控制变量t初始化为0。
迭代上限n为控制训练过程迭代上限的变量,为正实数集合内的任意正整数。
收敛判定阈值为判断迭代训练是否已收敛的阈值参数。
本方法直接作用于用户行为统计矩阵中的已知数据集合,能够处理具备大量缺失值的、极端稀疏的用户行为统计矩阵,收敛速度快,数据还原准确度高,能够处理大数据处理环境中的用户特征抽取问题。
优选的,步骤S3中所述绝对误差的计算公式为:
ϵ ( P , Q , X , Y ) = Σ ( u , i ) ∈ C ( r u , i - Σ k = 1 f x u , k y i , k ) 2 ,
s.t.P=X,P≥0,
Q=Y,Q≥0.
其中,C表示用户行为统计矩阵中的已知数据集合;ru,i表示用户行为统计矩阵中第u行,第i列的元素值,代表用户u在项目i上的历史行为统计数据;xu,k表示用户特征矩阵X的第u行,第k列元素;yi,k表示项目特征矩阵Y的第i行,第k列元素;P为用户特征约束矩阵,Q为项目特征约束矩阵。
步骤S3构造累积绝对误ε(P,Q,X,Y)对误差和非负性约束进行充分的表述,同时,对引入对偶参数提供了条件。
步骤S4使用约束条件对累积绝对误差ε(P,Q,X,Y)进行约束,保证相关模型参数在训练过程中的非负性。
步骤S5构造统一损失函数是通过使用拉格朗日乘子法对损失函数和相关约束条件进行统一,从而在训练过程中满足约束条件的约束。
优选的,步骤S4包括以下步骤:
S4-1.对于P中每一元素pu,k,如其不等于X中对应元素xu,k,则令pu,k=xu,k
S4-2.对于Q中每一元素qi,k,如其不等于Y中对应元素yi,k,则令qi,k=yi,k
S4-3.对于P中每一元素pu,k,如其小于0,则令pu,k=0;
S4-4.对于Q中每一元素qi,k,如其小于0,则令qi,k=0。
其中,pu,k表示用户特征约束矩阵P中第u行,第k列元素,qi,k表示项目特征约束矩阵中第i行,第k列元素。
优选的,步骤S5中所述损失函数计算公式为:
L ( P , Q , X , Y , Γ , K ) = 1 2 Σ ( u , i ) ∈ C ( r u , i - Σ k = 1 f x u , k y i , k ) 2 + Σ ( u , k ) γ u , k ( x u , k - p u , k ) + Σ ( i , k ) κ i , k ( y i , k - q i , k ) + ρ 2 Σ ( u , k ) ( x u , k - p u , k ) 2 + τ 2 Σ ( i , k ) ( y i , k - q i , k ) 2 ,
其中Γ和Κ均为对偶参数,γu,k表示Γ中第u行,第k列元素,κi,k表示K中第i行,第k列元素,该公式采用的是规约拉格朗日乘子法(augmented lagrangian),规约拉格朗日乘子法(augmented lagrangian)是在拉格朗日乘子法的基础上加入了对应限制条件的规约项,规约项为ρ是规约拉格朗日乘子法的规约参数,该参数参应于矩阵X,计算中是一个常量。
优选的,步骤S8中的迭代训练包括以下步骤:
S8-1.确定迭代训练目标,即全部参数P,Q,X,Y,Γ和Κ,使其满足统一损失函数L相对于P,Q,X,Y,Γ和Κ在用户行为统计矩阵中的已知数据集合C上最小,表示为公式:
arg min P , Q , X , Y , Γ , K L = 1 2 Σ ( u , i ) ∈ C ( r u , i - Σ k = 1 f x u , k y i , k ) 2 + Σ ( u , k ) γ u , k ( x u , k - p u , k ) + Σ ( i , k ) κ i , k ( y i , k - q i , k ) + ρ 2 Σ ( u , k ) ( x u , k - p u , k ) 2 + τ 2 Σ ( i , k ) ( y i , k - q i , k ) 2 ;
τ是规约拉格朗日乘子法的规约参数,为规约项,该参数参应于矩阵Y,计算中是一个常量。
S8-2.使用非负方向交替变换,对P,Q,X,Y,Γ和Κ中的单一元素进行顺序训练,训练规则表示为公式:
for k=1~f,
X . , k t + 1 : = arg min X . , k L ( P t , Q t , X . , 1 ~ k - 1 t + 1 , X . , k , X . , k + 1 ~ f t , Y . , 1 ~ k - 1 t + 1 , Y . , k ~ f t , Γ t , K t ) Y . , k t + 1 : = arg min Y . , k L ( P t , Q t , X . , 1 ~ k - 1 t + 1 , X . , k ~ f t , Y . , 1 ~ k - 1 t + 1 , Y . , k , Y . , k + 1 ~ f t , Γ t , K t ) ;
P t + 1 = arg min P L ( P , Q t , X t + 1 , Y t + 1 , Γ t , K t ) Q t + 1 = arg min Q L ( P t , Q , X t + 1 , Y t + 1 , Γ t , K t ) Γ t + 1 = Γ t + η ▿ Γ L ( P t + 1 , Q t + 1 , X t + 1 , Y t + 1 , Γ , K t ) K t + 1 = K t + η ▿ K L ( P t + 1 , Q t + 1 , X t + 1 , Y t + 1 , Γ t , K )
S8-3、对于P,Q,X,Y,Γ和Κ中的每个元素,按照如下公式对其进行
ρu=λ|C(u)|,τi=λ|C(i)|;
训练更新, x u , k = Σ i ∈ C ( u ) y i , k ( r u , i - Σ j = 1 , j ≠ k f x u , j y i , j ) + ρ u p u , k - γ u , k Σ i ∈ C ( u ) y i , k 2 + ρ u , y i , k = Σ u ∈ C ( i ) x u , k ( r u , i - Σ j = 1 , j ≠ k f x u , j y i , j ) + τ i q k , i - κ i , k Σ u ∈ C ( i ) x u , k 2 + τ i , p u , k = max ( 0 , x u , k + γ u , k ρ u ) , q i , k = max ( 0 , y i , k + κ i , k τ i ) , γ u , k = γ u , k + η ρ u ( x u , k - p u , k ) , κ i , k = κ i , k + η τ i ( y i , k - q i , k ) . , 其中,C(u)和C(i)分别表示已知数据集合C中,与用户u和项目i相关联的子集,τi中τ是规约拉格朗日乘子法的规约参数,该参数参应于矩阵Y,i对应于Y的第i行。
本发明还提出一种基于非负交替方向变换的用户特征抽取方法的抽取装置,包括数据接收模块、数据存储模块和执行模块,其中,所述数据接收模块与数据存储模块连接,数据接收模块用于接收服务器采集的用户行为统计数据,并将所接收的服务器采集的用户行为统计数据传递给数据存储模块进行存储,所述数据存储模块与执行模块相连接,执行模块执行服务器发送的进行用户特征抽取的指令,并将抽取的用户特征数据存入数据存储模块中。
用数据接收模块采集服务器的用户行为统计数据,用执行模块执行用户特征抽取的指令,数据存储模块对数据接收模块采集的服务器的用户行为统计数据和执行模块抽取的用户特征数据进行存储。本装置可直接作用于用户行为统计矩阵中的已知数据集合,能够处理具备大量缺失值的、极端稀疏的用户行为统计矩阵,能够解决大数据处理环境中的用户特征抽取问题。
进一步的,所述数据存储模块包括获取特征存储单元和统计数据存储单元,所述获取特征存储单元与所述执行模块连接,用于存储执行模块抽取的用户特征数据;所述统计数据存储单元与所述数据接收模块连接,用于存储数据接收模块传递的用户行为统计数据。
对数据接收模块采集的服务器的用户行为统计数据和执行模块抽取的用户特征数据进行分单元存储,在调取数据时能更加方便、准确和快捷。
进一步的,所述执行模块包括初始化单元,训练单元和输出单元,
所述初始化单元对用户特征抽取过程所依赖的参数进行初始化,初始化参数包括:特征空间维数f、对偶学习速率η、拉格朗日增强因子λ、用户特征矩阵X、用户训练辅助矩阵X_U、X_D和X_C、项目特征矩阵Y、项目训练辅助矩阵Y_U、Y_D和Y_C、迭代控制变量t、迭代上限n、收敛判定阈值
所述训练单元输入端分别与初始化单元和数据存储模块连接,根据初始化单元初始化的参数和数据存储模块中的用户行为统计数据构造用户特征数据,包括用户特征矩阵X和项目特征矩阵Y,训练单元首先构造累积绝对误差ε(P,Q,X,Y),其中P为用户特征约束矩阵,Q为项目特征约束矩阵,再构造统一损失函数L(P,Q,X,Y,Γ,K),其中Γ和Κ均为对偶参数,然后对P,Q,X,Y,Γ和Κ进行迭代训练,直至统一损失函数L(P,Q,X,Y,Γ,K)相对于P,Q,X,Y,Γ和Κ在用户行为统计矩阵中的已知数据集合C上收敛,或者迭代控制变量t等于迭代上限n;
所述输出单元输入端与训练单元输出端连接,输出单元输出端与数据存储模块相连接,所述输出单元将训练单元构造的用户特征数据输出并存储到数据存储模块中。
把执行模块划分为三个单元,使得在抽取的用户特征数据时,对参数的初始化、数据的抽取和存储能更加准确快捷。
本发明的有益效果是:本方法旨在通过非负交替方向变换,直接作用于用户行为统计矩阵中的已知数据集合,有以下优点:
1、能够处理具备大量缺失值的、极端稀疏的用户行为统计矩阵;
2、收敛速度快,数据还原准确度高,能够解决大数据处理环境中的用户特征抽取问题。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明结构示意图;
图2是本发明流程示意图;
图3为应用本发明实施例前后,对用户特征进行抽取的收敛速度对比图;
图4为应用本发明实施例前后,对用户特征进行抽取的数据还原准确度对比图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
如图1所示,本发明提供了一种基于非负交替方向变换的用户特征抽取方法,包括以下步骤:
S1.服务器对抽取装置发出进行用户特征抽取的指令;
S2.抽取装置接收指令并初始化参数,初始化参数包括:特征空间维数f、对偶学习速率η、拉格朗日增强因子λ、用户特征矩阵X、用户训练辅助矩阵X_U、X_D和X_C、项目特征矩阵Y、项目训练辅助矩阵Y_U、Y_D和Y_C、迭代控制变量t、迭代上限n、收敛判定阈值
其中,特征空间维数f为用户特征所处特征空间的维度,决定特征向量的维数,为正实数集合内的任意正整数,如25。
对偶学习速率η为统一损失函数中,对拉格朗日乘子进行训练的学习速率,为区间(0.0001,0.05)内的浮点数,如0.001。
拉格朗日增强因子λ为统一损失函数中,对约束条件进行规约表达的因数,为区间(0.01,0.1)内的任意小数,如0.05。
用户特征矩阵X为需要抽取的特征,是一个|A|×f的矩阵,其中A代表装置的存储单元所存储的用户集合。X的每一行对应一个用户,X的每一行向量是一个用户的特征向量。本发明实施例中,用户特征矩阵X中每个元素的初始值设置为开区间(0.4,0.8)范围内的随机数,如0.47。
用户训练辅助矩阵X_U、X_D和X_C为用以辅助迭代训练用户特征的数据结构,均为|A|×f的矩阵,其中,X_U用于缓存X矩阵在训练过程中的初始值、X_D用于缓存X矩阵在训练过程中的目标值,X_C用于缓存X矩阵在训练过程中的更新值。本发明实施例中,X_U、X_D和X_C中每个元素的初始化为0。
项目特征矩阵Y为需要抽取的特征,是一个|B|×f的矩阵,其中B代表装置的存储单元所存储的项目集合。Y的每一行对应一个项目,Y的每一行向量是全部用户对一个项目进行操作的特征向量。
项目训练辅助矩阵Y_U、Y_D和Y_C为用以辅助迭代训练用户特征的数据结构,均为|B|×f的矩阵,其中,Y_U用于缓存Y矩阵在训练过程中的初始值、Y_D用于缓存Y矩阵在训练过程中的目标值,Y_C用于缓存Y矩阵在训练过程中的更新值。本发明实施例中,Y_U、Y_D和Y_C中每个元素的初始化为0。
迭代控制变量t为控制特征训练过程的变量,迭代控制变量t初始化为0。
迭代上限n为控制训练过程迭代上限的变量,为正实数集合内的任意正整数,如500。
收敛判定阈值为判断迭代训练是否已收敛的阈值参数。本发明实施例中,设置为开区间(0,0.001)内的任意小数,如0.0001。
S3.抽取装置构造累积绝对误差ε(P,Q,X,Y),其中P为用户特征约束矩阵,Q为项目特征约束矩阵;
本步骤中所述绝对误差的计算公式为:
ϵ ( P , Q , X , Y ) = Σ ( u , i ) ∈ C ( r u , i - Σ k = 1 f x u , k y i , k ) 2 ,
s.t.P=X,P≥0,
Q=Y,Q≥0.
其中,C表示用户行为统计矩阵中的已知数据集合;ru,i表示用户行为统计矩阵中第u行,第i列的元素值,代表用户u在项目i上的历史行为统计数据;xu,k表示用户特征矩阵X的第u行,第k列元素;yi,k表示项目特征矩阵Y的第i行,第k列元素;P为用户特征约束矩阵,Q为项目特征约束矩阵。
S4.抽取装置使用约束条件对累积绝对误差ε(P,Q,X,Y)进行约束,P=X,P≥0,Q=Y,Q≥0均为约束条件。
S5.抽取装置构造统一损失函数L(P,Q,X,Y,Γ,Κ),其中Γ和Κ均为对偶参数;
本步骤中所述损失函数计算公式为:
L ( P , Q , X , Y , Γ , K ) = 1 2 Σ ( u , i ) ∈ C ( r u , i - Σ k = 1 f x u , k y i , k ) 2 + Σ ( u , k ) γ u , k ( x u , k - p u , k ) + Σ ( i , k ) κ i , k ( y i , k - q i , k ) + ρ 2 Σ ( u , k ) ( x u , k - p u , k ) 2 + τ 2 Σ ( i , k ) ( y i , k - q i , k ) 2 .
S6.抽取装置判断迭代训练控制变量t是否已达到上限n,
若已达上限,则执行步骤S9:抽取装置将通过迭代训练获取的用户特征矩阵X和项目特征矩阵Y输出,存储至数据模块中的获取特征存储单元,完成对用户特征的抽取;
若没有达到上限,则执行步骤S7;
本步骤中,抽取装置首先在迭代控制变量t上累加1,然后判断迭代控制变量t是否大于迭代上限n。
S7.抽取装置判断统一损失函数L相对于P,Q,X,Y,Γ和Κ是否在用户行为统计矩阵中的已知数据集合C上收敛,
若是,则执行步骤S9:抽取装置将通过迭代训练获取的用户特征矩阵X和项目特征矩阵Y输出,存储至数据模块中的获取特征存储单元,完成对用户特征的抽取;
若否,则执行步骤S8;
本步骤中,用户特征抽取装置判断统一损失函数L相对于用户特征矩阵X、项目特征矩阵Y、用户特征在用户行为统计矩阵中的已知数据集合C上是否已收敛的依据为,本轮迭代训练开始前,统一损失函数L的数值,对比上轮迭代训练开始前,统一损失函数L的数值,其差的绝对值是否小于收敛判定阈值如果小于,则判定为已收敛,反之亦然。
S8.抽取装置在用户行为统计矩阵中的已知数据集合C中的已知数据上对P,Q,X,Y,Γ和Κ进行迭代训练,再执行步骤S6,如此循环,直至完成步骤S9抽取装置将通过迭代训练获取的用户特征矩阵X和项目特征矩阵Y输出,存储至数据模块中的获取特征存储单元,完成对用户特征的抽取。
作为本实施例的优选方案,步骤S4包括以下步骤:
S4-1.对于P中每一元素pu,k,如其不等于X中对应元素xu,k,则令pu,k=xu,k
S4-2.对于Q中每一元素qi,k,如其不等于Y中对应元素yi,k,则令qi,k=yi,k
S4-3.对于P中每一元素pu,k,如其小于0,则令pu,k=0;
S4-4.对于Q中每一元素qi,k,如其小于0,则令qi,k=0。
其中,pu,k表示用户特征约束矩阵P中第u行,第k列元素;xu,k表示用户特征矩阵X中第u行,第k列元素;qi,k表示项目特征约束矩阵Q中第i行,第k列元素;yi,k表示项目特征矩阵Y第i行,第k列元素。
步骤S8中的迭代训练包括以下步骤:
S8-1.确定迭代训练目标,即全部参数P,Q,X,Y,Γ和Κ,对参数P,Q,X,Y,Γ和Κ进行求解,使其满足统一损失函数L相对于P,Q,X,Y,Γ和Κ在用户行为统计矩阵中的已知数据集合C上最小,表示为公式:
arg min P , Q , X , Y , Γ , K L = 1 2 Σ ( u , i ) ∈ C ( r u , i - Σ k = 1 f x u , k y i , k ) 2 + Σ ( u , k ) γ u , k ( x u , k - p u , k ) + Σ ( i , k ) κ i , k ( y i , k - q i , k ) + ρ 2 Σ ( u , k ) ( x u , k - p u , k ) 2 + τ 2 Σ ( i , k ) ( y i , k - q i , k ) 2 ;
S8-2.使用非负方向交替变换,对P,Q,X,Y,Γ和Κ中的单一元素进行顺序训练,训练规则表示为公式:
for k=1~f,
X . , k t + 1 : = arg min X . , k L ( P t , Q t , X . , 1 ~ k - 1 t + 1 , X . , k , X . , k + 1 ~ f t , Y . , 1 ~ k - 1 t + 1 , Y . , k ~ f t , Γ t , K t ) Y . , k t + 1 : = arg min Y . , k L ( P t , Q t , X . , 1 ~ k - 1 t + 1 , X . , k ~ f t , Y . , 1 ~ k - 1 t + 1 , Y . , k , Y . , k + 1 ~ f t , Γ t , K t )
P t + 1 = arg min P L ( P , Q t , X t + 1 , Y t + 1 , Γ t , K t ) Q t + 1 = arg min Q L ( P t , Q , X t + 1 , Y t + 1 , Γ t , K t ) Γ t + 1 = Γ t + η ▿ Γ L ( P t + 1 , Q t + 1 , X t + 1 , Y t + 1 , Γ , K t ) K t + 1 = K t + η ▿ K L ( P t + 1 , Q t + 1 , X t + 1 , Y t + 1 , Γ t , K ) ,
其中,t和t+1分别表示第t轮和第t+1轮迭代。
S8-3、对于P,Q,X,Y,Γ和Κ中的每个元素,按照如下公式对其进行
ρu=λ|C(u)|,τi=λ|C(i)|;
训练更新, x u , k = Σ i ∈ C ( u ) y i , k ( r u , i - Σ j = 1 , j ≠ k f x u , j y i , j ) + ρ u p u , k - γ u , k Σ i ∈ C ( u ) y i , k 2 + ρ u , y i , k = Σ u ∈ C ( i ) x u , k ( r u , i - Σ j = 1 , j ≠ k f x u , j y i , j ) + τ i q k , i - κ i , k Σ u ∈ C ( i ) x u , k 2 + τ i , p u , k = max ( 0 , x u , k + γ u , k ρ u ) , q i , k = max ( 0 , y i , k + κ i , k τ i ) , γ u , k = γ u , k + η ρ u ( x u , k - p u , k ) , κ i , k = κ i , k + η τ i ( y i , k - q i , k ) . ,
其中,C(u)和C(i)分别表示已知数据集合C中,与用户u和项目i相关联的子集。
按照此方法对P,Q,X,Y,Γ和Κ进行迭代训练后,再重复执行步骤S6,如此循环,直至完成对用户特征的抽取。
本发明还提出一种基于非负交替方向变换的用户特征抽取方法的抽取装置,如图2所示,包括数据接收模块、数据存储模块和执行模块,其中,所述数据接收模块与数据存储模块连接,数据接收模块用于接收服务器采集的用户行为统计数据,并将所接收的服务器采集的用户行为统计数据传递给数据存储模块进行存储,所述数据存储模块与执行模块相连接,执行模块执行服务器发送的进行用户特征抽取的指令,并将抽取的用户特征数据存入数据存储模块中。
用数据接收模块采集服务器的用户行为统计数据,用执行模块执行用户特征抽取的指令,数据存储模块对数据接收模块采集的服务器的用户行为统计数据和执行模块抽取的用户特征数据进行存储。本装置可直接作用于用户行为统计矩阵中的已知数据集合,能够处理具备大量缺失值的、极端稀疏的用户行为统计矩阵,能够解决大数据处理环境中的用户特征抽取问题。
本实施例中,所述数据存储模块包括获取特征存储单元和统计数据存储单元,所述获取特征存储单元与所述执行模块连接,用于存储执行模块抽取的用户特征数据;所述统计数据存储单元与所述数据接收模块连接,用于存储数据接收模块传递的用户行为统计数据。
对数据接收模块采集的服务器的用户行为统计数据和执行模块抽取的用户特征数据进行分单元存储,在调取数据时能更加方便、准确和快捷。
作为本实施例的优选方案,所述执行模块包括初始化单元,训练单元和输出单元。
所述初始化单元对用户特征抽取过程所依赖的参数进行初始化,初始化参数包括:特征空间维数f、对偶学习速率η、拉格朗日增强因子λ、用户特征矩阵X、用户训练辅助矩阵X_U、X_D和X_C、项目特征矩阵Y、项目训练辅助矩阵Y_U、Y_D和Y_C、迭代控制变量t、迭代上限n、收敛判定阈值其中,用户特征矩阵X、用户训练辅助矩阵X_U、X_D和X_C是根据当前用户集合A,和当前特征空间维数f,建立的|A|行,|f|列的矩阵;用户特征矩阵X中每个元素的初始值为区间(0.2,0.6)范围内的随机数,用户训练辅助矩阵X_U、X_D和X_C中每个元素的初始值为0。项目特征矩阵Y、项目训练辅助矩阵Y_U、Y_D和Y_C是根据当前项目集合B,和当前特征空间维数f,建立的|B|行,|f|列的矩阵;项目特征矩阵X中每个元素的初始值为区间(0.2,0.6)范围内的随机数,项目训练辅助矩阵Y_U、Y_D和Y_C中每个元素的初始值为0。
所述训练单元输入端分别与初始化单元和数据存储模块连接,根据初始化单元初始化的参数和数据存储模块中的用户行为统计数据构造用户特征数据,包括用户特征矩阵X和项目特征矩阵Y,X中的每一个行向量对应于一个用户的非负行为特征;Y中的每一个行向量对应于已知全部用户对于一个项目的非负操作特征。训练构造用户特征数据进一步包括,训练单元首先构造累积绝对误差ε(P,Q,X,Y),其中P为用户特征约束矩阵,Q为项目特征约束矩阵,再使用增强拉格朗日乘子法构造统一损失函数L(P,Q,X,Y,Γ,K),其中Γ和Κ均为对偶参数,并求解得出相关参数P,Q,X,Y,Γ和Κ,使全局损失函数在用户行为统计矩阵中的已知数据集合C上最小,然后使用非负交替方向变换,对P,Q,X,Y,Γ和Κ进行迭代训练,直至统一损失函数L(P,Q,X,Y,Γ,K)相对于P,Q,X,Y,Γ和Κ在用户行为统计矩阵中的已知数据集合C上收敛,或者迭代控制变量t等于迭代上限n;
所述输出单元输入端与训练单元输出端连接,输出单元输出端与数据存储模块相连接,所述输出单元将训练单元构造的用户特征数据,包括用户特征矩阵X和项目特征矩阵Y,输出并存储到数据存储模块中。
在具体实施中,实例分析使用训练迭代次数作为衡量进行用户特征抽取的收敛速度的指标,训练迭代次数越少,抽取用户特征的收敛速度越快;使用平均绝对误差MAE作为进行用户特征抽取的数据还原准确度的指标,平均绝对误差MAE越低,进行用户特征抽取的数据还原准确度越高。
图3为应用本实施例前后,抽取用户特征的收敛速度对比。应用本发明实施例后,在非负限制下抽取用户特征时,迭代次数有明显下降,收敛速度有明显提高。
图4为应用本实施例前后,抽取用户特征的数据还原准确度对比。应用本发明实施例后,在非负限制下抽取用户特征时,平均绝对误差MAE有明显下降,数据还原准确度有明显提高。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (8)

1.一种基于非负交替方向变换的用户特征抽取方法,其特征在于,包括以下步骤:
S1.服务器对抽取装置发出进行用户特征抽取的指令;
S2.抽取装置接收指令并设置初始化参数,初始化参数包括:特征空间维数f、对偶学习速率η、拉格朗日增强因子λ、用户特征矩阵X、用户训练辅助矩阵X_U、X_D和X_C、项目特征矩阵Y、项目训练辅助矩阵Y_U、Y_D和Y_C、迭代控制变量t、迭代上限n、收敛判定阈值
S3.抽取装置构造累积绝对误差ε(P,Q,X,Y),其中P为用户特征约束矩阵,Q为项目特征约束矩阵;
S4.抽取装置使用约束条件对累积绝对误差ε(P,Q,X,Y)进行约束,保证矩阵P、Q的参数在训练过程中的非负性;
S5.抽取装置构造统一损失函数L(P,Q,X,Y,Γ,Κ),其中Γ和Κ均为对偶参数;
S6.抽取装置判断迭代训练控制变量t是否已达到上限n,若是,则执行步骤S9,若否,则执行步骤S7;
S7.抽取装置判断统一损失函数L相对于P,Q,X,Y,Γ和Κ是否在用户行为统计矩阵中的已知数据集合C上收敛,若是,则执行步骤S9,若否,则执行步骤S8;
S8.抽取装置在用户行为统计矩阵中的已知数据集合C中的已知数据上对P,Q,X,Y,Γ和Κ进行迭代训练,再执行步骤S6;
S9.抽取装置将通过迭代训练获取的用户特征矩阵X和项目特征矩阵Y输出,存储至数据模块中的获取特征存储单元。
2.根据权利要求1所述的基于非负交替方向变换的用户特征抽取方法,其特征在于,步骤S3中所述绝对误差的计算公式为:
ϵ ( P , Q , X , Y ) = Σ ( u , i ) ∈ C ( r u , i - Σ k = 1 f x u , k y i , k ) 2 ,
s.t.P=X,P≥0,
Q=Y,Q≥0.
其中,C表示用户行为统计矩阵中的已知数据集合;ru,i表示用户行为统计矩阵中第u行,第i列的元素值,代表用户u在项目i上的历史行为统计数据;xu,k表示用户特征矩阵X的第u行,第k列元素;yi,k表示项目特征矩阵Y的第i行,第k列元素;P为用户特征约束矩阵,Q为项目特征约束矩阵。
3.根据权利要求1所述的基于非负交替方向变换的用户特征抽取方法,其特征在于,步骤S4包括以下步骤:
S4-1.对于P中每一元素pu,k,如其不等于X中对应元素xu,k,则令pu,k=xu,k
S4-2.对于Q中每一元素qi,k,如其不等于Y中对应元素yi,k,则令qi,k=yi,k
S4-3.对于P中每一元素pu,k,如其小于0,则令pu,k=0;
S4-4.对于Q中每一元素qi,k,如其小于0,则令qi,k=0。
4.根据权利要求1所述的基于非负交替方向变换的用户特征抽取方法,其特征在于,步骤S5中所述损失函数计算公式为:
L ( P , Q , X , Y , Γ , K ) = 1 2 Σ ( u , i ) ∈ C ( r u , i - Σ k = 1 f x u , k y i , k ) 2 + Σ ( u , k ) γ u , k ( x u , k - p u , k ) + Σ ( i , k ) κ i , k ( y i , k - q i , k ) + ρ 2 Σ ( u , k ) ( x u , k - p u , k ) 2 + τ 2 Σ ( i , k ) ( y i , k - q i , k ) 2 ,
其中Γ和Κ均为对偶参数。
5.根据权利要求1所述的基于非负交替方向变换的用户特征抽取方法,其特征在于,步骤S8中的迭代训练包括以下步骤:
S8-1.确定迭代训练目标,即全部参数P,Q,X,Y,Γ和Κ,使其满足统一损失函数L相对于P,Q,X,Y,Γ和Κ在用户行为统计矩阵中的已知数据集合C上最小,表示为公式:
arg min P , Q , X , Y , Γ , K L = 1 2 Σ ( u , i ) ∈ C ( r u , i - Σ k = 1 f x u , k y i , k ) 2 + Σ ( u , k ) γ u , k ( x u , k - p u , k ) + Σ ( i , k ) κ i , k ( y i , k - q i , k ) + ρ 2 Σ ( u , k ) ( x u , k - p u , k ) 2 + τ 2 Σ ( i , k ) ( y i , k - q i , k ) 2 ;
S8-2.使用非负方向交替变换,对P,Q,X,Y,Γ和Κ中的单一元素进行顺序训练,训练规则表示为公式:
for k=1~f,
X . , k t + 1 : = arg min X . , k L ( P t , Q t , X . , 1 ~ k - 1 t + 1 , X . , k , X . , k + 1 ~ f t , Y . , 1 ~ k - 1 t + 1 , Y . , k ~ f t , Γ t , K t ) Y . , k t + 1 : = arg min Y . , k L ( P t , Q t , X . , 1 ~ k - 1 t + 1 , X . , k ~ f t + 1 , Y . , 1 ~ k - 1 t + 1 , Y . , k , Y . , k + 1 ~ f t , Γ t , K t )
P t + 1 = arg min P L ( P , Q t , X t + 1 , Y t + 1 , Γ t , K t ) Q t + 1 = arg min Q L ( P t , Q , X t + 1 , Y t + 1 , Γ t , K t ) Γ t + 1 = Γ t + η ▿ Γ L ( P t + 1 , Q t + 1 , X t + 1 , Y t + 1 , Γ , K t ) K t + 1 = K t + η ▿ K L ( P t + 1 , Q t + 1 , X t + 1 , Y t + 1 , Γ t , K ) ;
S8-3、对于P,Q,X,Y,Γ和Κ中的每个元素,按照如下公式对其进行
ρu=λ|C(u)|,τi=λ|C(i)|;
训练更新, x u , k = Σ i ∈ C ( u ) y i , k ( r u , i - Σ j = 1 , j ≠ k f x u , j y i , j ) + ρ u p u , k - γ u , k Σ i ∈ C ( u ) y i , k 2 + ρ 2 , y i , k = Σ u ∈ C ( i ) x u , k ( r u , i - Σ j = 1 , j ≠ k f x u , j y i , j ) + τ i q k , i - κ i , k Σ u ∈ C ( i ) x u , k 2 + τ i , p u , k = max ( 0 , x u , k + γ u , k ρ u ) , q i , k = max ( 0 , y i , k + κ i , k τ i ) , γ u , k = γ u , k + η ρ u ( x u , k - p u , k ) , κ i , k = κ i , k + η τ i ( y i , k - q i , k ) , , 其中,C(u)和C(i)分别表示已知数据集合C中,与用户u和项目i相关联的子集。
6.一种根据权利要求1-5任意一项所述的基于非负交替方向变换的用户特征抽取方法的抽取装置,其特征在于,包括数据接收模块、数据存储模块和执行模块,其中,
所述数据接收模块与数据存储模块连接,数据接收模块用于接收服务器采集的用户行为统计数据,并将所接收的服务器采集的用户行为统计数据传递给数据存储模块进行存储,
所述数据存储模块与执行模块相连接,执行模块执行服务器发送的进行用户特征抽取的指令,并将抽取的用户特征数据存入数据存储模块中。
7.根据权利要求6所述的基于非负交替方向变换的用户特征抽取方法的抽取装置,其特征在于,所述数据存储模块包括获取特征存储单元和统计数据存储单元,
所述获取特征存储单元与所述执行模块连接,用于存储执行模块抽取的用户特征数据;
所述统计数据存储单元与所述数据接收模块连接,用于存储数据接收模块传递的用户行为统计数据。
8.根据权利要求6所述的基于非负交替方向交换的用户特征抽取方法的抽取装置,其特征在于,所述执行模块包括初始化单元,训练单元和输出单元,
所述初始化单元对用户特征抽取过程所依赖的参数进行初始化,初始化参数包括:特征空间维数f、对偶学习速率η、拉格朗日增强因子λ、用户特征矩阵X、用户训练辅助矩阵X_U、X_D和X_C、项目特征矩阵Y、项目训练辅助矩阵Y_U、Y_D和Y_C、迭代控制变量t、迭代上限n、收敛判定阈值
所述训练单元输入端分别与初始化单元和数据存储模块连接,根据初始化单元初始化的参数和数据存储模块中的用户行为统计数据构造用户特征数据,包括用户特征矩阵X和项目特征矩阵Y,训练单元首先构造累积绝对误差ε(P,Q,X,Y),其中P为用户特征约束矩阵,Q为项目特征约束矩阵,再构造统一损失函数L(P,Q,X,Y,Γ,K),其中Γ和Κ均为对偶参数,然后对P,Q,X,Y,Γ和Κ进行迭代训练,直至统一损失函数L(P,Q,X,Y,Γ,K)相对于P,Q,X,Y,Γ和Κ在用户行为统计矩阵中的已知数据集合C上收敛,或者迭代控制变量t等于迭代上限n;
所述输出单元输入端与训练单元输出端连接,输出单元输出端与数据存储模块相连接,所述输出单元将训练单元构造的用户特征数据输出并存储到数据存储模块中。
CN201510087359.1A 2015-02-25 2015-02-25 一种基于非负交替方向变换的用户特征抽取方法及抽取装置 Active CN104636486B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510087359.1A CN104636486B (zh) 2015-02-25 2015-02-25 一种基于非负交替方向变换的用户特征抽取方法及抽取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510087359.1A CN104636486B (zh) 2015-02-25 2015-02-25 一种基于非负交替方向变换的用户特征抽取方法及抽取装置

Publications (2)

Publication Number Publication Date
CN104636486A true CN104636486A (zh) 2015-05-20
CN104636486B CN104636486B (zh) 2018-01-02

Family

ID=53215232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510087359.1A Active CN104636486B (zh) 2015-02-25 2015-02-25 一种基于非负交替方向变换的用户特征抽取方法及抽取装置

Country Status (1)

Country Link
CN (1) CN104636486B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069741A (zh) * 2015-09-07 2015-11-18 深圳市万佳安物联科技股份有限公司 一种损坏图像非负隐特征提取装置和方法
CN105262612A (zh) * 2015-09-07 2016-01-20 重庆大学 一种云计算***节点失效预警装置和方法
CN107704830A (zh) * 2017-10-09 2018-02-16 中国科学院重庆绿色智能技术研究院 一种视频数据多维非负隐特征的提取装置和方法
CN108498089A (zh) * 2018-05-08 2018-09-07 北京邮电大学 一种基于深度神经网络的无创连续血压测量方法
CN111563203A (zh) * 2020-05-08 2020-08-21 深圳市万佳安人工智能数据技术有限公司 一种基于快速非负隐特征分析的智能家居用户-服务兴趣度个性化预测装置和预测方法
CN112037849A (zh) * 2020-09-04 2020-12-04 中国科学院重庆绿色智能技术研究院 基于交替方向乘子法的蛋白质间相互作用预测装置和方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
XIN LUO 等: "《An Efficient Non-Negative Matrix-Factorization-Based Approach to Collaborative Filtering for Recommender Systems》", 《IEEE TRANSACTIONS ON INDUSTRIAL INFORMATIONS》 *
王科俊,左春婷: "《非负矩阵分解特征提取技术的研究进展》", 《计算机应用研究》 *
郭勇,鲍丽春: "《基于非负矩阵分解的特征向量抽取方法特点研究》", 《计算机工程与应用》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069741A (zh) * 2015-09-07 2015-11-18 深圳市万佳安物联科技股份有限公司 一种损坏图像非负隐特征提取装置和方法
CN105262612A (zh) * 2015-09-07 2016-01-20 重庆大学 一种云计算***节点失效预警装置和方法
CN105069741B (zh) * 2015-09-07 2018-01-30 值得看云技术有限公司 一种损坏图像非负隐特征提取装置和方法
CN105262612B (zh) * 2015-09-07 2019-04-12 值得看云技术有限公司 一种云计算***节点失效预警装置和方法
CN107704830A (zh) * 2017-10-09 2018-02-16 中国科学院重庆绿色智能技术研究院 一种视频数据多维非负隐特征的提取装置和方法
CN107704830B (zh) * 2017-10-09 2020-12-08 中国科学院重庆绿色智能技术研究院 一种视频数据多维非负隐特征的提取装置和方法
CN108498089A (zh) * 2018-05-08 2018-09-07 北京邮电大学 一种基于深度神经网络的无创连续血压测量方法
CN108498089B (zh) * 2018-05-08 2022-03-25 北京邮电大学 一种基于深度神经网络的无创连续血压测量方法
CN111563203A (zh) * 2020-05-08 2020-08-21 深圳市万佳安人工智能数据技术有限公司 一种基于快速非负隐特征分析的智能家居用户-服务兴趣度个性化预测装置和预测方法
CN112037849A (zh) * 2020-09-04 2020-12-04 中国科学院重庆绿色智能技术研究院 基于交替方向乘子法的蛋白质间相互作用预测装置和方法
CN112037849B (zh) * 2020-09-04 2021-06-08 中国科学院重庆绿色智能技术研究院 基于交替方向乘子法的蛋白质间相互作用预测装置和方法

Also Published As

Publication number Publication date
CN104636486B (zh) 2018-01-02

Similar Documents

Publication Publication Date Title
Zhang et al. Quantifying total uncertainty in physics-informed neural networks for solving forward and inverse stochastic problems
CN104636486A (zh) 一种基于非负交替方向变换的用户特征抽取方法及抽取装置
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及***
CN108287864B (zh) 一种兴趣群组划分方法、装置、介质及计算设备
CN105893609A (zh) 一种基于加权混合的移动app推荐方法
CN104008203B (zh) 一种融入本体情境的用户兴趣挖掘方法
CN109885756B (zh) 基于cnn和rnn的序列化推荐方法
CN104123377B (zh) 一种微博话题热度预测***及方法
Shang et al. Fuzzy double trace norm minimization for recommendation systems
US11004239B2 (en) Image retrieval device and method, photograph time estimation device and method, repetitive structure extraction device and method, and program
CN105893362A (zh) 获取知识点语义向量的方法、确定相关知识点的方法及***
Shao et al. Clustering on multi-source incomplete data via tensor modeling and factorization
CN116415990B (zh) 一种基于云计算的自助数据分析方法、***及存储介质
CN103095849B (zh) 基于QoS属性预测和纠错的有监督Web服务发现方法及***
CN104469374A (zh) 图像压缩方法
CN110674642B (zh) 一种用于含噪稀疏文本的语义关系抽取方法
Xu et al. Iterative rank-one matrix completion via singular value decomposition and nuclear norm regularization
Liu et al. A null-space primal-dual interior-point algorithm for nonlinear optimization with nice convergence properties
Hull Machine learning for economics and finance in tensorflow 2
Gartrell et al. Scalable learning and MAP inference for nonsymmetric determinantal point processes
Chen et al. Efficient and differentiable low-rank matrix completion with back propagation
CN114625969A (zh) 一种基于交互近邻会话的推荐方法
Hafen et al. EDA and ML--A Perfect Pair for Large-Scale Data Analysis
Duong et al. Interpretable node embeddings with mincut loss
CN103700011B (zh) 一种特征抽取方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Xu Ming

Inventor after: Luo Xin

Inventor after: Zhang Nengfeng

Inventor after: Yuan Ye

Inventor after: Wu Di

Inventor after: Xia Yunni

Inventor before: Luo Xin

Inventor before: Xia Yunni

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20171204

Address after: DESAY No. 9789 building, 518000 Guangdong city of Shenzhen province Nanshan District Guangdong streets Shennan Road, room 2202

Applicant after: Worth watching cloud Technology Co., Ltd.

Applicant after: Chongqing Institute of Green and Intelligent Technology of the Chinese Academy of Sciences

Address before: 400020 No. 174 Sha Jie street, Shapingba District, Chongqing

Applicant before: Chongqing University

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190718

Address after: Room 2202, Desai Science and Technology Building, 9789 Shennan Avenue, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province, 518000

Patentee after: Worth watching cloud Technology Co., Ltd.

Address before: Room 2202, Desai Science and Technology Building, 9789 Shennan Avenue, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province, 518000

Co-patentee before: Chongqing Institute of Green and Intelligent Technology of the Chinese Academy of Sciences

Patentee before: Worth watching cloud Technology Co., Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210616

Address after: 518109 2-3 / F, No.3 plant, Jinrui Zhonghe hi tech Industrial Park, huawang Road, Dalang street, Longhua New District, Shenzhen City, Guangdong Province

Patentee after: SHENZHEN WANJIAAN INTERCONNECTED TECHNOLOGY Co.,Ltd.

Address before: Room 2202, Desai technology building, 9789 Shennan Avenue, Yuehai street, Nanshan District, Shenzhen, Guangdong 518000

Patentee before: Worth watching cloud Technology Co.,Ltd.