CN113342904B - 一种基于企业特征传播的企业服务推荐方法 - Google Patents

一种基于企业特征传播的企业服务推荐方法 Download PDF

Info

Publication number
CN113342904B
CN113342904B CN202110354107.6A CN202110354107A CN113342904B CN 113342904 B CN113342904 B CN 113342904B CN 202110354107 A CN202110354107 A CN 202110354107A CN 113342904 B CN113342904 B CN 113342904B
Authority
CN
China
Prior art keywords
enterprise
service
propagation
tail
enterprises
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110354107.6A
Other languages
English (en)
Other versions
CN113342904A (zh
Inventor
王英龙
张瀚中
舒明雷
周书旺
刘照阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Science and Technology
Shandong Computer Science Center National Super Computing Center in Jinan
Shandong Institute of Artificial Intelligence
Original Assignee
Shandong University of Science and Technology
Shandong Computer Science Center National Super Computing Center in Jinan
Shandong Institute of Artificial Intelligence
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Science and Technology, Shandong Computer Science Center National Super Computing Center in Jinan, Shandong Institute of Artificial Intelligence filed Critical Shandong University of Science and Technology
Priority to CN202110354107.6A priority Critical patent/CN113342904B/zh
Publication of CN113342904A publication Critical patent/CN113342904A/zh
Application granted granted Critical
Publication of CN113342904B publication Critical patent/CN113342904B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于企业特征传播的企业服务推荐方法,利用企业特征间关联的知识图谱,利用目标服务对交互记录中的企业进行特征传播,自动挖掘企业关联路径,刻画出企业之间关联特征,与企业特征结合,利用新的损失函数结合深度学习得到企业与服务的交互概率,能够解决通用框架仅使用交互数据以及基本信息而偏离企业间关系而导致的推荐效果不好等问题,实现对企业的服务方案精准推荐。通过对企业间关系自动挖掘,发现企业间关联路径,及企业特征进行交互预测评分,通过目标服务对交互记录中企业的特征传播以及交互框架,来解决企业对服务方案选择困难的问题。

Description

一种基于企业特征传播的企业服务推荐方法
技术领域
本发明涉及深度学习技术领域,具体涉及一种基于企业特征传播的企业服务推荐方法。
背景技术
随着经济的高速发展、中小微企业成为当前国家发展的重要力量,在改善民生,促进就业,刺激经济等方面有着不可替代的作用,其具有快速变化的业务和不完善的企业服务供给体系,而企业服务对中小微企业的发展起着重要作用。在海量的企业服务面前,难以精准的找到合适的企业服务方案,因此对于企业的服务方案的智能推荐就显得尤为重要。
在以往的推荐***中,主要传统推荐算法得到了广泛应用。随着深度学习的不断发展,其在推荐***中也表现出优越的性能。但在这些推荐算法中,使用了普通的交互信息以及辅助信息,但在企业服务推荐中,难以映射企业所属特征,以及企业间的关联。手动设计企业关联的元路径工作量极大,很难更深的挖掘关联关系,企业复杂的业务需求无法完整的反映,使得无法挖掘企业所需的潜在服务。
发明内容
本发明为了克服以上技术的不足,提供了一种通过对企业建立新结构特征传播模型,自动的通过企业特征知识图谱关系挖掘企业关联,通过一种新的损失函数结合深度学习方法得到较好的推荐结果的方法。
本发明克服其技术问题所采用的技术方案是:
一种基于企业特征传播的企业服务推荐方法,包括如下步骤:
a)获取n个企业经营数据,该数据中每个企业具有企业属性表C、服务属性表S及服务交互记录表R,将n个企业经营数据进行标准化处理;
b)在标准化处理后的数据中根据企业属性表C中的经营状态、所属行业、企业类型、经营范围和业务范围5个类别字段,使相同值进行连接,得到知识图谱<head,e,tail>,其中head为头实体,tail为尾实体,e为头尾实体间关系;
c)在服务交互记录表R中搜索目标预测服务s中包含的交互企业c′,s∈S,c′∈C,将搜索记录添加到目标预测服务s中形成企业交互集合Sets
d)利用知识图谱<head,e,tail>将企业交互集合Sets中企业作为head节点,通过头尾实体间关系e寻找尾实体tail,将寻找到的尾实体tail组成的集合建立第一次传播集合
Figure GDA0003380308040000021
Figure GDA0003380308040000022
作为head节点,通过头尾实体间关系e寻找尾实体,将寻找到的尾实体tail组成的集合建立第二次传播集合
Figure GDA0003380308040000023
重复上述循环,直至将
Figure GDA0003380308040000024
作为head节点,通过头尾实体间关系e寻找尾实体,将寻找到的尾实体tail组成的集合建立第n次传播集合
Figure GDA0003380308040000025
e)随机初始化所有企业的embedding编码和n个转化矩阵r,n为传播次数,embedding编码和转化矩阵r的训练的目标为h×r=t,h为头实体的embedding,t为尾实体的embedding,h、r、t的维度均为d;
f)通过公式wi=hirτco计算相似度权重wi,式中co为目标企业c的embedding编码,hi为传播集合
Figure GDA0003380308040000026
中第i个企业的embedding编码,τ∈{1,...,n},rτ为第τ次传播的转化矩阵,wi的维度为d;
g)通过公式
Figure GDA0003380308040000027
计算目标服务的转换向量aτ,aτ∈Rd,R为实数,d嵌入维度,ci为传播集合
Figure GDA0003380308040000028
中的企业的embedding编码;
h)随机初始化二维合并矩阵T∈Rd×d,通过公式
Figure GDA0003380308040000029
计算目标服务特征向量vτ
i)重复步骤h)直至得到n个企业服务表示向量v1,...,vn
j)通过公式
Figure GDA00033803080400000210
计算目标企业c对目标预测服务s采纳的概率,完成企业特征传播预训练模型的建立;
k)通过公式
Figure GDA00033803080400000211
计算损失函数L,式中
Figure GDA0003380308040000031
为预测值,y为预测企业和服务对应的标签,log为以e为底的对数函数,α∈(0,1),α为权重,
Figure GDA0003380308040000032
为第τ次传播下,传播集合
Figure GDA0003380308040000033
中的第i个企业的embedding编码,
Figure GDA0003380308040000034
为为第τ次传播下,传播集合
Figure GDA0003380308040000035
中的第i个企业对应尾结点的embedding编码;
l)对企业属性表C中企业经营范围关键词使用multi-hot编码,得到编码后的输出结果Ik,对企业属性表C中证照类信息l1,l2,...,lx使用SPSS软件分别进行k-means算法聚类操作,x为企业属性表C中证照类信息中字段的个数,聚类中心k=5,聚类后生成5类标签信息,将5类标签信息使用one-hot编码形式的向量进行拼接,得到证照输入集合Il
m)对企业属性表C中企业风险类信息t1,t2,...,ty使用SPSS软件分别进行k-means算法聚类操作,y为企业属性表C中风险类信息中字段的个数,聚类中心k=5,聚类后生成5类标签信息,将5类标签信息使用one-hot编码形式的向量进行拼接,得到证照输入集合It
n)通过公式
Figure GDA0003380308040000036
计算输入嵌入向量Ic
Figure GDA0003380308040000037
为向量拼接,通过公式
Figure GDA0003380308040000038
计算输入嵌入向量Is,Iside为服务属性表S中目标服务的特征;
o)将向量Ic通过多层MLP转化为d维向量得到企业embedding向量Vc
p)将向量Is通过多层MLP转化为与企业embedding向量Vc相同维度服务embedding向量Vs
q)利用公式
Figure GDA0003380308040000039
得到预测得分
Figure GDA00033803080400000310
完成企业特征传播网络模型的建立,θ为全局变量,T为转置;
i)利用损失函数L使用Adam优化方法对企业特征传播网络模型进行优化;
s)保持优化后的企业特征传播网络模型的参数;
t)将优化后的企业特征传播网络模型的预测得分
Figure GDA0003380308040000041
按大小排序,将得分最高的10个项目推荐给用户。
进一步的,步骤a)中企业属性表C中包含字段有:企业名、经营状态、所属行业、企业类型、经营范围、业务类型、营业执照数量、商标数量、著作权证数量、专利数量、认证数量、到期营业执照数量、到期商标数量、到期著作权证数量、到期专利数量、到期认证数量、企业纳税异常数量,经营异常数量,行政处罚数量,欠税记录数量,股权出资,动产抵押数量;服务属性表S包含字段有:服务编号、服务所属类型、服务价格;服务交互记录表R包含字段有:企业名、服务编号。
进一步的,步骤a)中标准化处理的过程为:将服务交互记录表R中没有的企业和服务在企业属性表C、服务属性表S中进行过滤,对于企业属性表C中的数值型缺失,使用企业属性表C中该字段的平均值差值处理,对于企业属性表C中类别缺失,使用相同所述行业对应该字段的众数补充。
进一步的,步骤b)中特征包括企业的经营状态、所述行业、企业类型、经营范围、业务类型。
进一步的,步骤l)中证照类信息包含字段有:营业执照数量、商标数量、著作权证数量、专利数量、认证数量、到期营业执照数量、到期商标数量、到期著作权证数量、到期专利数量、到期认证数量。
进一步的,步骤m)中企业风险类信息包含字段有:企业纳税异常数量,经营异常数量,行政处罚数量,欠税记录数量,股权出资,动产抵押数量。
本发明的有益效果是:利用企业特征间关联的知识图谱,利用目标服务对交互记录中的企业进行特征传播,自动挖掘企业关联路径,刻画出企业之间关联特征,与企业特征结合,利用新的损失函数结合深度学习得到企业与服务的交互概率,能够解决通用框架仅使用交互数据以及基本信息而偏离企业间关系而导致的推荐效果不好等问题,实现对企业的服务方案精准推荐。通过对企业间关系自动挖掘,发现企业间关联路径,及企业特征进行交互预测评分,通过目标服务对交互记录中企业的特征传播以及交互框架,来解决企业对服务方案选择困难的问题。
附图说明
图1为本发明的深度学习推荐网络框架图。
具体实施方式
下面结合附图1对本发明做进一步说明。
一种基于企业特征传播的企业服务推荐方法,包括如下步骤:
a)获取n个企业经营数据,该数据中每个企业具有企业属性表C、服务属性表S及服务交互记录表R,将n个企业经营数据进行标准化处理。
b)在标准化处理后的数据中根据企业属性表C中的经营状态、所属行业、企业类型、经营范围和业务范围5个类别字段,使相同值进行连接,得到知识图谱<head,e,tail>,其中head为头实体,tail为尾实体,e为头尾实体间关系。
c)在服务交互记录表R中搜索目标预测服务s中包含的交互企业c′,s∈S,c′∈C,将搜索记录添加到目标预测服务s中形成企业交互集合Sets
d)为加强企业特征形式表达,我们使用企业关联传播集合,利用知识图谱<head,e,tail>将企业交互集合Sets中企业作为head节点,通过头尾实体间关系e寻找尾实体tail,将寻找到的尾实体tail组成的集合建立第一次传播集合
Figure GDA0003380308040000051
Figure GDA0003380308040000052
作为head节点,通过头尾实体间关系e寻找尾实体,将寻找到的尾实体tail组成的集合建立第二次传播集合
Figure GDA0003380308040000053
重复上述循环,直至将
Figure GDA0003380308040000054
作为head节点,通过头尾实体间关系e寻找尾实体,将寻找到的尾实体tail组成的集合建立第n次传播集合
Figure GDA0003380308040000055
e)随机初始化所有企业的embedding编码和n个转化矩阵r,n为传播次数,embedding编码和转化矩阵r的训练的目标为h×r=t,h为头实体的embedding,t为尾实体的embedding,h、r、t的维度均为d。
f)通过公式wi=hirτco计算相似度权重wi,式中co为目标企业c的embedding编码,hi为传播集合
Figure GDA0003380308040000056
中第i个企业的embedding编码,τ∈{1,...,n},rτ为第τ次传播的转化矩阵,wi的维度为d。
g)通过公式
Figure GDA0003380308040000061
计算目标服务的转换向量aτ,aτ∈Rd,R为实数,d嵌入维度,ci为传播集合
Figure GDA0003380308040000062
中的企业的embedding编码。
h)随机初始化二维合并矩阵T∈Rd×d,通过公式
Figure GDA0003380308040000063
计算目标服务特征向量vτ
i)重复步骤h)直至得到n个企业服务表示向量v1,...,vn
j)通过公式
Figure GDA0003380308040000064
计算目标企业c对目标预测服务s采纳的概率,完成企业特征传播预训练模型的建立。
k)我们设计了针对于网络的形式的损失函数,加入企业关联影响,使得embedding向量通过转化矩阵表达企业关联更准确,损失函数加入转化损失,由于在不同传播次数下,较远的企业特征转化对损失的影响较小,因此加入了衰减权重,因此通过公式
Figure GDA0003380308040000065
计算损失函数L,式中
Figure GDA0003380308040000066
为预测值,y为预测企业和服务对应的标签,log为以e为底的对数函数,α∈(0,1),α为权重是用来控制传播部分在损失中的权重,利用传播次数根号的倒数
Figure GDA0003380308040000067
作为权重,衰减每次传播的权重。
Figure GDA0003380308040000068
为第τ次传播下,传播集合
Figure GDA0003380308040000069
中的第i个企业的embedding编码,
Figure GDA00033803080400000610
为为第τ次传播下,传播集合
Figure GDA00033803080400000611
中的第i个企业对应尾结点的embedding编码。最终得到预训练后的向量v1,...,vn
l)对企业属性表C中企业经营范围关键词使用multi-hot编码,得到编码后的输出结果Ik,企业属性表中证照类信息字段包括:营业执照数量、商标数量、著作权证数量、专利数量、认证数量、到期营业执照数量、到期商标数量、到期著作权证数量、到期专利数量、到期认证数量。为了进一步表达特征,先使证照数量信息转化成类别信息。对企业属性表C中证照类信息l1,l2,...,lx使用SPSS软件分别进行k-means算法聚类操作,共10类字段,x为企业属性表C中证照类信息中字段的个数,聚类中心k=5,聚类后生成5类标签信息,将5类标签信息使用one-hot编码形式的向量进行拼接,得到证照输入集合Il
m)企业属性表中风险类信息字段包括,企业纳税异常数量,经营异常数量,行政处罚数量,欠税记录数量,股权出资,动产抵押数量。提取每种数量信息,对企业属性表C中企业风险类信息t1,t2,...,ty使用SPSS软件分别进行k-means算法聚类操作,共6类字段,y为企业属性表C中风险类信息中字段的个数,聚类中心k=5,聚类后生成5类标签信息,将5类标签信息使用one-hot编码形式的向量进行拼接,得到证照输入集合It
n)通过公式
Figure GDA0003380308040000071
计算输入嵌入向量Ic
Figure GDA0003380308040000072
为向量拼接,通过公式
Figure GDA0003380308040000073
计算输入嵌入向量Is,Iside为服务属性表S中目标服务的特征;
o)将向量Ic通过多层MLP转化为d维向量得到企业embedding向量Vc
p)将向量Is通过多层MLP转化为与企业embedding向量Vc相同维度服务embedding向量Vs
q)利用公式
Figure GDA0003380308040000074
得到预测得分
Figure GDA0003380308040000075
完成企业特征传播网络模型的建立,θ为全局变量,T为转置。
i)利用损失函数L使用Adam优化方法对企业特征传播网络模型进行优化。优化时利用Dropout防止过拟合,取值0.5。由于业务量有限,数据较为稀疏,为了验证参数稳定性,可以采用7折交叉验证。
s)保持优化后的企业特征传播网络模型的参数。
t)将优化后的企业特征传播网络模型的预测得分
Figure GDA0003380308040000076
按大小排序,将得分最高的10个项目推荐给用户。
利用企业特征间关联的知识图谱,利用目标服务对交互记录中的企业进行特征传播,自动挖掘企业关联路径,刻画出企业之间关联特征,与企业特征结合,利用新的损失函数结合深度学习得到企业与服务的交互概率,能够解决通用框架仅使用交互数据以及基本信息而偏离企业间关系而导致的推荐效果不好等问题,实现对企业的服务方案精准推荐。通过对企业间关系自动挖掘,发现企业间关联路径,及企业特征进行交互预测评分,通过目标服务对交互记录中企业的特征传播以及交互框架,来解决企业对服务方案选择困难的问题。
实施例1:
步骤a)中企业属性表C中包含字段有:企业名、经营状态、所属行业、企业类型、经营范围、业务类型、营业执照数量、商标数量、著作权证数量、专利数量、认证数量、到期营业执照数量、到期商标数量、到期著作权证数量、到期专利数量、到期认证数量、企业纳税异常数量,经营异常数量,行政处罚数量,欠税记录数量,股权出资,动产抵押数量;服务属性表S包含字段有:服务编号、服务所属类型、服务价格;服务交互记录表R包含字段有:企业名、服务编号。
实施例2:
步骤a)中标准化处理的过程为:将服务交互记录表R中没有的企业和服务在企业属性表C、服务属性表S中进行过滤,对于企业属性表C中的数值型缺失,使用企业属性表C中该字段的平均值差值处理,对于企业属性表C中类别缺失,使用相同所述行业对应该字段的众数补充。
实施例3:
步骤b)中特征包括企业的经营状态、所述行业、企业类型、经营范围、业务类型。
实施例4:
步骤l)中证照类信息包含字段有:营业执照数量、商标数量、著作权证数量、专利数量、认证数量、到期营业执照数量、到期商标数量、到期著作权证数量、到期专利数量、到期认证数量。
实施例5:
步骤m)中企业风险类信息包含字段有:企业纳税异常数量,经营异常数量,行政处罚数量,欠税记录数量,股权出资,动产抵押数量。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于企业特征传播的企业服务推荐方法,其特征在于,包括如下步骤:
a)获取n个企业经营数据,该数据中每个企业具有企业属性表C、服务属性表S及服务交互记录表R,将n个企业经营数据进行标准化处理;
b)在标准化处理后的数据中根据企业属性表C中的经营状态、所属行业、企业类型、经营范围和业务范围5个类别字段,使相同值进行连接,得到知识图谱<head,e,tail>,其中head为头实体,tail为尾实体,e为头尾实体间关系;
c)在服务交互记录表R中搜索目标预测服务s中包含的交互企业c′,s∈S,c′∈C,将搜索记录添加到目标预测服务s中形成企业交互集合Sets
d)利用知识图谱<head,e,tail>将企业交互集合Sets中企业作为head节点,通过头尾实体间关系e寻找尾实体tail,将寻找到的尾实体tail组成的集合建立第一次传播集合
Figure FDA0003333903000000011
Figure FDA0003333903000000012
作为head节点,通过头尾实体间关系e寻找尾实体,将寻找到的尾实体tail组成的集合建立第二次传播集合
Figure FDA0003333903000000013
重复上述循环,直至将
Figure FDA0003333903000000014
作为head节点,通过头尾实体间关系e寻找尾实体,将寻找到的尾实体tail组成的集合建立第n次传播集合
Figure FDA0003333903000000015
e)随机初始化所有企业的embedding编码和n个转化矩阵r,n为传播次数,embedding编码和转化矩阵r的训练的目标为h×r=t,h为头实体的embedding,t为尾实体的embedding,h、r、t的维度均为d;
f)通过公式wi=hirτco计算相似度权重wi,式中co为目标企业c的embedding编码,hi为传播集合
Figure FDA0003333903000000016
中第i个企业的embedding编码,τ∈{1,...,n},rτ为第τ次传播的转化矩阵,wi的维度为d;
g)通过公式
Figure FDA0003333903000000017
计算目标服务的转换向量aτ,aτ∈Rd,R为实数,d嵌入维度,ci为传播集合
Figure FDA0003333903000000018
中的企业的embedding编码;
h)随机初始化二维合并矩阵T∈Rd×d,通过公式
Figure FDA0003333903000000019
计算目标服务特征向量vτ
i)重复步骤h)直至得到n个企业服务表示向量v1,...,vn
j)通过公式
Figure FDA0003333903000000021
计算目标企业c对目标预测服务s采纳的概率,完成企业特征传播预训练模型的建立;
k)通过公式
Figure FDA0003333903000000022
计算损失函数L,式中
Figure FDA0003333903000000023
为预测值,y为预测企业和服务对应的标签,log为以e为底的对数函数,α∈(0,1),α为权重,
Figure FDA0003333903000000024
为第τ次传播下,传播集合
Figure FDA0003333903000000025
中的第i个企业的embedding编码,
Figure FDA0003333903000000026
为为第τ次传播下,传播集合
Figure FDA0003333903000000027
中的第i个企业对应尾结点的embedding编码;
l)对企业属性表C中企业经营范围关键词使用multi-hot编码,得到编码后的输出结果Ik,对企业属性表C中证照类信息l1,l2,...,lx使用SPSS软件分别进行k-means算法聚类操作,x为企业属性表C中证照类信息中字段的个数,聚类中心k=5,聚类后生成5类标签信息,将5类标签信息使用one-hot编码形式的向量进行拼接,得到证照输入集合Il
m)对企业属性表C中企业风险类信息t1,t2,...,ty使用SPSS软件分别进行k-means算法聚类操作,y为企业属性表C中风险类信息中字段的个数,聚类中心k=5,聚类后生成5类标签信息,将5类标签信息使用one-hot编码形式的向量进行拼接,得到证照输入集合It
n)通过公式
Figure FDA0003333903000000028
计算输入嵌入向量Ic
Figure FDA0003333903000000029
为向量拼接,通过公式
Figure FDA00033339030000000210
计算输入嵌入向量Is,Iside为服务属性表S中目标服务的特征;
o)将向量Ic通过多层MLP转化为d维向量得到企业embedding向量Vc
p)将向量Is通过多层MLP转化为与企业embedding向量Vc相同维度服务embedding向量Vs
q)利用公式
Figure FDA0003333903000000031
得到预测得分
Figure FDA0003333903000000032
完成企业特征传播网络模型的建立,θ为全局变量,T为转置;
i)利用损失函数L使用Adam优化方法对企业特征传播网络模型进行优化;
s)保持优化后的企业特征传播网络模型的参数;
t)将优化后的企业特征传播网络模型的预测得分
Figure FDA0003333903000000033
按大小排序,将得分最高的10个项目推荐给用户。
2.根据权利要求1所述的基于企业特征传播的企业服务推荐方法,其特征在于:步骤a)中企业属性表C中包含字段有:企业名、经营状态、所属行业、企业类型、经营范围、业务类型、营业执照数量、商标数量、著作权证数量、专利数量、认证数量、到期营业执照数量、到期商标数量、到期著作权证数量、到期专利数量、到期认证数量、企业纳税异常数量,经营异常数量,行政处罚数量,欠税记录数量,股权出资,动产抵押数量;服务属性表S包含字段有:服务编号、服务所属类型、服务价格;服务交互记录表R包含字段有:企业名、服务编号。
3.根据权利要求1所述的基于企业特征传播的企业服务推荐方法,其特征在于:步骤a)中标准化处理的过程为:将服务交互记录表R中没有的企业和服务在企业属性表C、服务属性表S中进行过滤,对于企业属性表C中的数值型缺失,使用企业属性表C中该字段的平均值差值处理,对于企业属性表C中类别缺失,使用相同所述行业对应该字段的众数补充。
4.根据权利要求1所述的基于企业特征传播的企业服务推荐方法,其特征在于:步骤b)中特征包括企业的经营状态、所述行业、企业类型、经营范围、业务类型。
5.根据权利要求1所述的基于企业特征传播的企业服务推荐方法,其特征在于:步骤l)中证照类信息包含字段有:营业执照数量、商标数量、著作权证数量、专利数量、认证数量、到期营业执照数量、到期商标数量、到期著作权证数量、到期专利数量、到期认证数量。
6.根据权利要求1所述的基于企业特征传播的企业服务推荐方法,其特征在于:步骤m)中企业风险类信息包含字段有:企业纳税异常数量,经营异常数量,行政处罚数量,欠税记录数量,股权出资,动产抵押数量。
CN202110354107.6A 2021-04-01 2021-04-01 一种基于企业特征传播的企业服务推荐方法 Active CN113342904B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110354107.6A CN113342904B (zh) 2021-04-01 2021-04-01 一种基于企业特征传播的企业服务推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110354107.6A CN113342904B (zh) 2021-04-01 2021-04-01 一种基于企业特征传播的企业服务推荐方法

Publications (2)

Publication Number Publication Date
CN113342904A CN113342904A (zh) 2021-09-03
CN113342904B true CN113342904B (zh) 2021-12-24

Family

ID=77467798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110354107.6A Active CN113342904B (zh) 2021-04-01 2021-04-01 一种基于企业特征传播的企业服务推荐方法

Country Status (1)

Country Link
CN (1) CN113342904B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113592568B (zh) * 2021-09-30 2022-01-11 深圳前海环融联易信息科技服务有限公司 一种商机挖掘方法、装置、计算机设备及存储介质
CN116150221B (zh) * 2022-10-09 2023-07-14 浙江博观瑞思科技有限公司 服务于企业电商运营管理的信息交互方法及***
CN116523473B (zh) * 2023-06-29 2023-08-25 湖南省拾牛网络科技有限公司 基于相似企业的项目匹配方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685355A (zh) * 2018-12-19 2019-04-26 重庆百行智能数据科技研究院有限公司 企业风险识别方法、装置和计算机可读存储介质
CN110765775A (zh) * 2019-11-01 2020-02-07 北京邮电大学 一种融合语义和标签差异的命名实体识别领域自适应的方法
CN111861119A (zh) * 2020-06-17 2020-10-30 国家计算机网络与信息安全管理中心 基于企业风险关联图谱的企业风险数据处理方法及装置
JP2021002308A (ja) * 2019-06-25 2021-01-07 株式会社アフターネクスト 求人・採用支援システム、求人・採用支援システムのプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190259033A1 (en) * 2015-06-20 2019-08-22 Quantiply Corporation System and method for using a data genome to identify suspicious financial transactions
CN108563653B (zh) * 2017-12-21 2020-07-31 清华大学 一种用于知识图谱中知识获取模型的构建方法及***
CN108596439A (zh) * 2018-03-29 2018-09-28 北京中兴通网络科技股份有限公司 一种基于知识图谱的企业风险预测方法及***
US11537719B2 (en) * 2018-05-18 2022-12-27 Deepmind Technologies Limited Deep neural network system for similarity-based graph representations
CN109299362B (zh) * 2018-09-21 2023-04-14 平安科技(深圳)有限公司 相似企业推荐方法、装置、计算机设备及存储介质
CN112528007B (zh) * 2019-09-19 2023-04-07 中冶赛迪信息技术(重庆)有限公司 一种招商项目的目标企业的确认方法及确认装置
CN112579769A (zh) * 2019-09-30 2021-03-30 北京国双科技有限公司 关键词的聚类方法、装置、存储介质和电子设备
CN111985729A (zh) * 2020-09-07 2020-11-24 支付宝(杭州)信息技术有限公司 一种基于图神经网络进行预测的方法、***和装置
CN112381653A (zh) * 2020-10-29 2021-02-19 重庆撼地大数据有限公司 潜在投资企业的挖掘与推荐方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685355A (zh) * 2018-12-19 2019-04-26 重庆百行智能数据科技研究院有限公司 企业风险识别方法、装置和计算机可读存储介质
JP2021002308A (ja) * 2019-06-25 2021-01-07 株式会社アフターネクスト 求人・採用支援システム、求人・採用支援システムのプログラム
CN110765775A (zh) * 2019-11-01 2020-02-07 北京邮电大学 一种融合语义和标签差异的命名实体识别领域自适应的方法
CN111861119A (zh) * 2020-06-17 2020-10-30 国家计算机网络与信息安全管理中心 基于企业风险关联图谱的企业风险数据处理方法及装置

Also Published As

Publication number Publication date
CN113342904A (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
CN113342904B (zh) 一种基于企业特征传播的企业服务推荐方法
CN111368147B (zh) 图特征处理的方法及装置
CN106484813A (zh) 一种大数据分析***及方法
CN111522921A (zh) 一种基于语句改写的面向端到端对话的数据增强方法
CN113779264A (zh) 基于专利供需知识图谱的交易推荐方法
CN111047193A (zh) 一种基于信用大数据标签的企业信用评分模型生成算法
CN103838857A (zh) 一种基于语义的自动服务组合***及方法
US11853400B2 (en) Distributed machine learning engine
CN115526236A (zh) 一种基于多模态对比学习的文本网络图分类方法
CN115203550A (zh) 一种增强邻居关系的社交推荐方法及***
Song et al. Enhancing enterprise credit risk assessment with cascaded multi-level graph representation learning
CN113657473A (zh) 一种基于迁移学习的Web服务分类方法
CN116662570A (zh) 一种用于银行风险评估的异构图知识图谱补全方法及***
CN116471281A (zh) 一种考虑节点自私性的去中心化服务组合方法
CN116186298A (zh) 信息检索方法和装置
CN113742495B (zh) 基于预测模型的评级特征权重确定方法及装置、电子设备
CN113343100B (zh) 一种基于知识图谱的智慧城市资源推荐方法和***
CN117194966A (zh) 对象分类模型的训练方法和相关装置
Marella et al. Understanding the creation of trust in cryptocurrencies: Bitcoin
CN114840775A (zh) 一种融合多空间特征的网络对齐模型及其应用
Gao et al. Wide & ResNet: An improved network for CTR prediction
Zhang et al. [Retracted] Enterprise Credit Security Prediction and Evaluation Based on Multimodel Fusion
Wang A Study on Early Warning of Financial Indicators of Listed Companies Based on Random Forest
Yu et al. Workflow recommendation based on graph embedding
CN115114934B (zh) 一种标签融合的联合抽取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Wang Yinglong

Inventor after: Zhang Hanzhong

Inventor after: Shu Minglei

Inventor after: Zhou Shuwang

Inventor after: Liu Zhaoyang

Inventor before: Wang Yinglong

Inventor before: Zhang Hanzhong

Inventor before: Shu Minglei

Inventor before: Zhou Shuwang

Inventor before: Liu Zhaoyang

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant