CN111815173A - 一种基于关联规则的企业画像评估方法 - Google Patents

一种基于关联规则的企业画像评估方法 Download PDF

Info

Publication number
CN111815173A
CN111815173A CN202010660269.8A CN202010660269A CN111815173A CN 111815173 A CN111815173 A CN 111815173A CN 202010660269 A CN202010660269 A CN 202010660269A CN 111815173 A CN111815173 A CN 111815173A
Authority
CN
China
Prior art keywords
enterprise
data
enterprises
information
association rules
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010660269.8A
Other languages
English (en)
Inventor
杜治国
吴敏
高航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Group Shanghai Co ltd
Neusoft Corp
Original Assignee
Neusoft Group Shanghai Co ltd
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Group Shanghai Co ltd, Neusoft Corp filed Critical Neusoft Group Shanghai Co ltd
Priority to CN202010660269.8A priority Critical patent/CN111815173A/zh
Publication of CN111815173A publication Critical patent/CN111815173A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及大数据技术领域,尤其为一种基于关联规则的企业画像评估方法,包括如下步骤:采集企业相关的信息数据。对获取数据进行预处理后存入HDFS集群;把处理后的HDFS数据和待画像企业进行比对;利用企业信息数据库中数据创建企业画像基本属性部分;综合五维评估说明,通过分析公司的五大维度按照不同的权重计算得出结果;通过AHP层次法分析出待画像企业的十大相关联企业,本发明对企业从五个维度给予综合评估打分,尤其是对企业供应链及经营能力的评估,可得出企业在产业链的地位。

Description

一种基于关联规则的企业画像评估方法
技术领域
本发明涉及大数据技术领域,尤其是一种基于关联规则的企业画像评估方法。
背景技术
企业画像是指通过分析多个来源的数据,对企业相关的信息进行提炼与整理,从而刻画企业的经营业务、发展情况等多个方面的现状集。现有的企业画像中,刻画企业维度、企业上下游关联的较少,大部分只针对待画像企业进行简单的属性描述。
发明内容
本发明的一个目的是通过提出一种基于关联规则的企业画像评估方法,以解决上述背景技术中提出的缺陷。
本发明采用的技术方案如下:包括如下步骤:
S1:采集企业相关的信息数据。
S2:对获取数据进行预处理后存入HDFS集群;
S3:把处理后的HDFS数据和待画像企业进行比对;
S4:利用企业信息数据库中数据创建企业画像基本属性部分;
S5:综合五维评估说明,通过分析公司的五大维度按照不同的权重计算得出结果;
S6:通过AHP层次法分析出待画像企业的十大相关联企业。
作为本发明的一种优选技术方案:所述S2中的对获取数据进行预处理包括缺失数据、噪声数据、数据的一致性、离群点处理、重复。
作为本发明的一种优选技术方案:所述S2中和待画像企业进行比对过程如下:
S2.1:通过企业法人代码去相关数据中首次匹配,得出部分数据;
S2.2:通过企业名、法人名、产品名等信息进行二次模糊匹配,得出部分数据;
S2.3:两次数据合并后获得待画像企业数据。
作为本发明的一种优选技术方案:所述S5中的五大维度包括公司实力、经营能力、供应链稳定性、关联关系和履约历史。
作为本发明的一种优选技术方案:所述S5中的五维评估具体为:结合主客观权值算法、因子分析算法,综合目标企业的股东背景与实力、在其所处行业的对应地位、对外投资、知识产权、关联关系、疑似关系、行业信息、交易记录、交易规模、司法信息、行政监管信息、纳税记录等数据综合评估得出结果。
作为本发明的一种优选技术方案:所述供应链稳定性通过开票频次前十大下游企业、开票频次前十大供应商、开票金额前十大下游企业、开票金额前十大供应商、下游企业流动性、关联疑似关系交易信息六个指标,每个指标下选取交易次数、交易次数占比、交易金额、交易金额占比四个因子进行因子分析、权值分析后得出结论。
作为本发明的一种优选技术方案:所述S1的采集企业相关的信息数据为从互联网上进行采集的。
作为本发明的一种优选技术方案:所述S1还包括如下具体步骤:
S1.1:企业舆情相关数据采集,包括新闻、微博、微信、论坛多通道社会情报;
S1.2:基于XPATH或者正则表达式的方法将文本中包含的非文本数据和冗余信息删除,获得各企业的结构化的网络文本集;
S1.3:对特定企业相关的网络文本进行分词处理,利用统计算法从分词结果中获取各企业相关网络数据的文本特征词;
S1.4:将文本特征词进行组合排列后编入文本。
作为本发明的一种优选技术方案:所述S6中的AHP层次法包括目标层、准则层和方案层。
作为本发明的一种优选技术方案:所述目标层为六个指标的十大企业,准则层为六大准则,方案层为所有企业。
本发明对企业从五个维度给予综合评估打分,尤其是对企业供应链及经营能力的评估,可得出企业在产业链的地位。通过构建知识图谱,深度挖掘企业、高管、法定代表人、产品、产业链间的复杂网络关系,可为城市、区域宏观经济分析、招商引资提供服务,引导地方产业发展。针对监管机构,可监控目标企业发展态势,第一时间进行风险预警。针对企业内部,可提供企业情报、供应商评估等多项综合服务。
附图说明
图1为本发明优选实施例的结构框示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,本发明优选实施例提供了一种基于关联规则的企业画像评估方法,包括如下步骤:
S1:采集企业相关的信息数据。
S2:对获取数据进行预处理后存入HDFS集群;
S3:把处理后的HDFS数据和待画像企业进行比对;
S4:利用企业信息数据库中数据创建企业画像基本属性部分;
S5:综合五维评估说明,通过分析公司的五大维度按照不同的权重计算得出结果;
S6:通过AHP层次法分析出待画像企业的十大相关联企业。
本实施例中:所述S2中的对获取数据进行预处理包括缺失数据、噪声数据、数据的一致性、离群点处理、重复。
本实施例中:所述S2中和待画像企业进行比对过程如下:
S2.1:通过企业法人代码去相关数据中首次匹配,得出部分数据;
S2.2:通过企业名、法人名、产品名等信息进行二次模糊匹配,得出部分数据;
S2.3:两次数据合并后获得待画像企业数据。
本实施例中:所述S5中的五大维度包括公司实力、经营能力、供应链稳定性、关联关系和履约历史。
本实施例中:所述S5中的五维评估具体为:结合主客观权值算法、因子分析算法,综合目标企业的股东背景与实力、在其所处行业的对应地位、对外投资、知识产权、关联关系、疑似关系、行业信息、交易记录、交易规模、司法信息、行政监管信息、纳税记录等数据综合评估得出结果。
本实施例中:所述供应链稳定性通过开票频次前十大下游企业、开票频次前十大供应商、开票金额前十大下游企业、开票金额前十大供应商、下游企业流动性、关联疑似关系交易信息六个指标,每个指标下选取交易次数、交易次数占比、交易金额、交易金额占比四个因子进行因子分析、权值分析后得出结论。
本实施例中:所述S1的采集企业相关的信息数据为从互联网上进行采集的。
本实施例中:所述S1还包括如下具体步骤:
S1.1:企业舆情相关数据采集,包括新闻、微博、微信、论坛多通道社会情报;
S1.2:基于XPATH或者正则表达式的方法将文本中包含的非文本数据和冗余信息删除,获得各企业的结构化的网络文本集;
S1.3:对特定企业相关的网络文本进行分词处理,利用统计算法从分词结果中获取各企业相关网络数据的文本特征词;
S1.4:将文本特征词进行组合排列后编入文本。
本实施例中:所述S6中的AHP层次法包括目标层、准则层和方案层。
本实施例中:所述目标层为六个指标的十大企业,准则层为六大准则,方案层为所有企业。
本实施例以开票频次前十大供应商为例:
基于准则层,两两进行关联,构造比较矩阵。
Figure BDA0002578233130000041
基于方案层,两两进行关联,构造比较矩阵。
Figure BDA0002578233130000042
计算单排序权向量:
计算C1、C2、C3、C4、C5、C6对O的权重;
计算P1、P2、P3、P4、P5、P6、P7、P8、P9、P10对C1的权重;
计算P1、P2、P3、P4、P5、P6、P7、P8、P9、P10对C2的权重
计算P1、P2、P3、P4、P5、P6、P7、P8、P9、P10对C6的权重;
计算总排序权向量:
P1对总目标的权重=;
P1对C1的权重乘以C1对O的权重+
P1对C2的权重乘以C2对O的权重+
P1对C3的权重乘以C3对O的权重+
P1对C4的权重乘以C4对O的权重+
P1对C5的权重乘以C5对O的权重+
P1对C6的权重乘以C6对O的权重。
按上述规则计算P1~P10的总权重,然后按权重排序可作为最后的决策依据。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (10)

1.一种基于关联规则的企业画像评估方法,其特征在于:包括如下步骤:
S1:采集企业相关的信息数据。
S2:对获取数据进行预处理后存入HDFS集群;
S3:把处理后的HDFS数据和待画像企业进行比对;
S4:利用企业信息数据库中数据创建企业画像基本属性部分;
S5:综合五维评估说明,通过分析公司的五大维度按照不同的权重计算得出结果;
S6:通过AHP层次法分析出待画像企业的十大相关联企业。
2.根据权利要求1所述的基于关联规则的企业画像评估方法,其特征在于:所述S2中的对获取数据进行预处理包括缺失数据、噪声数据、数据的一致性、离群点处理、重复。
3.根据权利要求1所述的基于关联规则的企业画像评估方法,其特征在于:所述S2中和待画像企业进行比对过程如下:
S2.1:通过企业法人代码去相关数据中首次匹配,得出部分数据;
S2.2:通过企业名、法人名、产品名等信息进行二次模糊匹配,得出部分数据;
S2.3:两次数据合并后获得待画像企业数据。
4.根据权利要求1所述的基于关联规则的企业画像评估方法,其特征在于:所述S5中的五大维度包括公司实力、经营能力、供应链稳定性、关联关系和履约历史。
5.根据权利要求1所述的基于关联规则的企业画像评估方法,其特征在于:所述S5中的五维评估具体为:结合主客观权值算法、因子分析算法,综合目标企业的股东背景与实力、在其所处行业的对应地位、对外投资、知识产权、关联关系、疑似关系、行业信息、交易记录、交易规模、司法信息、行政监管信息、纳税记录等数据综合评估得出结果。
6.根据权利要求4所述的基于关联规则的企业画像评估方法,其特征在于:所述供应链稳定性通过开票频次前十大下游企业、开票频次前十大供应商、开票金额前十大下游企业、开票金额前十大供应商、下游企业流动性、关联疑似关系交易信息六个指标,每个指标下选取交易次数、交易次数占比、交易金额、交易金额占比四个因子进行因子分析、权值分析后得出结论。
7.根据权利要求1所述的基于关联规则的企业画像评估方法,其特征在于:所述S1的采集企业相关的信息数据为从互联网上进行采集的。
8.根据权利要求1所述的基于关联规则的企业画像评估方法,其特征在于:所述S1还包括如下具体步骤:
S1.1:企业舆情相关数据采集,包括新闻、微博、微信、论坛多通道社会情报;
S1.2:基于XPATH或者正则表达式的方法将文本中包含的非文本数据和冗余信息删除,获得各企业的结构化的网络文本集;
S1.3:对特定企业相关的网络文本进行分词处理,利用统计算法从分词结果中获取各企业相关网络数据的文本特征词;
S1.4:将文本特征词进行组合排列后编入文本。
9.根据权利要求1所述的基于关联规则的企业画像评估方法,其特征在于:所述S6中的AHP层次法包括目标层、准则层和方案层。
10.根据权利要求9所述的基于关联规则的企业画像评估方法,其特征在于:所述,目标层为六个指标的十大企业,准则层为六大准则,方案层为所有企业。。
CN202010660269.8A 2020-07-10 2020-07-10 一种基于关联规则的企业画像评估方法 Pending CN111815173A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010660269.8A CN111815173A (zh) 2020-07-10 2020-07-10 一种基于关联规则的企业画像评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010660269.8A CN111815173A (zh) 2020-07-10 2020-07-10 一种基于关联规则的企业画像评估方法

Publications (1)

Publication Number Publication Date
CN111815173A true CN111815173A (zh) 2020-10-23

Family

ID=72841704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010660269.8A Pending CN111815173A (zh) 2020-07-10 2020-07-10 一种基于关联规则的企业画像评估方法

Country Status (1)

Country Link
CN (1) CN111815173A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598302A (zh) * 2020-12-25 2021-04-02 北京知因智慧科技有限公司 企业数据的评估方法、装置及服务器
CN115640335A (zh) * 2022-12-06 2023-01-24 烟台广兴云涛文化传媒有限公司 基于企业画像的企业分析方法、***及云平台

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080235153A1 (en) * 2007-03-19 2008-09-25 Bstar Ip Pty Ltd Method of business valuation and data processing system
CN101840535A (zh) * 2010-01-22 2010-09-22 同济大学 一种基于改进灰关联法集成化供应链绩效指标评价方法
CN105512245A (zh) * 2015-11-30 2016-04-20 青岛智能产业技术研究院 一种基于回归模型建立企业画像的方法
CN108572967A (zh) * 2017-03-09 2018-09-25 神州数码***集成服务有限公司 一种创建企业画像的方法及装置
CN109658478A (zh) * 2017-10-10 2019-04-19 爱信诺征信有限公司 一种提供企业画像的方法及***
CN110135901A (zh) * 2019-05-10 2019-08-16 重庆天蓬网络有限公司 一种企业用户画像构建方法、***、介质和电子设备
CN110991922A (zh) * 2019-12-12 2020-04-10 山西云海智化大数据科技有限公司 基于企业画像的企业精准分析方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080235153A1 (en) * 2007-03-19 2008-09-25 Bstar Ip Pty Ltd Method of business valuation and data processing system
CN101840535A (zh) * 2010-01-22 2010-09-22 同济大学 一种基于改进灰关联法集成化供应链绩效指标评价方法
CN105512245A (zh) * 2015-11-30 2016-04-20 青岛智能产业技术研究院 一种基于回归模型建立企业画像的方法
CN108572967A (zh) * 2017-03-09 2018-09-25 神州数码***集成服务有限公司 一种创建企业画像的方法及装置
CN109658478A (zh) * 2017-10-10 2019-04-19 爱信诺征信有限公司 一种提供企业画像的方法及***
CN110135901A (zh) * 2019-05-10 2019-08-16 重庆天蓬网络有限公司 一种企业用户画像构建方法、***、介质和电子设备
CN110991922A (zh) * 2019-12-12 2020-04-10 山西云海智化大数据科技有限公司 基于企业画像的企业精准分析方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598302A (zh) * 2020-12-25 2021-04-02 北京知因智慧科技有限公司 企业数据的评估方法、装置及服务器
CN112598302B (zh) * 2020-12-25 2024-03-26 北京知因智慧科技有限公司 企业数据的评估方法、装置及服务器
CN115640335A (zh) * 2022-12-06 2023-01-24 烟台广兴云涛文化传媒有限公司 基于企业画像的企业分析方法、***及云平台
CN115640335B (zh) * 2022-12-06 2023-08-11 上海创飞纵横科技集团有限公司 基于企业画像的企业分析方法、***及云平台

Similar Documents

Publication Publication Date Title
CN110852856B (zh) 一种基于动态网络表征的***虚开识别方法
CN103064970B (zh) 优化译员的检索方法
CN105117426B (zh) 一种海关编码智能搜索方法
CN114880486A (zh) 基于nlp和知识图谱的产业链识别方法及***
Liang et al. A stock time series forecasting approach incorporating candlestick patterns and sequence similarity
CN111815173A (zh) 一种基于关联规则的企业画像评估方法
CN112419030B (zh) 财务舞弊风险评估的方法、***及设备
CN111428142A (zh) 一种基于随机森林分类器的代码评审人推荐***及方法
CN115794798A (zh) 一种市场监管信息化标准管理与动态维护***及方法
El Qadi et al. Feature contribution alignment with expert knowledge for artificial intelligence credit scoring
CN114399367A (zh) 保险产品推荐方法、装置、设备及存储介质
Sidi Improving S&P stock prediction with time series stock similarity
CN113283673A (zh) 一种模型性能衰减评价方法、模型训练方法及装置
Gong et al. Predicting stock price movement using financial news sentiment
CN117114812A (zh) 一种针对企业的金融产品推荐方法及装置
CN117035822A (zh) 基于大数据的电子商务产业带统计方法及***
Modrušan et al. Intelligent Public Procurement Monitoring System Powered by Text Mining and Balanced Indicators
Eskandary et al. Identification and prioritization of public-private partnership indicators in Iran’s water and wastewater industry via data mining algorithms
Šmidovnik et al. Inclusion of uncertainty with different types of fuzzy numbers into DEMATEL
Sliva et al. The soma terror organization portal (stop): Social network and analytic tools for the real-time analysis of terror groups
Seo et al. Measuring News Sentiment of Korea Using Transformer
CN113379211A (zh) 基于区块链的物流信息平台违约风险管控***及方法
Zhang et al. Graph representation learning for similarity stocks analysis
AlDarmaki et al. Prediction of the closing price in the Dubai financial market: a data mining approach
Tursina et al. Comparison of the nearest neighbor algorithm and C4. 5 for the retrieval on case-based reasoning process (case study: children respiratory disorders)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination