CN113723924A - 企业画像构建方法、装置、计算机设备和存储介质 - Google Patents
企业画像构建方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113723924A CN113723924A CN202111007300.9A CN202111007300A CN113723924A CN 113723924 A CN113723924 A CN 113723924A CN 202111007300 A CN202111007300 A CN 202111007300A CN 113723924 A CN113723924 A CN 113723924A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- information
- waste
- production
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 31
- 238000003860 storage Methods 0.000 title claims abstract description 18
- 239000002699 waste material Substances 0.000 claims abstract description 293
- 238000012545 processing Methods 0.000 claims abstract description 65
- 238000004364 calculation method Methods 0.000 claims abstract description 24
- 238000004140 cleaning Methods 0.000 claims abstract description 13
- 238000004519 manufacturing process Methods 0.000 claims description 181
- 238000000034 method Methods 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012706 support-vector machine Methods 0.000 claims description 12
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 9
- 238000012549 training Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 12
- 238000011161 development Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000032696 parturition Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及人工智能和区块链领域,提供了一种企业画像构建方法、装置、计算机设备和存储介质,获取各个产废企业的企业信息;将企业信息按照预设规则进行清洗处理,得到各个产废企业的标准企业信息;将各个标准企业信息分别输入预设的多个分类处理模块进行处理,得到各个产废企业对应的多个企业标签;将各个标准企业信息输入预设的学习模型中进行计算,得到处废能力标签;获取区块链中各个产废企业的处废交易信息,根据处废交易信息计算信用标签;根据企业标签、处废能力标签和信用标签构建各个产废企业的企业画像。本申请提供的企业画像构建方法、装置、计算机设备和存储介质,利用不同维度的企业数据构建企业画像。
Description
技术领域
本申请涉及人工智能的技术领域,特别涉及一种企业画像构建方法、装置、计算机设备和存储介质。
背景技术
随着大数据时代的来临,企业画像的概念应运而生。企业画像描述的是多维度企业信息数据,企业画像既有利于企业对自身的状况有更清晰更全面地了解,又有利于政府决策部门将企业按照行业、地区等进行汇总、分析,从而便于了解行业现状,分析区域经济形势,进而采取相应措施推动经济发展。近年来,随着各类环保政策法规的不断推陈出新,对产废企业的监管力度也不断增强,能够快速构建产废企业画像对于提高监管效率有着重要作用。
传统的企业画像构建方法虽能够构建产废企业的企业画像,但是目前已经进入到大数据时代,产废企业的数据信息都是一直散乱、无序、碎片化的存在。如何将这些不同维度的信息整合成产废企业的商业外貌(即企业画像),实现企业宏观洞察的统一标准,提升产废企业全方位信息的分类整理能力,是本领域技术人员需要解决的技术问题。
发明内容
本申请的主要目的为提供一种企业画像构建方法、装置、计算机设备和存储介质,旨在解决不同维度的信息未完全整合成产废企业的企业画像的技术问题。
为实现上述目的,本申请提供了一种企业画像构建方法,包括以下步骤:
获取各个产废企业的企业信息;
将所述企业信息按照预设规则进行清洗处理,得到各个所述产废企业的标准企业信息;
将各个所述标准企业信息按照预设规则分别输入预设的多个分类处理模块进行处理,得到各个所述产废企业对应的多个企业标签;
将各个所述标准企业信息输入预设的学习模型中进行计算,得到各个所述产废企业对应的处废能力标签;其中所述预设的学习模型基于支持向量机训练而成;
获取区块链中各个产废企业的处废交易信息,根据所述处废交易信息计算各个所述产废企业的信用标签;
根据所述企业标签、处废能力标签和信用标签构建各个所述产废企业的企业画像。
进一步地,所述将各个所述标准企业信息按照预设规则分别输入预设的多个分类处理模块进行处理,得到各个所述产废企业对应的多个企业标签的步骤,包括:
将所述标准企业信息按照预设规则进行分组处理,得到多组标准企业子信息;其中,每组标准企业子信息表示一类信息;
将各组标准企业子信息分别输入对应的分类处理模块进行计算,得到分类处理模块对应的企业标签。
进一步地,所述将各个所述标准企业信息输入预设的学习模型中进行计算,得到各个所述产废企业对应的处废能力标签的步骤,包括:
获取所述标准企业信息中关于处废能力的处废能力信息;其中,所述处废能力信息包括废弃物月均生产量、占地面积、合作处废单位数量、合作处废单位距离、运输方式、处置方式中的一种或多种;
将所述处废能力信息输入预设的学习模型进行计算,得到所述处废能力标签。
进一步地,所述获取区块链中各个产废企业的处废交易信息,根据所述处废交易信息计算各个所述产废企业的信用标签的步骤,包括:
从区块链中获取所述产废企业与处废企业之间的处废交易信息;
获取所述产废企业的生产信息;
计算所述生产信息和所述处废交易信息中的产废信息的相关性;
根据所述相关性确定所述产废企业的信用标签。
进一步地,所述计算所述生产信息和所述处废交易信息中的产废信息的相关性步骤,包括:
进一步地,所述计算所述生产信息和所述处废交易信息中的产废信息的相关性步骤,包括:
获取距离当前年份的k个年份的所述产废信息和所述生产信息;
计算每一年的所述产废信息与所述生产信息的子相关性;
通过公式ρ=a1ρ1+a2ρ2+···+akρk计算所述生产信息和所述处废交易信息中的产废信息的相关性,所述a1至ak分别为每一年的所述产废信息与所述生产信息的子相关性的预设权重,a1至ak的大小依次递减,ρk为距离当前年份的第k个年份的子相关性。
进一步地,所述根据所述企业标签、处废能力标签和信用标签构建各个所述产废企业的企业画像的步骤,包括:
将所述企业标签、处废能力标签和信用标签以图形化的形式形成各个产废企业的企业画像;
将各个产废企业的企业画像按照各自的位置信息在预设企业地图中展示。
本申请还提供了一种企业画像构建装置,包括:
获取单元,用于获取各个产废企业的企业信息;
清洗单元,用于将所述企业信息按照预设规则进行清洗处理,得到各个所述产废企业的标准企业信息;
企业标签单元,用于将各个所述标准企业信息按照预设规则分别输入预设的多个分类处理模块进行处理,得到各个所述产废企业对应的多个企业标签;
处废能力标签单元,用于将各个所述标准企业信息输入预设的学习模型中进行计算,得到各个所述产废企业对应的处废能力标签;其中所述预设的学习模型基于支持向量机训练而成;
信用标签单元,用于获取区块链中各个产废企业的处废交易信息,根据所述处废交易信息计算各个所述产废企业的信用标签;
构建单元,用于根据所述企业标签、处废能力标签和信用标签构建各个所述产废企业的企业画像。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的企业画像构建方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的企业画像构建方法的步骤。
本申请提供的企业画像构建方法、装置、计算机设备和存储介质,通过结合AI智能算法、区块链信息统筹技术手段对企业信息、处废交易信息等进行处理得到企业标签、处废能力标签和信用标签建立企业画像,利用了不同维度的企业数据,从而能够较为笼统的表现出企业内部信息,以便于企业客户直观了解企业形象,另一方面,使用学习模型从已有的数据中挖掘中产废企业的处废处理能力等相关信息,使用区块链记录产废到处废的交易记录信息,并且计算产废企业的信用标签,从而能够进一步使企业对应的客户了解企业风险因素把控效应结果,进一步增加企业画像的真实性。
附图说明
图1是本申请一实施例中企业画像构建方法步骤示意图;
图2是本申请一实施例中企业画像构建装置结构框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
进一步的,本申请提供的企业画像构建方法还可应用于区块链领域,将学习模型和企业画像存储在区块链中。
参照图1,本申请一实施例提供了一种企业画像构建方法,包括以下步骤:
步骤S1,获取各个产废企业的企业信息;
步骤S2,将所述企业信息按照预设规则进行清洗处理,得到各个所述产废企业的标准企业信息;
步骤S3,将各个所述标准企业信息按照预设规则分别输入预设的多个分类处理模块进行处理,得到各个所述产废企业对应的多个企业标签;
步骤S4,将各个所述标准企业信息输入预设的学习模型中进行计算,得到各个所述产废企业对应的处废能力标签;其中所述预设的学习模型基于支持向量机训练而成;
步骤S5,获取区块链中各个产废企业的处废交易信息,根据所述处废交易信息计算各个所述产废企业的信用标签;
步骤S6,根据所述企业标签、处废能力标签和信用标签构建各个所述产废企业的企业画像。
本实施例中,如上述步骤S1所述,产废企业是指生产废弃物的企业,这些废弃物需要专业的处废企业进行处理。通过多种途径获取产废企业的企业信息,企业信息包括企业数据信息、企业产废信息和其他信息,具体的,在已注册企业网络平台上搜寻企业信息,例如:企查查APP软件平台、天眼查APP软件平台以及企业网平台等,获取企业数据信息,企业数据信息包括但不限于企业名称、企业类型、成立日期、法定代表人、注册资金等信息;根据产废企业管理平台获取企业产废信息,企业产废信息包括产废类型,产废主成份分析、常用废弃物处理方法、单位时间废弃物生产体积或重量等信息;其他信息包括地理位置、废弃物处理单位、废弃物运输单位等。
如上述步骤S2所述,获取到的上述海量企业信息中存在分散、零乱、标准不统一等的缺点,需要对数据进行清洗、治理等预处理,如进行去重处理,标准化处理,通过各个途径获取的企业信息会存在重复的信息,如产废企业位置信息重复,需要做去重处理,删除多余的重复信息;企业信息中会存在一些统计信息会使用不同的单位,如体积单位、长度单位、重量单位等,将这些统计信息的单位进行标准化处理,通过换算,同一类统计信息使用同一个单位,如体积信息使用立方米,长度单位使用千米,重量单位使用千克等。
如上述步骤S3所述,预先设置有多个分类处理模块,每个分类处理模块提取相应的企业信息进行处理,进而得到对应的分类标签,如设置有企业基本信息模块、企业经营概况模块、企业财务分析模块、行业发展模块、企业融资模块、产废信息模块、空间位置模块、处废信息模块。每个模块根据相应的信息得到对应的企业标签。企业基本信息模块对应的信息用于表示企业股东、法人代表、管理人员、维护人员、质检人员以及一线员工之间关系。企业经营概况模块对应的信息用于表示主营业务发展、年度销售计划、市场份额、项目进展以及交易结构等概况。企业财务分析模块对应的信息用于表示企业近5年内财务报表、现金流动、长短期偿债、盈利亏损、运营概况等数据的大致情况。行业发展模块对应的信息用于表示企业行情分析、市场经济地位、发展趋势、竞争优势等数据情况。企业融资模块对应的信息用于表示企业融资概况、风险因素掌控等数据情况。产废信息模块:产废企业管理平台获取企业产废信息,包括产废类型,产废主成份分析、常用废弃物处理方法、单位时间废弃物生产体积或重量等,对应的信息用于表示企业的生产能力及产废能力掌控等情况。空间位置模块:表征产废企业的位置与占地等信息,1)与当地处废政策息息相关;2)与处废运输的便利程度。处废信息模块:用于描述产废企业与处置单位的联系密切程度。
如上述步骤S4所述,获取的企业信息中会包含有不属于上述各个模块的信息,如产废企业处理废弃物能力(是否能在有效时间内将生产的废弃物交由处废单位处理掉)等,对于这部分信息,简单的分类模块已经无法进行处理,通过预设的学习模型去计算处废能力标签。
具体的,支持向量机是常用的一种有监督的学***面,使得平面与两边集合最近的点的间隔空间最大。
三个训练结果文件里面类别属性是不一样的。划分一个平面只能分为两类,本申请分成3类,那就需要划分多个平面,对于每一个训练数据,如果是第一个训练结果文件,那么原来是A类的样本,标注结果为1,其余为-1,同理对于第二个训练结果文件,如果样本是B类的,标注结果为1,其余为-1,以此类推第三个xml,如果样本是C类的,标注结果为1,其余为-1.也就是每一个训练结果的标注结果是不一样的,三个训练结果文件生成的结果也就是不一样的。然后对于一个新的数据把它代到每一个训练结果文件中计算,肯定得到三个值,看哪个值比较大就属于那个类。比如如果一个数是A类的,那么它带到第一个训练好的训练结果文件中得到的结果肯定接近1,而其余两个训练结果文件肯定结果接近-1,所以最终采用第一个训练子集的结果,也就是属于第一类。
如上述步骤S5-S6所述,区块链是一个共享的、不可更改的账本,可以促进在业务网络中记录交易和跟踪资产的过程。结合企业的处置流程信息,根据产废企业的产废信息和处废企业的处废信息,即可创建一条交易记录。如产废单位A生产的50kg废弃物经由运输单位运输,交给处废单位B进行处理。根据各个产废企业与处废企业间的交易记录,建立处废流程区块链,记录处废交易记录。此区块链是由一个一个交易区块构成的有序链表,每一个区块都记录了一系列交易,并且,每个区块都指向前一个区块,从而形成一个链条。
区块链就是一个不断增长的全网总账本,每个完全节点都拥有完整的区块链,并且,节点总是信任最长的区块链,伪造区块链需要拥有超过51%的全网算力。使用区块链记录产废企业的交易信息,将每一次废弃物从生产—处置的流程均记录到区块链中,使得交易信息更加透明,并且最重要的是,防止产废与处废信息的纂改与伪造,根本处废交易信息计算信用标签,将各个产废企业的信用标签、企业标签和处废能力标签构建相应的企业画像。本实施例中,通过结合AI智能学习模型、区块链信息统筹技术手段计算产废企业的企业标签、处废能力标签和信用标签,根据前述三种标签建立企业画像,从而能够较为笼统的表现出企业内部信息,以便于企业客户直观了解企业形象,另一方面,使用学习模型从已有的数据中挖掘中产废企业的处废处理能力等相关信息,使用区块链记录产废到处废的交易记录信息,并且计算产废企业的信用标签,从而能够进一步使企业对应的客户了解企业风险因素把控效应结果,进一步增加企业画像的真实性。
在一实施例中,所述将各个所述标准企业信息按照预设规则分别输入预设的多个分类处理模块进行处理,得到各个所述产废企业对应的多个企业标签的步骤S3,包括:
步骤S31,将所述标准企业信息按照预设规则进行分组处理,得到多组标准企业子信息;其中,每组标准企业子信息表示一类信息;
步骤S32,将各组标准企业子信息分别输入对应的分类处理模块进行计算,得到分类处理模块对应的企业标签。
本实施例中,通过步骤2中清洗处理后的标准企业信息,进行分组处理,具体的,分组处理后的标准子信息包括企业标准信息、企业经营信息、企业财务信息、行业发展信息、企业融资信息、产废信息、空间位置信息和处废信息,分别与企业基本信息模块、企业经营概况模块、企业财务分析模块、行业发展模块、企业融资模块、产废信息模块、空间位置模块、处废信息模块一一对应。将每个标准企业子信息输入到对应的模块中得到企业标签,具体的,企业基本信息模块得到的企业标签有:法人、股东、主要人员、股东关系、分支机构等;企业经营概况模块得到的企业标签有:市场份额、主生产情况、招投标信息等;企业财务分析模块得到的企业标签有财务报表、现金流动、长短期偿债、盈利亏损等;行业发展模块得到的企业标签有市场经济地位、人才信息、招聘信息、专利及获奖等;企业融资模块得到的企业标签有投融资信息等;产废信息模块得到的企业标签有产废类型,产废主成份分析、常用废弃物处理方法、单位时间废弃物生产体积或重量等;空间位置模块得到的企业标签有地理位置、占地面积、运输难易等;处废信息模块得到的企业标签有常合作单位等。
本实施例中,通过对企业信息进行分组处理,再将分组处理后的企业信息输入到对应的分类模块中计算得到企业标签,减缓各个分类模块的数据处理量。分类模块包括有八个方面,能够较为笼统的表现出产废企业的企业内部信息,便于企业的客户能够直观的了解到企业对应的信息。
在一实施例中,所述将各个所述标准企业信息输入预设的学习模型中进行计算,得到各个所述产废企业对应的处废能力标签的步骤S4,包括:
步骤S41,获取所述标准企业信息中关于处废能力的处废能力信息;其中,所述处废能力信息包括废弃物月均生产量、占地面积、合作处废单位数量、合作处废单位距离、运输方式、处置方式中的一种或多种;
步骤S42,将所述处废能力信息输入预设的学习模型进行计算,得到所述处废能力标签。
本实施例中,预设的学习模型基于支持向量机(Support Vector Machine,SVM)训练而成,支持向量机把原来线性不可分的处废能力信息的数据点映射到一个新的空间,转换为在新空间中线性可分数据来进行分类。将上述处废能力信息作为学习模型的输入,使用实际人为划定处废能力标准,得到处废能力标签,处废能力标签包括三种,分别用A、B、C来表示,A表示处废能力较好,B表示处废一般,C表示处废能力较差。
本一实施例中,所述获取区块链中各个产废企业的处废交易信息,根据所述处废交易信息计算各个所述产废企业的信用标签的步骤S5,包括:
步骤S5A,从区块链中获取所述产废企业与处废企业之间的处废交易信息;
步骤S5B,获取所述产废企业的生产信息;
步骤S5C,计算所述生产信息和所述处废交易信息中的产废信息的相关性;
步骤S5D,根据所述相关性确定所述产废企业的信用标签。
本实施例中,预先建立有处废流程区块链,用于记录处废交易信息,生产信息即企业生产产品的信息,产废信息即生产产品过程中产生废弃物的信息,生产信息和产废信息可以是所有的,也可以是近几年时间段内的。假定生产信息与产废信息之间是成正相关的,计算生产信息与产废信息之间的相关性,通过生产信息与产废信息之间的相关性去衡量企业的信用等级。
在一实施例中,所述计算所述生产信息和所述处废交易信息中的产废信息的相关性步骤S5C,包括:
本实施例中,计算求得的ρ的取值区间在(-1.0,1.0)之间,将ρ取绝对值,0-0.09为没有相关性,0.3-弱,0.1-0.3为弱相关,0.3-0.5为中等相关,0.5-1.0为强相关。将相关性系数小于0.3范围的标识为信用一般企业,将0.3-0.5范围内的标拾为信用好企业,大于0.5标识为信用较好企业。
在一实施例中,所述计算所述生产信息和所述处废交易信息中的产废信息的相关性步骤S5C,包括:
步骤S5Ca,获取距离当前年份的k个年份的所述产废信息和所述生产信息;
步骤S5Cb,计算每一年的所述产废信息与所述生产信息的子相关性;
步骤S5Cc,通过公式ρ=a1ρ1+a2ρ2+···+akρk计算所述生产信息和所述处废交易信息中的产废信息的相关性,所述a1至ak分别为每一年的所述产废信息与所述生产信息的子相关性的预设权重,a1至ak的大小依次递减,ρk为距离当前年份的第k个年份的子相关性。
本实施例中,k可设置为5,生产信息和产废信息为近5年内的信息,计算每一年的生产信息和产废信息的子相关性,得到5个子相关性,分别为ρ1、ρ2、ρ3、ρ4、ρ5,ρ1为最近一年的子相关性,ρ5为距现在第五年的子相关性,通过公式ρ=a1ρ1+a2ρ2+a3ρ3+a4ρ4+a5ρ5计算总的相关性,a为各个子相关性的预设权重,a1-a5的大小依次递减,a1为最近一年的相关性赋予最大的权重,信用标签能够更好的贴合最近时间的生产信息和产废信息。
在一实施例中,所述根据所述企业标签、处废能力标签和信用标签构建各个所述产废企业的企业画像的步骤S6,包括:
步骤S61,将所述企业标签、处废能力标签和信用标签以图形化的形式形成各个产废企业的企业画像;
步骤S62,将各个产废企业的企业画像按照各自的位置信息在预设企业地图中展示。
本实施例中,每个产废企业的企业画像包括有企业标签、处废能力标签和信用标签,在得到企业标签、处废能力标签和信用标签后,可以根据该产废企业的这些标签以图形化的方式形成产废企业的企业画像,即将这些标签对应一个图形围绕在产废企业周围,预设有企业地图,将每个产废企业的企业画像按照各自的位置信息在企业地图上标注,通过企业地图将所有的产废企业关联起来。进一步地,企业地图中还标注有处废企业,将各个产废企业与处废企业连接上,同时,处废能力标签和信用标签是基于产废企业和处废企业之间的信息得到的,因此可在产废企业与处废企业之间的连接上展示信用标签。而与产废企业合作的处废企业可能存在着变更,因此,可以根据合作的不同处废企业之间的信息得到不同的处废能力标签和信用标签,并在对应的连接上展示对应的标签。
参见图2,本申请提供了一种企业画像构建装置,包括以下步骤:
获取单元10,用于获取各个产废企业的企业信息;
清洗单元20,用于将所述企业信息按照预设规则进行清洗处理,得到各个所述产废企业的标准企业信息;
企业标签单元30,用于将各个所述标准企业信息按照预设规则分别输入预设的多个分类处理模块进行处理,得到各个所述产废企业对应的多个企业标签;
处废能力标签单元40,用于将各个所述标准企业信息输入预设的学习模型中进行计算,得到各个所述产废企业对应的处废能力标签;其中所述预设的学习模型基于支持向量机训练而成;
信用标签单元50,用于获取区块链中各个产废企业的处废交易信息,根据所述处废交易信息计算各个所述产废企业的信用标签;
构建单元60,用于根据所述企业标签、处废能力标签和信用标签构建各个所述产废企业的企业画像。
在一实施例中,所述企业标签单元30,包括:
分组子单元,用于将所述标准企业信息按照预设规则进行分组处理,得到多组标准企业子信息;其中,每组标准企业子信息表示一类信息;
第一计算子单元,用于将各组标准企业子信息分别输入对应的分类处理模块进行计算,得到分类处理模块对应的企业标签。
在一实施例中,所述处废能力标签单元40,包括:
第一获取子单元,用于获取所述标准企业信息中关于处废能力的处废能力信息;其中,所述处废能力信息包括废弃物月均生产量、占地面积、合作处废单位数量、合作处废单位距离、运输方式、处置方式中的一种或多种;
第二计算子单元,用于将所述处废能力信息输入预设的学习模型进行计算,得到所述处废能力标签;其中所述预设的学习模型基于支持向量机训练而成。
在一实施例中,所述信用标签单元50,包括:
第二获取子单元,用于从区块链中获取所述产废企业与处废企业之间的处废交易信息;
第三获取子单元,用于获取所述产废企业的生产信息;
第三计算子单元,用于计算所述生产信息和所述处废交易信息中的产废信息的相关性;
确定子单元,用于根据所述相关性确定所述产废企业的信用标签。
在一实施例中,所述第三计算子单元,包括:
在一实施例中,所述第三计算子单元,包括:
获取模块,用于获取距离当前年份的k个年份的所述产废信息和所述生产信息;
第二计算模块,用于计算每一年的所述产废信息与所述生产信息的子相关性;
第三计算模块,用于通过公式ρ=a1ρ1+a2ρ2+···+akρk计算所述生产信息和所述处废交易信息中的产废信息的相关性,所述a1至ak分别为每一年的所述产废信息与所述生产信息的子相关性的预设权重,a1至ak的大小依次递减,ρk为距离当前年份的第k个年份的子相关性。
在一实施例中,所述构建单元60,包括:
形成子单元,用于将所述企业标签、处废能力标签和信用标签以图形化的形式形成各个产废企业的企业画像;
展示子单元,用于将各个产废企业的企业画像按照各自的位置信息在预设企业地图中展示。
在本实施例中,上述各个单元、子单元的具体实现请参照上述方法实施例中所述,在此不再进行赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种企业画像构建方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种企业画像构建方法。
综上所述,为本申请实施例中提供的企业画像构建方法、装置、计算机设备和存储介质,获取各个产废企业的企业信息;将所述企业信息按照预设规则进行清洗处理,得到各个所述产废企业的标准企业信息;将各个所述标准企业信息按照预设规则分别输入预设的多个分类处理模块进行处理,得到各个所述产废企业对应的多个企业标签;将各个所述标准企业信息输入预设的学习模型中进行计算,得到各个所述产废企业对应的处废能力标签;其中所述预设的学习模型基于支持向量机训练而成;获取区块链中各个产废企业的处废交易信息,根据所述处废交易信息计算各个所述产废企业的信用标签;根据所述企业标签、处废能力标签和信用标签构建各个所述产废企业的企业画像。通过本申请提供的企业画像构建方法、装置、计算机设备和存储介质,通过结合AI智能算法、区块链信息统筹技术手段对企业信息、处废交易信息等建立企业画像,从而能够较为笼统的表现出企业内部信息,以便于企业客户直观了解企业形象,另一方面,使用学习模型从已有的数据中挖掘中产废企业的处废处理能力等相关信息,使用区块链记录产废到处废的交易记录信息,并且计算产废企业的信用标签,从而能够进一步使企业对应的客户了解企业风险因素把控效应结果,进一步增加企业画像的真实性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种企业画像构建方法,其特征在于,包括以下步骤:
获取各个产废企业的企业信息;
将所述企业信息按照预设规则进行清洗处理,得到各个所述产废企业的标准企业信息;
将各个所述标准企业信息按照预设规则分别输入预设的多个分类处理模块进行处理,得到各个所述产废企业对应的多个企业标签;
将各个所述标准企业信息输入预设的学习模型中进行计算,得到各个所述产废企业对应的处废能力标签;其中所述预设的学习模型基于支持向量机训练而成;
获取区块链中各个产废企业的处废交易信息,根据所述处废交易信息计算各个所述产废企业的信用标签;
根据所述企业标签、处废能力标签和信用标签构建各个所述产废企业的企业画像。
2.根据权利要求1所述的企业画像构建方法,其特征在于,所述将各个所述标准企业信息按照预设规则分别输入预设的多个分类处理模块进行处理,得到各个所述产废企业对应的多个企业标签的步骤,包括:
将所述标准企业信息按照预设规则进行分组处理,得到多组标准企业子信息;其中,每组标准企业子信息表示一类信息;
将各组标准企业子信息分别输入对应的分类处理模块进行计算,得到分类处理模块对应的企业标签。
3.根据权利要求1所述的企业画像构建方法,其特征在于,所述将各个所述标准企业信息输入预设的学习模型中进行计算,得到各个所述产废企业对应的处废能力标签的步骤,包括:
获取所述标准企业信息中关于处废能力的处废能力信息;其中,所述处废能力信息包括废弃物月均生产量、占地面积、合作处废单位数量、合作处废单位距离、运输方式、处置方式中的一种或多种;
将所述处废能力信息输入预设的学习模型进行计算,得到所述处废能力标签。
4.根据权利要求1所述的企业画像构建方法,其特征在于,所述获取区块链中各个产废企业的处废交易信息,根据所述处废交易信息计算各个所述产废企业的信用标签的步骤,包括:
从区块链中获取所述产废企业与处废企业之间的处废交易信息;
获取所述产废企业的生产信息;
计算所述生产信息和所述处废交易信息中的产废信息的相关性;
根据所述相关性确定所述产废企业的信用标签。
6.根据权利要求4所述的企业画像构建方法,其特征在于,所述计算所述生产信息和所述处废交易信息中的产废信息的相关性步骤,包括:
获取距离当前年份的k个年份的所述产废信息和所述生产信息;
计算每一年的所述产废信息与所述生产信息的子相关性;
通过公式ρ=a1ρ1+a2ρ2+···+akρk计算所述生产信息和所述处废交易信息中的产废信息的相关性,所述a1至ak分别为每一年的所述产废信息与所述生产信息的子相关性的预设权重,a1至ak的大小依次递减,ρk为距离当前年份的第k个年份的子相关性。
7.根据权利要求1所述的企业画像构建方法,其特征在于,所述根据所述企业标签、处废能力标签和信用标签构建各个所述产废企业的企业画像的步骤,包括:
将所述企业标签、处废能力标签和信用标签以图形化的形式形成各个产废企业的企业画像;
将各个产废企业的企业画像按照各自的位置信息在预设企业地图中展示。
8.一种企业画像构建装置,其特征在于,包括:
获取单元,用于获取各个产废企业的企业信息;
清洗单元,用于将所述企业信息按照预设规则进行清洗处理,得到各个所述产废企业的标准企业信息;
企业标签单元,用于将各个所述标准企业信息按照预设规则分别输入预设的多个分类处理模块进行处理,得到各个所述产废企业对应的多个企业标签;
处废能力标签单元,用于将各个所述标准企业信息输入预设的学习模型中进行计算,得到各个所述产废企业对应的处废能力标签;其中所述预设的学习模型基于支持向量机训练而成;
信用标签单元,用于获取区块链中各个产废企业的处废交易信息,根据所述处废交易信息计算各个所述产废企业的信用标签;
构建单元,用于根据所述企业标签、处废能力标签和信用标签构建各个所述产废企业的企业画像。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的企业画像构建方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的企业画像构建方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111007300.9A CN113723924A (zh) | 2021-08-30 | 2021-08-30 | 企业画像构建方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111007300.9A CN113723924A (zh) | 2021-08-30 | 2021-08-30 | 企业画像构建方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113723924A true CN113723924A (zh) | 2021-11-30 |
Family
ID=78679338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111007300.9A Pending CN113723924A (zh) | 2021-08-30 | 2021-08-30 | 企业画像构建方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113723924A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005310075A (ja) * | 2004-04-19 | 2005-11-04 | Tomoo Yoshimasa | 1伝票複数品目データの電子マニフェスト登録とaspコンピュータによる登録代行 |
CN109754177A (zh) * | 2018-12-29 | 2019-05-14 | 广州明动软件股份有限公司 | 污染源画像标签体系、污染源画像的构造方法及其应用 |
CN110599095A (zh) * | 2019-09-12 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 基于区块链网络的危废处理方法及区块链网络的节点 |
CN111461167A (zh) * | 2020-03-02 | 2020-07-28 | 平安国际智慧城市科技股份有限公司 | 基于大数据的污染源定位方法、装置、设备及存储介质 |
CN112487105A (zh) * | 2020-11-12 | 2021-03-12 | 深圳市中博科创信息技术有限公司 | 一种企业画像的构建方法 |
-
2021
- 2021-08-30 CN CN202111007300.9A patent/CN113723924A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005310075A (ja) * | 2004-04-19 | 2005-11-04 | Tomoo Yoshimasa | 1伝票複数品目データの電子マニフェスト登録とaspコンピュータによる登録代行 |
CN109754177A (zh) * | 2018-12-29 | 2019-05-14 | 广州明动软件股份有限公司 | 污染源画像标签体系、污染源画像的构造方法及其应用 |
CN110599095A (zh) * | 2019-09-12 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 基于区块链网络的危废处理方法及区块链网络的节点 |
CN111461167A (zh) * | 2020-03-02 | 2020-07-28 | 平安国际智慧城市科技股份有限公司 | 基于大数据的污染源定位方法、装置、设备及存储介质 |
CN112487105A (zh) * | 2020-11-12 | 2021-03-12 | 深圳市中博科创信息技术有限公司 | 一种企业画像的构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lyu et al. | Artificial Intelligence and emerging digital technologies in the energy sector | |
CN110400021B (zh) | 银行网点现金用量预测方法及装置 | |
CN112182246B (zh) | 通过大数据分析建立企业画像的方法、***、介质及应用 | |
CN109859052B (zh) | 一种投资策略的智能推荐方法、装置、存储介质和服务器 | |
US20140081832A1 (en) | System and method for building and validating a credit scoring function | |
CN110427406A (zh) | 组织机构相关人员关系的挖掘方法及装置 | |
CN111506723B (zh) | 问答响应方法、装置、设备及存储介质 | |
CN110633316A (zh) | 一种多场景融合双随机市场监管方法 | |
KR102121901B1 (ko) | 정책자금 온라인 심사평가 시스템 | |
CN110544023A (zh) | 一种企业区域性贡献力的数据化评估***及其评估方法 | |
CN115293537A (zh) | 基于大数据和人工智能的企业政策匹配度评估方法及*** | |
Curme et al. | Quantifying the diversity of news around stock market moves | |
Androniceanu et al. | Public Administration Digitalization and Government Effectiveness in the EU Countries | |
Ugur et al. | Information asymmetry, risk aversion and R&D subsidies: effect-size heterogeneity and policy conundrums | |
Neumann et al. | Machine Learning-based predictions of customers’ decisions in car insurance | |
Yu et al. | Computational intelligent data analysis for sustainable development | |
Modrušan et al. | Intelligent Public Procurement Monitoring System Powered by Text Mining and Balanced Indicators | |
CN116166999A (zh) | 异常交易数据识别方法、装置、计算机设备及存储介质 | |
CN113723924A (zh) | 企业画像构建方法、装置、计算机设备和存储介质 | |
CN112506930B (zh) | 一种基于机器学习技术的数据洞察*** | |
Mahalle et al. | Data Acquisition and Preparation | |
Bogdanova et al. | Valuating the position of the control object based on a universal complex indicator using structured and unstructured data | |
Semenenko et al. | Automated system-cognitive analysis of the dependence of export and import of agricultural machinery on its production (the case of Russia) | |
Gamidullaeva et al. | Study of regional innovation ecosystem based on the big data intellectual analysis | |
Lozano-Medina et al. | Risk profiles of financial service portfolio for women segment using machine learning algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |