CN115344639A - 区域企业的全景分析方法、装置、计算机设备及介质 - Google Patents
区域企业的全景分析方法、装置、计算机设备及介质 Download PDFInfo
- Publication number
- CN115344639A CN115344639A CN202210996486.3A CN202210996486A CN115344639A CN 115344639 A CN115344639 A CN 115344639A CN 202210996486 A CN202210996486 A CN 202210996486A CN 115344639 A CN115344639 A CN 115344639A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- data
- panoramic
- analysis
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 89
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000007418 data mining Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 6
- 238000011161 development Methods 0.000 abstract description 13
- 238000007405 data analysis Methods 0.000 abstract description 9
- 230000009286 beneficial effect Effects 0.000 abstract description 6
- 239000000284 extract Substances 0.000 abstract description 4
- 238000009826 distribution Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012098 association analyses Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 235000008429 bread Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 235000008446 instant noodles Nutrition 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 235000013580 sausages Nutrition 0.000 description 1
- 239000002453 shampoo Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9566—URL specific, e.g. using aliases, detecting broken or misspelled links
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种区域企业的全景分析方法、装置、计算机设备及介质,其中,该区域企业的全景分析方法包括:通过多个数据源获取同一区域的企业全景数据;采用资源描述框架分析企业全景数据,形成区域对应的企业关联数据集;基于企业关联数据集,形成多个企业关联数据图;采用GraphX对多个企业关联数据图进行分析,获取区域的企业全景分析结果。该方法便于企业获得企业关注区域的各个方面的行业发展现状,通过大数据分析提取有益于企业经营发展的关键性数据,为企业经营的决策提供准确及时的数据支持。
Description
技术领域
本发明涉及大数据分析技术领域,尤其涉及一种区域企业的全景分析方法、装置、计算机设备及介质。
背景技术
随着人工智能、感知计算和互联网技术的迅猛发展,互联网云数据量亦呈指数级增长趋势。通过互联网大数据的融合与深度知识挖掘可为用户实现全方位精准服务,并已广泛应用于各行各业。全球大数据解决方案不断成熟,各领域大数据应用全面展开,为大数据发展带来强劲动力。大数据逐渐成为全球IT支出新的增长点。根据Wikibon研究数据,全球大数据市场规模将从2018年的420亿美元增长至2024年的840亿美元,年复合增长率为12.3%。基于大数据市场规模的爆发,2017年全球有53%的公司采用大数据分析,2019年,这比例上升至64%。2019年大数据分析在任务优化及业务自动化领域使用将更加普及。根据Frost&Sullivan数据,大数据分析市场规模正以29.7%的年复合增长率增长,预计到2023年增长至406亿美元。如何通过大数据提取有益于企业经营发展的关键性数据成为亟待解决的问题。
发明内容
本发明实施例提供一种区域企业的全景分析方法、装置、计算机设备及介质,以解决通过大数据提取有益于企业经营发展的关键性数据的问题。
一种区域企业的全景分析方法,包括:
通过多个数据源获取同一区域的企业全景数据;
采用资源描述框架分析企业全景数据,形成区域对应的企业关联数据集;
基于企业关联数据集,形成多个企业关联数据图;
采用GraphX对多个企业关联数据图进行分析,获取区域的企业全景分析结果。
进一步地,通过多个数据源获取同一区域的企业全景数据,包括:
通过设定网址、设定数据库获取同一区域的企业对应的信用公示信息、知识产权信息和财务***息。
进一步地,采用资源描述框架分析企业全景数据,形成区域对应的企业关联数据集,包括:
采用资源描述框架对企业全景数据按不同的企业参考维度进行数据关联,形成可通过统一资源标志符进行定位的企业关联数据集,企业关联数据集包括多个企业参考维度数据。
进一步地,基于企业关联数据集,形成多个企业关联数据图,包括:
基于企业关联数据集,通过基础数量维度、地理位置维度、时间序列维度以及关联关系维度对企业关联数据集进行分析,获取企业关联数据集对应的多个企业关联数据图。
进一步地,采用GraphX对多个企业关联数据图进行分析,获取区域的企业全景分析结果,包括:
按企业全景分析中设定的数据挖掘维度,采用GraphX对每一企业关联数据图进行数据挖掘,获取区域的企业全景分析结果。
进一步地,数据挖掘维度包括技术创新热点;
采用GraphX对每一企业关联数据图进行数据挖掘,获取区域的企业全景分析结果,包括:
当数据挖掘维度为技术创新热点时,获取企业关联数据图中的词云图;
采用GraphX对词云图进行数据挖掘,获取指定期间内区域内的多个热点技术创新领域。
进一步地,在通过多个数据源获取同一区域的企业全景数据之前,还包括:
获取客户端发送的企业全景具体分析请求,企业全景具体分析请求包括指定区域和指定行业,以便最终获取的企业全景分析结果是基于指定区域和指定行业形成的。
一种区域企业的全景分析装置,包括:
获取全局数据模块,用于通过多个数据源获取同一区域的企业全景数据;
形成关联数据集模块,用于采用资源描述框架分析企业全景数据,形成区域对应的企业关联数据集;
形成关联数据图模块,用于基于企业关联数据集,形成多个企业关联数据图;
获取分析结果模块,用于采用GraphX对多个企业关联数据图进行分析,获取区域的企业全景分析结果。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述区域企业的全景分析方法。
一种计算机可读介质,所述计算机可读介质存储有计算机程序,所述计算机程序被处理器执行时实现上述区域企业的全景分析方法。
上述区域企业的全景分析方法、装置、计算机设备及介质,通过采用GraphX对大规模的形式多样的企业关联数据图进行分析,可获取企业全景分析结果,便于企业通过本申请提供的***一键获得企业关注区域的各个方面的行业发展现状,及时获取商机或及时止损,通过大数据分析提取有益于企业经营发展的关键性数据,为企业经营的决策提供准确及时的数据支持。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1绘示本发明一实施例中区域企业的全景分析方法的应用环境示意图;
图2绘示本发明第一实施例中区域企业的全景分析方法的第一流程图;
图3绘示本发明第一实施例中区域企业的全景分析方法中得到的展示政策扶持方向的示例图;
图4绘示本发明第二实施例中区域企业的全景分析方法的第二流程图;
图5绘示本发明第一实施例中区域企业的全景分析方法中得到的词云示例图;
图6绘示本发明一实施例中区域企业的全景分析装置的示意图;
图7绘示本发明一实施例中计算机设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的区域企业的全景分析方法,可应用在如图1的应用环境中,该区域企业的全景分析方法应用在区域企业的全景分析***中,该区域企业的全景分析***包括客户端和服务器,其中,客户端通过网络与服务器进行通信。客户端又称为用户端,是指与服务器相对应,为客户端提供本地服务的程序。进一步地,客户端为计算机端程序、智能设备的APP程序或嵌入其他APP的第三方小程序。该客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备等计算机设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种区域企业的全景分析方法,以该方法应用在图1中的服务器为例进行说明,具体包括如下步骤:
S10.通过多个数据源获取同一区域的企业全景数据。
其中,多个数据源包括网页连接、数据库等存储企业相关内容的公开网址以及数据库。
企业全景数据是从企业的多个角度、多个方向充分展示企业情况,提高企业对社会的信息透明度的全视信息。
具体地,本实施例可通过监控多个数据源,定期通过指定网站比如专利网站、企业信用信息公示***、证券交易所公开的数据库等获取企业公开的本***所需要涉及的所有相关数据作为企业全景数据。
S20.采用资源描述框架分析企业全景数据,形成区域对应的企业关联数据集。
其中,资源描述框架(Resource Description Framework,RDF),以下简称RDF,是使用XML语法来表示的资料模型(Datamodel),用来描述Web资源的特性,及资源与资源之间的关系。
关联数据是语义网上具有同一的数据格式(RDF等),能够被任意计算机获取到的数据,这些数据之间存在关联关系,计算机能够理解并处理这些数据之间的关系。可以理解地,企业关联数据集是与企业相关的所有关联数据形成的集合。
具体地,通过多个数据源获取的企业全景数据可能存在数据格式不统一的情况,通过RDF可将多个数据源的数据进行数据整合和格式统一,并提取多个数据源中存在的关联关系,比如,通过多个数据集中存在的相同元素进行数据集的关联,形成区域对应的企业关联数据集。
RDF资料模型是与语法无关(Syntax neutral)的表示法。如果两个RDF语法对应的资料模型相同,则代表这两个RDF语法具有同样的意义,反过来说,如果两个RDF语法具有同样的意义,则它们的资料模型应该相同。RDF的基本资料模型包括了三个对象类型(Objecttypes):
资源(Resource):所有以RDF表示法来描述的东西都叫做资源,可能是一个网站,可能是一个网页,可能只是网页中的某个部分,甚至是不存在于网络的东西,如纸本文献、器物、人等。
属性(Properties):属性是用来描述资源的特定特征或关系,每一个属性都有特定的意义,用来定义它的属性值(Value)和它所描述的资源形态,以及和其他属性的关系。
陈述(Statements):特定的资源以一个被命名的属性与相应的属性值来描述,称为一个RDF陈述,其中资源是主词(Subject),属性是述词(Predicate),属性值则是受词(Object),陈述的受词除了可能是一个字符串,也可能是其他的资料形态或是一个资源。
通过RDF对企业全景数据进行分析,目的是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构等。比如,超市有时候采取一些商品组合打包进行优惠销售的情况,洗发水+沐浴露、方便面+火腿肠、面包+牛奶等样式的组合,在这些产品组合的背后,其实存在相应的营销数据做支撑,而这背后涉及的原理就是多个数据源中存在的关联关系。对于关联分析,需要关注以下几个概念和指标:
1.项集:在关联分析中,包含0个或多个项目的集合称为项集。
2.支持度:代表数据集中包含几个特定项的概率。继续前叙的超市为例进行说明,支持度是指A商品和B商品同时被购买的概率,或者说某个商品组合的购买次数占总购买次数的比例。比如1000次商品交易中同时出现啤酒和尿布的次数是50次,那么此关联的支持度为5% 。
3.置信度:置信度是指在数据集中出现A商品时,B商品出现的概率,即指购买A后又购买B的条件概率。其算法公式是:C=F(A&B)/F(A)。
其中C代表置信度,F表示条件概率,A&B代表购买了A且购买了B的次数,A代表购买A的次数。比如今天共有10笔订单,其中购买A的次数是8,同时购买A和B的次数是6,则其置信度是6/8=75%。
4.提升度:提升度是先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,也即看组合商品被购买的次数是否高于单独商品的购买次数,大于1说明该组合方式有效,小于1则说明无效。
对概念和指标清晰后就可进行后续数据关联的分析。一般来说,给定一个事务数据库,关联分析就是通过用户定义的最小支持和最小置信度来寻找强关联规则的过程。
S30.基于企业关联数据集,形成多个企业关联数据图。
具体地,企业关联数据图是将企业关联数据集进行可视化表现的图集。比如,可将表格记录的数据按条状、柱状或树状等图形化格式表现出来,以使数据的特征更为直观化。
S40.采用GraphX对多个企业关联数据图进行分析,获取区域的企业全景分析结果。
其中,Spark GraphX是分布式图处理框架,它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大地方便了对分布式图处理的需求。GraphX 组件在基于社交网络数据的条件下得到快速发展,其将图形中各个节点之间的关系图挖掘出来,从而实现图形的社会价值。也即于本实施例中,GraphX可对企业关联数据图进行图形化分析,从而通过企业管理数据可 挖掘出的企业发展中关注的各个维度数据。
GraphX的语义和运算符相对丰富,可以进行比较好的图算法描述,适合变化多样的图需求。图计算可得到什么结果,从社交网络、人物关系挖掘、节点之间依赖计算等方面来理解图计算。首先,图数据存在于人民生活的方方面面,如果将数据相关方分别定位为一个点,而他们之间的互相联系抽象为边,则整个不同事物时间的错综复杂的联系就构成了一幅幅“图数据”。
社交关系数据:将每个人作为一个点,而人与人之间的互动关系是边,那么庞大的社交圈子中,不同人之间的互动联系就构成了庞大的社交关系数据。
网页链接数据:通过一个网页链接,可以跳转到其他多个网页,则网页与网页之间的多个跳转联系就构成了一个复杂的网页链接数据。通过这些数据可以进行多个研究,比如,可以分析出哪个网页是入口大的重要网页等。
图数据和图计算应用,比如,可通过交易网络数据图来分析出哪些交易是欺诈交易、通过通信网络数据图来分析企业员工之间的社交关系、通过用户—商品图数据图来分析用户需求,做个性化推荐等。
具体地,经本实施例提供的区域企业的全景分析方法,可采用GraphX对多个企业关联数据图进行分析,获取区域的企业全景分析结果,包括:企业注册资本/成立年限分布、新增/注销企业概况、热门行业榜单、企业规模分布、上市企业行业排行、专利申请趋势、专利申请行业分布、企业技术创新实力排行以及如图3所示的政策扶持方向等。
本实施例提供的区域企业的全景分析方法,通过采用GraphX对大规模的形式多样的企业关联数据图进行分析,可获取企业全景分析结果,便于企业通过本申请提供的***一键获得企业关注区域的各个方面的行业发展现状,及时获取商机或及时止损,通过大数据分析提取有益于企业经营发展的关键性数据,为企业经营的决策提供准确及时的数据支持。
在一具体实施例中,在步骤S10中,即通过多个数据源获取同一区域的企业全景数据,具体包括如下步骤:
S11.通过设定网址、设定数据库获取同一区域的企业对应的信用公示信息、知识产权信息和财务***息。
具体地,企业信用公示信息主要包括:市场主体的注册登记、许可审批、年度报告、行政处罚、抽查结果以及经营异常状态等信息。
知识产权信息指体现企业作为知识产权主体、客体、法律、经济及技术特征的知识产权信息,如专利申请人和专利权人信息、专利技术信息、专利法律信息、专利经济信息、商标权权利人信息、商标状态信息、著作权权利人信息、著作权内容信息和著作权法律信息等。知识产权信息反映着主体在从事科学、文学、艺术创作活动中因智力成果而获得的财产权与法律保护的权利,这种创作活动几乎涉及人类智力活动的各个领域,因而知识产权信息具有数量巨大、涉及领域非常广泛的特点。
财务信息是用来记录与企业的生产经营活动有着直接或间接联系的各种信息资料。对企业财务信息的利用是企业财务信息工作的重点,利用好企业财务信息才能发挥企业财务信息的“晴雨表”和“预警器”的作用。
在一具体实施例中,在步骤S20中,即采用资源描述框架分析企业全景数据,形成区域对应的企业关联数据集,具体包括如下步骤:
S21.采用资源描述框架对企业全景数据按不同的企业参考维度进行数据关联,形成可通过统一资源标志符进行定位的企业关联数据集,企业关联数据集包括多个企业参考维度数据。
其中,统一资源定位符(uniform resource locator,URL)是因特网的万维网服务程序上用于指定信息位置的表示方法。统一资源标志符(Uniform Resource Identifier,URI)以下简称URI,提供了一种识别资源的方法。但与URL不同的是,URI不提供定位资源的方法。URI常见的形式是统一资源定位符(URL),经常指定为非正式的网址。URI是URL的超集,且每个URL上也是一个URI。
企业参考维度数据包括企业注册资本/成立年限分布、企业规模分布以及上市企业行业排行等数据。进一步地,上市企业行业的数据可进一步地包括:计算机、通信和其他电子设备制造业、软件和信息技术服务业、电气机械和器材制造业、商务服务业、专用设备制造业和医疗制造业等数据。
在一具体实施例中,在步骤S30中,即基于企业关联数据集,形成多个企业关联数据图,具体包括如下步骤:
S31.基于企业关联数据集,通过基础数量维度、地理位置维度、时间序列维度以及关联关系维度对企业关联数据集进行分析,获取企业关联数据集对应的多个企业关联数据图。
具体地,对企业关联数据集进行数据分析时,可从多种维度抽象数据的特征,并以不同的分析与可视化手段进行洞察。除了基础数量维度之外,还应考虑地理位置、时间序列与关联关系这三个维度。
随着分析数据的复杂化,需要将多个维度协同进行分析。从图分析角度来看,将图数据与时序,以及与地理位置结合是解决实际问题的直观手段。可产生了带有时间属性的动态图(Dynamic network)以及带有地理属性的地理空间图(Geospatial graph)。比如,典型的地理空间图可以描述各种资源在不同地理位置之间的流动或者描述不同的关联事件在多个地理位置之间的发生情况,比如航空网络、航运网络、以及事件调查网络等。
本实施例提供的方法可获取企业关联数据集对应的多个企业关联数据图(将企业关联数据集过渡到可视化的企业关联数据图),便于快速发现数据节点之间的关联关系或者异常关系。
在一具体实施例中,在步骤S40中,即采用GraphX对多个企业关联数据图进行分析,获取区域的企业全景分析结果,具体包括如下步骤:
S41.按企业全景分析中设定的数据挖掘维度,采用GraphX对每一企业关联数据图进行数据挖掘,获取区域的企业全景分析结果。
其中,数据挖掘维度是构成企业全景分析的所有基本维度,比如企业注册资本/成立年限分布、企业规模分布以及上市企业行业排行等。
本实施例可基于企业的不同需要自动添加或者删除企业全景分析中设定的数据挖掘维度,以提高企业全景分析的可适用性和灵活性。
在一具体实施例中,如图4所示,在步骤S41中,即数据挖掘维度包括技术创新热点。
采用GraphX对每一企业关联数据图进行数据挖掘,获取区域的企业全景分析结果,具体包括如下步骤:
S411.当数据挖掘维度为技术创新热点时,获取企业关联数据图中的词云图。
S412.采用GraphX对词云图进行数据挖掘,获取指定期间内区域内的多个热点技术创新领域。
具体地,词云是通过形成“关键词云层”或“关键词渲染”,对网络文本中出现频率较高的“关键词”的视觉上的突出。
本实施例中,GraphX可统计如图5所示的词云图中预设前n名词在一个月、一个季度或者半年等出现频次较高的热点技术关键词,得出现在同行业的关注重点,或者本区域所有企业在指定期间内的技术关注热点。
在一具体实施例中,在步骤S10之前,即在通过多个数据源获取同一区域的企业全景数据之前,还具体包括如下步骤:
S101.获取客户端发送的企业全景具体分析请求,企业全景具体分析请求包括指定区域和指定行业,以便最终获取的企业全景分析结果是基于指定区域和指定行业形成的。
具体地,用户还可指定区域和行业进行企业全景具体分析,以获取更加适用于不同企业的个性化的分析结果,提高本实施例提供的企业全景分析结果的针对性和可参考性。
本实施例提供的区域企业的全景分析方法,通过采用GraphX对大规模的形式多样的企业关联数据图进行分析,可获取企业全景分析结果,便于企业通过本申请提供的***一键获得企业关注区域的各个方面的行业发展现状,及时获取商机或及时止损,通过大数据分析提取有益于企业经营发展的关键性数据,为企业经营的决策提供准确及时的数据支持。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种区域企业的全景分析装置,该区域企业的全景分析装置与上述实施例中区域企业的全景分析方法一一对应。如图6所示,该区域企业的全景分析装置包括获取全局数据模块10、形成关联数据集模块20、形成关联数据图模块30和获取分析结果模块40。各功能模块详细说明如下:
获取全局数据模块10,用于通过多个数据源获取同一区域的企业全景数据;
形成关联数据集模块20,用于采用资源描述框架分析企业全景数据,形成区域对应的企业关联数据集;
形成关联数据图模块30,用于基于企业关联数据集,形成多个企业关联数据图;
获取分析结果模块40,用于采用GraphX对多个企业关联数据图进行分析,获取区域的企业全景分析结果。
关于区域企业的全景分析装置的具体限定可以参见上文中对于区域企业的全景分析方法的限定,在此不再赘述。上述区域企业的全景分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性介质、内存储器。该非易失性介质存储有操作***、计算机程序和数据库。该内存储器为非易失性介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于区域企业的全景分析方法相关的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种区域企业的全景分析方法。
在一实施例中,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例区域企业的全景分析方法,例如图2所示S10至步骤S40。或者,处理器执行计算机程序时实现上述实施例中区域企业的全景分析装置的各模块/单元的功能,例如图6所示模块10至模块40的功能。为避免重复,此处不再赘述。
在一实施例中,提供一种计算机可读介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例区域企业的全景分析方法,例如图2所示S10至步骤S40。或者,该计算机程序被处理器执行时实现上述装置实施例中区域企业的全景分析装置中各模块/单元的功能,例如图6所示模块10至模块40的功能。为避免重复,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种区域企业的全景分析方法,其特征在于,包括:
通过多个数据源获取同一区域的企业全景数据;
采用资源描述框架分析所述企业全景数据,形成所述区域对应的企业关联数据集;
基于所述企业关联数据集,形成多个企业关联数据图;
采用GraphX对多个所述企业关联数据图进行分析,获取所述区域的企业全景分析结果。
2.根据权利要求1所述的区域企业的全景分析方法,其特征在于,所述通过多个数据源获取同一区域的企业全景数据,包括:
通过设定网址、设定数据库获取同一区域的企业对应的信用公示信息、知识产权信息和财务***息。
3.根据权利要求1所述的区域企业的全景分析方法,其特征在于,所述采用资源描述框架分析所述企业全景数据,形成所述区域对应的企业关联数据集,包括:
采用资源描述框架对所述企业全景数据按不同的企业参考维度进行数据关联,形成可通过统一资源标志符进行定位的所述企业关联数据集,所述企业关联数据集包括多个企业参考维度数据。
4.根据权利要求1所述的区域企业的全景分析方法,其特征在于,所述基于所述企业关联数据集,形成多个企业关联数据图,包括:
基于所述企业关联数据集,通过基础数量维度、地理位置维度、时间序列维度以及关联关系维度对所述企业关联数据集进行分析,获取所述企业关联数据集对应的多个企业关联数据图。
5.根据权利要求1所述的区域企业的全景分析方法,其特征在于,所述采用GraphX对多个所述企业关联数据图进行分析,获取所述区域的企业全景分析结果,包括:
按企业全景分析中设定的数据挖掘维度,采用GraphX对每一所述企业关联数据图进行数据挖掘,获取所述区域的企业全景分析结果。
6.根据权利要求5所述的区域企业的全景分析方法,其特征在于,所述数据挖掘维度包括技术创新热点;
所述采用GraphX对每一所述企业关联数据图进行数据挖掘,获取所述区域的企业全景分析结果,包括:
当所述数据挖掘维度为技术创新热点时,获取所述企业关联数据图中的词云图;
采用GraphX对所述词云图进行数据挖掘,获取指定期间内所述区域内的多个热点技术创新领域。
7.根据权利要求1所述的区域企业的全景分析方法,其特征在于,在所述通过多个数据源获取同一区域的企业全景数据之前,还包括:
获取客户端发送的企业全景具体分析请求,所述企业全景具体分析请求包括指定区域和指定行业,以便最终获取的所述企业全景分析结果是基于所述指定区域和所述指定行业形成的。
8.一种区域企业的全景分析装置,其特征在于,包括:
获取全局数据模块,用于通过多个数据源获取同一区域的企业全景数据;
形成关联数据集模块,用于采用资源描述框架分析所述企业全景数据,形成所述区域对应的企业关联数据集;
形成关联数据图模块,用于基于所述企业关联数据集,形成多个企业关联数据图;
获取分析结果模块,用于采用GraphX对多个所述企业关联数据图进行分析,获取所述区域的企业全景分析结果。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述区域企业的全景分析方法。
10.一种计算机可读介质,所述计算机可读介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述区域企业的全景分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210996486.3A CN115344639A (zh) | 2022-08-19 | 2022-08-19 | 区域企业的全景分析方法、装置、计算机设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210996486.3A CN115344639A (zh) | 2022-08-19 | 2022-08-19 | 区域企业的全景分析方法、装置、计算机设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115344639A true CN115344639A (zh) | 2022-11-15 |
Family
ID=83953152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210996486.3A Pending CN115344639A (zh) | 2022-08-19 | 2022-08-19 | 区域企业的全景分析方法、装置、计算机设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115344639A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117078054A (zh) * | 2023-06-07 | 2023-11-17 | 科学技术部火炬高技术产业开发中心 | 一种科技型企业创新能力量化评估方法及*** |
CN117251993A (zh) * | 2023-08-29 | 2023-12-19 | 上海数禾信息科技有限公司 | 业务数据模型构建方法、装置、计算机设备和存储介质 |
-
2022
- 2022-08-19 CN CN202210996486.3A patent/CN115344639A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117078054A (zh) * | 2023-06-07 | 2023-11-17 | 科学技术部火炬高技术产业开发中心 | 一种科技型企业创新能力量化评估方法及*** |
CN117078054B (zh) * | 2023-06-07 | 2024-04-05 | 科学技术部火炬高技术产业开发中心 | 一种科技型企业创新能力量化评估方法及*** |
CN117251993A (zh) * | 2023-08-29 | 2023-12-19 | 上海数禾信息科技有限公司 | 业务数据模型构建方法、装置、计算机设备和存储介质 |
CN117251993B (zh) * | 2023-08-29 | 2024-05-14 | 上海数禾信息科技有限公司 | 业务数据模型构建方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Industrial big data analytics: challenges, methodologies, and applications | |
KR102055356B1 (ko) | 데이터 리소스들에 대한 엑세스 제어 | |
Lim et al. | Business intelligence and analytics: Research directions | |
CN105447184B (zh) | 信息抓取方法及装置 | |
US8856157B2 (en) | Automatic detection of columns to be obfuscated in database schemas | |
CN115344639A (zh) | 区域企业的全景分析方法、装置、计算机设备及介质 | |
US20110231385A1 (en) | Object oriented data and metadata based search | |
CN101782998A (zh) | 一种违规在线产品信息的智能判断方法与*** | |
CN111444256A (zh) | 一种数据可视化的实现方法和装置 | |
US20200409944A1 (en) | Visual distributed data framework for analysis and visualization of datasets | |
CN111046237A (zh) | 用户行为数据处理方法、装置、电子设备及可读介质 | |
US20130067496A1 (en) | Situational recommendations in heterogenous system environment | |
Kapur et al. | When to stop testing multi upgradations of software based on cost criteria | |
US20240152972A1 (en) | Marketing to consumers using data obtained from abandoned gps searches | |
Malaverri et al. | A provenance–based approach to evaluate data quality in eScience | |
CN117033654A (zh) | 一种面向科技迷雾识别的科技事件图谱构建方法 | |
Juan et al. | Systematic approach for the gap analysis of business processes | |
US20150073902A1 (en) | Financial Transaction Analytics | |
Do et al. | DW-PathSim: a distributed computing model for topic-driven weighted meta-path-based similarity measure in a large-scale content-based heterogeneous information network | |
Yao | Application of sensor-based speech data mining in E-commerce operations data analysis | |
Shen et al. | A Catalogue Service for Internet GIS ervices Supporting Active Service Evaluation and Real‐Time Quality Monitoring | |
CN106716403A (zh) | 网站入口页面的自动生成 | |
Mai et al. | An efficient approach for mining closed high utility itemsets and generators | |
US20150169776A1 (en) | System and method for displaying contextual data respective of events | |
Zhang et al. | Patentdom: Analyzing patent relationships on multi-view patent graphs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |